【公務同行】數據說話 政策有本 施政才有方 由電腦到AI看統計處「保持創新」
2026年人口普查已於今年1月份展開,今次是香港特區政府統計處首度改為用一整年時間進行普查。除了人口普查,統計處日常會定時公布失業率、消費物價指數、零售業銷售額及本地生產總值等統計數據,但市民卻未必清楚其重要性,以及獲取數據的背後過程。統計處高級統計主任吳偉文近日在接受香港文匯報專訪時表示,相關數據不僅有助特區政府了解香港的實際情況,也為政府制訂各項政策時提供基本數據及有用參考。隨着時代的變遷,統計處也經歷了從早期的大型電腦到人工智能(AI)的演變,吳偉文笑說:「統計主任的工作性質亦隨時代與科技而不斷轉變,因此必須保持創新思維、勇於接受改變。」 ●香港文匯報記者 嚴鍇華
吳偉文憶述,1990年初年僅20歲的他加入統計處擔任見習統計主任純屬機緣巧合,「當時我還在讀中七,某天上物理課時無意中從報章看到一則招聘廣告便提交了申請。其實我對統計處的運作及統計主任的具體工作一無所知,沒想到竟成為我職業生涯中唯一的全職工作。」入職後他接受了為期兩年的在職培訓,並參加由部門提供的香港理工學院(現為香港理工大學)兼讀制統計學課程,再通過香港統計學會的公開試並取得證書後,正式成為二級統計主任。
不同數據助更精準制訂政策
統計處發布的統計數字其實與市民日常生活息息相關。吳偉文表示,政府須依賴統計處的不同數據,才能更精準地制訂各項政策,例如失業率讓政府掌握本地勞動人口就業狀況,從而因應形勢制訂或調整與勞務相關的政策,紓緩勞工就業問題。另外,透過消費物價指數能了解通脹走勢,有助分析物價對市民消費的影響及制訂所需紓困政策;而收入及工時的統計數據則能為私人機構制定薪金調整幅度、釐定薪酬水平提供參考,直接或間接涉及市民生活。
「我剛入職時被編派到人口統計組,當時仍有人使用計數機以人手加減運算。」吳偉文指出,當年全組只有一部桌上電腦,處理數據的工作,一般要利用終端機連接到靠磁帶存儲數據的大型電腦,取回數據再進行處理。早期的桌上電腦並無內置硬盤,一般文書處理程式功能亦遠不及現時完備,必須插入5吋半磁碟才能啟動軟件讀取數據。至2000年代桌上電腦開始普及,他說:「再後來,我們的桌上電腦已可直接連接到中央伺服器,我們還可自行編寫電腦程式、運用專業統計軟件處理數據,大大提升便利性與運算速度。」踏入AI時代,統計處近年已透過AI分析進出口報關單上的文字內容,之後自動審核貨物編號和單位價格有否異常,取代了大部分以往需靠人手檢查的工作,既大幅提升效率,還能節省大量人手工序。
與市民互動模式更直接更方便
隨着時代進步與科技發展,統計處的技術與電腦設備亦不斷升級。吳偉文表示,最大的轉變就是與市民的互動模式變得更直接、更方便。他指以往市民須透過電話查詢或親身到訪才能取得統計數據,現時透過統計處網站,足不出戶便可以自行查閱、下載所需的統計資料。他以於今年三月推出的通用互動數據發布服務為例指出,市民可以根據本身需要自行編制所需的統計表及統計圖,以便進行跨主題的分析。網站操作靈活、彈性極高,「例如數據庫最早可追溯至1961年的人口數據,市民可自訂圖表格式、揀選所需時間,以及年齡組別、性別等不同分類,並即時以試算表或其他檔案格式下載數據,大大便利市民、商業機構及研究人員分析使用。」
吳偉文入行以來最難忘的經歷就是參與人口普查,「早年人口普查仍會給住戶郵寄問卷,部分年長的市民因擔心不懂填寫,會親自上來統計處辦公室求助。每次遇到這種情況,我們都會即時協助,讓他們安心之餘,也感謝他們積極參與、認真配合的心。」及至後來推出網上自填問卷,有市民提交問卷後會致電給統計處查詢,確認資料有否填錯,同事會耐心協助查閱和核實,「這反映市民非常重視自身的公民義務,亦是對統計處工作的支持、肯定和信任。」
8年前率先用AI 靠模型分析進出口報關單
行政長官李家超於去年的施政報告提出成立「AI效能提升組」,統籌和指導各政府部門有效應用人工智能(AI)技術,當中提及政府統計處運用AI技術審核貿易統計資料,以及從上千間上市公司的財務報表和公告中提取財務資訊,編制統計數據,效能皆以倍計提升。統計處高級統計主任吳偉文在接受香港文匯報專訪時指出,統計處早在2018年便開始探索使用AI模型分析進出口報關單,至2024年初全面實施新方法,令現時所需人力成本大幅減少一半;統計處亦從今年的人口普查開始進一步運用AI技術,例如引入AI圖像分析技術,透過航拍照片自動識別船艇並進行分類,以估算水上人口數目,以及引入機器學習模型,為住戶提供的行業和職業的文字資料進行自動編碼,正是AI融入統計工作的典型應用。
統計處平均每月需處理過百萬份進出口報關單,利用當中的資料編制每月的對外商品貿易統計數字。統計處須在短時間內準確驗證大量數據,挑戰甚大。而且有關貨物說明的部分,是由報關人士以文字描述,傳統的電腦系統難以有效處理和分析這些自由文本。吳偉文透露,由部門內部開發的AI模型採用深度學習算法,運用以往數以千萬條已標記的貨物描述進行訓練,以預測每份新申報貿易的貨物編號,並驗證其單位價格,「每月需處理數以百萬條的報關單紀錄,若依靠人手逐條審核會花費很長時間,引入AI技術可節省約一半人手。」他笑言,以往需花費大量時間處理的數據,現時只需短短數小時便可完成,效率大幅提升。
AI技術為市民帶來的便利,亦顯現於今年的人口普查上。吳偉文表示,過去人口普查是以十抽一的方式選取住戶填寫長問卷,其餘九成住戶則填寫短問卷,今年起只維持十分之一住戶填寫長問卷,其餘住戶無須填寫,「該九成住戶的基本人口資料將透過政府行政數據作補充。統計處亦會採用自行研發以AI技術為基礎的地址配對工具,高效、準確地把普查樣本與政府行政紀錄進行配對。」
新方式不僅有效減少數據收集的成本和受訪者的回應負擔,還能善用大數據估計人口結構特徵。吳偉文指出,以往人口普查多在暑期進行,時間緊迫且易受天氣、突發事件影響。2026年人口普查擴展至全年進行,令時間彈性更大,後續核實與跟進時間更充裕,提高數據質素,「無須再短期招聘數千名學生作臨時調查員,只需約200名合約員工便成,普查工作亦更專業。」統計處估計2026年和2031年人口普查總成本將減少約40%,可節省約6.8億元。
保持學習心態 立足AI年代
已在統計處工作了36年的吳偉文回顧其職業生涯時感觸甚深,「日常工作流程看似簡單,只是按月、按季、按年進行統計調查,但每個月都要做足準備,進行抽樣,還要整理數據、運用統計系統及軟件進行數據審核、協助撰寫報告等,同時需要處理市民查詢,主動協助市民使用統計處網站搜尋資料,工作繁多但不可或缺。」他直言,作為統計主任雖然只是默默耕耘,但每當想到自己對政府推出的政策也有所貢獻時,都讓他對這份工作深感自豪,「自問認真工作逾30年,跟隨部門一直走到今天,付出與貢獻不少,將來退休回想起來,也會覺得這份工作很有意義。」
入行多年,吳偉文的最大感受是科技進步帶來的工作轉變,「舊有工作模式與工具不斷迭代,不論新舊同事都必須持續學習新科技、新系統與新程式,以適應AI與大數據年代的工作模式。」他坦言,部分較年長的同事對適應新科技可能較為吃力,或要花較長時間才有一點進步;年輕一輩可能不用特別鑽研便能很快掌握。但他認為,這是各行各業同樣會面對的情況。他強調,面對社會的需求及快速轉變,所有政府部門都必須與時並進,不能與時代脫節,「統計處會定期舉辦座談會及工作坊,讓同事多了解並加快適應新事物。我也一直保持學習心態,上網查教學、看教程,自我增值。」
科技依賴度高 適合勇於創新者
談及為何選擇加入統計處時,統計處高級統計主任吳偉文笑言,當時沒有想得太複雜,也沒有特別原因,「我知道統計主任是一個有晉升階梯的職系,加上我有公務員須具備服務市民的心與使命感,便抱着嘗試的心態去投考。」他寄語有意加入統計處成為統計主任的人士,這份工作須接觸大量數據,對數字敏感、做事細心審慎、面對龐大數據也能沉着處理的人士會比較適合,「部門非常重視數據的準確度,以及保障市民的私隱,因此絕不能掉以輕心,必須按程序辦事、謹慎地處理數據。」他補充,統計工作對科技依賴度極高,特別適合對科技應用感興趣、願意接受新事物、勇於創新的年輕人。
每組別各負責專門項目
吳偉文指出,統計主任的工作範疇十分廣泛,他剛入職時統計處已有四、五十個組別,每個組別各自負責專門的統計項目。他以人口統計組為例,主要負責編制香港人口數據,包括出生、死亡、婚姻等數字,亦會編制人口預期壽命等數據。他過去亦曾被調派參與2001年人口普查工作,負責更新及整理全港屋宇單位地址資料庫,「這個資料庫的作用,是作為各住戶統計調查的抽樣框架。」
那麼統計師和統計主任是如何分工?吳偉文解釋,統計師主要負責統籌與督導統計項目,當中包括制訂其整體系統設計、研究合適的統計方法與執行模式等。統計主任需協助及支援統計師執行每項工作,包括統計系統的設計及測試、抽選樣本、設計問卷等流程;亦要處理與審核搜集得來的數據,制訂審核標準,確保數據準確可靠,之後協助編制各類統計數據、建立統計數據資料庫、協助撰寫統計報告等,「簡而言之就是協助專業統計規劃的實務執行與操作,運用電腦程式、專業統計系統去落實各項數據處理相關工作。」