話你知/何為數據加工?

  圖:參觀者在第二屆香港國際創科展上體驗AI成像。/新華社
  圖:參觀者在第二屆香港國際創科展上體驗AI成像。/新華社

  《經濟學人》(The Economist)將數據類比為21世紀的石油,但石油是不能直接使用的,需要經過複雜的煉製過程才能成為可以被利用的資源。同樣,非結構化的原始數據也是無法直接使用的,需要根據使用者的需要進行加工。數據加工主要包括數據清洗、數據標註、數據審核以及數據融合處理等方式,實現從原始數據到數據資源的轉化,為數據資源的挖掘和分析奠定基礎。其中,對於AI建模而言,最重要的數據加工環節是將非結構化數據中有用的部分標記出來,轉變為計算機可以理解的結構化數據,亦即數據標註。\大公報整理