經濟透視/「自駕模型需百萬級數據 背後是數十萬小時人工」 內企研發平台識別數據 AI訓練提速


  「一段10秒的道路視頻,包含車輛、行人、紅綠燈、車道線、障礙物等數十類目標,標註員需逐幀識別、精準框選,完成一段視頻往往需要數小時;而訓練一個基礎自動駕駛模型,需要百萬級標註數據,背後是數十萬小時的人工投入。」寧波博登智能科技有限公司創始人兼CEO趙捷以自動駕駛場景為例,說明有多少智能,背後就有多少人工。\大公報記者 俞晝

  業內人士指出,傳統標註模式的「三重困境」:一是效率低下,面對上游海量的數據需求,只能靠「堆人」來解決;二是質量參差,人工標註受疲勞、主觀判斷影響,誤差率普遍在10%左右,而AI模型對數據精度的要求近乎苛刻,「垃圾數據」只會訓練出「幻覺模型」;三是成本高企,伴隨着人力成本的逐年上漲,標註成本已然成為了AI模型研發不可忽視的沉重負擔。

  傳統純人手操作易有偏差

  面對傳統標註模式的「三重困境」,趙捷從來不認為數據工作就是簡單的重複勞動,真實世界的可執行經驗才是人工智能(AI)模型的靈魂素材,這樣才能更好地支撐AI從數字世界的虛擬認知走向物理場景的落地執行。

  寧波博登智能科技提供全面的人工智能數據處理服務與整套AI算法解決方案,涵蓋從基礎數據標註到高級算法優化的各個環節。團隊通過自主研發的BASE平台,幫助企業加速AI模型的訓練和應用,可為企業提供從數據採集、標註、處理到合成的全方位服務,滿足自動駕駛、智慧政務、智能客服等多個行業的數據需求。

  走進公司的具身智能實訓室,數百台顯示器同時跳動着像素級畫面:機械臂抓取水杯的動態軌跡、人形機器人跨越障礙的關節數據、廚房場景裏「視覺—觸覺—力反饋」的多模態交互,每幀畫面都在被精準拆解、標註、校準。「這裏每一秒產生的真實數據,都是訓練具身智能模型的核心素材……真實世界的訓練體系才是決定行業發展上限的關鍵變量。」「當所有人都在談論人工智能如何改變世界時,很少有人注意到,數據才是決定行業發展上限的關鍵變量。」趙捷說。

  「數據決定行業發展上限」

  2019年從德國人工智能公司裸辭後回國創辦公司的趙捷,他要做的是真實世界AI訓練基礎設施生態的「構建者」:通過博登智能自主研發的「全自動化數據引擎」,先用雲端大模型對原始真實世界交互記錄進行70%至80%的自動化預處理;再由專家工程師對「邊緣場景」「疑難樣本」進行校驗、修正;最終形成高精度數據。

  為了讓記者更直觀地感受「流水線」的便捷,趙捷推開了技術研發中心的大門,工程師們正在對BASE6.0平台進行測試。屏幕上,一段複雜的3D點雲數據被快速拆解,200餘個自動化標註小模型同步運行,精準識別車輛、行人、障礙物等「交通參與者」的三維坐標;這些坐標的下一站,是10餘個相關領域垂直大模型的實時校驗、修正,直至被送往最後的人工「關卡」。

  「新一代平台的核心優勢,是『全模態、自動化、高精度、低成本』。」研發中心技術負責人向記者介紹說,BASE6.0版本融合智能體和多模態大模型,支持2D圖像、3D點雲、4D動態數據、文本、語音、視頻等所有主流AI數據類型,適配多種場景,「以前一個訓練數據工程團隊需要100人,現在靠平台+少量專家,20人就能完成同等工作量,而且質量更高、成本更低。」