專注主業/具身智能發展迅速 數據分析炙手可熱


  「行業的共識是,具身智能將成為AI產業的下一個萬億級金礦,既然這樣,博登智能想成為那個『賣鏟子的人』。」趙捷2023年將公司業務從自動駕駛、大模型數據服務,拓展至具身智能數據服務的決定。「傳統的AI訓練素材是靜態的、單模態的、事後標註的,而具身智能的訓練素材是動態的、多模態的、因果關聯的。」趙捷舉例說,一個「拿起杯子」的動作,包含了視覺、觸覺、運動學、音頻等多種信號,並且每一個信號之間都存在嚴格的時間因果關係,需要給它「餵」大量的數據才能習得。

  對於從原來業務拓展至具身智能數據服務的轉變,趙捷表示,認真研究過中國具身智能企業的創始團隊後發現,超過半數都是曾經從事或參與過自動駕駛技術的研發。兩者在包括關節、傳感器等硬件,還是底層算法,都是通用的。所以目前新業務的很多技術人員就是從原本的兩個賽道「平移」過來的。他補充,在新的賽道上,博登智能沒有選擇跟風研發機器人本體,而是聚焦核心業務,自主研發了具身智能BRIC Robo數據採集平台與Blink數據管理平台,這樣「我們僅用了一年多時間,就將具身智能訓練素材的工程化效率最高提升700%、質檢效率提升300%、綜合交付準確率超99%。」

  與自駕訓練邏輯相若

  趙捷提到,主流大語言模型的預訓練數據量有數十萬億token,自動駕駛需要百億小時數據才能取得今天的效果。具身智能要從「想做」到「會做」,同樣需要大量的數據來學習訓練。但據不完全統計,全球範圍內研發端對高質量數據的需求量約為120萬小時,中間有着巨大的缺口。