粵首個機器人訓練場啟用
16類大場景採集數據 受訓助入屋幹活
馬年春晚舞台上,機器人輪番上台表演,完成了一場國產人形機器人的國民級亮相,也引發大量追問:機器人何時走進日常生活?今年初啟動試運營的廣東省首個機器人訓練場——惠陽異構具身智能訓練場,或許可以解答一二。
訓練場位於惠州市惠陽區科技創新中心推門而入,幾十台形態各異的機器人正在給超市貨架擺放商品、收銀掃描,在「快遞站」分揀包裹,製作咖啡,分類生物醫藥物料……充滿科幻感的「未來」觸手可及。細看之下,每台機器人背後都有一位人類訓練師在仔細操控。這其實是機器人正在接受不同場景的「職業培訓」,過程中產生的海量行為數據,正是讓通用機器人順利走入千家萬戶的「秘籍」。
與實驗室裏簡單、有限、可復現的場景不同,一旦走入真實世界,機器人將面對無窮無盡的複雜狀況。要「智能地」應對一切,還需更多來自物理世界的真實行為數據。具身智能機器人訓練場通過搭建真實物理場景與仿真平台,供機器人「學習」人類行為,採集有效訓練數據,推動具身智能數據標準化,破解高質量訓練數據短缺這一發展瓶頸。
首批「數字資產」陸續交付
「機器人一定要有更強的泛化能力,要能舉一反三,達到一定程度後才會出現『湧現』的能力,遇到沒見過的東西也能自主應對。」惠陽異構具身智能訓練場運營方刻行時空創始人兼CEO黃陽明介紹,目前訓練場共劃分16類大場景,涵蓋康養家庭、酒店客房、工業流水線分揀、生物醫藥物料分類等,場景維持高頻迭代,平均每兩周更新一次。上月末,訓練場正式產出的首批「數字資產」已陸續交付。
訓練場中的場景均採用當地企業、工廠的真實環境。機器人在訓練師操控下,一遍遍重複人類的精準動作,學習應對不同規格、材質、形狀物體時的發力方式與運動軌跡等信息,並生成相應數據。數據經過標註、清洗等技術處理後,留下有價值的高質量數據。基於對這些數據的學習,機器人逐漸形成自己的「手感」,愈發靈活地應對現實場景。「必須有足夠多的數據去教會它,這個過程和我7個月大的小孩學習拿東西很像。」黃陽明說。
目前,優必選、星塵智能、智元、穹徹智能、浙江人形等國內頭部機器人企業的約180台機器人已在此「入學」,預計一年可採集500萬條多模態數據。
數據標準助爭取全球話語權
國家「十五五」規劃綱要重點布局具身智能等未來產業,構建全鏈條培育體系,提出強化算力算法數據高效供給,促進模型算法迭代創新,鼓勵具身智能技術創新,探索通用人工智能發展路徑。
在此背景下,「數據」正成為新的石油、黃金,和未來國際競爭的關鍵資源。「這類數據的需求是全球化的,中國如果能率先掌握高質量的數據標準,就擁有了話語權。」黃陽明說,中國的競爭優勢在於製造業基礎,大量的場景和技術工人有助於數據生產,快速填補空白。