AI浪潮/教具身智能學本領 出得廳堂進得工廠 數據採集員:我給機器人當老師
在深圳市人工智能與機器人研究院的實驗室裏,一場特殊的「教學」正在進行。具身智能數據採集員譚禮博正操控手柄,指導人形機器人完成電力櫃開關撥動、指示燈識別、接地棒接電等一系列精細動作。這些對人類而言輕而易舉的操作,卻是機器人必須通過海量數據學習才能掌握的「硬技能」。譚禮博的工作,就是給機器人當「老師」,把人類的行為、經驗、力度、角度轉化為機器可讀懂的數據,讓它們從「會動」變得「會幹、會思考、會應變」,既能做家務,又能進廠打工。/大公報記者 郭若溪
2024年初,大數據技術專業畢業的譚禮博,在高交會上,被靈動自如的人形機器人深深吸引。「我好奇這些動作背後的『教導者』,也想成為其中一員。」帶着這份熱忱,他入職研究院,踏上「教機器人學本領」的道路。一年多來,他參與訓練星辰S1、語數G1等多款人形機器人,見證它們從家庭場景的端茶倒水,到高危場景的變電站巡檢,實現從「蹣跚學步」到「獨立作業」的蛻變。
手把手教學 採集高質數據
「我們的核心工作,就是通過人為操控機器人完成指定動作,精準記錄動作過程中的力度、速度、角度、軌跡等參數,形成高質量數據集,再投餵給AI大模型進行訓練。」譚禮博以電力場景最常見的按鈕開關為例,人類隨手可完成的動作,機器人需學習多姿態操作邏輯,「從正面、側面、45度傾斜等角度採集數據,一條動作重複成百上千次,才能確保機器人應對非理想場景。」
數據採集後,譚禮博還要承擔數據質檢、初步審核工作,剔除無效、卡頓、異常的數據,確保交付給算法工程師的數據集「乾淨、精準、可用」。「機器人學會一項技能需上千條有效數據,我們每天產出的幾百條原始數據,經篩選後僅少數能成為『學習教材』。」他坦言,這份看似重複的工作,考驗着耐心與場景理解力,「優秀的採集員,必須懂工藝、懂場景,才能拿到高質量數據。」
深圳建具身智能 訓練師培養體系
隨着具身智能納入「十五五」規劃重點布局,這一新職業站上時代風口。深圳市人工智能與機器人研究院副研究員夏軒指出,未來五年具身智能模型的數據需求將呈指數級增長,「數據採集員不僅要教技能,更要教機器人適配產業部署」。據統計,2025年我國具身智能領域人才缺口將超50萬,涵蓋算法研發、數據採集等全崗位。「深圳正在積極建立具身智能訓練師的培養體系,這不僅是應對國家對物理交互AI人才的需求,也是為未來的人才和專利儲備。」夏軒說。
譚禮博表示,具身智能訓練師是複合型崗位,要求從業者既懂機械原理,又懂場景應用,還要具備一定的數據思維。「數據採集、標註、審核等基礎崗位,大專學歷可勝任基礎崗位;算法研發、模型優化等高端崗位則需碩博學歷,各專業均可跨界適配。「當我訓練的機器人走進變電站,替代人類遠離危險時,我真切感受到工作的價值。我們既是機器人的老師,也是智能時代的建設者。」
作為具身智能產業高地,深圳正構建「政策+產業+人才」全生態,成立廣東省具身智能機器人創新中心,聚焦電力巡檢、橋樑檢測等場景推進AI+機器人落地,為訓練師提供廣闊的實踐舞台。「我們優先攻克險重危難場景,比如橋樑高空檢測、電力變電站巡檢、智慧城市能源運維等險重危難場景,用機器人替代人工降低風險。」深圳市人工智能與機器人研究院機器人系統中心主任張建國博士介紹,團隊正攻克機器人環境感知核心難題,未來3-5年將向家庭服務、養老護理等民生場景拓展。