從零開始/機器人逐漸學會與世界交互
讓機器人完成複雜數學運算只需幾行代碼,但讓它平穩端起一杯水,卻難如登天。這一「莫拉維克悖論」,正是具身智能訓練師們攻克的難題:對人類容易的事,對機器很難;對機器容易的事,對人類很難。人類億萬年進化而來的運動智能,機器人必須從零開始學習。
譚禮博用「按開關」舉例:「人類隨手可完成的動作,機器人需兼顧視覺、觸覺與空間感,去理解燈的顏色、感受按壓力度和知道位置偏移。」為讓機器人適應真實世界,訓練師必須模擬各種「意外」情況,「如果只從正面按開關,一旦機器人站歪了一點,它就找不到開關了。」譚禮博說。因此,訓練師需要從45度角、從側面,甚至從不同距離去採集數據,讓機器人學會「舉一反三」,真正理解動作的核心邏輯而非機械復刻。
這種多姿態數據採集,是具身智能訓練的核心。它並非簡單重複,而是構建應對突發狀況的「概率模型」,讓機器人在未知場景中也能做出合理判斷。張建國表示,在實驗室裏,光線、物體位置都是固定的。但在真實世界中,環境是不斷變動的,光線明暗、物體輕微移位,都可能讓機器人「手足無措」。
張建國表示,目前核心技術難點,是讓機器人「大腦」實時感知、認知環境並決策,「我們要訓練的,是能理解場景、掌握物理規律的智能大腦,而非單純復刻動作」。隨着觸覺傳感器、力反饋技術和大模型技術的進步,機器人正在逐漸學會像人類一樣與世界交互。而這背後,是無數具身智能訓練師在用數據,一點一滴地教會機器「生存」的技能,讓機器人真正走進真實世界,實現從「會動作」到「懂世界」的跨越,為具身智能產業發展築牢根基。\大公報記者郭若溪