- +1
人機(jī)分揀大戰(zhàn)結(jié)果出爐:Figure 03差點(diǎn)反超,人類贏了比分輸了未來
這可能是人類最后一次戰(zhàn)勝機(jī)器人了。
近期,在 Figure AI 最近一場 10 小時(shí)「人類 vs 機(jī)器人」包裹分揀挑戰(zhàn)里,實(shí)習(xí)生 Aime 最終分揀 12924 件包裹,F(xiàn)igure 03 則完成 12732 件,人類以 192 件的微弱優(yōu)勢守住了勝利。雖然,人類在這場比賽里勝利了,但多家媒體稱這可能會是人類最后一次在于機(jī)器人的對決里獲得勝利。
(圖源:Youtube)
這話并非空穴來風(fēng),在結(jié)束比賽后,實(shí)習(xí)生 Aime 的手指和手部多個(gè)關(guān)節(jié)已經(jīng)出現(xiàn)酸脹感,無法繼續(xù)分揀工作,而 Figure 03 則還能堅(jiān)守在崗位上。也就是說,速度上人類是勝利的,但持續(xù)工作這一塊,機(jī)器人贏得更多。
從這場有趣的比賽,我們能看到人形機(jī)器人正在從舞臺和發(fā)布會,走向工廠、倉庫和流水線,而另一個(gè)問題是,它們距離真正全面「上崗」,還有多遠(yuǎn)?
機(jī)器人與人類同場競技,誰贏了并不重要
在比賽之前,F(xiàn)igure 已經(jīng)把包裹分揀做成了一場連續(xù)直播。最初它展示的是 8 小時(shí)自主分揀,后來又把測試?yán)L到 24 小時(shí)以上,至截稿前,該直播間已經(jīng)連續(xù)直播了 137 個(gè)小時(shí)。直播的內(nèi)容其實(shí)也有點(diǎn)無聊,就是幾臺 Figure 03 站在傳送帶旁邊,一遍遍識別包裹、抓取包裹、翻轉(zhuǎn)包裹,再把面單或條碼朝向指定方向放回去。
直播間里的觀眾給機(jī)器人起了名字,有的叫 Bob,有的叫 Frank,有的叫 Gary,還有 Rose、Jim 這樣的名字,觀眾們給這些機(jī)器人取名字,盯著看它們會不會出錯(cuò),讓一場看著有些無聊的直播,變成了「真人秀」。
(圖源:Youtube)
事實(shí)上,這樣強(qiáng)烈的反差感也是讓越來越多人圍觀這場直播的原因。一邊是一個(gè)極其枯燥的物流動作,另一邊是幾百萬甚至上千萬網(wǎng)友盯著機(jī)器人搬箱子,看它會不會卡住、會不會掉包裹、會不會突然罷工。有網(wǎng)友調(diào)侃,這些機(jī)器人不只是在搶倉庫工人的活,連主播的活也一起搶了。還有人表示,這場直播太好「睡」了,已經(jīng)成為了自己的助眠神器。
對普通觀眾來說,這可能有點(diǎn)催眠,但對 Figure 來說,這正是它想要的效果。人形機(jī)器人如果真的要進(jìn)入工廠和倉庫,重要的是要在幾個(gè)小時(shí)、十幾個(gè)小時(shí)甚至幾十個(gè)小時(shí)里,持續(xù)完成那些單調(diào)的動作。越多人圍觀、越多人盯著這些機(jī)器人會不會出錯(cuò),反倒是給了 Figure 更多修正的機(jī)會。
(圖源:Youtube)
Figure 選擇包裹分揀這個(gè)最無聊的任務(wù),其實(shí)考驗(yàn)的正是目前工業(yè)任務(wù)里最難的幾項(xiàng)工作。試想一下,對人來說,分揀包裹只是看一眼、拿起來、翻個(gè)面、放回去;但對機(jī)器人來說,這是視覺、抓取、力度控制、路徑規(guī)劃結(jié)合起來的綜合性能力考驗(yàn)。這些包裹也不完全都是統(tǒng)一的紙箱,還有軟袋、薄信封,有的很輕、有的很重,機(jī)器人還得先看清條碼和姿態(tài),再決定抓哪里、用多大力。所以,在這場直播里,「翻車」的機(jī)器人還真不少。
(圖源:Youtube)
按照 Figure 的介紹,此次參與直播分揀物流的機(jī)器人系旗下的 Figure 03,身高約 173 厘米,重量 61 公斤,最大載荷 20 公斤,續(xù)航約 5 小時(shí),全電驅(qū),并支持無線充電。它不是一臺只為某個(gè)動作定制的機(jī)械臂,而是一個(gè)能站在人類工作環(huán)境里的通用人形平臺。
真正讓它能處理包裹分揀的,是 Figure 自研的 Helix 視覺-語言-動作模型。簡單來說,Helix 要解決的是三件事,分別是機(jī)器人看見了什么,機(jī)器人知道自己要做什么,以及機(jī)器人下一刻身體、手腕、手指該怎么動。Figure 把這套系統(tǒng)分成負(fù)責(zé)理解任務(wù)和環(huán)境的「慢系統(tǒng)」,以及負(fù)責(zé)高速輸出動作控制的「快系統(tǒng)」,后者可以以 200Hz 的頻率控制手、腕、軀干和手指的連續(xù)動作。
比如,包裹分揀看起來只是手部動作,實(shí)際上機(jī)器人每一次伸手之前,都要先完成一次動態(tài)判斷,機(jī)器人不能只知道「抓箱子」,還要知道這個(gè)箱子現(xiàn)在在哪里、條碼朝哪邊、用哪只手更合適、翻轉(zhuǎn)后會不會遮住面單。Figure 還在 Figure 03 上強(qiáng)化了手部和視覺能力,比如更低延遲的視覺系統(tǒng)、手掌相機(jī)、柔順手指和指尖觸覺傳感器,這些都是為了讓機(jī)器人在抓取時(shí)更接近人類揀貨的能力。
(圖源:Youtube)
實(shí)際上,F(xiàn)igure 從 2022 年創(chuàng)立之初就幾乎是 All in 機(jī)器人工業(yè)領(lǐng)域,他要做的就是設(shè)計(jì)生產(chǎn)能直接投入到制造、物流、倉儲、零售等場景的通用人形勞動力。2024 年,F(xiàn)igure 02 已經(jīng)進(jìn)入 BMW 位于美國南卡羅來納州 Spartanburg 的工廠測試,用于把鈑金件放入夾具等生產(chǎn)環(huán)節(jié)。一段時(shí)間后, Figure 披露,機(jī)器人在 BMW 產(chǎn)線上進(jìn)行了更長時(shí)間部署,參與實(shí)際生產(chǎn)任務(wù)。
這其實(shí)說明,機(jī)器人進(jìn)入到產(chǎn)線,已經(jīng)不是遙不可及的事情,它已經(jīng)真實(shí)地發(fā)生在某些細(xì)分行業(yè)里。至于與人類的比賽,無論勝負(fù)結(jié)果,當(dāng)一個(gè)機(jī)器人能夠與真人在某個(gè)工作上比拼,這對于前者而言,已經(jīng)是一個(gè)進(jìn)步。
人形機(jī)器人,先去工廠打工
Figure 之外,國內(nèi)外機(jī)器人公司其實(shí)早就把目光投向了工廠和倉庫。
國內(nèi)走得比較快的一個(gè)例子是智元機(jī)器人。它的落地重心并不只是發(fā)布會上展示人形機(jī)器人走路、互動,而是把工業(yè)智能制造、物流分揀、上下料、搬運(yùn)等作為重點(diǎn)方向。智元的遠(yuǎn)征 A2-W 面向柔性制造,已經(jīng)在周轉(zhuǎn)箱拆碼垛、車間搬運(yùn)、上下料等場景里推進(jìn)應(yīng)用;精靈 G1 則更偏向倉儲分揀這類對泛化能力要求更高的任務(wù)。據(jù)了解,智元與富臨精工達(dá)成數(shù)千萬元項(xiàng)目合作,近百臺遠(yuǎn)征 A2-W 將落地工廠;在物流領(lǐng)域,德馬科技也訂購了數(shù)十臺精靈 G1,用于倉儲分揀。
(圖源:智元機(jī)器人)
優(yōu)必選先扎進(jìn)汽車廠,再向 3C 和物流擴(kuò)散。Walker S 系列本身就是面向工業(yè)場景開發(fā)的人形機(jī)器人,過去一年多已經(jīng)多次進(jìn)入車廠實(shí)訓(xùn),包括蔚來、極氪、一汽-大眾青島、奧迪一汽、比亞迪、北汽新能源等。它做的也不是抽象的「智能制造」,而是更具體的裝配、轉(zhuǎn)運(yùn)、質(zhì)檢、維護(hù)、物料處理等工序。比如 Walker S1 在極氪工廠進(jìn)行多機(jī)協(xié)同訓(xùn)練,還與無人叉車、物流設(shè)備配合完成汽車零部件入庫等任務(wù)。更值得注意的是,優(yōu)必選還把合作范圍擴(kuò)到富士康和順豐,前者為 3C 制造,后者則是深入到物流體系。
(圖源:優(yōu)必選)
小米與其他兩家都不太一樣,它先選擇了在自家工廠「實(shí)習(xí)」。今年 3 月,雷軍和小米技術(shù)官方披露,小米人形機(jī)器人已經(jīng)進(jìn)入小米汽車工廠「實(shí)習(xí)」,基于通用 VLA 基座模型 Xiaomi-Robotics-0,結(jié)合多模態(tài)感知和強(qiáng)化學(xué)習(xí),在自攻螺母上件工站、料箱搬運(yùn)等場景中進(jìn)行自主作業(yè)。其中,自攻螺母上件工站的數(shù)據(jù)十分亮眼,機(jī)器人連續(xù)自主運(yùn)行 3 小時(shí),雙側(cè)同時(shí)安裝成功率達(dá)到 90.2%,同時(shí)滿足最快 76 秒的產(chǎn)線生產(chǎn)節(jié)拍要求。
(圖源:小米)
最先被大眾以表演形式認(rèn)識到的魔法原子也在工業(yè)領(lǐng)域加速前進(jìn),比如 MagicBot 已經(jīng)進(jìn)入工廠產(chǎn)線進(jìn)行多項(xiàng)作業(yè)訓(xùn)練,覆蓋工業(yè)、商業(yè)、家庭等場景。雖然大家可能在 2026 年春晚上看到的魔法原子人形機(jī)器人和四足機(jī)器人因?yàn)槲枧_表演出圈,尤其是多機(jī)協(xié)同、動作編排和高密度調(diào)度,但其實(shí)它在工業(yè)的布局也比大眾想象得要更加深入。
(圖源:魔法原子)
在海外,特斯拉的 Optimus 更加激進(jìn)。Optimus 先是綁定自家工廠,在在特斯拉工廠中進(jìn)行過電池分揀、零部件搬運(yùn)等任務(wù)演示,另外,特斯拉也承諾 Optimus 將在完成驗(yàn)證后,對外出售。
(圖源:特斯拉)
不難看出,人形機(jī)器人行業(yè)的整體共識就是,第一批落地的崗位,可能不是表演、家庭,而是倉庫和流水線上。這些場景雖然沒有要求高度情緒交互,但也并不代表沒有實(shí)用場景,這些搬運(yùn)、上下料、分揀、裝配等崗位,很難被自動化完全替代,但人力去做,難免辛苦又無聊。從這個(gè)角度回到這次 Figure 看似有點(diǎn)「離奇」的分揀直播和分揀挑戰(zhàn)賽,就不是太難理解了,它只是用一種更像「表演」的形式告訴大眾,機(jī)器人或許真的要上崗了。
和人類「輪班制」,工廠機(jī)器人的下一個(gè)選擇
說到底,人形機(jī)器人今天還不是工廠里的最優(yōu)解。
如果只看單一動作的速度和精度,專用機(jī)械臂依然更成熟。它不需要長成人的樣子,也不需要理解太復(fù)雜的環(huán)境,只要在固定位置、固定軌跡、固定節(jié)拍里重復(fù)工作,就能跑得又快又穩(wěn)。對很多已經(jīng)高度自動化的產(chǎn)線來說,人形機(jī)器人未必有優(yōu)勢,甚至可能顯得有點(diǎn)「繞遠(yuǎn)路」。
如果和熟練工人比,它也沒有便宜到哪里去。就比如一個(gè)老工人看到包裹卡住、料箱歪了、零件掉到地上,伸手就能處理,機(jī)器人還是不一樣,它要先看見異常,再判斷發(fā)生了什么,最后規(guī)劃下一步動作,這中間還不包括識別出錯(cuò)造成的重復(fù)思考,效率大打折扣。
所以,人形機(jī)器人目前真正能解決的,可能不是那些已經(jīng)被機(jī)械臂吃透的標(biāo)準(zhǔn)化崗位,也不是立刻把熟練工人全部替掉,或許它可以成為與人類「輪班制」工作的存在,比如夜班、節(jié)假日工作等,又或者是在不改造一些老舊倉庫的情況下,增加自動化的崗位,讓機(jī)器人負(fù)責(zé)。
(圖源:robotmagazine)
像搬運(yùn)、分揀、質(zhì)檢、簡單裝配,都屬于這樣的工作。
但更現(xiàn)實(shí)的問題是,工廠并不總是追求某一個(gè)動作的極限效率。很多時(shí)候,它追求的是一條產(chǎn)線、一個(gè)倉庫、一個(gè)班次能不能穩(wěn)定運(yùn)轉(zhuǎn)。專用機(jī)械臂當(dāng)然快,但它通常需要固定工位,而熟練工人很難在這樣無聊的崗位上待上好幾年。
人形機(jī)器人的能力,正好在這兩者之間。它不一定在第一天就比機(jī)械臂快,也不一定立刻比人工便宜,但如果它能像人一樣使用現(xiàn)有通道、貨架、料箱和工具,就有機(jī)會繞開大規(guī)模改造產(chǎn)線的成本。對很多老工廠和物流倉庫來說,他們不需要先把空間改造成「機(jī)器人友好型」,機(jī)器人本來就有能力先適應(yīng)這個(gè)環(huán)境。
所以,人形機(jī)器人真正要跨過的門檻,不只是技術(shù)演示,也不是把目標(biāo)定在「比賽中勝過人類」,要讓企業(yè)信任才是關(guān)鍵。這里的信任,更多的是指這些機(jī)器人加入到生產(chǎn)流程里,會不會打亂原有的節(jié)奏,影響產(chǎn)線效率。只有充分展示了長期的穩(wěn)定性,才能真正走進(jìn)更多工廠,完成更多「無聊」的工作。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




