必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會展特約記者

全球首個(gè)!銀河通用全自主人形機(jī)器人打網(wǎng)球火爆全球

2026年3月23日 10:35CCTIME飛象網(wǎng)

近日,銀河通用機(jī)器人與真人選手的連續(xù)自主網(wǎng)球?qū)Υ蛞曨l刷爆全網(wǎng)。

這背后是銀河通用機(jī)器人發(fā)布的最新成果——全球首個(gè)面向網(wǎng)球?qū)沟娜诵螜C(jī)器人全身實(shí)時(shí)智能規(guī)控算法:LATENT。

不靠預(yù)編程,銀河通用世界范圍內(nèi)首次攻克人形機(jī)器人在長程、高動態(tài)對抗場景中的實(shí)時(shí)決策與復(fù)雜運(yùn)動難題。

視頻一經(jīng)發(fā)布,央視新聞第一時(shí)間進(jìn)行報(bào)道點(diǎn)贊;

相關(guān)內(nèi)容在海外社交平臺爆火,馬斯克看到后立即關(guān)注回復(fù);

AI知名研究員Andrej Karpathy自發(fā)評論表示驚嘆,一度"懷疑"視頻是由 AI 生成。

然而,視頻呈現(xiàn)的是一場真實(shí)"對抗":人類與人形機(jī)器人在場地中連續(xù)多回合對拉。

但真正打動大家的,不止是"機(jī)器人能打網(wǎng)球",而是:機(jī)器人不是在執(zhí)行預(yù)先編程的動作,而是在像人一樣——全場跑動、自主決策、精確擊打。

在所有運(yùn)動場景中,網(wǎng)球是人形機(jī)器人最難的考題:

高速來球逼迫瞬時(shí)判斷,全身協(xié)同決定回球質(zhì)量,滿場奔跑則持續(xù)考驗(yàn)爆發(fā)力與控制力。

那么,當(dāng)機(jī)器人真正站上球場,它能否像人類運(yùn)動員一樣完成判斷、移動與連續(xù)回合擊球?

畫面中,機(jī)器人迅速移動腳步調(diào)整站位,上下半身協(xié)同揮拍擊球,并將球精準(zhǔn)回?fù)舻街付ㄎ恢。面對各種來球,它能夠持續(xù)調(diào)整身體姿態(tài)與擊球時(shí)機(jī),與不同水平的網(wǎng)球?qū)κ滞瓿啥嗷睾线B續(xù)對拉。

銀河通用機(jī)器人揮拍擊球

在網(wǎng)球這樣的高動態(tài)、高對抗環(huán)境中,機(jī)器人面對的是時(shí)速超過幾十公里的來球、變幻莫測的落點(diǎn)軌跡,以及對手不斷變化的擊球節(jié)奏。

更重要的是,這一能力并非依賴預(yù)編程動作實(shí)現(xiàn),而是機(jī)器人通過深度強(qiáng)化學(xué)習(xí)自主習(xí)得——

全球首次在人形機(jī)器人上實(shí)現(xiàn)高動態(tài)網(wǎng)球?qū)Υ颍瑱C(jī)器人正在實(shí)現(xiàn)從"機(jī)械復(fù)刻動作"向"智能決策響應(yīng)"的底層跨越。

銀河通用機(jī)器人智能決策響應(yīng)擊球的多角度瞬間

這背后,是來自銀河通用與清華大學(xué)聯(lián)合提出的新研究:

LATENT(Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data)。

研究團(tuán)隊(duì)提出了一種新的機(jī)器人運(yùn)動學(xué)習(xí)方法,使人形機(jī)器人能夠從不完美的人類動作數(shù)據(jù)中學(xué)習(xí)復(fù)雜的運(yùn)動技能,并在真實(shí)世界中完成高動態(tài)、高敏捷的網(wǎng)球擊球與對打任務(wù)。

這其中的關(guān)鍵在于:

LATENT并沒有沿用傳統(tǒng)"高質(zhì)量遙操數(shù)據(jù)進(jìn)行模仿學(xué)習(xí)"的路徑,而是從現(xiàn)實(shí)世界更可獲取的數(shù)據(jù)出發(fā),重新設(shè)計(jì)了運(yùn)動能力的學(xué)習(xí)方式。

從不完美的人類數(shù)據(jù)中,構(gòu)建支持高動態(tài)、高敏捷全身運(yùn)動能力的"運(yùn)動小腦"

傳統(tǒng)的人形機(jī)器人運(yùn)動學(xué)習(xí),往往依賴高質(zhì)量遙操作數(shù)據(jù)進(jìn)行模仿學(xué)習(xí)。但在網(wǎng)球這樣的高動態(tài)運(yùn)動場景中,這類數(shù)據(jù)幾乎難以獲取。

一方面,完整記錄一場網(wǎng)球比賽的人體運(yùn)動,需要高精度、大范圍動作捕捉系統(tǒng);另一方面,擊球過程中手部細(xì)節(jié)的捕捉要求極高,使得數(shù)據(jù)采集成本極高且技幾乎不可獲得。

LATENT提供了一種完全不同的思路:

它不依賴昂貴且?guī)缀醪豢色@得的運(yùn)動員全場比賽跑動數(shù)據(jù),也不依賴精確的擊球手部軌跡,而是僅通過收集前后移動、正反手揮拍、橫向步伐等碎片化動作,讓機(jī)器人自主學(xué)習(xí)運(yùn)動技能。

銀河通用與清華大學(xué)聯(lián)合提出的新研究LATENT 框架圖

這些數(shù)據(jù),在LATENT中被構(gòu)建為"運(yùn)動小腦",從而解鎖大范圍跑動、急停調(diào)整,以及對各種來球的穩(wěn)定回?fù)裟芰Α?/P>

換句話說,LATENT從源頭上解決了一個(gè)長期限制機(jī)器人發(fā)展的關(guān)鍵問題:

如何利用可獲得的數(shù)據(jù),學(xué)習(xí)復(fù)雜且不可簡化的運(yùn)動能力,從而打通機(jī)器人運(yùn)動技能的可擴(kuò)展學(xué)習(xí)路徑。

定義"運(yùn)動技能空間",讓動作既自然又可控

僅僅擁有動作片段,并不足以完成復(fù)雜運(yùn)動任務(wù)。真正的關(guān)鍵在于:如何將這些零散經(jīng)驗(yàn)組織成可執(zhí)行、可泛化的運(yùn)動能力。

為此,研究團(tuán)隊(duì)在隱空間中構(gòu)建了一個(gè)"運(yùn)動技能空間"。

在這一空間中:

碎片化的人類動作被組織為可組合、可泛化的技能結(jié)構(gòu);

在訓(xùn)練過程中,對關(guān)鍵自由度引入隨機(jī)擾動,使技能具備可修正、可探索能力。

這一空間帶來了一個(gè)非常關(guān)鍵的效果:

機(jī)器人不再只是復(fù)刻已有動作,而是獲得了一種既保留自然運(yùn)動風(fēng)格、又允許細(xì)節(jié)優(yōu)化的技能表示

在強(qiáng)化學(xué)習(xí)驅(qū)動下,規(guī)劃器可以在這個(gè)技能空間中進(jìn)行采樣與組合。面對不同來球,機(jī)器人可以基于球速、落點(diǎn)、自身姿態(tài)等信息,對步伐、揮拍節(jié)奏和身體姿態(tài)進(jìn)行實(shí)時(shí)規(guī)劃,在保持自然運(yùn)動風(fēng)格的同時(shí)實(shí)現(xiàn)穩(wěn)定擊球。

同時(shí),在執(zhí)行過程中,機(jī)器人還會根據(jù)實(shí)時(shí)感知進(jìn)行微調(diào),尤其是在擊球末端對揮拍軌跡進(jìn)行修正,從而實(shí)現(xiàn)對回球方向與落點(diǎn)的精細(xì)控制。

"隱空間動作屏障":像人類網(wǎng)球運(yùn)動員般優(yōu)雅的擊球

在網(wǎng)球這樣的高動態(tài)對抗中,一個(gè)常見問題是:如果完全依賴強(qiáng)化學(xué)習(xí)進(jìn)行探索,系統(tǒng)往往會發(fā)展出"投機(jī)策略"。

例如,通過抖動、非自然動作勉強(qiáng)完成擊球——任務(wù)完成了,但動作質(zhì)量嚴(yán)重下降。

為了解決這一問題,研究團(tuán)隊(duì)提出了隱空間動作屏障(Latent Action Barrier, LAB)。

隱空間動作屏障(LAB)

LAB為策略學(xué)習(xí)提供了一種約束但不僵化的探索機(jī)制:

一方面,允許策略針對不同來球、自主跑位、擊球動作靈活調(diào)整動作;另一方面,限制其不會輕易偏離人類自然運(yùn)動模式。

這種"有約束的探索",使機(jī)器人在訓(xùn)練過程中既能不斷適應(yīng)復(fù)雜環(huán)境,又不會犧牲動作的自然性與穩(wěn)定性。

最終結(jié)果是:機(jī)器人不僅"能打到球",而且能夠在高動態(tài)環(huán)境中以接近人類運(yùn)動員的方式完成穩(wěn)定擊球,且動作流暢、節(jié)奏自然。

實(shí)驗(yàn)驗(yàn)證:LATENT 不僅打得準(zhǔn),并且打得絲滑!

為了驗(yàn)證LATENT的性能,研究團(tuán)隊(duì)將策略部署在29自由度的人形機(jī)器人上,并在仿真與真實(shí)環(huán)境中進(jìn)行了大量測試。

首先,實(shí)驗(yàn)系統(tǒng)對比了LATANT 與經(jīng)典基線算法例如:PPO、AMP 的性能表現(xiàn)。

LATANT 在擊球成功率(SR),回球落點(diǎn)精準(zhǔn)性(DE),關(guān)節(jié)順滑程度(Smth)與關(guān)節(jié)力矩(Torque)上展現(xiàn)出了絕對優(yōu)勢:LATENT 不僅打得準(zhǔn),并且打得絲滑!

在真實(shí)世界測試中,機(jī)器人完成了連續(xù)20局的人實(shí)驗(yàn)類-機(jī)器人網(wǎng)球?qū)荣,覆蓋機(jī)器人正手擊球、反手擊球、網(wǎng)前擊球、后場擊球等多種場景。

真實(shí)世界復(fù)雜多變,為了在不同場地、不同材質(zhì)的網(wǎng)球地面上進(jìn)行穩(wěn)定擊打,研究者在仿真中對地面彈性系數(shù)、空氣阻力、網(wǎng)球質(zhì)量、機(jī)器人本體動力學(xué)性質(zhì)等多個(gè)方面進(jìn)行了隨機(jī)擾動,并借助GPU 進(jìn)行大規(guī)模強(qiáng)化學(xué)習(xí)訓(xùn)練:

LATENT 真機(jī)性能表現(xiàn)的消融對比

實(shí)驗(yàn)顯示,機(jī)器人在真實(shí)世界與人類進(jìn)行網(wǎng)球?qū),正手成功率超過90%,反手接近 80%,網(wǎng)前成功率接近 90%,底線附近擊球成功率超過 80%。

實(shí)驗(yàn)證明了 LATENT 在不同球場位置、不同擊球動作的表現(xiàn)下均有著較高的擊球成功率和擊球精準(zhǔn)度,而研究者發(fā)現(xiàn)域隨機(jī)化的加入和訓(xùn)練中觀察噪聲的引入對機(jī)器人在真機(jī)上的性能表現(xiàn)起到關(guān)鍵作用,測試時(shí),機(jī)器人展現(xiàn)出了極強(qiáng)的運(yùn)動自然性和穩(wěn)定性。

更進(jìn)一步,銀河通用團(tuán)隊(duì)在仿真中統(tǒng)計(jì)了機(jī)器人 400 輪的網(wǎng)球回?fù)暨^程中的機(jī)器人全場跑動范圍,并可視化了機(jī)器人在網(wǎng)球場上的跑動范圍和擊球軌跡:

實(shí)驗(yàn)證明,搭載LATENT 的策略的跑動范圍覆蓋全場,有能力接到來自各個(gè)方向的刁鉆擊球!

除了人與機(jī)器人的對打,研究團(tuán)隊(duì)還展示了兩個(gè)機(jī)器人之間的連續(xù)對練場景。這不禁讓人聯(lián)想到十年前通過自我博弈不斷提升棋力、最終戰(zhàn)勝柯潔的AlphaGo。

雖然兩者技術(shù)路徑并不相同,但機(jī)器人之間的互動對練,也為未來機(jī)器人的自主學(xué)習(xí)與持續(xù)能力進(jìn)化帶來了更多想象空間。

當(dāng)機(jī)器人能夠像人類一樣移動、判斷并完成復(fù)雜運(yùn)動任務(wù)時(shí),人形機(jī)器人的應(yīng)用邊界也將進(jìn)一步擴(kuò)展。從運(yùn)動娛樂到家庭服務(wù),再到各種復(fù)雜的人機(jī)協(xié)作場景,具身智能正在逐漸走出實(shí)驗(yàn)室,進(jìn)入真實(shí)世界。

從"打網(wǎng)球",到具身智能的下一步

值得關(guān)注的是,這一突破依托于銀河通用已構(gòu)建的全身全手端到端具身大模型"銀河星腦(AstraBrain)"。

人形機(jī)器人實(shí)現(xiàn)與人類網(wǎng)球?qū)Υ,正是銀河通用在人形機(jī)器人大小腦方面探索的關(guān)鍵一步,這一突破也為其后續(xù)在復(fù)雜場景中的落地應(yīng)用展現(xiàn)了巨大的潛力與價(jià)值。

它所驗(yàn)證的是,人形機(jī)器人在復(fù)雜動態(tài)環(huán)境中已經(jīng)實(shí)現(xiàn)實(shí)時(shí)感知、決策與全身協(xié)同控制的能力。

這種寶貴能力,是真實(shí)世界任務(wù)共同依賴的技術(shù)基礎(chǔ)。

無論是在工業(yè)場景中的精細(xì)操作,還是在零售、服務(wù)等開放環(huán)境中的持續(xù)交互,乃至走進(jìn)家庭面對更加多變的生活環(huán)境,核心都在于機(jī)器人能否在變化中保持穩(wěn)定判斷,在運(yùn)動中自主完成閉環(huán)決策。

從這個(gè)角度看,網(wǎng)球并非應(yīng)用終點(diǎn),而是一個(gè)高度濃縮的動態(tài)能力測試場。

機(jī)器人所對應(yīng)的高速移動、連續(xù)對抗與實(shí)時(shí)決策,正是復(fù)雜場景所共同具備的特征。LATENT 在這一場景中的表現(xiàn),為未來更廣泛的場景應(yīng)用提供了堅(jiān)實(shí)的能力驗(yàn)證。

這是全球范圍內(nèi)人形機(jī)器人在真實(shí)對抗環(huán)境中實(shí)現(xiàn)全自主運(yùn)動的重要突破,更標(biāo)志著銀河通用機(jī)器人正引領(lǐng)行業(yè),開啟人形機(jī)器人運(yùn)動全自主、無編排,走向場景應(yīng)用的新時(shí)代。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 2026十大科技趨勢

    2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順?biāo)欤?/P>[詳細(xì)]

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像