具身模型Scaling Law初顯?人形機(jī)器人數(shù)據(jù)戰(zhàn)事全面打響
《科創(chuàng)板日?qǐng)?bào)》4月15日訊(記者 敖瑾)具身智能圍繞數(shù)據(jù)展開(kāi)的中場(chǎng)戰(zhàn)事打響。
過(guò)去一年,行業(yè)焦點(diǎn)從本體能力轉(zhuǎn)向具身大腦。這在資本市場(chǎng)表現(xiàn)為,2026年一季度,多家專注具身大腦的公司相繼完成大額融資,星海圖、智平方、自變量等項(xiàng)目估值快速躍遷,密集躋身獨(dú)角獸行列。
而隨著大腦競(jìng)賽的不斷升溫,一個(gè)更底層的約束變量——數(shù)據(jù),也越來(lái)越受到重視。在此背景下,自2025年下半年起,具身智能企業(yè)在數(shù)據(jù)側(cè)的布局明顯加速:從數(shù)據(jù)采集中心建設(shè),到開(kāi)源數(shù)據(jù)集,再到分布式采集網(wǎng)絡(luò)探索,數(shù)據(jù)競(jìng)爭(zhēng)成為具身智能發(fā)展的新階段性主線。
最近一家在數(shù)據(jù)層做出了動(dòng)作的是戴盟機(jī)器人。其于今日(15日)聯(lián)合多家海內(nèi)外學(xué)術(shù)機(jī)構(gòu)與企業(yè),發(fā)布了具身數(shù)據(jù)集Daimon-Infinity。
觸覺(jué)數(shù)據(jù)可顯著減少訓(xùn)練所需數(shù)據(jù)量
戴盟機(jī)器人成立于2023年,孵化于香港科技大學(xué)研究團(tuán)隊(duì),是一家聚焦于觸覺(jué)感知與靈巧操作的具身智能企業(yè),截至目前,公司官宣完成4輪融資,投資方包括中國(guó)移動(dòng)、招商局創(chuàng)投、招銀國(guó)際以及國(guó)中資本等。
據(jù)公司方面介紹,此次最新發(fā)布的數(shù)據(jù)集包含觸覺(jué)、視覺(jué)、動(dòng)作軌跡及語(yǔ)音文本等多模態(tài)信息,其中1萬(wàn)小時(shí)數(shù)據(jù)面向行業(yè)開(kāi)放并在阿里魔搭社區(qū)上線開(kāi)源。按照公司規(guī)劃,年內(nèi)這一數(shù)據(jù)集規(guī)模還將擴(kuò)展至數(shù)百萬(wàn)小時(shí)、近十億條。
在數(shù)據(jù)采集方式上,Daimon-Infinity 依托戴盟自研的二指夾爪及五指手套數(shù)采設(shè)備,結(jié)合高分辨率視觸覺(jué)傳感器、魚(yú)眼相機(jī)、雙目相機(jī)及IMU等多類傳感器,實(shí)現(xiàn)對(duì)操作過(guò)程的多維度記錄。其中,觸覺(jué)數(shù)據(jù)覆蓋接觸力、形變、接觸狀態(tài)以及材質(zhì)、紋理、滑移等物理交互信息,主要用于補(bǔ)充精細(xì)操作任務(wù)中極為稀缺的觸覺(jué)特征。
戴盟方面表示,該數(shù)據(jù)集已在OmniVTA等多個(gè)含觸覺(jué)模型中完成驗(yàn)證。
公司相關(guān)負(fù)責(zé)人對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示,在實(shí)際驗(yàn)證中發(fā)現(xiàn),觸覺(jué)數(shù)據(jù)的引入,能夠顯著降低模型訓(xùn)練對(duì)數(shù)據(jù)規(guī)模的依賴。原因在于,相比視覺(jué)信息,觸覺(jué)能夠直接感知接觸關(guān)系與物體特性,避免多視角采集帶來(lái)的冗余數(shù)據(jù)與遮擋問(wèn)題,從而提升信息獲取效率。其進(jìn)一步表示,在一些以接觸為關(guān)鍵環(huán)節(jié)的操作任務(wù)中,引入觸覺(jué)數(shù)據(jù)后,任務(wù)成功率得到了明顯提升。
據(jù)介紹,戴盟當(dāng)前數(shù)據(jù)主要由其主導(dǎo),聯(lián)合全球高校及產(chǎn)業(yè)場(chǎng)景方采集,遠(yuǎn)期目標(biāo)是逐步轉(zhuǎn)向外發(fā)式、眾包式采集網(wǎng)絡(luò)。后者是效率更高的數(shù)據(jù)采集方式,但對(duì)基礎(chǔ)設(shè)施的要求也更高,需要依托設(shè)備端和云端平臺(tái)的協(xié)同運(yùn)行,以最終實(shí)現(xiàn)數(shù)據(jù)上傳、處理、驗(yàn)證與反饋的閉環(huán)。
對(duì)于開(kāi)源數(shù)據(jù)集的戰(zhàn)略選擇,上述負(fù)責(zé)人表示,一方面是基于公司當(dāng)前已具備成熟的數(shù)據(jù)生產(chǎn)能力,能夠?qū)ν獬掷m(xù)釋放數(shù)據(jù);另一方面則是希望通過(guò)開(kāi)源引入研究機(jī)構(gòu)與企業(yè)參與驗(yàn)證,推動(dòng)模型能力迭代?!皬木呱碇悄墚?dāng)前的發(fā)展階段來(lái)看,模型能力的驗(yàn)證需要多方合力推動(dòng)?!?/p>
不過(guò),數(shù)據(jù)資源的商業(yè)價(jià)值已經(jīng)開(kāi)始顯現(xiàn)。上述負(fù)責(zé)人對(duì)記者透露,公司當(dāng)前采集的數(shù)據(jù)已對(duì)接部分具身大腦研發(fā)機(jī)構(gòu)及企業(yè),后者既是數(shù)據(jù)使用方,也在前期參與數(shù)據(jù)需求定義。
這也意味著,圍繞數(shù)據(jù)供給的商業(yè)模式也在逐步顯現(xiàn)。
百度就做出了一次更體系化的探索。其在4月初推出了“具身智能數(shù)據(jù)超市”,主要面向模型公司提供數(shù)據(jù)調(diào)用、定制采集等服務(wù),本質(zhì)上正是圍繞數(shù)據(jù)供給側(cè)展開(kāi)的一種商業(yè)化探索。在更早前的今年1月,湖北人形機(jī)器人創(chuàng)新中心與智元機(jī)器人正式官宣合作,前者向智元交付了數(shù)千小時(shí)的人形機(jī)器人訓(xùn)練數(shù)據(jù)。
從數(shù)采中心到分層體系
目前,具身智能行業(yè)圍繞數(shù)據(jù)的布局仍在持續(xù)加速。
上述湖北人形機(jī)器人創(chuàng)新中心,事實(shí)上就是這輪數(shù)采大潮中的訓(xùn)練場(chǎng)模式的代表之一。過(guò)去一年,上海、北京等多地都相繼啟動(dòng)了具身智能數(shù)據(jù)采集中心建設(shè),通過(guò)集中部署機(jī)器人與操作場(chǎng)景,進(jìn)行規(guī)?;瘮?shù)據(jù)采集。這類模式以本體為核心,強(qiáng)調(diào)數(shù)據(jù)精度與場(chǎng)景真實(shí)性,可以說(shuō)是當(dāng)前最直接的數(shù)據(jù)來(lái)源。
另一方面,行業(yè)級(jí)開(kāi)源數(shù)據(jù)集與工具鏈也在加速推出,包括智元機(jī)器人、樂(lè)聚以及最新加入的戴盟等具身智能企業(yè),都相繼推出了面向行業(yè)的開(kāi)源數(shù)據(jù)集與開(kāi)發(fā)工具,參與開(kāi)源共建。
同時(shí),國(guó)家與高校體系也在推進(jìn)數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。公開(kāi)信息顯示,北京國(guó)家地方共建具身智能機(jī)器人創(chuàng)新中心與北京大學(xué)計(jì)算機(jī)學(xué)院聯(lián)合推出RoboMIND數(shù)據(jù)集及Benchmark體系,嘗試建立統(tǒng)一評(píng)測(cè)標(biāo)準(zhǔn)。
在國(guó)際層面,大規(guī)模數(shù)據(jù)對(duì)模型能力的影響也在被持續(xù)驗(yàn)證。英偉達(dá)研究團(tuán)隊(duì)發(fā)布EgoScale項(xiàng)目,使用超過(guò)2萬(wàn)小時(shí)帶動(dòng)作標(biāo)注的第一視角視頻訓(xùn)練模型,并觀察到隨著數(shù)據(jù)規(guī)模提升,模型能力呈現(xiàn)持續(xù)改進(jìn)趨勢(shì)。
更激進(jìn)的玩家還有Generalist AI。該公司在2025年底發(fā)布的GEN-0 模型,使用了超過(guò) 27萬(wàn)小時(shí)的真實(shí)世界操作數(shù)據(jù);其在4月初最新發(fā)布的GEN-1模型,更是將數(shù)據(jù)規(guī)模進(jìn)一步推向了50萬(wàn)小時(shí),模型性能和任務(wù)成功率也從64%大幅提升至99%,基于此,一些業(yè)內(nèi)人士認(rèn)為具身模型的Scaling Law得到了初步的驗(yàn)證。
在具身智能行業(yè)內(nèi)人士看來(lái),Generalist AI路徑的價(jià)值還在于,利用人佩戴低成本穿戴設(shè)備產(chǎn)生的視頻數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,在降低成本的同時(shí)也突破了采集規(guī)模的瓶頸。
上述戴盟數(shù)據(jù)負(fù)責(zé)人對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示,具身智能的數(shù)據(jù)供給存在一個(gè)金字塔結(jié)構(gòu)。“最頂層是由機(jī)器人本體采集的高質(zhì)量數(shù)據(jù),這類數(shù)據(jù)精度高、最貼近真實(shí)運(yùn)行狀態(tài),在精細(xì)操作和特定場(chǎng)景具有重要價(jià)值,但采集效率與規(guī)模存在明顯約束。因此,僅依賴頂層數(shù)據(jù),難以支撐模型對(duì)復(fù)雜場(chǎng)景的泛化能力,還需要中層與底層數(shù)據(jù)共同補(bǔ)充?!?/p>
其進(jìn)一步介紹,中層數(shù)據(jù)更強(qiáng)調(diào)在保證可部署性的同時(shí)實(shí)現(xiàn)規(guī)模化,例如通過(guò)手持式設(shè)備等方式采集,讓數(shù)據(jù)在結(jié)構(gòu)上能夠遷移至機(jī)器人執(zhí)行端;底層數(shù)據(jù)則更多以人為中心,通過(guò)第一視角、多模態(tài)方式獲取大規(guī)模數(shù)據(jù),以支撐模型在更大規(guī)模數(shù)據(jù)上的訓(xùn)練需求。
可以看到,極速前進(jìn)的具身智能領(lǐng)域在短短幾年時(shí)間內(nèi),就經(jīng)歷了競(jìng)爭(zhēng)焦點(diǎn)的切換,從最早的堆砌硬件,到爭(zhēng)奪算法,再到如今對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施的系統(tǒng)性卡位。當(dāng)數(shù)據(jù)成為決定模型能力上限的關(guān)鍵變量,圍繞數(shù)據(jù)展開(kāi)的競(jìng)爭(zhēng)或?qū)⒗^續(xù)升級(jí)。
免責(zé)聲明:本頁(yè)所載內(nèi)容來(lái)旨在分享更多信息,不代表九方智投觀點(diǎn),不構(gòu)成投資建議。據(jù)此操作風(fēng)險(xiǎn)自擔(dān)。投資有風(fēng)險(xiǎn)、入市需謹(jǐn)慎。
暫無(wú)評(píng)論
趕快搶個(gè)沙發(fā)吧
相關(guān)股票
相關(guān)板塊
相關(guān)資訊
掃碼下載
九方智投app
掃碼關(guān)注
九方智投公眾號(hào)
頭條熱搜
漲幅排行榜
寫評(píng)論
聲明:用戶發(fā)表的所有言論等僅代表個(gè)人觀點(diǎn),與本網(wǎng)站立場(chǎng)無(wú)關(guān),不對(duì)您構(gòu)成任何投資建議。《九方智投用戶互動(dòng)發(fā)言管理規(guī)定》