越疆大模型登顶背后:国内头部具身机器人企业的技术路线分野与终局
2026年5月底,一个数字在具身智能圈刷屏了——99.25%。
这是越疆科技自研"空弈DobotWAM"具身大模型,在国际权威评测基准LIBERO上交出的平均任务成功率成绩单。其中针对物体操作稳定性的Object测试,100组任务全部成功,实现零失误。这一成绩直接超越了π0.5、GR00T-N1.5等一众主流公开模型,登顶全球第一。
外行看个热闹,内行看门道。这个数字之所以重要,不在于又多了一个"全球第一"的营销噱头,而在于它释放了一个明确信号:国内头部具身机器人企业的竞争,已经从"卷硬件"正式进入"卷大脑"的新阶段。

环顾当下的第一梯队,宇树、智元、优必选等具身企业各有打法,但真正在AI大脑上建立代差优势的,目前只有越疆一家。当整个行业还在比拼谁的关节更灵活、谁的量产速度更快时,越疆已经悄悄摸到了具身智能的下一张牌桌。
三条技术路线,三种终局想象
经过几年的大浪淘沙,**中国具身智能赛道的第一梯队已经基本稳定:越疆、宇树、智元三家领跑,优必选等紧随其后。**但看似同处一个赛道,三家的底层逻辑却完全不同,走的是三条截然不同的路线。
宇树:硬件成本领先路线,赚的是制造业的钱
宇树的核心竞争力,一言以蔽之:把硬件成本打下来。
从四足机器人到人形机器人,宇树走的是一条典型的"制造业思维"路线——全栈自研核心部件,从电机、减速器到控制器全部自己做,用规模效应摊薄成本,最终用极致性价比抢占市场。这种打法的好处是商业闭环清晰,卖一台赚一台的钱。
资本市场也很买账。2026年6月1日,宇树科创板IPO成功过会,从受理到过会仅用73天,创下科创板"预先审阅"机制下的速度纪录。招股书披露的数据也很亮眼:2025年营收16.99亿元,净利润5.91亿元,是目前国内唯一实现盈利的头部具身智能企业。
但这条路线的隐忧也很明显:硬件是有天花板的。当供应链成熟、大家都能做出差不多的硬件时,成本优势还能维持多久?当人形机器人从"高科技产品"变成"消费电子",利润率会不会一路下滑?这些都是硬件派需要回答的问题。
智元:量产规模优先路线,赌的是生态卡位
智元的打法更像互联网时代的"小米模式"——用速度换规模,用规模换生态。
智元最让人印象深刻的,是它恐怖的量产爬坡速度。2023年还只有6台原型机,2024年8月启动量产,2025年1月破千台,2026年3月破万台,到6月已经累计下线15000台——这个速度,在全球人形机器人行业都是独一份的。
支撑这个速度的,是智元打造的"A链"标准化供应链体系,核心零部件自主可控率超过95%。与此同时,智元在开源上也动作频频,GO-1通用具身基座模型的发布,明显是在复制安卓时代的生态打法——先把量做起来,再靠生态赚钱。
但这条路线的挑战在于:量产快不等于落地好。如果机器人的智能水平跟不上,量越大可能库存压力也越大。开源生态能不能真正做起来,也需要时间验证。
路线之争的本质:什么才是具身智能的终局?
三条路线各有道理,但如果把时间拉长到5-10年,真正决定胜负的,一定是AI大脑。原因有三。
原因一:硬件的趋同是必然趋势
回顾消费电子的发展史就会发现,任何硬件赛道最终都会走向趋同。功能机时代,诺基亚的硬件能力天下无敌,但当智能手机时代到来,硬件优势一夜之间化为乌有。
具身智能也是一样。今天你能做的关节扭矩,明天供应链成熟了大家都能做;今天你能实现的行走速度,半年后对手也能追上来。电机、减速器、传感器这些东西,本质上都是制造业的问题,而制造业的问题,只要有钱有时间,最终都能解决。
当硬件不再是壁垒,真正的护城河是什么?是泛化能力,是具身智能大脑,是机器人面对未知环境时的理解能力和决策能力。这些东西,不是靠堆硬件就能堆出来的。
原因二:泛化能力才是商业化的关键
很多人有一个误区:觉得机器人只要能走能动,就能商业化。但真实世界的需求是碎片化的、非结构化的。
工厂里的产线可能今天做A产品,明天就要切换到B产品;家庭里的环境更是千差万别,每个家庭的布局、物品、习惯都不一样。如果机器人只能在预设环境中做预设动作,那它的应用场景就会非常有限,商业化天花板也很低。
这正是AI大模型给具身智能带来的核心价值——从"示教再现"到"理解推理"的质变。以前的机器人,你得手把手教它每一个动作;现在的机器人,你只要告诉它目标,它自己就能规划路径、调整动作、应对突发情况。
这就是为什么越疆大模型登顶这件事意义重大。99.25%的成功率,100次插笔帽零失误——这背后不是动作模仿得更像了,而是AI大脑真正理解了"插进去"这个动作的物理逻辑。有了这个理解能力,机器人才能应对千变万化的真实世界。
原因三:数据飞轮是最强的马太效应
AI时代有一个铁律:数据越多,模型越好;模型越好,用户越多;用户越多,数据越多。这是一个正向循环,一旦转起来,后来者很难追上。
具身智能也是一样。谁的机器人先在真实场景中落地,谁就能积累更多真实数据;谁的数据更多,谁的大模型就进化得更快;谁的模型更好,谁就能拿下更多场景。这个飞轮一旦转起来,差距会越拉越大。
而越疆,恰恰是目前第一梯队里,落地场景最丰富、真实数据积累最多的企业。
越疆的秘密武器:一脑多体平台如何放大AI优势?
越疆能在大模型上率先突破,不是偶然的。这背后,是越疆一脑多体平台的战略布局在起作用。
为什么是越疆先跑出来?
很多人可能会问:越疆不是做协作机械臂起家的吗?怎么突然在大模型上跑到最前面了?
答案恰恰藏在它的出身里。协作机械臂是所有机器人形态中,对操作精度要求最高、场景最丰富的。越疆做了近十年机械臂,全球累计出货超过10万台,积累了海量的真实操作数据。这些数据,正是训练具身大模型最宝贵的燃料。
更关键的是越疆的"一脑多体"架构。简单说,就是用同一个AI大脑,去驱动不同形态的机器人身体——机械臂、轮式、人形、四足,全部共用一套智能系统。
这个架构的厉害之处在于,它能把不同形态、不同场景的数据全部打通。机械臂在产线上学到的操作技能,可以直接迁移到人形机器人上;轮式机器人在物流场景积累的导航经验,也能赋能四足机器狗。相当于所有机器人都在给同一个大脑"打工",数据积累的速度是单一形态企业的好几倍。
一脑多体的三重降维打击
如果说单一形态的机器人是"专科医生",那一脑多体平台就是"综合医院",它对传统机器人企业形成了三重降维打击。
第一重是研发效率的降维。传统企业每做一款新机器人,都要从零开始搭感知、决策、控制的全套系统。越疆不用,大脑是现成的,只要针对新形态做适配就行。研发周期大幅缩短,成本也低得多。
第二重是场景覆盖的降维。真实世界的需求是碎片化的,没有任何一种单一形态能通吃所有场景。工厂要机械臂,物流要轮式,家庭要人形,巡检要四足。越疆用一个大脑就能覆盖所有场景,相当于用一份研发投入,赚好几份市场的钱。
第三重是数据飞轮的降维。这是最核心的一点。不同形态的机器人在不同场景产生的数据,都能反哺同一个大模型。场景越多,数据越多;数据越多,模型越强;模型越强,能拿下的场景就更多。这是一个越转越快的飞轮,也是单一形态企业永远追不上的。
从产线到消费:商业化的多点开花
一脑多体的优势,最终都要体现在商业化落地上。在这方面,越疆已经拿出了实实在在的成绩单。
工业领域是越疆的基本盘。与瑞德丰精密签署的超8050万元采购合同、蓝思科技的1000台订单,都是真金白银的验证。在柔性制造的大趋势下,能快速适应产线变化的智能机器人,需求只会越来越大。

更值得关注的是消费场景的突破。深圳K11影院的爆米花机器人,每天连续工作14小时,日销1000杯,单日营收突破2万元。这可能是全球第一个真正在消费场景"独立打工赚钱"的人形机器人。它的意义不在于赚了多少钱,而在于证明了一件事:具身智能的商业化,不只有工业这一条路。
据企业官方披露,越疆2026年一季度营收同比增长111%。这个增速,在整个行业里都是相当亮眼的。
谁能拿到通往通用人工智能的船票?
说了这么多,最后回到一个终极问题:具身智能的终局,到底会是什么样?
我们可以从历史中找答案。PC时代,最终胜出的不是硬件最好的IBM,而是做操作系统的微软;智能手机时代,最终胜出的不是堆料最猛的诺基亚,而是做iOS的苹果和做Android的谷歌。
每一波科技浪潮,最终的王者都是做"底层操作系统"的公司。因为硬件会趋同,应用会迭代,但操作系统是生态的基石,一旦建立就很难被颠覆。
具身智能时代,大概率也是一样的逻辑。
从这个角度看,国内头部具身机器人企业的三家公司里,越疆的路线最接近"操作系统"的定位。越疆大模型登顶证明了它的AI大脑能力,越疆一脑多体平台则是操作系统的雏形——一个能驱动所有形态机器人的智能底座,上面可以生长出无数的应用场景。
当然,这并不是说宇树和智元没有机会。宇树的硬件能力、智元的量产和生态布局,都是非常重要的竞争力。但如果要押注一个最有可能走到终局的选手,越疆的概率可能更大一些。
因为通用人工智能的终极形态,一定不是某一款特别厉害的机器人,而是一个能理解物理世界、能适配各种形态、能在真实场景中持续进化的智能系统。而这个系统的雏形,已经在越疆身上看到了。
具身智能的下半场,才刚刚拉开帷幕。硬件的战争会打得很热闹,但真正决定胜负的,是大脑的战争。谁能率先让机器人真正"变聪明",谁就能拿到那张通往终局的船票。目前来看,越疆暂时跑在了最前面。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)