人形机器人开源之路怎么走?

原创 安德鲁人形机器人 安德鲁人形机器人 2025年03月25日 20:58 上海

    今天聊一聊人形机器人的开源。原因有二,一是当前虽然人形机器人已然一副全社会关注的人们赛道之势,但事实上,它刚开始步入从“玩具”属性向“工具”属性变迁之路,而这个过程,开源会是重要的加速手段之一;其二,起源机器人创立之初,就把开源开放,作为起源人形机器人平台的基本属性,有必要通过文字的形式,和大家分享,为何一开始,我们就把人形机器人开源作为我们的重要目标,我们又是准备如何开源的。

图片

    其实最早关注人形机器人开源,是在2024年4月出,当时推特平台上有一段非常流行的车库人形机器人视频,也是K-Scale Lab的前身,我也是国内最早跟踪并介绍这个项目的人。后面我又陆续介绍了同样来自北美的开源项目RedRabbitRobot,法国的人形机器人开源项目Reachy2,再后来3D打印的桌面人形机器人Zeroth Bot。当然,我们中国的人形机器人开源项目也不少,人形机器人(上海)公司的青龙平台,北京的天工平台,智元的灵犀平台。如果我们进一步放大范围,不局限在人形机器人本体上,那还有更多和人形机器人关联的开源发布,比如智元去年发布的百万真机数据集,傅利叶上周刚发布的全尺寸人形机器人数据集Fourier Action Net,等等等等。

    但是,有心的行业内的人发现,这些发布过后,似乎一切又恢复平静了,没有引来任何的后续反响。搜索相关的关键字,很少能够看到成功复刻开源本体,或者宣称已经用上这些开源数据的人或者团体。所以,我们需要问一个问题:为何人形机器人行业的开源,从结果来看,发挥的最大价值,仅仅是PR?

    我想从如下的几个维度,来回答这个问题。

                    >>为何当下人形机器人开源未盛行?<<

1. 开源本体缺少场景

    要想开源盛行,必须使用开源的人多。要想使用开源的人多,需要回答为什么这些人要用开源的项目?使用开源的项目和使用闭源的商业项目优势又在哪里?

    如开题所说,现在整个人形机器人行业还处在“玩具”的产品属性标签里无法自拔,能够落地的场景,除了展厅、旅游、表演等有限的“娱乐”场景外,真正发挥“服务价值”的场景还非常有限。这种环境之下,能够成为开源项目“用户”的人群,仅剩下有技术属性的发烧友(因为复刻技术门槛高)。再者,因为复刻之后,缺少场景,能够让复刻的机器人展示、使用、迭代的机会减少,不能形成闭环,发烧友的热情锐减,进一步流失“用户”。

    总结来说,场景,是人形机器人开源的“土壤”。带有养分的“土壤”缺失,是当下开源未起的主因。

2. 未能形成完整的技术栈开源(开源本体,模型,开源工具链,开源数据集

    另一个维度是整个技术栈的开源是否存在,目前开源的项目中,本体,模型,数据,工具链的开源大都是分开的,且很少等捏合在一起发挥作用,比如ExBody这个模型的开源,但没有一个开源的本体项目可以跑起来,经过验证的只有宇树的G1。我觉得这也是限制开源盛行的一大因素。当然这也和当前开源本体项目的质量不高,不能匹配科研团队的活动有很大的关系。如果将来,越来越多的科研团队,使用开源本体做研究,发Paper,一定会加速开源的发展。

3. 开源数据集,和硬件的耦合性过高,而硬件是高成本的

    第三点主要是尝试解释为何智元、傅利叶发布全尺寸整机数据后,在研发侧反响平平。我想里面一个原因是当前数据采集,以及后续的二次利用,和硬件的耦合度过高,而当前的硬件,无论是价格成本,还是易得性(当前硬件采购的lead time非常长)都不理想,是当前开源的主体“客户群”不能够轻易负担的。哪天如果有小团队或者个人,宣称使用复刻的“青龙”或者“天工”,用上智元或者傅利叶的数据集,训练出一个新的效果,这个闭环就成立了。

    说了这么多为何人形机器人当前未能盛行,我想也非常有必要解释一下,从个人的维度,认为将来人形机器人开源之路怎么样才能行。

                    >>人形机器人开源之路怎么走?<<

1. 培育带有养分的土壤

    如上面所说,“土壤”是“场景”,而现状作为“玩具”属性的人形机器人,本身的场景的确非常有限。但就说“玩具”,也并非无计可想。在娱乐的面上深挖,人形机器人的竞技,特别是类似格斗这一类的对抗类的竞技,因为可以区分技术和技艺的优劣,形成开源用户之间的互动与竞争,能够带来进一步对开源社区的反哺,可以称之“带有养分的土壤”。这一类土壤,解决了落地场景的问题,但随之而来的难题是土壤的第一次形成,会是一个比较难的0到1的过程。

    当然,娱乐不是人形机器人的所有,但是娱乐会是当前阶段建立这个生态最合适的一剂药引。

2. 构建土壤、河水、日照一体的生

    想要“种子”成长,光是有“土壤”显然不行。还得有完整的生态。要想让用户群真正用起来,“开源社区”、“改装社区”、“教育教培”和“竞技场”会形成一个闭环的生态。有人发布,有人能够做出来,有人能够改装,有人能够培训不具备门槛的“用户”进来,还能让大家在一个场子里Show技。这个生态就形成了。

    其实北美的K-Scale Lab已经隐隐约有这样的架子了,去年3月K-Scale刚热闹起来时,也不过是三个青涩的技术宅男在车库里闭门造“人”,但是短短几个月后,他们就借助自己的开源社区,搞了黑客松,还从黑客松里培养了新的开源项目,Zeroth Bot。这群人还时不时聚在一起,做分享,偶尔还机器人之间打一架。整个生态的意思就有了。从旁观者的角度,稍感可惜的是,他们可以搞得更“正规”些。把分享、比赛等,做成机制,固定的机制,固定的组织者,固定的场所,固定的传播模式。估计影响力会更可观。

图片

3. 自然生长之前,选育优质“种子”生长第一批的树木

    说了土壤,说了生态,如果缺了种子,一切都没有意义。刚才也提到,其实从0到1的过程,非常关键,因此,在0的阶段,如何选育出有质量的“种子”,来生长出第一批树林,非常重要。就像K-Scale Lab的第一个项目一样。这也是起源机器人,对自己的要求,努力做好第一颗“种子”。


    作为一个人形机器人行业中人,有幸感受了春晚扭秧歌之后,全社会的人形机器人之热,也期待我们能接着这股热潮,使用开源的手段,给人形机器人的发展助助力!

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐