今天的人形机器人圈子,信息量有点大。

从哥伦比亚大学的"照镜子机器人"到 Apptronik 的天价融资,从北京人形的具身天工 3.0 到智元机器人的全机器人春晚——一天之内,技术突破、资本狂欢、产品发布全凑齐了。

挨个聊聊。

哥大突破:机器人对着镜子学说话,还出了张专辑

哥伦比亚大学 Hod Lipson 团队在 Science Robotics 上发了篇论文,搞了个能自主学习唇部动作的机器人。

方法挺有意思:先让机器人对着镜子观察自己的脸(26 个面部电机),搞清楚"我动哪个电机、脸会怎么变"。然后再看 YouTube 上人类说话唱歌的视频,学习嘴唇怎么跟着语音动。

结果?这机器人不仅能用多种语言说话,还录了张 AI 生成的专辑叫 hello world_

Lipson 说了句很到位的话:“机器人领域现在大部分精力都花在腿和手上,但面部表情才是情感连接的关键缺口。”

做面部表情的同学注意了,这篇论文值得细读。它用"自我观察+模仿学习"的路子绕开了传统的规则驱动方法,对恐怖谷问题给出了一个新思路。

👉 原文链接(ScienceDaily)

智元机器人办了场"全机器人春晚",首形科技 Elf Xuan 亮相

智元机器人(Agibot)搞了个大活——一场长达一小时的全机器人晚会,200 多台机器人上台表演舞蹈、武术、拳击、走秀,观众也全是机器人。

节目里有几个技术含量很高的动作:空翻、高速旋转、大规模同步编舞。还有人类舞者和 Agibot G2 人形机器人、D1 四足机器人同台,展示实时人机动作对齐。

最吸引眼球的是首形科技(AheadForm)的超仿真人形机器人 Elf Xuan 的演唱环节,逼真的面部表情让不少人直呼"有点东西"。

顺便提一嘴,根据 Omdia 的数据,智元机器人 2025 年出货 5168 台人形机器人,全球第一。全球全年大概出了 1.3 万台。

👉 原文链接(VnExpress)

Apptronik 融资 9.35 亿美元,估值 53 亿

这条是今天最大的资本新闻。

德州大学孵化的 Apptronik 把 A 轮扩展到了 9.35 亿美元,估值约 53 亿美元——比最初 A 轮的 17.5 亿估值翻了 3 倍。投资方包括 Google、Mercedes-Benz、B Capital。

为什么不叫 B 轮?公司说自己还在早期阶段,不是主动融资,是投资人追着给钱。行吧,5 亿多美元送上门,谁拒绝谁傻。

Apptronik 的核心卖点是跟 Google DeepMind 合作搞具身 AI,他们的 Apollo 机器人定位仓储物流场景——卸货、拣货、产线操作。

作为对比,Figure AI 到去年秋天已经累计融了近 20 亿美元。人形机器人赛道的资本密度,真的离谱。

👉 原文链接(TechCrunch)

北京人形发布具身天工 3.0:能翻 1 米障碍,精度到毫米级

北京人形机器人创新中心发布了具身天工 3.0,定位"更开放、更好用"的通用机器人平台。

几个关键参数:

  • 行业首个实现触物交互式全身高动态运动控制的全尺寸人形机器人
  • 能翻越约 1 米高的障碍
  • 操作精度控制在毫米级
  • 支持跪地作业、弯腰转身等复杂姿态
  • 开放软硬件接口,兼容 TCP/IP 等主流通信协议

配套的"慧思开物"平台构建了"感知-决策-执行"全链路闭环,支持"一脑多机"的多智能体协作。

说白了,北京人形想做的是人形机器人领域的"安卓"——开放生态,降低开发门槛,让更多人能基于这个平台做应用。

👉 原文链接(人民网)

埃斯顿酷卓发布 Codroid 02

埃斯顿旗下的酷卓机器人发布了第二代人形机器人 Codroid 02:

  • 身高 170cm,体重 70kg
  • 单臂负载 5 公斤
  • 全身 31 个自由度(不含灵巧手)

定位工业应用场景,参数中规中矩,但作为国产工业机器人龙头埃斯顿的人形机器人产品线,后续发展值得关注。

👉 原文链接(B站视频)

写在最后

今天最让我兴奋的是哥大那篇面部表情的论文。做人形机器人的人都知道,腿和手的问题大家都在卷,但脸部表情一直是个被低估的方向。Lipson 团队用"自我观察+模仿学习"的方法,给这个方向打开了一扇新窗户。

资本层面,Apptronik 一轮 9.35 亿的融资再次证明:人形机器人是当下最热的赛道,没有之一。

明天见。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐