2025云栖大会达摩院展区上,呈现了达摩院在多个关键技术领域的创新成果。

 

 

图片

 

 

图片

达摩院前沿技术全景:医疗AI、决策智能与视频技术落地突破


面向医院、体检机构,针对群众百姓的机会性筛查场景,达摩院医疗AI实验室基于平扫CT+AI”技术,搭建达医智影医疗AI平台,辅助医生高效阅片和临床诊断。患者入院仅需做一次平扫CT,就能够完成包括胰腺癌、胃癌、食管癌、肝癌、结直肠癌在内的五大癌症筛查,脂肪肝、CVD风险、骨质疏松、肌肉脂肪含量的慢病评估以及AAS、肋骨骨折、肺动脉栓塞的急诊诊断,真正意义上实现早期筛查和一扫多筛。

 

 

图片

 

相较于增强CT/MRI,平扫CT的辐射量更少,价格更低,并且在需要患者做增强CT/MRI时,往往已经是癌症中晚期,几乎无法治愈。达摩院的平扫CT+AI”技术,相较于高年资影像科医生看平扫(以胃癌举例,影像科医生准确率为敏感性59.1%,特异性77.6%DAMO GRAPE敏感性为81.9%,特异性99.7%),能够更早期也更准确的发现癌症,提高患者治愈率和生存期。

 

决策智能实验室致力于优化求解、时序预测、高精细气象和可解释AI等领域的研究和创新,构建了体系化的预测与决策引擎,其核心产品敏迭(MindOpt)优化求解器历经多年发展,技术从单点突破到全面稳定,线性优化性能多次登顶国际权威测评榜单,实现百万量级并发调用;八观气象大模型充分结合全球模型和区域模型的优点,实现区域级1公里1小时的精准气象预报。其解决方案广泛应用于电力能源、工业制造、交通、互联网、云计算等行业,为数千企业用户提供决策依据。

 

 

图片

 

视频技术实验室介绍了基于新一代视频编解码标准H.266的自研编解码方案DAMO266的应用推广与生态共建情况。对于视频平台而言,采用H.266标准可获得单流50%的带宽节省收益,约等同于16%的综合带宽成本下降,并带来显著的用户体验提升,如流量消耗减半、卡顿率减半等。DAMO266落地优酷、支付宝以及阿里集团外部多个国民级应用,处理的日均视频播放量(VV)破亿,其软解解码器已适配市面上99%的移动设备。DAMO266最新的直播转码方案分别在x86平台端和移动端ARM平台上支持4k1080p实时H.266软件实时编码。

 

 

图片

 

此外,达摩院积极与行业伙伴共建H.266生态,推动先进视频编解码技术的普及应用,如联合优酷、vivo推出了业内首个H.266手机软解异构优化方案,在1080P 60fps的优酷帧享视频播放场景下实现17%的解码提速和13%的功耗下降;与高通合作,在搭载骁龙X EliteWindows 11 AI PC上首次实现4K 120fps视频的流畅播放。

 

 

图片

让具身智能触手可及:打通机器人技能开发全链路

 

与此同时,具身智能作为DAMO开发者矩阵社区的重要组成部分,也在本次展区中展出。

 

完整的机器人技能开发链路涵盖机器人控制、遥操作、数据采集与预处理、模型训练、仿真评测,直至最终的真机部署与测试这一链条环节众多、耦合紧密、技术门槛高,导致开发周期长、成本高、难以复用,严重制约了具身智能的普及与创新效率。作为DAMO开发者矩阵社区在具身智能方向的重要实践平台,乐云具身智能开发平台正致力于解决机器人技能开发链路过长的问题。

 

赋能机械臂智能学习与控制

 

平台集成了达摩院自主研发的具身智能大模型 RynnBot VLA,以及丰富的开源机器人大模型。这些模型经过大规模自研数据集的训练,具备强大的环境感知、任务理解与动作规划能力,相当于为机器人赋予了智能大脑。开发者可直接调用这些模型,快速实现 Lerobot 机械臂的自主任务执行,如目标识别、抓取、定位、放置等,显著降低开发门槛,提升研发效率。

 

同时,系统将实时记录操作过程中的姿态、力控、时序等多维数据,实现对人手精密动作的精准模仿,并支持多关节协同联动,还原真实操作的流畅性与灵活性。这一过程不仅直观展现了机器人模仿学习(Learning from Demonstration)的技术优势,也为自主行为策略的生成提供了高质量的数据基础。

 

 

图片

 

主从异构遥操作动作映射

 

低成本一拖四主从异构遥操作” 行为数据采集功能,不同于市面上多采用相同尺寸、同构型的主从遥操作方案,该技术实现了基于小型、低成本主操作手,对多种异构、高精度、高控制频率机械臂的动作伺服。

 

异构遥操作算法在保持末端执行器姿态的前提下,根据不同主从臂的工作空间大小进行等比例位置缩放,并通过微分逆运动学将伺服问题建模为凸优化,在高频下实时求解与控制,实现跨本体的精准遥操作与数据采集。

 

 

图片

 

远程遥操:具身智能训练师构建人机协作新模式

 

基于睿尔曼的“RealBOT具身开源平台,结合了达摩院在人工智能算法、大模型及系统级创新方面的能力。用户可将同构或异构的主从遥操本体接入远程遥操平台,在本地操控设备,远程控制异地机器人执行任务。基于优化的通信协议与低延迟视频传输链路,系统保障了控制指令与视觉反馈的实时同步,实现稳定可靠的远程机器人控制与遥操作

 

 

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐