许华哲团队最新DOGlove！仅600美元成本，代码开源，彻底打破灵巧操作的普及壁垒

人类的手和机器人的手尺寸、结构都不同，直接把人手动作映射过去会出现 “指不对、动不准” 的问题。动作重定向：通过正运动学（FK）计算人类指尖的精确位置，再用逆运动学（IK）结合缩放因子，把动作适配到不同尺寸的机器人灵巧手（如 LEAP Hand、Shadow Hand，图 7）。比如人类拇指和食指对捏时，机器人手会根据自身尺寸比例，精准完成对应的对捏动作，指尖对齐误差几乎可以忽略；力重定向：机器人

Tom Hardy

580人浏览 · 2026-01-22 18:34:30

Tom Hardy · 2026-01-22 18:34:30 发布

在机器人灵巧操作领域，“精准遥操作” 与 “低成本普及” 似乎是一对不可调和的矛盾。商用力反馈手套动辄 5000 美元以上，普通科研团队难以负担；而低成本方案要么自由度不足，要么缺乏关键的触觉力反馈，导致机器人在接触密集型任务中 “抓不准、拿不稳”。

清华大学、上海 AI 实验室等团队联合推出的DOGlove，用不到 600 美元的成本实现了 21 自由度运动捕捉与 5 自由度双模态反馈，不仅能让机器人精准完成 “挤炼乳”“盲抓瓶子” 等复杂任务，还能为模仿学习提供高质量数据。更关键的是，它完全开源，从机械设计到代码算法全部公开，彻底打破了灵巧操作技术的普及壁垒。

项目地址：https://do-glove.github.io/

论文地址：https://arxiv.org/pdf/2502.07730v1

原文链接：许华哲团队最新DOGlove！仅600美元成本，代码开源，彻底打破灵巧操作的普及壁垒

痛点暴击：传统遥操作的 “三大死穴”

当前灵巧手遥操作技术始终卡在 “成本、精度、反馈” 的三角困境中，各类方案都存在致命短板：

方案类型	典型代表	核心槽点
商用力反馈手套	SenseGlove Nova、Manus VR	价格堪比高端电脑（5000 美元 +），闭源生态难以适配机器人学习框架，科研和工业都用不起
视觉动捕方案	RGB 相机 + AnyTeleop 算法	手 - 物交互时容易被遮挡，只能捕捉姿态却没有力反馈，操作全靠 “猜”，精准度堪忧
简易手套系统	低成本传感器 + 基础连杆	自由度通常低于 15，无法还原人类手指的精细动作，反馈单一，复杂任务直接 “歇菜”

这些方案都忽略了一个核心事实：灵巧操作的本质是 “几何运动精准映射” 与 “接触动力学真实感知” 的双向奔赴。人类用手操作时，既能通过指尖位置控制物体姿态，又能通过触觉和力度感知物体的软硬、轻重，而传统方案要么只做 “运动捕捉”，要么只做 “简单反馈”，始终无法实现真正的沉浸式操作。

DOGlove 的出现，正是要一次性解决这三大痛点——用低成本实现高精度运动捕捉，用双模态反馈还原真实接触感知，用开源生态打破技术垄断。

硬核拆解：600 美元实现专业级性能的秘密

DOGlove 的核心优势的在于 “硬件精简高效 + 软件智能适配”，每个设计都精准命中需求，没有一丝多余：

21 自由度运动捕捉：复刻人类手指的 “灵活舞步”

要让机器人精准模仿人类动作，首先要让手套能精准捕捉手指的每一个细微姿态。DOGlove 采用拟人化 kinematic 设计（图 3），完美复刻了人类手部的关节结构：

拇指包含 3 个关键关节：1 个旋转关节（IP）负责屈伸，1 个铰链关节（MCP）控制摆动，1 个球关节（TM）支持多方向活动，还额外增加了手腕旋转自由度，让拇指能完成复杂的对捏、翻转动作；
食指、中指、无名指、小指各有 3 个关节：2 个铰链关节（DIP/PIP）负责指尖和指节屈伸，1 个球关节（MCP）支持手指的摆动和开合，每个关节都能独立运动，互不干扰；
关键部件选用超紧凑的 Alps RDC506018A 旋转编码器（尺寸仅 11mm×14.9mm×2.2mm），16 个编码器配合 5 个伺服电机，实现 21 自由度的全姿态捕捉。原始角度误差仅 ±7.2°，经过校准后能降至 ±1°，精准度媲美专业动捕设备。

更贴心的是，手套采用模块化设计，连杆长度适配多数成人手型，还支持定制化替换，避免因手型差异导致的佩戴不适或捕捉误差（图 4）。

双模态反馈：让机器人的 “触感” 直达人类指尖

如果说运动捕捉是 “让机器人跟着人手动”，那么触觉力反馈就是 “让人手感知机器人的触感”。DOGlove 创新采用 “线缆驱动 force feedback + LRA 触觉反馈” 的双模态方案（图 5），还原最真实的接触体验：

力反馈部分：选用 Dynamixel XC/XL330 伺服电机，通过精巧的线缆驱动滑轮系统（图 6），实现双向扭矩传递， stall torque 可达 0.5N・m，足以阻止手指运动，模拟物体的阻力。比如抓握瓶子时，手套会根据机器人的握力大小，给手指施加反向压力，让操作者清晰感知 “握得太紧” 或 “太松”；

触觉反馈部分：每个指尖都装有 8mm×2.5mm 的线性共振执行器（LRA），能在 240Hz 的共振频率下产生细腻振动，配合 TI DRV2605L 驱动芯片和 100 + 种预编程波形，可模拟不同物体的表面纹理——比如触碰光滑的玻璃、粗糙的纸张、柔软的布料时，振动模式完全不同，触感真实可辨；
反馈策略智能适配：根据机器人指尖力传感器的数据（精度 1g），DOGlove 设计了三段式反馈逻辑（表 1），低于 10g 时过滤噪声，10-50g 时仅触发触觉反馈感知轻微接触，50-100g 时双反馈协同，超过 100g 时仅保留力反馈避免干扰，让反馈既精准又不冗余。

重定向算法：打通 “人机协作” 的最后一公里

人类的手和机器人的手尺寸、结构都不同，直接把人手动作映射过去会出现 “指不对、动不准” 的问题。DOGlove 的重定向算法，就像一位 “翻译官”，完美解决了人机几何与动力学的适配问题：

动作重定向：通过正运动学（FK）计算人类指尖的精确位置，再用逆运动学（IK）结合缩放因子，把动作适配到不同尺寸的机器人灵巧手（如 LEAP Hand、Shadow Hand，图 7）。比如人类拇指和食指对捏时，机器人手会根据自身尺寸比例，精准完成对应的对捏动作，指尖对齐误差几乎可以忽略；

力重定向：机器人指尖的力传感器实时采集接触力数据，通过线性映射转化为伺服电机的控制信号，再通过线缆传递给人类手指。同时，LRA 根据力的大小切换振动波形，让操作者既能感知力的强度，又能分辨接触的类型。

更厉害的是，整个系统的延迟极低：运动捕捉频率最高 120Hz，力反馈频率最高 30Hz，配合 STM32 单片机的 DMA 加速和串口高速传输，从人手动作到机器人响应，再到反馈回人手，全程延迟控制在 30ms 以内，实现 “手随心动” 的沉浸式操作体验。

实战检验：这些复杂任务都能轻松拿捏

DOGlove 在遥操作、物体感知、模仿学习三大核心场景中，都用实验证明了其硬核实力：

盲辨物体：仅凭 “触感” 区分不同物体

5 名未经过训练的操作者，仅凭 DOGlove 的反馈，在无视觉、无听觉的情况下区分 5 组物体（图 8），涵盖形状、尺寸、软硬度等不同差异：

基础物体对（球与盒子、不同尺寸圆柱）：所有反馈模式的成功率都达到 100%，操作者能轻松通过触觉和力反馈区分明显差异；
复杂物体对（装满水与可乐的相同瓶子）：仅力反馈组成功率 80%，操作者能通过握力感知瓶子的软硬差异；仅触觉反馈组成功率 60%，能通过接触时的振动持续时间判断物体变形程度；
最难的一组（玩具卷心菜与真实卷心菜）：玩具卷心菜更软、尺寸更大，但抓取时会变形，导致力反馈判断失真，而触觉反馈能感知表面纹理差异，成功率 30%，展现了双模态反馈的互补价值。

无视觉遥操作：闭眼也能精准控物

在瓶身滑动任务中（图 9a），操作者佩戴眼罩和耳机，完全依赖 DOGlove 的反馈控制瓶子滑动，要求 15 秒内让瓶子成功滑动且不跌落：

仅开启力反馈时，成功率就达到 90%；当力反馈 + 触觉反馈协同工作时，成功率直接拉满至 100%；
对比纯视觉遥操作方案 AnyTeleop，后者成功率为 0—— 没有力反馈，操作者根本无法判断瓶子是否在滑动、滑动速度是否过快，很容易导致瓶子跌落；
即使有视觉反馈，力反馈组的滑动偏差也仅 1.1cm，远优于无反馈组（2.1cm）和纯视觉组（2.4cm），证明力反馈能显著提升操作精度。

模仿学习：3 条数据就能训练出高精度策略

DOGlove 采集的高质量演示数据，能直接用于训练机器人的模仿学习策略。研究团队采用 3D Diffusion Policy（DP3）算法，基于 DOGlove 采集的数据训练了 3 个典型任务：

推箱任务：40 条演示数据，机器人能精准控制按压力度，既不会因压力太小导致打滑，也不会因压力太大无法推动，20 次试验成功率 85%；
毛绒玩具抓取：40 条演示数据，机器人能根据玩具的柔软特性调整抓取力度，避免变形或滑落，20 次试验成功率 70%；
纸盒旋转放置（长时域接触任务）：仅用 3 条演示数据，机器人就能完成 “水平抓取 - 垂直旋转 - 精准放入桶中” 的复杂动作，10 次试验成功率 90%，远超传统数据采集方案的效率。

总结：

DOGlove 的突破性价值不仅在于以不到 600 美元的成本（仅为商用产品的 1/10）实现了专业级灵巧操作性能，更在于其全开源生态对行业的普惠意义——硬件端公开机械设计、电路原理图，主体结构可通过普通 3D 打印机（PETG 材料）制作，电子元件均为市售标准件，6 小时即可完成组装；软件端开放嵌入式代码、装配指南、URDF 模型、重定向算法及 MuJoCo 仿真环境，为开发者提供了完整的二次开发基础，彻底打破了高端灵巧操作技术的价格壁垒与生态垄断。

尽管当前 550g 的重量对长时间佩戴的舒适性仍有影响，手型适配性也存在优化空间，但团队规划的轻量化伺服选型、定制化减速机构及多尺寸连杆套件开发，将进一步提升其实际应用场景的适配能力。作为一款兼具高性价比、精准双模态反馈与开源属性的人机交互设备，DOGlove 不仅为遥操作提供了高保真解决方案，更让科研机构、中小企业乃至个人都能参与到灵巧操作技术的研发中，推动该领域从实验室走向规模化应用，真正开启了人机协同灵巧操作的 “民主化” 时代，为工业装配、医疗辅助、家庭服务等多元场景的技术落地奠定了低成本、可复制的基础。

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

模型推理理论： KV Cache 原理分析和vla-cache代码实操

DAMO开发者矩阵

多种机械臂系列+五自由度机械臂、双机械臂+dobot机械臂轨迹规划、正逆运动学系列MATLAB仿真

在现代工业自动化、机器人技术以及智能制造等领域，机械臂作为一种关键设备，广泛应用于物料搬运、装配、焊接、喷涂等多种任务场景。不同类型的机械臂，如五自由度机械臂、双机械臂以及 dobot 机械臂等，各自具有独特的结构和功能特点，以适应多样化的工作需求。轨迹规划和正逆运动学分析是机械臂控制的核心技术。轨迹规划决定了机械臂如何从初始位置移动到目标位置，确保运动的平稳性、高效性以及满足任务的精度要求。正逆