【论文阅读】SONIC: Supersizing Motion Tracking for Natural Humanoid Whole-Body Control
SONIC是一个多模态人形机器人控制框架,可将文本、音乐、运动规划等不同来源的动作意图转换为实时关节控制命令。它采用编码器-FSQ量化器-解码器结构,通过三个并行MLP编码器将多种运动输入映射到共享潜在空间,再经FSQ量化器生成通用token,最后由控制解码器输出29个关节的目标位置。训练时结合PPO算法和辅助损失函数(如重建损失、token对齐等),在仿真环境中优化控制策略。相比GMT、Any2
所有评论(0)