Agent 的下半场，该给它装个身体了

主理人柚子

80人浏览 · 2026-06-29 19:00:00

主理人柚子 · 2026-06-29 19:00:00 发布

Agent 的下半场，该给它装个身体了

从纯文本到具身交互，为什么我认为具身 Agent 才是人机交互的终局形态

主题方向：Agent 认知

前言：Agent 越来越聪明，但交互越来越别扭
一、纯文本 Agent 的"表达缺失"问题
二、参数流：Agent 从文本到具身的技术桥梁
三、从文本到具身：Agent 交互架构的重构
- Agent 的三层架构
四、实战：给教育陪读 Agent 装上3D身体
五、教育陪读场景的深度探索
六、具身 Agent：下一代人机交互的入口
- 从CLI到GUI到EUI
- Agent 的"身体"为什么重要
七、实际体验总结

前言：Agent 越来越聪明，但交互越来越别扭

今年做项目有一个很强烈的体感：Agent 的推理能力、工具调用、记忆管理都在快速进化，但用户端的交互方式几乎没有变化——还是一个输入框、一段文字流。

MCP 协议火了，Function Calling 成了标配，Multi-Agent 框架层出不穷。这些都在解决 Agent "能做什么"的问题。但有一个更基础的问题没人认真回答：Agent 做完了，用户怎么"感知"到它做了？

我最近半年做了三个 Agent 项目——教育陪读、展厅讲解、门店导购。技术方案都不复杂：RAG 检索 + 大模型推理 + 结构化输出。但每次交付演示，甲方的反馈都差不多：“功能没问题，但感觉就是在跟一个搜索框聊天。”

这句话背后的问题不是功能缺失，而是表达缺失——Agent 只有认知通道，没有感知通道。它知道答案，但没法"像人一样"把答案给出去。没有表情、没有语气、没有肢体反馈，用户面对的还是一个冷冰冰的文字终端。

直到我用魔珐星云的具身驱动 SDK 给 Agent 跑通了一个3D具象交互方案，才真正理解"具身"对于 Agent 意味着什么。先放一个移动端体验链接，手机打开感受一下 Agent 有了身体之后的交互差异：3d数字人

一、纯文本 Agent 的"表达缺失"问题

在聊方案之前，先把问题拆透彻。Agent 的交互瓶颈不是"延迟高"或"回答不准"（这些在持续优化），而是一个结构性问题。

1. 单通道输出 vs 多模态感知

人面对面对话时，信息传递是多通道的。心理学里有个经典数据：语言内容只占信息传递的 7%，语气语调占 38%，表情肢体占 55%。纯文本 Agent 只用了那 7% 的通道。

这不是"锦上添花"的问题。在教育陪读场景里，Agent 回答"这道题的答案是 B，因为……"，纯文本就是一串分析。但如果是一个具身智能体，它可以微微点头、指向虚拟白板、语气从疑问切换到肯定——学生对"答案是 B"这件事的理解深度和记忆强度，和纯文字阅读完全不同。

多模态输出不是视觉美化，是信息传递效率的提升。

2. 状态黑洞：用户不知道 Agent 在干什么

Agent 调用工具、检索知识库、执行多步推理——这些过程在纯文本交互中是"黑盒"的。用户发完消息后只能盯着光标闪，无法判断 Agent 是在思考、在查询还是卡死了。

这种"状态不可见"在长链路任务中尤其明显。比如让 Agent 做一个复杂的税务分析，它需要：查政策库 → 比对条款 → 计算金额 → 生成结论。每一步可能耗时数秒，用户全程只能等。

具身智能体的解法很直接：让 Agent 的内部状态外化为可见的物理状态。检索时数字人表情切换到思考，计算时手指轻轻敲击，得出结论时表情变得坚定。用户不需要"看进度条"，感知Agent的状态就够了。

3. 交互模式的根本差异

我把纯文本 Agent 和具身 Agent 的交互模式做了个对比：

纯文本 Agent 交互模式：
用户输入 → [黑盒等待] → 文字输出 → 用户阅读理解

具身 Agent 交互模式：
用户输入 → Agent思考(可见) → 语音+表情+动作输出 → 用户多通道感知
                 ↑                    ↑
              状态可见化            表达具象化

这两种模式的差异不是"好不好看"，而是交互范式的差异。纯文本是"命令行范式"——输入指令，返回结果。具身交互是"对话范式"——双方在同一个物理空间里，通过多通道信息实时交流。

Agent 的能力越强（能做的事越多），纯文本通道的信息传递效率就越成为瓶颈。这就是为什么我认为 Agent 的下半场必须解决"表达"问题。

二、参数流：Agent 从文本到具身的技术桥梁

理解了问题，接下来聊方案。魔珐星云解决 Agent 表达缺失的核心技术是参数流。

1. 为什么不是视频流

市面主流数字人采用云端视频流方案，在服务端完成全帧画面生成后，向终端分发完整视频画面，整条链路多层环节叠加，交互延迟大幅拉高。ASR 200-400ms → 大模型推理 300-800ms → TTS 200-500ms → 云端GPU渲染+编码 100-300ms → 推流+解码 100-300ms，整个端到端普遍在 2-5秒。

对于 Agent 来说，这个延迟是致命的。Agent 的推理链路本身就比简单问答长（可能涉及多步工具调用、知识库检索），如果再加上视频流的传输延迟，用户体感就是"问完了等半天才有反应"。

而且视频流方案还有三个 Agent 落地场景里很难接受的问题：

- 带宽成本：每路并发 5Mbps+，多终端部署需要专线网络

- 并发上限：云端GPU渲染是瓶颈，每路并发都要占GPU算力

- 终端门槛：需要较强的视频解码能力，低端设备跑不动

2. 参数流的技术逻辑

星云的参数流方案是：云端只计算表情参数和动作参数（几KB的数据量），传到终端由设备自己渲染。

视频流架构（Agent 场景）：
用户 → Agent感知 → Agent推理 → Agent工具调用 → TTS → 云端GPU渲染 → 视频编码 → 推流 → 解码播放
                                                                    ↑
                                                          每帧几百KB，总延迟2-5s

参数流架构（Agent 场景）：
用户 → Agent感知 → Agent推理 → Agent工具调用 → TTS+参数生成 → 参数流传输 → 端侧渲染
                                                              ↑
                                                    每帧几KB，总延迟≈500ms

参数流能做到端到端≈500ms 驱动响应，核心原因是把渲染从云端搬到了端侧。数据量从每帧几百KB压缩到几KB，网络传输不再是瓶颈；端侧渲染不需要等云端排队，并发能力只受参数生成服务限制。

3. AI端渲和端侧解算：低硬件门槛的关键

参数流能成立的技术前提是AI端渲和端侧解算技术——让端侧设备不需要GPU也能实时渲染3D数字人。

传统3D渲染依赖GPU，星云通过算法优化，让 RK3566（720P）、RK3588（1080P）这类百元级硬件芯片就能跑起来。不需要游戏引擎，不需要独立显卡，参数数据到了端侧就能直接驱动渲染。

这对 Agent 落地来说意义重大：Agent 的部署终端往往是展厅大屏、门店POS机、桌面机器人——这些设备的算力有限，视频流方案根本跑不动，但参数流方案可以。

4. 低延时、高并发、低成本同时成立

视频流方案里这三个指标是互斥的：低延时要实时渲染，实时渲染要烧GPU，烧GPU就推高成本、限制并发。参数流方案下，云端不承担渲染压力，终端只需要百元级芯片，网络带宽需求极低——三个在视频流方案里不可能同时满足的指标，在参数流架构下同时成立了。

一套轻量化 SDK 全域覆盖屏幕端数字人、人形服务机器人、AR/VR 空间穿戴设备三大终端赛道，全终端硬件兼容适配。

---

三、从文本到具身：Agent 交互架构的重构

理解了参数流的技术逻辑，接下来聊聊 Agent 的交互架构应该怎么重构。

Agent 的三层架构

魔珐星云平台的三层设计，其实为 Agent 的交互架构提供了一个清晰的框架：

┌─────────────────────────────────────────────┐
│          多模态感知层（Perception）            │
│   语音识别 / 文本输入 / 视觉输入              │
│   → Agent "听到/看到" 用户的需求              │
├─────────────────────────────────────────────┤
│     大模型 + 智能体认知层（Cognition）         │
│   推理 / 规划 / 工具调用 / 知识检索            │
│   → Agent "想清楚" 该怎么回答                 │
├─────────────────────────────────────────────┤
│       多模态具身表达层（Expression）           │
│   语音合成 / 表情生成 / 动作驱动              │
│   → Agent "说出来、演出来"                    │
└─────────────────────────────────────────────┘

纯文本 Agent 只有前两层——能感知、能思考，但表达层只输出文字。星云补齐的是第三层：把 Agent 的文本输出实时转换成3D具象的拟人交互——语音、表情、肢体动作同步输出。

这三层不是简单串联，而是端到端协同——语义理解、语音合成、表情生成、动作驱动在同一个参数流管线里同步进行。所以数字人说话时表情和语音是同步的，打断时动作和状态是连贯的。

四、实战：给教育陪读 Agent 装上3D身体

下面直接上代码。我选的场景是教育陪读——学生在屏幕前跟一个3D数字人老师对话，问作业题、学知识点，数字人实时回答、带表情和肢体动作。

开发工具和模型选型

- AI Coding工具：trae（代码编辑+调试）+ Claude 3.5 Sonnet（辅助生成前端框架代码）

- 大模型：GLM-4-Plus 作为 Agent 的对话大脑，通过 OpenAI 兼容接口对接

- 星云SDK：具身驱动 JS SDK，负责3D数字人渲染、语音合成和状态驱动

- 前端：原生 HTML + JavaScript，极简方案

Step 1：星云平台配置

登录魔珐星云平台，进入控制台 → 应用管理 → 创建驱动应用。选择数字人角色（教育场景选了一个亲切的女性形象）、音色和表演风格。创建完成后拿到 appId 和 appSecret。
在这里插入图片描述

Step 2：核心 Demo 代码

这个 Demo 实现了"学生提问 → Agent推理 → 数字人实时回答"的完整链路，重点展示如何将大模型流式输出和星云SDK的流式speak对接，并加入状态管理和肢体动作：

引入星云SDK

<!-- 引入魔珐星云SDK（必须） -->
    <script src="https://media.xingyun3d.com/xingyun3d/general/litesdk/xmovAvatar@latest.js"></script>

SDK服务封装

创建 src/services/xingyun.service.js ：

// src/services/xingyun.service.js
class XingYunService {
  constructor() {
    this.sdkInstance = null
    this.isInitialized = false
    this.containerId = 'avatar-container'
    this.defaultConfig = {
      appId: '【请在魔珐平台获取】',
      appSecret: '【请在魔珐平台获取】',
      gatewayServer: 'https://nebula-agent.xingyun3d.com/user/v1/ttsa/session'
    }
  }

  // 初始化SDK
  async initSDK(config) {
    // 1. 检查容器元素
    const container = document.getElementById(this.containerId)
    if (!container) throw new Error('容器元素不存在')

    // 2. 动态加载SDK
    if (!window.XmovAvatar) {
      await this.loadSDKScript()
    }

    // 3. 创建实例
    this.sdkInstance = new window.XmovAvatar({
      containerId: `#${this.containerId}`,
      appId: config.appId || this.defaultConfig.appId,
      appSecret: config.appSecret || this.defaultConfig.appSecret,
      gatewayServer: this.defaultConfig.gatewayServer,
      
      onStateChange: (state) => {
        if (config.onStateChange) config.onStateChange(state)
      },
      
      onWidgetEvent: (data) => {
        if (data.type === 'subtitle_on' && config.onSubtitle) {
          config.onSubtitle(data.text)
        }
      }
    })

    // 4. 初始化连接
    await this.sdkInstance.init({
      onDownloadProgress: (progress) => {
        if (config.onProgress) config.onProgress(progress)
      },
      onError: (error) => {
        if (config.onError) config.onError(error)
      }
    })

    this.isInitialized = true
    return true
  }

  // 让数字人说话
  speak(text, isStart = true, isEnd = true) {
    if (!this.isInitialized) throw new Error('SDK未初始化')
    this.sdkInstance.speak(text, isStart, isEnd)
  }

  // 带动作的说话
  speakWithAction(text, action = 'Hello') {
    const ssml = `
<speak>
  <ue4event>
    <type>ka</type>
    <data>
      <action_semantic>${action}</action_semantic>
    </data>
  </ue4event>
  ${text}
</speak>`
    this.speak(ssml, true, true)
  }

  // 断开连接
  disconnect() {
    if (this.sdkInstance) {
      this.sdkInstance.stop()
      this.sdkInstance.destroy()
      this.sdkInstance = null
      this.isInitialized = false
    }
  }

  // 支持的动作列表
  getSupportedActions() {
    return ['Hello', 'Goodbye', 'Agree', 'Disagree', 'Think', 'Explain']
  }
}

export default new XingYunService()

AI对话服务封装

创建 src/services/llm.service.js ：

// src/services/llm.service.js
import OpenAI from 'openai'

class LLMService {
  constructor() {
    this.openai = new OpenAI({
      apiKey: '【请在AI平台获取】',
      baseURL: '【AI服务地址】',
      dangerouslyAllowBrowser: true,
    })
  }

  async sendMessageStream(userMessage, systemPrompt = '你是一位专业的教育陪读讲师...') {
    const messages = [
      { role: 'system', content: systemPrompt },
      { role: 'user', content: userMessage }
    ]

    const stream = await this.openai.chat.completions.create({
      model: '【模型名称】',
      messages: messages,
      stream: true,
      temperature: 0.7,
      max_tokens: 500,
    })

    let fullResponse = ''
    for await (const chunk of stream) {
      const content = chunk.choices[0]?.delta?.content || ''
      if (content) fullResponse += content
    }
    return fullResponse
  }
}

export default new LLMService()

Step 3：代码核心逻辑解读

Demo 的核心是 `agentTeach` 函数里的流式对接。星云SDK的 `speak(ssml, is_start, is_end)` 和大模型的 SSE 流式输出天然对齐：

参数	含义	在流式对话中的作用
`ssml`	文本内容，支持SSML嵌入KA动作指令	接收大模型每个token片段
`is_start`	是否是本轮回答的第一段	大模型首次输出时为true
`is_end`	是否是本轮回答的最后一段	大模型输出完成时为true

这意味着大模型每吐出一段token，就能直接驱动数字人"边想边说"，不需要等整段回答生成完。配合参数流的低延迟特性，用户感知到的就是"问完就答"。

Step 4：语义驱动的肢体动作——Agent 具身化的关键

纯文字驱动只是"给Agent加了声音"，真正让Agent"具身"的是语义驱动的肢体动作。星云支持 SSML 标记嵌入 KA（Key Animation）指令：

// 讲解知识点：思考动作
sdk.speak(
  `<speak>
    <ue4event>
      <type>ka_intent</type>
      <data><ka_intent>Think</ka_intent></data>
    </ue4event>
    勾股定理其实很好理解，想象一个直角三角形……
  </speak>`,
  true, true
);

// 学生答对题目：鼓励动作
sdk.speak(
  `<speak>
    <ue4event>
      <type>ka_intent</type>
      <data><ka_intent>Nod</ka_intent></data>
    </ue4event>
    完全正确！你掌握得很快，我们来看下一题吧。
  </speak>`,
  true, true
);

// 开课迎宾：欢迎动作
sdk.speak(
  `<speak>
    <ue4event>
      <type>ka_intent</type>
      <data><ka_intent>Welcome</ka_intent></data>
    </ue4event>
    同学你好呀，今天想学什么？我随时都在～
  </speak>`,
  true, true
);

KA 指令让数字人的肢体动作和语义内容同步——讲解时思考，答对时点头，开场时欢迎。这不是"播放一段预设动画"，而是语义实时驱动动作，是具身智能交互的核心能力：Agent 不只是在"说"，而是在"表演"。
在这里插入图片描述

五、教育陪读场景的深度探索

基础Demo跑通后，我在教育陪读场景做了更深入的探索。这个场景的特殊性在于：学生是未成年人，对交互的温度和亲和力非常敏感。

1. 情感感知与表达的双向闭环

教育陪读不只是"回答问题"，更重要的是"感知学生的状态并给出情感反馈"。理想的交互闭环是：

学生困惑（"这道题我还是不太懂"）→ Agent感知困惑情绪 → 数字人表情变得温和
→ Agent调整解释策略（换一种说法） → 数字人用鼓励的语气+点头动作表达

目前的实现中，情感感知靠大模型的语义理解（在system prompt里加入"识别学生困惑并调整语气"的指令），表达靠星云SDK的KA指令 + 语气控制。虽然不是端到端的情感计算，但在实际使用中已经能感受到明显的交互温度提升。

// 在system prompt中加入情感感知指令
const ENHANCED_PROMPT = `你是一位耐心、亲切的AI老师。
特别要求：
1. 如果学生表达困惑（"不太懂"、"还是不明白"），先鼓励再换一种更简单的方式解释
2. 如果学生答对，给予真诚的肯定
3. 语气始终保持温暖，像一个关心你的大姐姐`;

// 根据大模型的输出判断是否需要切换KA动作
function detectEmotion(text) {
  if (/鼓励|没错|很棒|答对|正确/.test(text)) return 'Nod';
  if (/别急|慢慢来|换个角度/.test(text)) return 'Think';
  if (/你好|欢迎|开始吧/.test(text)) return 'Welcome';
  return null;
}

2. 状态可见化的教育价值

在纯文本交互中，学生发完问题后进入"等待黑盒"，这个等待对学习心态是有负面影响的——学生会焦虑、会分心。

具身智能体的状态可见化在这个场景里价值非常明确：

// 状态流转：待机 → 倾听 → 思考 → 讲解 → 待机
function updateAvatarState(state) {
  switch(state) {
    case 'listening':
      sdk.interactiveidle();  // 数字人表情切换为专注倾听
      setState('listening');
      break;
    case 'thinking':
      // 使用think状态的KA动作，让学生看到"老师正在想"
      sdk.speak(
        `<speak>
          <ue4event>
            <type>ka_intent</type>
            <data><ka_intent>Think</ka_intent></data>
          </ue4event>
        </speak>`,
        true, true
      );
      setState('thinking');
      break;
    case 'speaking':
      // 大模型流式输出驱动speak
      setState('speaking');
      break;
    case 'idle':
      sdk.interactiveidle();
      setState('idle');
      break;
  }
}

学生看到数字人"思考"的表情，会自然地等待而不是焦虑。这是一个很小的交互细节，但对教育场景的体验影响很大。

3. 打断交互的教育场景适配

教育陪读中的打断很常见——学生听到一半"懂了懂了，下一题"，或者"等等，前面那步能再说一遍吗"。这要求Agent支持自然的打断交互：

// 学生打断 → 暂存新请求 → 打断当前播报 → 播报结束后接新话题
function onStudentInterrupt(newQuestion) {
  voiceCtrl.interrupt(
    `<speak>
      <ue4event>
        <type>ka_intent</type>
        <data><ka_intent>Nod</ka_intent></data>
      </ue4event>
      好的，那我们来看这道题～
    </speak>`
  );
}

这里的打断和纯文本的"发新消息"完全不同——数字人会在当前说话的位置停下来，点头表示"听到了"，然后切换到新的话题。学生能明确感知到"老师听到我说话了"，这是拟人交互的核心体验。

4. 多Agent协作的具身化

在更复杂的教育场景里，可能需要多个Agent协作——数学Agent、英语Agent、心理辅导Agent。每个Agent可以对应不同的数字人形象和性格：

// Agent切换 = 数字人切换
// 在星云平台创建多个驱动应用（不同角色/音色），通过destroy+重建切换
async function switchAgent(agentType) {
  if (sdk) sdk.destroy(); // 释放当前数字人

  const agentConfigs = {
    math:     { appId: 'math_app_id', appSecret: 'math_secret', prompt: MATH_PROMPT },
    english:  { appId: 'eng_app_id',  appSecret: 'eng_secret',  prompt: ENG_PROMPT },
    counselor:{ appId: 'psy_app_id',  appSecret: 'psy_secret',  prompt: PSY_PROMPT },
  };

  const config = agentConfigs[agentType];
  // 重新初始化SDK实例，加载新数字人
  sdk = new XmovAvatar({
    containerId: '#sdk',
    appId: config.appId,
    appSecret: config.appSecret,
    gatewayServer: 'https://nebula-agent.xingyun3d.com/user/v1/ttsa/session',
    // ...其他配置
  });
  sdk.initModel({}, 'normal');
}

不同学科对应不同的数字人形象、音色和表达风格，这让多Agent协作的体验从"同一个聊天窗口切不同prompt"升级为"面对不同的老师"。

---

六、具身 Agent：下一代人机交互的入口

做完这些项目，我对"具身 Agent"有了更明确的判断。

从CLI到GUI到EUI

人机交互的范式一直在演进：

- CLI时代：命令行，用户需要学习机器的语言

- GUI时代：图形界面，机器学会了人的视觉语言

- CUI时代：对话界面，机器学会了人的自然语言

- EUI时代：Embodied UI，具身界面，机器学会了人的完整表达方式

每一个范式跃迁的本质，都是交互通道的增加和信息密度的提升。纯文本 Agent 处于 CUI 时代——自然语言交互，但只有文字一个通道。具身 Agent 进入 EUI 时代——自然语言 + 语音 + 表情 + 肢体，多通道同步输出。

这不是"加个3D模型"的表面升级。参数流技术让语音、表情、动作在同一个管线里同步生成，Agent 的"思考"和"表达"是端到端一体的。这种一体性保证了交互的连贯性——数字人说话时嘴型和语音同步，打断时动作和状态衔接，思考时表情自然过渡。这些细节决定了交互是"像真人"还是"像配音动画"。

Agent 的"身体"为什么重要

回看 Agent 的发展路线，能力层面（推理、规划、工具调用）在快速收敛——各大框架的差距在缩小。下一个竞争维度是交互体验。

具身智能交互补齐的是 Agent 最短的那块板：表达。一个推理能力很强但没有身体的 Agent，就像一个极其聪明但只能通过打字交流的人——能力被交互通道限制了。参数流 + AI端渲给 Agent 装上了3D具象拟人交互形态，低延时、高并发、低成本、全兼容让这个"身体"可以在任何终端上跑起来。

魔珐星云不是操作系统，而是具身智能数字人开放平台——它不做Agent的大脑，而是给各类Agent提供一个可实时交互的3D身体。Agent 的认知能力各家都在做，但表达能力的补齐，目前参数流方案是最具可行性的技术路径。

七、实际体验总结

最后说说我自己用下来的真实感受。

这个教育陪读的具身 Agent Demo，从零搭建到跑通，花了大约一个下午。trae + Claude 3.5 Sonnet 帮我快速搭了前端框架和样式，核心的星云SDK对接参考官方"从零到一教学"文档，API设计确实简洁——实例化、初始化、speak，三个步骤就跑起来了。

几个实际体验中感受最深的点：

1. 500ms 的延迟体感是质变级别的。在教育陪读场景里，学生问完问题数字人几乎是即时回应。这种体感和"等2秒再回答"完全不同——前者是对话，后者是检索。参数流架构是做到这一点的技术基础。

2. KA动作让交互有了"温度"。没有KA的数字人就像一个会说话的模型，有了KA之后它才像一个"人"——点头鼓励、思考时的表情变化、欢迎时的挥手。这些肢体语言在教育场景里不是装饰，是实实在在的交互信号。

3. 全兼容的SDK省了大量的终端适配工作。一套SDK覆盖Web和Android，同一套Agent逻辑换终端只需要换个容器。教育场景需要同时覆盖PC（课堂大屏）、平板（课后练习）、手机（家长端），全兼容意味着不用为每个终端单独开发交互层。

4. 硬件门槛确实低。我拿RK3588开发板跑1080P渲染毫无压力，百元级芯片就能部署运行。对于学校这种预算有限的场景，终端成本几乎可以忽略。

需要注意的坑：SDK 要求 localhost 或 https 环境，本地开发用IP地址访问会报错；首次连接需要加载角色资源有几秒等待；流式speak首次建议积攒6字符再传入避免语速不稳。

总的来说，如果你在做 Agent 相关的工作，而且场景涉及面对面交互，魔珐星云的参数流方案值得认真评估。它解决的不是Agent能不能回答的问题，而是Agent 怎么把回答"演"给用户的问题——纯文本 Agent 缺少的3D具象拟人交互形态，参数流给出了一条可行路径。具身 Agent，可能是 Agent 从"工具"变成"伙伴"的关键一步。

相关资源：

具身驱动SDK文档：https://xingyun3d.com/developers/52-183
从零到一教学：https://xingyun3d.com/developers/52-194
JS SDK Demo：https://xingyun3d.com/developers/52-187

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

影刀RPA新手教程：影刀云调度完全指南——任务中心配置、机器人管理与并发执行

DAMO开发者矩阵

基于 ROS Noetic 的参数服务器功能设计与实现

项目采用标准 catkin 工作空间架构，设计并实现了参数写入节点与参数操作节点，完整覆盖参数写入、读取、修改、删除四大核心功能，并通过 roslaunch 实现多节点一键启动。参数服务器的出现解决了这一痛点，它以 ROS Master 为载体，提供全局共享的字典存储服务，所有节点均可通过统一的 API 进行参数读写，实现配置的集中管理。实验结果表明，ROS 参数服务器能够稳定支持多类型数据的存储