Qwen-Agent：基于通义千问的智能体开发框架全面解析

最近逛 GitHub 时，看到了 Qwen 开源的专用 Agent 框架，**Qwen-Agent** 。为开发者提供了强大的工具和灵活的接口，支持构建具备指令遵循、工具使用、规划、记忆等能力的智能体应用。

小马不会过河

3719人浏览 · 2025-06-06 19:38:33

小马不会过河 · 2025-06-06 19:38:33 发布

最近逛 GitHub 时，看到了 Qwen 开源的专用 Agent 框架，Qwen-Agent 。为开发者提供了强大的工具和灵活的接口，支持构建具备指令遵循、工具使用、规划、记忆等能力的智能体应用。

本文将深入解析 Qwen-Agent 的核心功能、安装配置、使用示例及常见问题，帮助开发者快速上手并高效开发。

一、Qwen-Agent 概览

1.1 核心功能

Qwen-Agent 是一个开发框架，旨在让开发者充分利用通义千问模型（Qwen）的能力，构建智能化的 Agent 应用。其核心特点包括：

指令遵循：支持自然语言指令的解析与执行。
工具调用：集成多种工具（如代码解释器、图像生成器等），实现复杂任务的自动化。
规划与记忆：支持多步骤任务规划及上下文记忆，提升交互连续性。
示例应用：提供浏览器助手、代码解释器、自定义助手等示例，方便开发者快速学习。

1.2 最新更新（截至 2025 年 5 月）

Qwen3 Tool-call Demo：新增 Qwen3 模型的工具调用示例，展示更高效的推理能力。
MCP Cookbooks：扩展 Model Context Protocol（MCP）的使用场景，支持更灵活的内存管理。
QwQ-32B 支持：新增对 QwQ-32B 模型的并行、多步工具调用支持。
GUI 升级：基于 Gradio 5 的图形界面优化，要求 Python 3.10+。
RAG 解决方案：发布高效的 RAG（检索增强生成）方案，支持超长文档问答。

二、安装与配置

2.1 安装方式

方式一：通过 PyPI 安装

# 安装稳定版本（包含常用依赖）
pip install -U "qwen-agent[rag,code_interpreter,gui,mcp]"

# 或安装最小依赖版本
pip install -U qwen-agent

方式二：从源码安装

git clone https://github.com/QwenLM/Qwen-Agent.git
cd Qwen-Agent
pip install -e ."[gui,rag,code_interpreter,mcp]"

2.2 模型服务配置

Qwen-Agent 支持两种模型服务接入方式：

1. 阿里云 DashScope 服务

配置环境变量 DASHSCOPE_API_KEY：
```
export DASHSCOPE_API_KEY=your_api_key
```

在代码中指定模型参数：

llm_cfg = {
    'model': 'qwen-max-latest',
    'model_server': 'dashscope'
}

2. 开源模型服务（如 vLLM/Ollama）

部署兼容 OpenAI API 的服务后，配置如下：

llm_cfg = {
    'model': 'Qwen2.5-7B-Instruct',
    'model_server': 'http://localhost:8000/v1',
    'api_key': 'EMPTY'
}

三、快速开发示例

以下示例演示如何创建一个图像生成 + 图像处理的智能体：

3.1 自定义工具：图像生成

from qwen_agent.agents import Assistant
from qwen_agent.tools.base import BaseTool, register_tool
import json5
import urllib.parse

@register_tool('my_image_gen')
class MyImageGen(BaseTool):
    description = 'AI 绘画服务，输入文本描述，返回图像 URL。'
    parameters = [{
        'name': 'prompt',
        'type': 'string',
        'description': '图像内容的详细描述',
        'required': True
    }]

    def call(self, params: str, **kwargs) -> str:
        prompt = json5.loads(params)['prompt']
        prompt = urllib.parse.quote(prompt)
        return json5.dumps({'image_url': f'https://image.pollinations.ai/prompt/{prompt}'})

3.2 创建智能体

llm_cfg = {
    'model': 'qwen-max-latest',
    'model_server': 'dashscope'
}

system_instruction = '''收到用户请求后：
1. 生成图像 URL；
2. 使用 code_interpreter 下载并处理图像；
3. 展示处理后的图像。'''

bot = Assistant(
    llm=llm_cfg,
    system_message=system_instruction,
    function_list=['my_image_gen', 'code_interpreter'],
    files=['./examples/resource/doc.pdf']  # 提供文档知识库
)

# 运行智能体
messages = []
whileTrue:
    query = input('用户请求: ')
    messages.append({'role': 'user', 'content': query})
    response = bot.run(messages=messages)
    print('机器人回应:', response)

3.3 启动 GUI 界面

from qwen_agent.gui import WebUI
WebUI(bot).run()  # 通过 Gradio 启动 Web 界面

四见问题（FAQ）

4.1 如何使用 MCP？

安装依赖（Node.js、uv、Git、SQLite）：

macOS:
```
brew install uv git sqlite3
```
Windows:bash winget install astral-sh.uv git.sqlite sqlite.sqlite配置 MCP 服务器（如内存、文件系统、SQLite）：

可以在开源的 MCP Server 网站上选择需要的工具，并配置相关环境

https://github.com/modelcontextprotocol/servers

MCP 允许智能体管理外部资源（如文件系统、数据库）。配置示例：

{
    "mcpServers": {
        "memory": {
            "command": "npx",
            "args": ["-y", "@modelcontextprotocol/server-memory"]
        },
        "filesystem": {
            "command": "npx",
            "args": ["-y", "@modelcontextprotocol/server-filesystem", "/path/to/files"]
        }
    }
}

4.2 是否支持函数调用？

是的！Qwen-Agent 提供了完整的函数调用支持，示例代码位于 examples/function_calling.py，并支持 FnCallAgent 和 ReActChat 等高级智能体。

4.3 其他示例 - BrowserQwen

BrowserQwen 是一款基于 Qwen-Agent 构建的浏览器助手。如需了解详情，请参阅其文档。

https://github.com/QwenLM/Qwen-Agent/blob/main/browser_qwen_cn.md

五、结语

Qwen-Agent 以其灵活性、高效性和强大的功能扩展，为开发者提供了构建智能体应用的完整解决方案。无论是图像生成、代码执行，还是超长文档处理，Qwen-Agent 都能胜任。通过本文的详细解析，相信您已经掌握了 Qwen-Agent 的核心用法。现在，就动手尝试开发属于您的智能体应用吧！

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

工业机器人离线编程基础与 ABB RobotStudio 软件实操

工业机器人编程方法主要包括示教编程和离线编程两种主流方式。示教编程需现场操作机器人记录轨迹，而离线编程通过虚拟环境进行三维建模与仿真，具有不占用生产时间、支持复杂轨迹等优势。国内外主流离线编程软件分为专用型（如ABB RobotStudio、FANUC RoboGuide）和通用型（如RobotMaster、国产PQArt），正朝着智能化、专用化方向发展。文章重点介绍了ABB RobotStudi

DAMO开发者矩阵

硬实时·强生态：鸿道Intewell硬实时操作系统

DAMO开发者矩阵

零基础玩转AI智能体：Coze从入门到实战

Coze是一个无需编程基础的AI智能体开发平台，你可以通过自然语言描述和拖拽式操作，快速构建能对话、能调用工具、能处理图片视频的智能机器人。用户输入 → 提取关键词 → 调用搜索API → 生成总结 → 配图 → 输出通过本文，你学会了：在Coze上注册和创建Bot配置人设与回复逻辑添加插件扩展能力上传知识库实现专业问答搭建工作流处理复杂任务发布到各平台会打字，就能创造AI智能体。🎉。