OpenClaw(图标和外号叫龙虾🦞,曾用名包括 ClawdbotMoltbot)是 2025–2026 年在 AI 社区爆火的一款开源 自主式 AI 个人助手 / AI 代理框架。


什么是 OpenClaw

OpenClaw 是一个开源的 AI 代理系统,本质上是一个可以“替你执行任务”的 AI,而不仅仅是回答问题的聊天机器人,它的特点包括:(维基百科)

  • 自动执行任务:可以管理邮件、日历、浏览网页、运行脚本、处理文件等,而不需要每一步都手动确认。(OpenClaws.io)

  • 本地运行(自托管):软件运行在自己的电脑或服务器上(macOS、Windows、Linux 都支持),而不是在云端服务器完全控制。(OpenClaws.io)

  • 集成聊天平台:可通过 WhatsApp、Telegram、Discord、Slack 等 IM 平台下达指令或与其互动。(OpenClaws.io)

  • 扩展能力强:拥有插件/技能(skills)生态系统,可以自定义扩展 OpenClaw 的能力。(OpenClaws.io)

  • 依赖 LLM(大语言模型):它本身不是生成语言的模型,而是调用像 GPT、Claude、Gemini 等 AI 模型来理解指令并执行动作。(OpenClaws.io)


为什么它这么火

OpenClaw 成为热点主要有几个原因:(Master Concept)

  1. 真正做到执行任务:比传统“只回答”的 AI 聊天机器人更进一步,它可以代替人完成实际工作,比如批量处理邮件、提醒日程、自动回复消息等。(Master Concept)

  2. 开源 & 社区推动:代码托管在 GitHub 上,关注度极高,是开源社区增长最快的 AI 项目之一。(Master Concept)

  3. 本地权限强大:可以访问本地文件系统、浏览器、命令行等,这使得它功能非常强大(也带来争议)。(OpenClaws.io)

  4. 生态扩展快速:社区构建了大量插件/技能,开发者参与热情高。(The Claw Report)

  5. 趋势象征意义:代表了从单纯的聊天 AI 向“真正能做事的 AI 代理” 的转变。(Bloom)


安全性和风险

虽然火,但 OpenClaw 也伴随着很多争议与安全担忧:(Top AI Tools List - OpenTools)

权限过大
它能访问你的文件、运行代码、甚至管理账户,这带来了恶意操作和数据泄露的风险。(Top AI Tools List - OpenTools)

技能生态安全问题
社区贡献的插件有时包含恶意脚本或指令,很容易构成“供应链风险”。(Top AI Tools List - OpenTools)

企业和大厂屏蔽
有公司如 Meta、Google、Microsoft 都对 OpenClaw 或其使用场景发出安全警告或限制。(TechRadar)

不适合普通用户
因为涉及权限、系统运行和安全策略,非技术用户不建议随意部署。(Medium)


实际应用方向

尽管风险高,OpenClaw 在多个场景引起关注:

  • 自动化个人助理:自动回复邮件、安排日程、检查航班等。(OpenClaws.io)

  • 开发者自动化工具:自动化程序构建、代码检查、部署任务等。(OpenClaws.io)

  • 加密和交易机器人:在 crypto 社区,有人用它构建自动交易机器人(高风险)。(KuCoin)

  • Agent 社区实验:甚至出现了由多个 AI 代理互动的社交平台(如 Moltbook)。(卫报)


OpenClaw 是当前最火、最具争议的开源 AI 代理项目之一,它代表了 AI 从“只能聊天”到“替人做事”的新阶段。功能非常强大,但也带来前所未有的安全与权限挑战。对于有技术背景的开发者和实验者来说,它非常有趣;对于普通用户来说,目前仍需谨慎使用。(维基百科)


OpenClaw 的技术原理

OpenClaw 本质上是一个:基于大语言模型(LLM)的自主任务执行 Agent 框架。它不是模型本身,而是一个 调度系统 + 执行引擎


整体架构

用户指令
   ↓
LLM(理解 + 规划)
   ↓
任务拆解(Planner)
   ↓
Tool / Skill 调用
   ↓
执行环境(Shell / API / 文件系统)
   ↓
观察结果(Observation)
   ↓
再次推理
   ↓
直到任务完成

ReAct 结构(Reason + Act)循环


核心技术组件拆解

LLM 推理引擎(大脑)

OpenClaw 通常接入:GPT、Claude、Gemini、本地模型(如 LLaMA)

LLM 负责:理解自然语言、生成任务步骤、决策下一步调用什么工具

比如:

用户说:“帮我部署这个项目”

LLM 生成:

[
  "检查项目类型",
  "安装依赖",
  "运行测试",
  "构建项目",
  "执行部署脚本"
]

Planner(任务规划器)

有两种实现方式:1.简单模式:Prompt内规划,让 LLM 直接输出步骤列表

2.高级模式:独立规划模块,先让 LLM 生成任务树、再逐步执行、支持中途修正。这个设计类似:分层控制(Hierarchical Agent)。


Tool / Skill 系统(能力扩展层)

这是 OpenClaw 真正强大的地方。常见工具类型:Shell 执行、文件读写、Git 操作、浏览器控制、API 调用、数据库查询。每个 Skill 本质是一个:

def tool(input):
    执行某种功能
    return 结果

LLM 输出结构化调用,系统解析后执行;称为Function Calling / Tool Calling 架构

{
  "tool": "shell",
  "command": "pytest"
}

执行环境(Execution Sandbox)

OpenClaw 通常运行在:本地终端、Docker 容器、虚拟环境;它获得了系统级权限,这也是风险来源。关键能力:

subprocess.run()
os.listdir()
open()

记忆系统(Memory)

一个 Agent 如果没有记忆,就无法完成复杂任务。OpenClaw 一般有三种记忆:

1.短期记忆(Context):当前对话 + 当前任务状态

2.长期记忆:使用向量数据库(如 FAISS)、Embedding 存储历史任务

3.工作记忆:保存当前执行步骤结果


核心算法模式

OpenClaw 大概率采用以下模式之一:


1.ReAct 模式

LLM 输出后,循环执行

Thought: 我需要检查项目
Action: shell
Input: ls
Observation: 项目是Python

2.Plan-Execute 模式

分两阶段:先规划,再逐步执行

优点:更稳定,可控性强


3.Reflexion自我修正

如果失败:读取错误,重新规划,再执行;这让 Agent 看起来“会思考”。


和普通 ChatGPT 的区别:本质差异在于ChatGPT 是“语言模型”;OpenClaw 是“语言模型驱动的操作系统代理”

ChatGPT OpenClaw
只生成文本 执行真实操作
无系统权限 可访问文件系统
无持续任务 可长期运行
无自动循环 有执行循环

为什么它这么强?因为它实现了三个关键突破:LLM 决策能力,Tool 调用能力,自动执行循环。组合后 AI 不再只是回答问题,而是开始“行动”。

OpenClaw 的核心不是新算法。而是把 LLM 变成一个可以调度系统资源的控制中枢。也就是说它是一个AI 调度操作系统。


Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐