OpenClaw文档官方
OpenClaw,适用于任何操作系统的AI智能体Gateway网关,支持WhatsApp Telegram Discord iMessage等通讯渠道,通过插件可添加更多渠道
标签:养龙虾教程合集OpenClaw文档官方 OpenClaw文档官方官网 OpenClaw文档官方官网入口OpenClaw文档官方网站开源AI智能体项目的权威技术资料库
简介
OpenClaw官方架构文档深入解析了项目的技术实现与系统设计原理,面向开发者提供源码级技术参考。文档详细阐述了Gateway网关的核心架构,包括消息路由系统、会话管理器、通道适配器及Agent执行引擎的工作机制。其中Pi智能体集成部分说明了嵌入式AgentSession的创建流程、工具注入机制、系统提示词构建及多模型回退策略。文档涵盖了设备身份认证与配对协议、ACP(Agent Communication Protocol)通信规范、WebSocket实时通信实现等技术细节。对于扩展开发,文档提供了Skills插件开发指南、自定义工具注册接口、Hook注入点说明及内存压缩与上下文修剪机制。架构图与流程图清晰展示了消息从聊天应用进入Gateway,经路由分发至Agent处理,再通过工具执行返回结果的完整数据流,为二次开发和源码贡献者提供精确的技术导航。
OpenClaw官方文档官网: https://docs.openclaw.ai/zh-CN

OpenClaw 文档官方全解析:2026 年最强开源 AI 智能体框架
OpenClaw 是一个开源的本地 AI 智能体框架,它不是传统意义上的聊天机器人,而是一个能够真正”动手干活”的自主 AI 助手——执行终端命令、读写文件、操控浏览器、收发消息,7×24 小时不间断运行。
它从何而来
OpenClaw 的诞生颇具戏剧性。2025 年 11 月 24 日,奥地利开发者 Peter Steinberger(PSPDFKit 创始人)以”Clawdbot”之名发布了这个项目的第一个版本。由于与 Anthropic 的商标纠纷,项目在四天内经历了两次改名——先改为”Moltbot”,最终于 2026 年 1 月正式定名为 OpenClaw。这场商标风波反而带来了大量媒体曝光,项目迅速出圈。到 2026 年 2 月,GitHub Star 数突破 10 万,目前已达 247K+,成为 GitHub 历史上增速最快的开源项目之一,所有这些仅用了不到 8 周时间。
OpenClaw 采用 MIT 许可证,主体语言为 TypeScript(基于 Node.js ≥ 22),完全免费,用户只需自行承担所调用 AI 模型的 API 费用。

官方文档体系
官方文档是理解 OpenClaw 的第一入口,入口地址为 openclaw.ai,文档结构清晰,涵盖以下几大核心板块:
- 快速开始(Quick Start):一键脚本安装、
onboard向导配置、首次对话验证 - 架构说明(Architecture):Gateway 网关、Agent 智能体、Skill 技能三层结构详解
- Skills 生态(ClawHub):官方技能库,目前收录 200+ 官方和社区技能
- MCP 配置(Model Context Protocol):连接外部 API、数据库、第三方服务的协议说明
- 安全指南(Security):工具权限白名单、沙盒模式、企业部署清单
- 环境变量参考(ENV Reference):三层配置架构、热重载、多环境管理
官方文档持续迭代,每个小版本均会同步更新 CLI 命令参考。清华大学出版社即将出版的《OpenClaw 超级个体实操手册》对官方文档中约 60% 的命令进行了核对与修正,侧面反映官方文档仍在快速演进中。

核心架构:三层设计哲学
Gateway 网关
Gateway 是整个 OpenClaw 的中枢入口,负责统一处理所有进出流量——消息路由、插件调度、异常捕获。它像一个智能交换机,将来自 Telegram、WhatsApp、Discord、Slack、飞书、iMessage 等不同通道的消息,统一格式化后转发给 Agent 处理,再将结果回传原始通道。
Gateway 支持多通道并发监听,即同一套配置可以同时响应 Telegram 消息和飞书消息,无需重复部署。端口默认为 18789,可通过环境变量 OPENCLAW_PORT 自定义。
Agent 智能体
Agent 是实际执行任务的核心单元。它接收来自 Gateway 的指令,调用大模型进行意图理解,再通过 Tools 或 MCP 触发具体操作。官方文档将 Agent 的演进分为三个阶段:
- Phase 1(2025 年 11 月):WhatsApp Relay——AI 回复转发至消息应用
- Phase 2(2026 年 1 月初):主动消息助手,具备定时推送能力
- Phase 3(2026 年 1 月 30 日):模型无关的完整 Agentic AI 基础设施
当前版本的 Agent 支持持久化记忆(存储为本地 Markdown 文件,即 SOUL.md 和 MEMORY.md),可以跨会话记住用户偏好、历史操作习惯。
Skill 技能系统
Skill 是 OpenClaw 的能力扩展单元。官方文档将扩展机制分为三类,各有侧重:
| 类型 | 核心作用 | 实现方式 | 使用难度 | Token 消耗 |
|---|---|---|---|---|
| Skills | 知识复用、工作流程 | Markdown 文件 | ⭐ 简单 | 低(渐进加载) |
| MCP | 连接外部 API、数据库 | 服务器端配置 | ⭐⭐⭐ 复杂 | 高(启动全量加载) |
| Tools | 单一功能快速调用 | API 接口 | ⭐⭐ 中等 | 中等 |
ClawHub 官方技能库目前收录了超过 200 个技能,包括百度搜索、百度百科、学术检索、一键生成 PPT、AI 绘本等,均可一键接入。

主要功能全景
多平台消息集成
这是 OpenClaw 区别于同类产品最显著的特征。官方文档明确列出支持的通信平台:
- 即时通讯:Telegram、WhatsApp、Discord、Slack、Microsoft Teams
- 企业协作:飞书(Lark)官方插件、Signal
- 苹果生态:iMessage(macOS 原生)
通过一条 Telegram 或 WhatsApp 消息,你就能控制本机或远程服务器上的完整操作系统——查询文件、执行脚本、操作浏览器,甚至控制智能家居设备。
计算机完整控制权
官方文档中描述的最强能力是”计算机完整控制”:
- 文件系统:读取、写入、重命名、移动、删除任意路径文件
- Shell 命令:在受控环境中执行任意 Bash/PowerShell 脚本
- 浏览器自动化:基于 Chrome DevTools Protocol,支持 attach 模式直接连接已登录浏览器(2026 年 3 月新增),无需重新登录
- 邮件收发:自动处理邮件,支持触发条件过滤
- 代码编写与执行:生成代码后直接在本地运行并返回结果
权限精细化管控
安全是官方文档重点强调的部分。工具权限系统通过 tools.allow / tools.deny 配置白名单与黑名单,同时提供四种开箱即用的权限 profile:
minimal:仅基础对话coding:代码生成与执行messaging:消息读写full:完整系统权限
官方强烈建议新用户从 sandbox(沙盒)模式开始,避免 AI 误操作影响系统文件。
多模型支持
OpenClaw 是真正的模型无关(model-agnostic)框架,官方文档支持列表包括:Claude(Anthropic)、GPT-4 / GPT-4o(OpenAI)、Gemini(Google)、DeepSeek、MiniMax,以及通过 Ollama 运行的本地模型。2026 年 3 月更新的 Ollama 一键安装引导,让本地模型部署变得更加便捷,支持 Local 和 Cloud+Local 混合模式。
多模态记忆索引
2026 年 3 月版本新增的多模态记忆功能,支持对图片和音频内容使用 Gemini Embedding 进行语义检索,这意味着你可以用自然语言查询本机历史截图或录音内容。

安装与配置指南
系统要求
| 项目 | 要求 |
|---|---|
| 操作系统 | Windows 10+、macOS 12+、Ubuntu 22.04+ |
| 运行时 | Node.js ≥ v22(脚本自动安装) |
| 网络 | 需要联网下载依赖包 |
| 权限 | Windows 需 PowerShell 管理员权限 |
官方推荐安装步骤
macOS / Linux:
curl -fsSL https://openclaw.ai/install.sh | bash
Windows(PowerShell 管理员模式):
iwr -useb https://openclaw.ai/install.ps1 | iex
安装完成后,执行入门向导:
openclaw onboard
向导会引导配置大模型 API Key,完成通道绑定(Telegram / WhatsApp 等),以及初始化权限 profile。整个过程官方文档承诺约 5 分钟完成。
三层配置架构
官方文档定义了环境变量的优先级层次:
- 系统级环境变量:最高优先级,适合 CI/CD 场景
.env文件:项目级配置,敏感信息存储首选openclaw.config.js:应用级配置,支持动态逻辑
支持热重载(Hot Reload)功能,修改配置文件后无需重启服务即可生效,这在 2026 年 2 月版本中正式稳定。
实测体验
基于社区大量测评反馈以及官方文档声明的能力,以下是 OpenClaw 在真实使用场景中的表现梳理。
亮点体验:
消息驱动的工作流是 OpenClaw 最让人惊艳的使用体验。用一条 Telegram 消息说”帮我整理桌面上所有 PDF 文件,按日期重命名后移到 Documents/Archive”,整个操作在本机完成,不经过任何第三方云服务器。持久化记忆功能表现稳定,基础自动化任务(定时任务、文件监控、邮件过滤)执行一致性高。Chrome DevTools attach 模式让浏览器自动化门槛大幅降低,直接复用已登录的 Cookie 和 Session。
明显短板:
学习曲线确实陡峭——配置过程强依赖 CLI(命令行界面),没有任何图形界面,对非技术用户不友好。权限配置一旦出错,误操作风险真实存在,曾有用户因一条错误指令覆盖了系统目录下的配置文件。Token 消耗成本需要注意:MCP 配置在启动时全量加载,如果接入了大量外部服务,每次对话的 Token 起始消耗会相当可观。此外,当前云端部署(非本地)无法使用交互式安装向导,需要手动配置,官方文档对此部分的覆盖仍有欠缺。
五大同类产品深度横评
AutoGPT
AutoGPT 是最早引发自主 AI 浪潮的开源项目,2023 年 3 月发布,目前 GitHub Stars 为 170K+,积累了 3 年以上的生态沉淀。其架构基于”目标驱动循环”——给定一个高层目标后,由 LLM 自主分解为子任务并逐步执行。
| 对比维度 | AutoGPT | OpenClaw |
|---|---|---|
| 安装时间 | 30–60 分钟 | 5–10 分钟 |
| 浏览器控制 | 有限(插件方式) | 完整实时控制 |
| 桌面应用控制 | 不支持 | 支持任意原生应用 |
| 消息平台集成 | 仅 CLI | Telegram/WhatsApp/Slack 等 |
| 响应速度 | 5–30 秒 | 1–3 秒 |
| 模型支持 | 以 OpenAI 为主 | 200+ 模型 |
| 记忆管理 | 基础向量存储 | SOUL.md + MEMORY.md 结构化 |
AutoGPT 在纯文本推理链和研究工作流中仍有竞争力,但在浏览器和桌面自动化方面远弱于 OpenClaw。社区维护活跃度近两年也有所下降,更新节奏明显放缓。
CrewAI
CrewAI 是一个专注于”多智能体团队协作”的 Python 框架,2023 年 12 月发布,当前 GitHub Stars 约 28K+。其核心理念是将多个 AI Agent 组织成不同”角色”的团队(类似公司部门),每个 Agent 负责特定职能,协同完成复杂任务。
CrewAI 的最大优势在于上手速度——10 分钟即可创建第一个多智能体工作流,Python API 设计直觉友好,文档质量在同类产品中被普遍评为最优。月均 API 成本控制在 $5–20,是成本最低的方案之一。
劣势在于:它与 OpenClaw 的定位根本不同,CrewAI 不支持直接集成 Telegram/WhatsApp 等即时通讯平台,也没有本地计算机控制能力。它更像一个”代码框架”,而不是一个”可以直接用”的产品。
LangGraph
LangGraph 由 LangChain 团队在 2024 年 1 月推出,是目前最成熟的状态机式工作流框架。它通过显式的节点(Node)和边(Edge)定义智能体行为图,内置检查点(Checkpointing)和状态管理,原生支持”人工审批节点”,这使它在需要人机协作的企业场景中极具价值。
对于需要复杂、确定性工作流的场景,LangGraph 是 OpenClaw 的有力竞争者。但其学习曲线最为陡峭(30–60 分钟仅是基础配置),没有内置消息通道支持,本质上是给开发者用的底层框架,而不是面向普通用户的工具。
AutoGen(微软)
AutoGen 是微软 2023 年 9 月开源的多智能体对话框架,以”群聊式”多 Agent 协作为核心特色。多个 Agent 可以在一个虚拟”对话房间”中互相发送消息、协商分工,特别适合代码生成和研究任务。
AutoGen 背后有微软的企业级背书,在可靠性和合规性上有一定优势,目前 GitHub Stars 约 40K+,贡献者超 500 人。与 OpenClaw 的主要差异在于:AutoGen 没有本地计算机控制能力,也没有内置的消息平台集成,定位更偏向”研究与代码生成”而非”个人 AI 助手”。
Devin
Devin 是 Cognition AI 于 2024 年 3 月发布的 AI 软件工程师,也是这张对比名单中唯一的闭源商业产品,定价 $500/月。它运行在云端沙盒中,能够独立完成从需求分析到代码提交的完整软件工程任务,支持 Git 操作、环境配置、调试和单元测试。
Devin 的核心差异是”开箱即用”——不需要任何配置,5 分钟上手,但代价是完全的闭源和高昂费用。与 OpenClaw 相比,两者定位不同:Devin 针对专业软件工程任务,OpenClaw 定位于个人全方位 AI 助手。对于非软件工程场景(日常任务自动化、文件管理、消息处理),Devin 既不适合也不划算。
六款工具横向对比矩阵
| 维度 | OpenClaw | AutoGPT | CrewAI | LangGraph | AutoGen | Devin |
|---|---|---|---|---|---|---|
| 架构 | 网关 + Agent | 目标循环 | 角色团队 | 状态图 | 群聊对话 | 云端沙盒 |
| 语言 | TypeScript | Python | Python | Python/JS | Python | 闭源 |
| 上手时间 | 15 分钟 | 30 分钟 | 10 分钟 | 30–60 分钟 | 20–30 分钟 | 5 分钟(SaaS) |
| 消息平台 | ✅ 8+ 平台 | ❌ 仅 CLI | ❌ 无 | ❌ 无 | ❌ 无 | ❌ 无 |
| 计算机控制 | ✅ 完整控制 | ❌ 有限 | ❌ 无 | ❌ 无 | ❌ 有限 | ✅ 云端沙盒 |
| 本地部署 | ✅ 原生本地 | ✅ 可本地 | ✅ 可本地 | ✅ 可本地 | ✅ 可本地 | ❌ 仅云端 |
| 技能生态 | ClawHub 200+ | 插件 | LangChain | LangChain | 自定义 | 内置 |
| 模型支持 | 任意模型 | 以 OpenAI 为主 | 任意 | 任意 | 任意 | 闭源 |
| 记忆机制 | 文件 + 长期记忆 | 向量存储 | 多类型记忆 | 检查点 | 聊天历史 | 会话级 |
| 月均费用 | $5–30 | $10–50 | $5–20 | $5–20 | $5–30 | $500 |
| GitHub Stars | 247K+ | 170K+ | 28K+ | 10K+ | 40K+ | 不公开 |
| 最适合场景 | 个人 AI 全能助手 | 自主任务完成 | Python 多智能体 | 复杂有状态工作流 | 研究与代码生成 | AI 软件工程师 |
安全风险与官方建议
官方文档将安全风险划分为四个维度,并给出对应建议:
提示注入攻击(Prompt Injection) 是当前最大威胁。由于 OpenClaw 拥有完整的系统权限,恶意构造的网页内容或文件内容可能诱导 Agent 执行非预期操作。官方建议始终启用工具白名单,限制 Agent 可操作的目录范围。
权限过度开放:许多新用户急于体验”全功能”而直接使用 full profile,官方明确警告这在非受控环境中极其危险。企业部署建议使用隔离的 Docker 容器,并通过 tools.allow 精确授权。
API Key 泄露:.env 文件不应提交到代码仓库,官方建议使用系统级密钥管理工具(如 macOS Keychain)。
供应链风险:社区 Skills 和第三方 MCP 服务器存在恶意代码风险,官方建议优先使用 ClawHub 官方认证技能。
2026 年路线图与未来方向
根据官方文档和社区讨论,OpenClaw 近期路线图涵盖:
- 能力隔离强化:即使 Agent 遭遇提示注入攻击,也无法突破能力边界访问底层操作系统
- 联邦学习(Federated Learning)集成:用于管控多智能体集群的安全协作
- iOS 体验优化:首次运行引导页已在 2026 年 3 月上线,移动端交互持续打磨
- 多模态能力扩展:Gemini Embedding 驱动的图片/音频语义检索已落地,视频内容索引在规划中
- 企业级多租户支持:团队协作场景下的权限隔离和审计日志
OpenClaw 目前的核心社区聚集在 GitHub Discussions 和 Discord,有超过 200 名活跃贡献者,版本迭代约每两周一次,是当前开源 AI 智能体领域维护最活跃的项目之一。