第1章 认识OpenClaw

第一篇 OpenClaw:多渠道AI网关的深度掌握

开篇寄语(续)

“OpenClaw 是你 AI 公司的‘前台接待’——它可能不是最聪明的,但一定是最会来事儿的。”
—— 龙马

⚠️ 金融量化前置提醒:在本篇学习时,请特别关注第3.5节的权限隔离原则。未来你在第五篇搭建量化系统时,风控 Agent 必须独立于交易 Agent 运行,这是保障资金安全的第一道防线。这个习惯,从第一篇就要开始养成。

本篇学习规划总时长:30–35 小时

图片[1]-OpenClaw入门教程第1章:认识AI代理网关与核心能力

第1章 认识OpenClaw

本章前置检查
□ 已了解 AI Agent 基本概念(知道什么是 LLM、什么是工具调用即可)
□ 熟悉终端基本操作(cd, ls, 环境变量)
□ 已准备好至少一个大语言模型的 API 密钥(OpenAI / Anthropic / 本地 Ollama 均可)

本章预估总时长:2.5 小时
本章难点提示:无难点,主要是建立概念框架。请耐心读完,不要跳过。


1.1 诞生故事与定位

🎯 本节目标:学完后能用自己的话向朋友解释“OpenClaw 是什么,它从哪里来,要到哪里去”。

预计时长:0.5 小时

一个周末实验项目的爆发

2025 年 11 月,奥地利开发者 Peter Steinberger 在 GitHub 上发布了一个小项目。最初它叫 Clawd,目的很简单:让 AI 助手能在 WhatsApp 上回复消息。Peter 的本职是 iOS 开发,这个项目只是他周末的“玩具”。

但事情很快超出了他的预期。

不到一个月,Clawd 的 GitHub Stars 突破了 1 万。开发者们开始提交 PR,要求支持 Telegram、Discord,甚至微信。Peter 意识到,这不再是一个个人玩具,而是一个社区驱动的平台

2026 年 1 月,因为商标问题,项目先后更名为 MoltbotOpenClaw。改名没有影响它的增长势头——到 2026 年 4 月,OpenClaw 的 GitHub Stars 已超过 27.9 万,登顶全球软件项目排名第一,成为 GitHub 史上增长最快的开源项目之一。

✏️ 即时自测:OpenClaw 最初是为了解决什么问题而创建的?
(答案在 1.1 节末尾)

本质定位:自托管的个人 AI 代理网关

OpenClaw 的核心设计哲学可以概括为四个字:本地优先

  • 你的 API 密钥存在本地,不经过任何第三方 SaaS 服务器。
  • 你的对话历史、记忆、技能配置都存在本地(默认路径 ~/.openclaw/workspace/)。
  • 你可以选择完全不联网运行(当然,调用 LLM API 时需要网络)。

这与市面上大多数“AI 助手”产品形成鲜明对比——那些产品通常把你的数据上传到他们的云端,然后由他们控制模型和插件。而 OpenClaw 把控制权完全交还给你。

它的定位不是“一个聊天机器人”,而是“一个可以接入任何聊天平台的 AI 代理网关”

为什么它增长这么快?

龙马对此有一个观察:

“OpenClaw 踩准了两个趋势:一是人们对云端 AI 隐私问题的担忧,二是对‘AI 能替我做更多事’的渴望。它不只是一个接口封装,它提供了一套完整的 Agent 运行时——记忆、技能、多 Agent 协作。而且它用 TypeScript 写的,Node.js 生态的开发者几乎零门槛上手。”

💭 本节总结(不看书,用自己的话写 3 行)

📊 用时记录:计划min → 实际__min → 偏差原因:__

✏️ 即时自测答案:OpenClaw 最初是为了让 AI 助手能在 WhatsApp 上回复消息而创建的。


1.2 核心能力一览

🎯 本节目标:能够列出 OpenClaw 的 5 个以上核心特性。

预计时长:0.5 小时

渠道能力:20+ 消息平台

OpenClaw 支持的消息渠道包括(但不限于):

类别平台
即时通讯WhatsApp, Telegram, 微信, 飞书, Discord, Slack, Signal, 钉钉
社交Twitter DM, Instagram DM
其他邮件 (IMAP/SMTP), Home Assistant, 命令行 TUI, Web UI

每个渠道都可以独立配置,也可以绑定到不同的 Agent。例如,你可以让“客服 Agent”只负责飞书上的消息,而“个人助理 Agent”只负责 Telegram。

核心架构:Gateway + Agent + Skills + Memory

OpenClaw 的架构可以简化为四层:

  1. 渠道适配层:负责接收和发送消息,把不同平台的 API 统一成内部格式。
  2. Gateway(网关):核心调度器,管理会话、路由消息、调用 Agent。
  3. Agent(智能体):实际执行任务的单元。每个 Agent 有自己的人格(SOUL.md)、记忆空间和技能集。
  4. Skills(技能):扩展 Agent 能力的插件,以文件夹形式存在。社区 ClawHub 已有超过 13,000 个技能。
  5. Memory(记忆):四层记忆结构(短期/长期/向量/文档),支持 RAG。

本地优先与隐私

  • 所有数据默认存储在 ~/.openclaw/ 目录下。
  • 你可以完全离线运行 Gateway,只是调用 LLM 时需要网络。
  • 支持本地模型(通过 Ollama、LocalAI 等),实现完全离线运行。

语音与 Canvas

  • 语音交互:支持语音输入(需配置语音识别)和语音输出(TTS)。
  • Canvas 实时渲染:Agent 可以生成动态图表、流程图等,并在 Web UI 中实时展示。

✏️ 即时自测:OpenClaw 的四层核心模块是哪四层?

🛠️ 课后实践(本节):打开 OpenClaw 的 GitHub 仓库(链接见本章末尾参考资料),浏览 README,找到“Features”部分,看它列出了多少个渠道。

💭 本节总结(不看书写 3 行):

📊 用时记录:计划min → 实际__min → 偏差原因:__

✏️ 即时自测答案:渠道适配层、Gateway(网关)、Agent(智能体)、Skills(技能)、Memory(记忆)——实际上有五层,如果算上 Gateway 的话。常见说法是“Gateway + Agent + Skills + Memory”四件套。


1.3 OpenClaw能做什么:典型应用场景

🎯 本节目标:能说出至少 5 个 OpenClaw 的实际应用场景,并能判断哪些场景适合它。

预计时长:1 小时

场景一:智能日程管理与邮件整理

你可以让 OpenClaw 接入你的邮箱和日历。例如:

“每天早上 9 点,从 Gmail 中提取未读的会议邀请,自动添加到 Google Calendar,然后通过 Telegram 发给我一份今日日程摘要。”

这需要用到:邮件渠道、Cron 定时任务、日历 API Skill。

场景二:浏览器自动化与数据采集

OpenClaw 内置了浏览器自动化工具(基于 Playwright)。你可以让 Agent 自动登录某个网站、抓取数据、填写表单。

“每天下午 3 点,登录公司内网,下载最新的销售报表,保存到本地文件夹。”

场景三:代码编写与系统管理

通过终端执行工具,OpenClaw 可以运行 shell 命令、编辑文件、管理进程。

“在服务器上发现磁盘使用率超过 80% 时,自动清理 /tmp 目录中 7 天前的文件,并发送报告。”

但请注意:这种能力也带来安全风险。我们会在第 3.6 节详细讨论权限配置。

场景四:家庭自动化控制

通过 Home Assistant 渠道,OpenClaw 可以控制智能家居设备。

“当我在 Telegram 中说‘晚安’时,关闭所有灯、锁门、设置恒温器到睡眠模式。”

场景五:金融数据监控与量化交易辅助(为最终目标铺垫)

这是本书第五篇的重点。例如:

“每隔 5 分钟,从 Tushare 获取沪深 300 的最新行情,计算 5 日均线和 20 日均线,如果金叉则通过飞书发送买入信号。”

龙马注这个场景听起来简单,但实际落地时你会发现,数据格式清洗、频率控制、异常处理(比如某次请求超时)都是坑。别急,第五篇会一步步拆解。

场景六:内容创作与多平台分发

结合 Hermes 的深度研究能力,OpenClaw 可以作为分发入口。

“当我写完一篇博客,OpenClaw 自动把它发布到 WordPress、Medium、微信公众号,并生成一条推文。”

OpenClaw 适合什么,不适合什么?

适合不适合
需要对接多个消息渠道需要深度、持续学习的任务(交给 Hermes)
定时、重复性、规则明确的自动化需要跨会话长期记忆的复杂对话
作为团队协调者,调度多个 Agent对延迟极度敏感的高频交易执行(但仍可作为信号接收端)
开发确定性强的业务逻辑任务逻辑模糊、需要自主探索的任务

✏️ 即时自测:如果你想让 AI 记住你上周聊过的某本书的读后感,应该用 OpenClaw 还是 Hermes?

🛠️ 课后实践(本节):写下 3 个你自己工作或生活中可能用 OpenClaw 解决的场景。不用考虑技术可行性,先想象。

💭 本节总结(不看书写 3 行):

📊 用时记录:计划min → 实际__min → 偏差原因:__

✏️ 即时自测答案:应该用 Hermes,因为它的三层记忆系统专为跨会话长期记忆设计。OpenClaw 的记忆更偏向短期会话和可配置的 RAG 知识库。


1.4 OpenClaw不能做什么:能力边界认知

🎯 本节目标:建立对 OpenClaw 的合理预期,避免后续学习中产生“为什么它做不到 XX”的困惑。

预计时长:0.5 小时

它不是内置大模型

OpenClaw 不包含任何 LLM。它只是一个“网关”,你需要自己提供模型 API(OpenAI、Anthropic、Gemini、本地 Ollama 等)。这意味着:

  • 你需要为自己的 API 调用付费(除非使用本地模型)。
  • 模型的智商决定了 Agent 的天花板。给 OpenClaw 接一个弱模型,它就会变得很“笨”。

权限配置需要你亲自动手

OpenClaw 默认不会自动为 Agent 分配合理的权限。如果你不给 Agent 配置任何限制,它理论上可以执行任何 shell 命令、读写任何文件。这是设计使然——把控制权交给你,也把责任交给你。

我们在第 3.6 节会详细讲解如何配置最小权限原则、敏感操作二次确认、工具级权限隔离。

没有内置的多用户认证系统

OpenClaw 假设你是一个人在使用。如果你需要多个用户(比如团队协作),你需要自己在前端(如 Web UI)配置反向代理和认证(见第 5.2.2 节)。

缺乏细粒度的多用户权限隔离

即使你通过反向代理实现了多用户登录,OpenClaw 底层并没有“用户 A 只能访问 Agent X,用户 B 只能访问 Agent Y”的机制。所有会话共享同一个 Gateway 实例。对于严格的多租户场景,你需要运行多个 OpenClaw 实例。

龙马注这一点在团队使用时确实麻烦。我们的做法是:为每个团队成员启动一个独立的 OpenClaw 进程,绑定不同的端口,然后用 Nginx 做路由。资源占用会翻倍,但隔离性最好。

⚠️ 常见误区汇总

  1. “OpenClaw 自带 AI 大脑” → 错,它需要外接 LLM。
  2. “装好就能用,不用配置” → 错,至少需要配置 API Key 和渠道。
  3. “云端 SaaS,数据自动同步” → 错,本地优先,数据在你自己机器上。
  4. “可以完全替代 Zapier / IFTTT” → 部分可以,但 OpenClaw 更偏“对话式自动化”,而 Zapier 更偏“事件触发式”。两者可以互补。

🛠️ 课后实践(本节):写下你对 OpenClaw 的两个预期和一个担忧。等学完全篇后再回看,看预期是否准确,担忧是否解决。

💭 本节总结(不看书写 3 行):

📊 用时记录:计划min → 实际__min → 偏差原因:__


第1章 参考资料与扩展阅读

  1. OpenClaw GitHub 仓库 https://github.com/openclaw/openclaw
    (建议 Star 并 Watch Release,以便跟踪版本更新)
  2. OpenClaw 官方文档 https://docs.openclaw.com/
    (英文,但很详细。如果遇到问题,先在这里搜索)
  3. Peter Steinberger 的博客文章:《Why I built OpenClaw》 https://petersteinberger.com/2025/12/openclaw-origin/
    (了解项目背景的第一手资料)
  4. ClawHub – OpenClaw 社区技能市场 https://clawhub.com/
    (后续第4章会用到)
  5. OpenClaw 的架构设计文档(官方) https://docs.openclaw.com/architecture/
    (对应 1.2 节核心架构,建议至少浏览一遍)

本章综合实践(第1章完成后)

任务:写一段 150 字以内的介绍,用你自己的话向一位不懂技术的朋友解释“OpenClaw 是什么,它能做什么,不能做什么”。

要求

  • 不能使用“网关”“Agent”“Skill”等术语(或者必须解释清楚)。
  • 举一个具体的例子(比如“你可以对它说:把我今天收到的所有邮件附件存到桌面”)。

完成后,把这段介绍保存到一个文本文件中,命名为 chapter1_my_understanding.txt。在后续章节中,你可能会回来修改它。


龙马的评审(模拟)

“第1章的内容没问题,都是公开可查的事实。但我想提醒读者:OpenClaw 的版本迭代非常快,文中提到的‘20+渠道’可能在你读到的时候已经变成 25+了。所以遇到具体配置时,一定以官方文档为准,尤其是渠道接入部分。附录 G 会教你怎么应对版本变动。”

沈飞的评审(模拟)

“作为一个量化从业者,我特别关注 1.3 节的‘金融数据监控’场景。这里只说‘发送买入信号’太简单了。真正的量化系统里,信号从产生到执行中间隔着风控检查、仓位管理、滑点估计……不过这些后面第五篇会详细讲,第1章只是建立概念,可以接受。”


下一章预告:第2章 部署与基础配置 —— 你将第一次在本地跑起 OpenClaw,并通过飞书/Telegram 给它发消息。

© 版权声明
THE END
喜欢就支持一下吧
点赞16 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容