OpenClaw入门教程第1章：认识AI代理网关与核心能力

第一篇 OpenClaw：多渠道AI网关的深度掌握

开篇寄语（续）

“OpenClaw 是你 AI 公司的‘前台接待’——它可能不是最聪明的，但一定是最会来事儿的。”
—— 龙马

⚠️ 金融量化前置提醒：在本篇学习时，请特别关注第3.5节的权限隔离原则。未来你在第五篇搭建量化系统时，风控 Agent 必须独立于交易 Agent 运行，这是保障资金安全的第一道防线。这个习惯，从第一篇就要开始养成。

本篇学习规划总时长：30–35 小时

第1章认识OpenClaw

本章前置检查：
□ 已了解 AI Agent 基本概念（知道什么是 LLM、什么是工具调用即可）
□ 熟悉终端基本操作（cd, ls, 环境变量）
□ 已准备好至少一个大语言模型的 API 密钥（OpenAI / Anthropic / 本地 Ollama 均可）

本章预估总时长：2.5 小时
本章难点提示：无难点，主要是建立概念框架。请耐心读完，不要跳过。

1.1 诞生故事与定位

🎯 本节目标：学完后能用自己的话向朋友解释“OpenClaw 是什么，它从哪里来，要到哪里去”。

预计时长：0.5 小时

一个周末实验项目的爆发

2025 年 11 月，奥地利开发者 Peter Steinberger 在 GitHub 上发布了一个小项目。最初它叫 Clawd，目的很简单：让 AI 助手能在 WhatsApp 上回复消息。Peter 的本职是 iOS 开发，这个项目只是他周末的“玩具”。

但事情很快超出了他的预期。

不到一个月，Clawd 的 GitHub Stars 突破了 1 万。开发者们开始提交 PR，要求支持 Telegram、Discord，甚至微信。Peter 意识到，这不再是一个个人玩具，而是一个社区驱动的平台。

2026 年 1 月，因为商标问题，项目先后更名为 Moltbot 和 OpenClaw。改名没有影响它的增长势头——到 2026 年 4 月，OpenClaw 的 GitHub Stars 已超过 27.9 万，登顶全球软件项目排名第一，成为 GitHub 史上增长最快的开源项目之一。

✏️ 即时自测：OpenClaw 最初是为了解决什么问题而创建的？
（答案在 1.1 节末尾）

本质定位：自托管的个人 AI 代理网关

OpenClaw 的核心设计哲学可以概括为四个字：本地优先。

你的 API 密钥存在本地，不经过任何第三方 SaaS 服务器。
你的对话历史、记忆、技能配置都存在本地（默认路径 ~/.openclaw/workspace/）。
你可以选择完全不联网运行（当然，调用 LLM API 时需要网络）。

这与市面上大多数“AI 助手”产品形成鲜明对比——那些产品通常把你的数据上传到他们的云端，然后由他们控制模型和插件。而 OpenClaw 把控制权完全交还给你。

它的定位不是“一个聊天机器人”，而是“一个可以接入任何聊天平台的 AI 代理网关”。

为什么它增长这么快？

龙马对此有一个观察：

“OpenClaw 踩准了两个趋势：一是人们对云端 AI 隐私问题的担忧，二是对‘AI 能替我做更多事’的渴望。它不只是一个接口封装，它提供了一套完整的 Agent 运行时——记忆、技能、多 Agent 协作。而且它用 TypeScript 写的，Node.js 生态的开发者几乎零门槛上手。”

💭 本节总结（不看书，用自己的话写 3 行）

📊 用时记录：计划min → 实际__min → 偏差原因：__

✏️ 即时自测答案：OpenClaw 最初是为了让 AI 助手能在 WhatsApp 上回复消息而创建的。

1.2 核心能力一览

🎯 本节目标：能够列出 OpenClaw 的 5 个以上核心特性。

预计时长：0.5 小时

渠道能力：20+ 消息平台

OpenClaw 支持的消息渠道包括（但不限于）：

类别	平台
即时通讯	WhatsApp, Telegram, 微信, 飞书, Discord, Slack, Signal, 钉钉
社交	Twitter DM, Instagram DM
其他	邮件 (IMAP/SMTP), Home Assistant, 命令行 TUI, Web UI

每个渠道都可以独立配置，也可以绑定到不同的 Agent。例如，你可以让“客服 Agent”只负责飞书上的消息，而“个人助理 Agent”只负责 Telegram。

核心架构：Gateway + Agent + Skills + Memory

OpenClaw 的架构可以简化为四层：

渠道适配层：负责接收和发送消息，把不同平台的 API 统一成内部格式。
Gateway（网关）：核心调度器，管理会话、路由消息、调用 Agent。
Agent（智能体）：实际执行任务的单元。每个 Agent 有自己的人格（SOUL.md）、记忆空间和技能集。
Skills（技能）：扩展 Agent 能力的插件，以文件夹形式存在。社区 ClawHub 已有超过 13,000 个技能。
Memory（记忆）：四层记忆结构（短期/长期/向量/文档），支持 RAG。

本地优先与隐私

所有数据默认存储在 ~/.openclaw/ 目录下。
你可以完全离线运行 Gateway，只是调用 LLM 时需要网络。
支持本地模型（通过 Ollama、LocalAI 等），实现完全离线运行。

语音与 Canvas

语音交互：支持语音输入（需配置语音识别）和语音输出（TTS）。
Canvas 实时渲染：Agent 可以生成动态图表、流程图等，并在 Web UI 中实时展示。

✏️ 即时自测：OpenClaw 的四层核心模块是哪四层？

🛠️ 课后实践（本节）：打开 OpenClaw 的 GitHub 仓库（链接见本章末尾参考资料），浏览 README，找到“Features”部分，看它列出了多少个渠道。

💭 本节总结（不看书写 3 行）：

📊 用时记录：计划min → 实际__min → 偏差原因：__

✏️ 即时自测答案：渠道适配层、Gateway（网关）、Agent（智能体）、Skills（技能）、Memory（记忆）——实际上有五层，如果算上 Gateway 的话。常见说法是“Gateway + Agent + Skills + Memory”四件套。

1.3 OpenClaw能做什么：典型应用场景

🎯 本节目标：能说出至少 5 个 OpenClaw 的实际应用场景，并能判断哪些场景适合它。

预计时长：1 小时

场景一：智能日程管理与邮件整理

你可以让 OpenClaw 接入你的邮箱和日历。例如：

“每天早上 9 点，从 Gmail 中提取未读的会议邀请，自动添加到 Google Calendar，然后通过 Telegram 发给我一份今日日程摘要。”

这需要用到：邮件渠道、Cron 定时任务、日历 API Skill。

场景二：浏览器自动化与数据采集

OpenClaw 内置了浏览器自动化工具（基于 Playwright）。你可以让 Agent 自动登录某个网站、抓取数据、填写表单。

“每天下午 3 点，登录公司内网，下载最新的销售报表，保存到本地文件夹。”

场景三：代码编写与系统管理

通过终端执行工具，OpenClaw 可以运行 shell 命令、编辑文件、管理进程。

“在服务器上发现磁盘使用率超过 80% 时，自动清理 /tmp 目录中 7 天前的文件，并发送报告。”

但请注意：这种能力也带来安全风险。我们会在第 3.6 节详细讨论权限配置。

场景四：家庭自动化控制

通过 Home Assistant 渠道，OpenClaw 可以控制智能家居设备。

“当我在 Telegram 中说‘晚安’时，关闭所有灯、锁门、设置恒温器到睡眠模式。”

场景五：金融数据监控与量化交易辅助（为最终目标铺垫）

这是本书第五篇的重点。例如：

“每隔 5 分钟，从 Tushare 获取沪深 300 的最新行情，计算 5 日均线和 20 日均线，如果金叉则通过飞书发送买入信号。”

龙马注：这个场景听起来简单，但实际落地时你会发现，数据格式清洗、频率控制、异常处理（比如某次请求超时）都是坑。别急，第五篇会一步步拆解。

场景六：内容创作与多平台分发

结合 Hermes 的深度研究能力，OpenClaw 可以作为分发入口。

“当我写完一篇博客，OpenClaw 自动把它发布到 WordPress、Medium、微信公众号，并生成一条推文。”

OpenClaw 适合什么，不适合什么？

适合	不适合
需要对接多个消息渠道	需要深度、持续学习的任务（交给 Hermes）
定时、重复性、规则明确的自动化	需要跨会话长期记忆的复杂对话
作为团队协调者，调度多个 Agent	对延迟极度敏感的高频交易执行（但仍可作为信号接收端）
开发确定性强的业务逻辑	任务逻辑模糊、需要自主探索的任务

✏️ 即时自测：如果你想让 AI 记住你上周聊过的某本书的读后感，应该用 OpenClaw 还是 Hermes？

🛠️ 课后实践（本节）：写下 3 个你自己工作或生活中可能用 OpenClaw 解决的场景。不用考虑技术可行性，先想象。

💭 本节总结（不看书写 3 行）：

📊 用时记录：计划min → 实际__min → 偏差原因：__

✏️ 即时自测答案：应该用 Hermes，因为它的三层记忆系统专为跨会话长期记忆设计。OpenClaw 的记忆更偏向短期会话和可配置的 RAG 知识库。

1.4 OpenClaw不能做什么：能力边界认知

🎯 本节目标：建立对 OpenClaw 的合理预期，避免后续学习中产生“为什么它做不到 XX”的困惑。

预计时长：0.5 小时

它不是内置大模型

OpenClaw 不包含任何 LLM。它只是一个“网关”，你需要自己提供模型 API（OpenAI、Anthropic、Gemini、本地 Ollama 等）。这意味着：

你需要为自己的 API 调用付费（除非使用本地模型）。
模型的智商决定了 Agent 的天花板。给 OpenClaw 接一个弱模型，它就会变得很“笨”。

权限配置需要你亲自动手

OpenClaw 默认不会自动为 Agent 分配合理的权限。如果你不给 Agent 配置任何限制，它理论上可以执行任何 shell 命令、读写任何文件。这是设计使然——把控制权交给你，也把责任交给你。

我们在第 3.6 节会详细讲解如何配置最小权限原则、敏感操作二次确认、工具级权限隔离。

没有内置的多用户认证系统

OpenClaw 假设你是一个人在使用。如果你需要多个用户（比如团队协作），你需要自己在前端（如 Web UI）配置反向代理和认证（见第 5.2.2 节）。

缺乏细粒度的多用户权限隔离

即使你通过反向代理实现了多用户登录，OpenClaw 底层并没有“用户 A 只能访问 Agent X，用户 B 只能访问 Agent Y”的机制。所有会话共享同一个 Gateway 实例。对于严格的多租户场景，你需要运行多个 OpenClaw 实例。

龙马注：这一点在团队使用时确实麻烦。我们的做法是：为每个团队成员启动一个独立的 OpenClaw 进程，绑定不同的端口，然后用 Nginx 做路由。资源占用会翻倍，但隔离性最好。

⚠️ 常见误区汇总

“OpenClaw 自带 AI 大脑” → 错，它需要外接 LLM。
“装好就能用，不用配置” → 错，至少需要配置 API Key 和渠道。
“云端 SaaS，数据自动同步” → 错，本地优先，数据在你自己机器上。
“可以完全替代 Zapier / IFTTT” → 部分可以，但 OpenClaw 更偏“对话式自动化”，而 Zapier 更偏“事件触发式”。两者可以互补。

🛠️ 课后实践（本节）：写下你对 OpenClaw 的两个预期和一个担忧。等学完全篇后再回看，看预期是否准确，担忧是否解决。

💭 本节总结（不看书写 3 行）：

📊 用时记录：计划min → 实际__min → 偏差原因：__

第1章参考资料与扩展阅读

OpenClaw GitHub 仓库 https://github.com/openclaw/openclaw
（建议 Star 并 Watch Release，以便跟踪版本更新）
OpenClaw 官方文档 https://docs.openclaw.com/
（英文，但很详细。如果遇到问题，先在这里搜索）
Peter Steinberger 的博客文章：《Why I built OpenClaw》 https://petersteinberger.com/2025/12/openclaw-origin/
（了解项目背景的第一手资料）
ClawHub – OpenClaw 社区技能市场 https://clawhub.com/
（后续第4章会用到）
OpenClaw 的架构设计文档（官方） https://docs.openclaw.com/architecture/
（对应 1.2 节核心架构，建议至少浏览一遍）

本章综合实践（第1章完成后）

任务：写一段 150 字以内的介绍，用你自己的话向一位不懂技术的朋友解释“OpenClaw 是什么，它能做什么，不能做什么”。

要求：

不能使用“网关”“Agent”“Skill”等术语（或者必须解释清楚）。
举一个具体的例子（比如“你可以对它说：把我今天收到的所有邮件附件存到桌面”）。

完成后，把这段介绍保存到一个文本文件中，命名为 chapter1_my_understanding.txt。在后续章节中，你可能会回来修改它。

龙马的评审（模拟）：

“第1章的内容没问题，都是公开可查的事实。但我想提醒读者：OpenClaw 的版本迭代非常快，文中提到的‘20+渠道’可能在你读到的时候已经变成 25+了。所以遇到具体配置时，一定以官方文档为准，尤其是渠道接入部分。附录 G 会教你怎么应对版本变动。”

沈飞的评审（模拟）：

“作为一个量化从业者，我特别关注 1.3 节的‘金融数据监控’场景。这里只说‘发送买入信号’太简单了。真正的量化系统里，信号从产生到执行中间隔着风控检查、仓位管理、滑点估计……不过这些后面第五篇会详细讲，第1章只是建立概念，可以接受。”

下一章预告：第2章部署与基础配置 —— 你将第一次在本地跑起 OpenClaw，并通过飞书/Telegram 给它发消息。

文章版权归作者所有，未经允许请勿转载。

THE END

搭建一人公司给自己的书一人多Agent公司
# openclaw # 一人公司 # Hermes # AI量化 # 给自己写的书

第1章认识OpenClaw

第一篇 OpenClaw：多渠道AI网关的深度掌握

开篇寄语（续）

第1章认识OpenClaw

1.1 诞生故事与定位

一个周末实验项目的爆发

本质定位：自托管的个人 AI 代理网关

为什么它增长这么快？

1.2 核心能力一览

渠道能力：20+ 消息平台

核心架构：Gateway + Agent + Skills + Memory

本地优先与隐私

语音与 Canvas

1.3 OpenClaw能做什么：典型应用场景

场景一：智能日程管理与邮件整理

场景二：浏览器自动化与数据采集

场景三：代码编写与系统管理

场景四：家庭自动化控制

场景五：金融数据监控与量化交易辅助（为最终目标铺垫）

场景六：内容创作与多平台分发

OpenClaw 适合什么，不适合什么？

1.4 OpenClaw不能做什么：能力边界认知

它不是内置大模型

权限配置需要你亲自动手

没有内置的多用户认证系统

缺乏细粒度的多用户权限隔离

第1章参考资料与扩展阅读

本章综合实践（第1章完成后）

请登录后发表评论

香樟树旁的龙虾公司（钱卫篇）

梧桐树下的阿尔法

第9章 Hermes三层记忆系统

第11章 Hermes工具集与子Agent委托

第14章协作架构设计与ACP协议安装配置

《一人多Agent公司：OpenClaw与Hermes的自学搭建AI量化》完整目录

第1章 认识OpenClaw

第一篇 OpenClaw：多渠道AI网关的深度掌握

开篇寄语（续）

第1章 认识OpenClaw

1.1 诞生故事与定位

一个周末实验项目的爆发

本质定位：自托管的个人 AI 代理网关

为什么它增长这么快？

1.2 核心能力一览

渠道能力：20+ 消息平台

核心架构：Gateway + Agent + Skills + Memory

本地优先与隐私

语音与 Canvas

1.3 OpenClaw能做什么：典型应用场景

场景一：智能日程管理与邮件整理

场景二：浏览器自动化与数据采集

场景三：代码编写与系统管理

场景四：家庭自动化控制

场景五：金融数据监控与量化交易辅助（为最终目标铺垫）

场景六：内容创作与多平台分发

OpenClaw 适合什么，不适合什么？

1.4 OpenClaw不能做什么：能力边界认知

它不是内置大模型

权限配置需要你亲自动手

没有内置的多用户认证系统

缺乏细粒度的多用户权限隔离

第1章 参考资料与扩展阅读

本章综合实践（第1章完成后）

请登录后发表评论

香樟树旁的龙虾公司（钱卫篇）

梧桐树下的阿尔法

第9章 Hermes三层记忆系统

第11章 Hermes工具集与子Agent委托

第14章 协作架构设计与ACP协议安装配置

《一人多Agent公司：OpenClaw与Hermes的自学搭建AI量化》完整目录

第1章认识OpenClaw

第1章认识OpenClaw

第1章参考资料与扩展阅读

第14章协作架构设计与ACP协议安装配置