第8章 Hermes部署与基础配置

第8章 Hermes部署与基础配置

本章前置检查

  • □ Python 3.10+ 环境
  • □ 网络通畅(可访问 GitHub 及 LLM 提供商 API)
  • □ 至少一个大语言模型的 API Key(OpenAI / Anthropic / 本地 Ollama / 国内大模型平台均可)
  • □ 已完成第 7 章的学习,了解 Hermes 的核心架构

本章预估总时长:4 小时

本章难点提示

  • 8.1 节的环境要求是本章最容易忽视的部分——Hermes 不支持原生 Windows,Windows 用户必须使用 WSL2,这一步不要跳过。
  • 8.3 节的执行后端配置是多环境部署的关键,Local 用于本地调试,Docker 用于隔离运行,SSH 用于远程管理,按需选择即可。
  • 8.4 节的模型配置是本章的核心,建议优先通过交互式向导完成首次配置(5 分钟即可),之后再根据需要手动编辑配置文件。国内用户推荐使用阿里云百炼或 SiliconFlow 等聚合平台,一个 API Key 可调用多款主流模型。
  • 8.5 节的飞书接入需要飞书开放平台的权限配置,建议提前准备好飞书企业账号(个人版也可创建测试应用)。

🎯 本章教学目标:独立完成 Hermes 部署,通过 CLI 成功发送第一条测试消息,配置至少一种模型后端(云端 API 或本地 Ollama),掌握 DeepSeek、Qwen 3.5 等主流国内模型的接入方法,并完成飞书渠道的接入。

图片[1]-Hermes Agent 怎么部署?从环境检查到飞书接入的完整避坑指南

8.1 环境要求与系统准备

🎯 本节目标:检查你的机器是否满足 Hermes 的运行要求,并完成基础环境搭建。

预计时长:0.5 小时

8.1.1 Hermes 与 OpenClaw 的关系

在开始部署之前,有必要澄清 Hermes 和 OpenClaw 的关系。

这两个项目看似在做同样的事情,但实际上解决的不是同一层问题。OpenClaw 更像入口层和调度层,重点是“消息怎么进来、会话怎么路由、平台怎么接”;Hermes 更像 Agent 本体的执行与学习引擎,重点是“工具怎么用、经验怎么沉淀、下次怎么变强”。它们不是竞争关系,而是可以配合使用的互补工具——OpenClaw 负责多渠道接入和团队调度,Hermes 负责深度学习和策略进化,这在第五篇的量化系统中会有完整体现。

龙马注:我一开始也以为 Hermes 是 OpenClaw 的“替代品”,后来才发现它们是互补的。我的做法是:OpenClaw 管接入和调度(飞书消息进来,分发到各个任务队列),Hermes 管执行和进化(拿到任务后执行、学习、沉淀技能)。两者通过 ACP 协议通信,各取所长。如果你还没上手 OpenClaw,也完全可以直接从 Hermes 开始,它自带基础的消息网关能力。

8.1.2 操作系统支持

操作系统支持情况说明
Ubuntu 20.04+✅ 完全支持官方推荐,生产环境首选
macOS✅ 完全支持Intel 和 Apple Silicon 均可
Windows⚠️ 需要 WSL2不支持原生 Windows,必须在 WSL2 中运行
Android✅ 通过 Termux 支持可在手机上运行,适合移动端测试

Windows 用户必读

如果你使用 Windows,请务必先安装 WSL2。具体步骤已在第 2.1.5 节详细说明。安装完成后,在 WSL2 终端中执行后续所有命令,不要在 Windows 原生命令行或 PowerShell 中尝试。

验证 WSL2 环境:

bash

wsl -l -v          # 确认 Ubuntu 版本为 2
cd ~              # 进入 Linux home 目录

8.1.3 硬件与软件要求

配置项最低要求推荐配置说明
CPU2 核4 核多任务并行时 CPU 压力较大
内存4 GB8 GB+运行本地 LLM 模型需要额外内存
磁盘2 GB20 GB+主要存储记忆、技能、日志
网络稳定低延迟调用 LLM API 需要网络
Python3.10+3.12+安装脚本会自动处理
Git已安装最新版一键安装脚本需要

龙马注:一键安装脚本会自动安装 Python、Node.js、ripgrep、ffmpeg 等依赖,你不需要提前装好它们,但 Git 建议提前装好——网络不好的时候 Git 下载失败是整个安装过程中最可能卡住的地方。

8.2 一键安装与手动安装

🎯 本节目标:通过命令行安装 Hermes,完成首次配置向导。

预计时长:0.5 小时

8.2.1 一键安装(推荐新手)

Hermes 官方提供了一键安装脚本,支持 Linux、macOS、WSL2 和 Android Termux。在终端中执行:

bash

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装脚本会自动完成:

  • 检测操作系统和 Python 版本
  • 安装 uv(Python 包管理器)
  • 安装 Python 依赖
  • 配置 PATH 环境变量(自动添加到 ~/.bashrc 或 ~/.zshrc
  • 触发首次运行配置向导

龙马注:这个安装脚本写得很聪明——它不会破坏你现有的 Python 环境,所有依赖都装在 ~/.local 下。Windows 用户记得在 WSL2 里跑,不要在 PowerShell 里跑。另外,如果网络环境不太稳定,下载 GitHub 资源可能会慢一些,属于正常情况。

8.2.2 验证安装

安装完成后,重新加载终端环境

bash

# 如果你使用的是 bash
source ~/.bashrc

# 如果你使用的是 zsh
source ~/.zshrc

验证安装是否成功:

bash

hermes --version

预期输出类似:hermes v0.11.0(版本号以实际为准)。

8.2.3 手动安装(网络受限或定制安装)

如果一键安装遇到网络问题,可以手动安装:

bash

# 克隆仓库
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent

# 安装依赖
pip install -r requirements.txt

# 以模块方式运行
python -m hermes

龙马注:手动安装没有一键安装那么方便,后续更新也需要手动 git pull。但如果你在内网环境,或者想定制某些依赖版本,手动安装是唯一的选择。

8.2.4 配置文件结构(了解即可)

安装完成后,Hermes 会在你的 home 目录下创建以下结构。理解这些文件的作用,对你后续配置和调试非常有帮助:

~/.hermes/
├── config.yaml          # 主配置文件(模型、后端、工具集等核心设置)
├── .env                 # 环境变量文件(API Key 等敏感信息,权限 0600)
├── state.db             # SQLite 数据库(跨会话记忆和用户档案)
├── gateway/             # 消息网关配置目录
│   └── config.yaml      # 渠道接入配置
├── skills/              # 自动生成的 Skill 存放目录
└── logs/                # 日志文件目录

关键安全提示:配置读取优先级为 .env 文件中的环境变量 > config.yaml 中的配置项 > 内置默认值。API Key 一律放在 .env 中,不要写在 config.yaml 里,防止文件被意外分享或上传到公开仓库。

8.3 执行后端配置

🎯 本节目标:理解六种执行后端的区别,掌握 Local、Docker、SSH 三种常用模式的配置方法。

预计时长:0.5 小时

8.3.1 什么是执行后端?

执行后端决定了 Hermes 在哪里执行代码。Hermes 支持六种执行后端:

后端说明适用场景
Local在 Hermes 进程所在机器直接执行开发调试、可信环境
Docker在临时容器中执行,提供隔离不信任的代码、沙箱运行
SSH通过 SSH 在远程服务器执行管理多台服务器、跨网络任务
Daytona按需创建开发环境开发测试、临时环境
SingularityHPC 容器方案高性能计算场景
Modal云端无服务器执行弹性算力需求

这些执行后端在 Hermes 的核心架构中位于 Layer 2(执行环境层),负责将 Agent 生成的命令在指定的环境中实际执行。

沈飞注:在量化场景中,我通常这样搭配:WSL2 里用 Local 模式做开发和回测,云端用 Docker 模式跑一些隔离的定时任务,生产交易服务器用 Local 模式保证最低延迟。一套代码,三套后端,切换成本几乎为零。

8.3.2 Local 模式(默认,推荐新手)

Local 模式是 Hermes 的默认后端,所有命令直接在宿主机执行。适用于开发调试和可信环境。

通过命令配置(推荐) :

bash

# 在配置向导中选择 Local
hermes setup

# 或在配置向导中直接设置
hermes config set backend.type local

通过配置文件配置

编辑 ~/.hermes/config.yaml

yaml

backend:
  type: local
  local:
    user: "$USER"        # 当前系统用户名

配置完成后重启 Gateway:

bash

hermes gateway restart

8.3.3 Docker 模式(沙箱隔离)

Docker 模式将每条命令封装进临时容器中执行,提供进程级隔离和环境一致性保障。适用于高安全要求或需要特定运行环境的场景。

前置条件:Docker 守护进程必须运行中。

配置步骤

bash

# 安装 Docker(如尚未安装)
# Ubuntu/Debian
sudo apt install docker.io

# macOS
brew install docker

# 启动 Docker
sudo systemctl start docker   # Linux
# macOS 直接启动 Docker Desktop

通过命令配置

bash

hermes config set backend.type docker
hermes config set backend.docker.image "ubuntu:22.04"

通过配置文件配置

yaml

backend:
  type: docker
  docker:
    image: "ubuntu:22.04"
    network_mode: "bridge"
    volumes:
      - "/tmp:/tmp:rw"

验证配置

bash

docker info                    # 确认 Docker 可用
hermes gateway restart

龙马注:Docker 模式的启动速度比 Local 慢一点(每次执行都要拉容器),但对于执行不信任的 Skill 或处理用户上传的代码时,这个隔离级别是必要的。我一般在生产环境给风控 Agent 用 Docker 模式,交易 Agent 用 Local 模式——安全与性能之间的取舍,得分场景。

8.3.4 SSH 模式(远程执行)

SSH 模式使 Hermes 通过加密连接将命令转发至指定远程主机执行。适用于跨网络管理多台服务器。该模式要求目标主机已启用 SSH 服务且配置了免密登录。

配置步骤

bash

# 生成 SSH 密钥(如果还没有)
ssh-keygen -t rsa -b 4096

# 将公钥复制到远程服务器
ssh-copy-id username@remote-host

# 配置 Hermes 使用 SSH 后端
hermes config set backend.type ssh
hermes config set backend.ssh.host "your-remote-server.com"
hermes config set backend.ssh.username "your-username"
hermes config set backend.ssh.key_path "/home/user/.ssh/id_rsa"

配置文件示例

yaml

backend:
  type: ssh
  ssh:
    host: "your-remote-server.com"
    port: 22
    username: "deploy"
    key_path: "/home/user/.ssh/id_rsa"

验证连接

bash

ssh -i /home/user/.ssh/id_rsa username@remote-host "echo Connected"
hermes gateway restart

8.3.5 验证当前生效模式

执行以下命令确认后端配置已生效:

bash

hermes gateway status
# 输出 Active Backend 字段应显示 local / ssh / docker

💡 学习建议:本章先掌握 Local 模式即可,Docker 和 SSH 属于进阶内容。后续用到时再回来参考。

8.4 模型配置:接入大语言模型

🎯 本节目标:学会配置 LLM 模型,让 Hermes 能够智能生成回复。本章将详细讲解国内主流模型(DeepSeek、Qwen 3.5)、阿里云百炼、OpenRouter、本地 Ollama、vLLM 等多种接入方式。

预计时长:1.5 小时

8.4.1 Hermes 与 LLM 的关系

Hermes 本身不包含任何大语言模型,它是一个“模型无关”的调度框架——只要服务暴露 OpenAI 风格的 API,就能无缝接入-43。这意味着你完全不会被单一模型供应商锁定,可以在云端 API、本地 Ollama、自建推理集群之间自由切换。

8.4.2 方法一:通过交互式命令配置(推荐新手,5 分钟搞定)

Hermes 提供了完整的交互式配置流程,无需手动编辑文件,特别适合首次配置或快速切换模型-43

bash

# 启动模型配置向导(在终端运行,不要在会话中执行)
hermes model

向导会依次引导你完成:

  1. 选择 LLM provider(模型提供商)
  2. 输入 API Key
  3. 选择默认模型

配置完成后,直接运行 hermes 即可进入交互式对话界面。

龙马注hermes model 是供应商设置向导,运行在终端(非会话内);/model 斜杠命令只能在已配置的供应商中切换,两者职责不同,新增供应商必须用 hermes model

8.4.3 方法二:编辑 config.yaml 配置文件(灵活定制)

如果需要更精细的控制(比如配置自定义中转服务、同时配置多个模型),直接编辑配置文件是更灵活的选择。

bash

# 使用以下命令在默认编辑器中打开配置文件
hermes config edit

# 也可以手动编辑
vim ~/.hermes/config.yaml

基础配置模板如下:

yaml

model:
  provider: openai
  base_url: https://your-proxy-endpoint.com/v1
  name: your-model-name

关键提示base_url 必须以 /v1 结尾。

8.4.4 国内主流模型接入详解

方案一:DeepSeek 接入(成本最优的旗舰 Agent 方案)

DeepSeek 系列模型以约 1/7 的价格实现接近 GPT-5.5 的性能,日处理 1 万次 Agent 任务仅需约 $42-1。Hermes Agent 原生支持 deepseek 提供商-1

① 通过交互式向导配置

bash

hermes model
# → 选择 "deepseek"
# → 输入 API Key
# → 选择模型(deepseek-v4-flash 或 deepseek-v4-pro)

② 通过 CLI 直接设置

bash

# 方式 A:使用内置 deepseek provider
hermes config set model deepseek/deepseek-v4-flash

# 方式 B:设置 API Key(自动路由到 .env 文件)
hermes config set DEEPSEEK_API_KEY sk-your-deepseek-key-here

# 验证配置是否生效
hermes config get model   # 输出示例:deepseek/deepseek-v4-flash

③ 手动编辑配置文件

yaml

model:
  provider: deepseek
  model: deepseek-v4-flash
  base_url: https://api.deepseek.com/v1
  api_key: ""          # 请填写在 .env 文件中

④ 使用环境变量临时覆盖(不修改任何持久化配置,适用于调试或多人共用服务器):

bash

export DEEPSEEK_API_KEY=sk-xxx
export DEEPSEEK_MODEL=deepseek-v4-pro
export DEEPSEEK_BASE_URL=https://api.deepseek.com/v1
hermes

龙马注:对于新用户,建议先使用默认的 deepseek-chat 模型测试连通性,确保 API 配置正确后再切换到 V4 系列正式使用。

方案二:阿里云百炼 + Qwen 3.5 接入(国内用户推荐)

阿里云百炼是阿里云一站式大模型开发与应用构建平台,提供了通义千问 3 全系列模型(Qwen3-Max、Qwen3-Plus 等),支持 OpenAI 兼容接口,无缝适配 Hermes Agent 等开源工具。Qwen3.5 Plus 作为 2026 年初更新的旗舰大模型,采用 3970 亿总参数量(推理仅激活 170 亿)的高效架构。

前置准备

  1. 登录阿里云百炼控制台,创建并复制 sk- 开头的 API Key-。
  2. 确认模型接口地址:
    • base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1(OpenAI 兼容接口地址)-
    • 模型 code:如 qwen3-2026-01-23(Qwen3 系列)、qwen-turbo(通义千问 Turbo 版),可在百炼“模型广场”查询具体模型 code-

yaml

model:
  provider: custom
  name: qwen3-2026-01-23
  base_url: https://dashscope.aliyuncs.com/compatible-mode/v1
  api_key: ""          # 请填写在 .env 文件中

验证配置

bash

hermes test   # 验证响应是否正常
# 否则检查 Key 有效性、URL 拼写及模型权限

沈飞注:在量化场景中,我常用百炼的 Qwen 模型做因子分析和策略回测,搭配阿里云的 OSS 存储历史数据,整个链路都在同一生态内,数据流转非常顺畅。建议新用户先在百炼申请免费额度测试,确认连通性后再根据实际调用量选择付费方案。

方案三:OpenRouter / 硅基流动(SiliconFlow)模型聚合平台

如果你希望用一个 API Key 调用多款主流模型,OpenRouter 和硅基流动是理想选择。

硅基流动(SiliconFlow)配置(100+ 高性能大模型聚合平台):

yaml

model:
  provider: custom
  base_url: https://api.siliconflow.cn/v1
  name: deepseek-ai/DeepSeek-V3   # 在模型广场复制完整模型名称
  api_key: ""   # 请填写在 .env 文件中

硅基流动 API Key 以 sk- 开头,请在平台 API 密钥页面创建。base_url 务必包含末尾的 /v1

OpenRouter 配置(100+ 模型聚合,一个密钥通吃):

yaml

model:
  provider: openrouter
  name: deepseek/deepseek-v4-flash
  base_url: https://openrouter.ai/api/v1
  api_key: ""   # 请填写在 .env 文件中

龙马注:OpenRouter 的模型命名规则通常是 provider/model 格式,比如 deepseek/deepseek-chat 或 anthropic/claude-3-sonnet。如果拿不准模型名,可以在 OpenRouter 官网的 Models 页面查到完整标识符。

方案四:本地大模型部署(Ollama / vLLM / TGI)

4.1 Ollama 本地部署(推荐新手)

如果你希望完全离线运行,或担心云端 API 泄露核心数据,Ollama 是最简单的本地大模型部署方案。Ollama 与 Hermes 配合,无需 API 密钥且完全离线。

① 安装并启动 Ollama

bash

# 安装 Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 启动 Ollama 服务
ollama serve

# 新开终端,下载模型(如 Qwen3.5 9B 轻量版,消费级显卡即可运行)
ollama pull qwen3.5:9b

② 配置 Hermes 使用 Ollama

bash

hermes model
# → 选择 "ollama"
# → 输入模型名称(如 qwen3.5:9b)
# → 输入 Base URL(http://localhost:11434)

或者手动编辑配置文件:

yaml

model:
  provider: ollama
  name: qwen3.5:9b
  base_url: http://127.0.0.1:11434
  # 本地 Ollama 不需要 api_key

启用 Ollama 兼容模式(Ollama 原生 API 与 OpenAI 标准存在字段差异,需显式开启兼容层)-46

yaml

llm:
  ollama_compatible: true

③ 验证端到端连通性

bash

hermes chat -q "你好,请用中文简单自我介绍"
# 若出现 Connection refused,检查 Ollama 是否仍在运行
# 若返回 model not found,核对模型名称与 ollama list 输出是否完全一致
# 若响应内容为空或格式异常,确认 ollama_compatible 已设为 true
4.2 vLLM 和 TGI 部署(企业级高性能推理)

对于生产环境需要高并发、低延迟的场景,vLLM(Very Large Language Model Serving)和 TGI(Text Generation Inference)是专业的开源推理框架,支持高性能 GPU 推理、连续批处理、PagedAttention 等技术。

安装并启动 vLLM

bash

# 安装 vLLM
pip install vllm

# 启动 vLLM 服务(以 Qwen3.5 为例)
python -m vllm.entrypoints.openai.api_server \
    --model Qwen/Qwen3.5-7B-Instruct \
    --served-model-name qwen3.5 \
    --api-key your-api-key \
    --port 8000

配置 Hermes 使用 vLLM(vLLM 默认端口为 8000)-:

yam

model:
  provider: custom
  name: qwen3.5
  base_url: http://localhost:8000/v1
  api_key: your-api-key   # 与 vLLM 启动时的 api-key 保持一致

硬件对硬件要求较高:建议使用 GPU 服务器(如 A10、V100、A100)以获得流畅体验。

TGI(Text Generation Inference) 是 Hugging Face 推出的高速推理框架,同样支持 OpenAI 风格 API,配置方法与 vLLM 类似:

bash

# 启动 TGI 服务
docker run --gpus all -p 8080:80 \
    ghcr.io/huggingface/text-generation-inference:latest \
    --model-id Qwen/Qwen3.5-7B-Instruct

yaml

model:
  provider: custom
  base_url: http://localhost:8080/v1
  name: Qwen/Qwen3.5-7B-Instruct

8.4.5 多模型共存与切换

在生产场景中,你可能有多种需求组合:对话用 GPT-4o,复盘和数据分析用便宜的 DeepSeek V4 Flash,代码指令用本地 Qwen 模型。

你可以在配置文件中预设多套模型配置,然后灵活切换:

bash

# 列出所有已配置的模型
hermes model list

# 切换模型
hermes model set deepseek/deepseek-v4-flash

也可以在每次对话时临时指定:

bash

hermes -m deepseek/deepseek-v4-flash
hermes -m ollama/qwen3.5:9b

8.4.6 常见问题与排障指南

问题现象可能原因解决方案
请求报错 401 UnauthorizedAPI Key 未设置或已过期检查 API Key 是否有效,确认已写入 .env
连线超时/Connection refusedbase_url 配置错误检查是否以 https:// 开头,路径以 /v1 结尾,排除代理干扰
模型无响应provider 与 base_url 不匹配确认 provider 字段与实际使用的 API 类型一致;对自定义端点使用 provider: custom
API Key 存错位置使用了 config.yaml 存储将密钥移至 .env,配置文件用 api_key_env: "KEY_NAME" 引用
报错 404 Not FoundURL 路径不正确确认 vLLM/Ollama 启动时是否指定了 /v1 路径

沈飞注:配置信息中写到,API Key、base_url 和模型名称这三个字段必须严格对应,有一项不对就接不通。很多用户在群里报错问“为什么 Hermes 没反应”,最后发现往往是这几个字段里有一个没写对。建议拿到一个新的 API 时,先用 curl 或 Postman 测试原始 endpoints 是否可达,确认无误后再配置到 Hermes 中排查思路会清晰很多。你可以先配置一个廉价或免费模型跑通流程,再去配置正式的生产模型。

8.5 多渠道接入:飞书 / Telegram 配置

🎯 本节目标:至少完成一个外部消息渠道的接入,能通过手机 App 与 Hermes 对话。

预计时长:0.5 小时

学习提示:消息平台配置是可选的。如果本章时间紧张,可以先跳过,通过 CLI 熟悉 Hermes 之后再回来配置。

Hermes 原生支持 12 个消息平台,包括 Telegram、Discord、Slack、飞书、钉钉、企业微信、个人微信等。本节以飞书为例,展示完整的接入流程。

8.5.1 通用配置流程

无论接入哪个渠道,基本流程都是:

  1. 在对应平台创建 Bot 应用,获取凭证
  2. 在 Hermes 中运行 hermes gateway setup 配置渠道
  3. 启动 Gateway,完成设备配对

8.5.2 飞书接入(推荐国内用户)

步骤 1:创建飞书企业自建应用

  • 登录飞书开放平台,进入开发者后台
  • 点击“创建企业自建应用”,填写名称(如“Hermes Agent”)和应用描述

步骤 2:添加机器人能力

  • 在应用详情页,点击“添加应用能力”,选择“机器人”

步骤 3:配置权限

在左侧导航栏进入“权限管理”,至少需要添加以下核心权限:

权限名称用途
im:message接收与发送消息的核心权限
im:resource获取消息中的资源文件(图片、文件等)
im:chat:readonly读取群聊信息(群聊场景必须)

建议补充以下权限以保障稳定运行:

  • im:chat:访问群组信息
  • im:message.group_at_msg:readonly:接收群内 @ 消息
  • im:message.p2p_msg:readonly:接收私聊消息

步骤 4:获取 App ID 和 App Secret

  • 在左侧导航栏进入“凭证与基础信息”
  • 记录下 App ID 和 App Secret(稍后配置 Hermes 时需要)

步骤 5:配置事件订阅

  • 在左侧导航栏进入“事件与回调”
  • 订阅方式选择“长连接”(WebSocket)
  • 添加事件 im.message.receive_v1(接收消息事件)

龙马注:飞书的“长连接”方式比老的“回调地址”方式简单太多——不需要公网 IP,不需要配回调 URL,不需要搞 ngrok。强烈推荐。如果找不到“长连接”选项,确保你的飞书应用已正确添加机器人能力,并在“事件与回调”页面检查订阅方式的配置入口。

步骤 6:发布应用

  • 进入“版本管理与发布”,创建版本并提交发布
  • 等待审批通过(企业自建应用通常自动通过)

步骤 7:配置 Hermes Gateway

bash

# 启动 Gateway 配置向导
hermes gateway setup

向导选择 Feishu,按提示依次填写:

  • App ID:从飞书开放平台复制
  • App Secret:从飞书开放平台复制
  • Domain:国内用户填 feishu
  • Connection mode:选 websocket

步骤 8:启动 Gateway 并配对

bash

# 启动 Gateway
hermes gateway start

# 安装飞书 SDK 依赖(如果需要)
pip install lark-oapi==2.19.0   # Windows/WSL2 环境下可能需要

打开飞书,搜索你创建的机器人,发送一条消息(如“你好”)。首次对话需要根据终端提示运行配对命令进行授权确认。

沈飞注:配置写入及配对其他有量化场景提到的部分,我在生产环境中发现,飞书配对成功之后,记得把飞书群里的机器人设成“管理员”——否则它只能读消息不能发,很多自动化场景(比如定时推送风控报告)就跑不通了,我也是配到第三次才发现这个问题。

8.5.3 Telegram 接入(国际用户首选)

步骤 1:创建 Bot

  • 在 Telegram 中搜索 @BotFather
  • 发送 /newbot,按提示输入名称和用户名(以 bot 结尾)
  • 记录返回的 Token

步骤 2:配置 Hermes

bash

hermes gateway setup

选择 Telegram,输入 Token。

步骤 3:启动并测试

bash

hermes gateway start

8.5.4 验证渠道连通性

bashet <模型名> # 直接设置模型
hermes config list # 查看当前配置
hermes config set <key> <value> # 修改配置
hermes config get <key> # 查看配置值
hermes config reset # 重置配置
hermes gateway start # 启动消息网关
hermes gateway stop # 停止消息网关
hermes gateway status # 查看网关状态
hermes gateway setup # 配置网关(包括消息渠道)
hermes gateway logs –follow # 实时查看网关日志
hermes schedule “每天早上8点,发送今日待办事项” # 创建定时任务
hermes schedule list # 查看定时任务列表
hermes skills list # 列出已安装的 Skills
hermes skills info <名称> # 查看 Skill 详情
hermes session list # 列出所有会话
hermes session delete –id <会话ID> # 删除会话
hermes test # 测试模型连通性

第8章 参考资料与扩展阅读

  1. Hermes Agent 安装指南(官方) https://help.aliyun.com/zh/model-studio/hermes-agent-token-plan
  2. Hermes Agent 安装与部署指南(附飞书接入教程) https://www.feishu.cn/content/article/7630758640865037530
  3. Hermes Agent 接入飞书 & 企业微信全流程指南 https://cloud.tencent.cn/developer/article/2652796
  4. DeepSeek V4 接入 Hermes Agent 完整指南 https://news.qiniu.com/archives/1777262571046
  5. HermesAgent配置DeepSeek模型:国产大模型新选择 https://www.php.cn/faq/2375148.html
  6. 阿里云/本地部署 Hermes Agent 接入 Qwen3.5 Plus 保姆级教程 https://developer.aliyun.com/article/1731587
  7. 阿里云部署 Hermes Agent / OpenClaw 集成阿里云百炼 Token Plan 保姆级教程 https://developer.aliyun.com/article/1730865
  8. Hermes Agent 怎么接大模型?云端 API 到本地 Ollama 的全路径接入实操 https://www.ai-indeed.com/encyclopedia/19252.html
  9. 本地模型部署_Ollama 与 Hermes Agent 无缝连接教程 https://www.php.cn/faq/2367687.html
  10. OpenClaw – SiliconFlow 配置文档 https://docs.siliconflow.cn/cn/usercases/use-siliconcloud-in-OpenClaw
  11. Hermes Agent 多模型配置与第三方接口接入实战 https://cn-sec.com/archives/11123456.html
  12. Hermes Agent × Qwen 3.5 Plus:构建企业级 AI Agent 工作流 https://developer.aliyun.com/article/1732180

本篇综合实践(第 8 章完成后)

任务:完成以下所有检查项,并记录输出。请注意,飞书渠道配置属于可选拓展任务,如果你时间紧张,可以先完成强制任务,跳过飞书配置,后续如果需要再补上。

🔰 强制任务(1 小时,必须完成)

  • 在本地成功安装 Hermes,运行 hermes --version 确认版本号
  • 完成 hermes setup 向导,配置至少一种模型(推荐 DeepSeek 或阿里云百炼)
  • 通过 hermes 命令进入交互式对话,成功发送并接收至少一条消息
  • 使用 hermes test 测试模型连通性,确认 API 配置正确
  • 理解 8.3 节执行后端的区别,知道 6 种后端分别适用于什么场景
  • 理解 8.4 节模型配置的几种方法,知道 ~/.hermes/ 下各配置文件的作用

🚀 进阶任务(1 小时,推荐完成)

  • 配置第二种模型(如本地 Ollama 或另一云端模型),使用 hermes model 命令切换并测试
  • 配置一个本地 Ollama 模型(如 qwen3.5:9b),体验完全离线推理
  • (可选)将执行后端配置为 Docker 模式,验证隔离执行效果
  • 运行 hermes config list 查看所有配置项,理解每个配置的作用

🔌 拓展任务(30 分钟,可选)

  • (可选)完成飞书或 Telegram 渠道接入,通过手机 App 与 Hermes 对话
  • (可选)运行 hermes gateway start 并保持后台运行

完成后,保存一份环境状态快照,命名为 chapter8_hermes_env.txt,至少包含:

  • hermes --version 的输出
  • hermes config list 的关键配置片段
  • 你使用的模型类型配置(截图或复制配置片段即可)
  • 你的飞书渠道配置状态及首次对话截图(如完成飞书接入)

龙马的评审(模拟):

第 8 章的内容相当详细,尤其是模型配置部分,把国内用户关心的 DeepSeek、Qwen 3.5、百炼、Ollama 都涵盖了。有几个点补充:

  • 关于 hermes gateway setup,有时候会提示缺少 lark-oapi 依赖,直接 pip install lark-oapi 就行。
  • 如果 hermes gateway start 启动失败,先用 lsof -i :18789 看看端口是不是被别的进程占了——这个坑和 OpenClaw 一样。
  • 对于 Ollama 本地部署,ollama pull qwen3.5:9b 需要足够的网络带宽,首次下载约 5-6GB,建议留出足够时间。如果显存不足,可以考虑更小的版本(如 4B 或 1.5B)。
  • 国内用户在配置阿里云百炼时,如果遇到 Connection timeout,建议检查服务器的网络出口是否能够正常访问 dashscope.aliyuncs.com,部分企业内网需要配置白名单。
  • 配置新 API 时,建议先用廉价模型或免费额度验证连通性,没有问题之后再切换到正式的生产模型。这样即使配错了也不会有经济损失。

沈飞的评审(模拟):

第 8 章的执行后端配置、多渠道接入和多模型配置在量化部署里非常实用。DeepSeek V4 以约 1/7 的成本实现接近旗舰模型的性能——这个定价策略对于高频调用量化 Agent 的场景无疑是重大利好。我个人的经验是:策略研发、因子分析这种单次高吞吐需求用百炼 Qwen 3.5 或 DeepSeek V4 Pro(追求推理深度),盘中信号监控这种 7×24 持续任务转给本地 Ollama(完全离线,单次调用零成本)。

另外补充一点生产环境经验:无论时面提到的“定期备份 skill 和会话记录”,还是飞书配对成功之后,记得把飞书群里的机器人设成“管理员”——否则它只能读消息不能发,很多自动化场景(比如定时推送风控报告)就跑不通了,我也是配到第三次才发现这个问题。

下一章预告:第 9 章 Hermes 三层记忆系统——从本章的部署配置进入到 Hermes 最核心的能力:跨会话记忆。你会学到 FTS5 全文检索、MEMORY.md 常驻提示、USER.md 用户画像,以及 RAG 配置——真正理解“越用越聪明”的内核。这是整个 Hermes 区别于其他 Agent 最显著的能力,也是第五篇量化系统中策略 Agent 能够持续优化的基础。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容