Hermes Agent
Hermes Agent,一个随你成长的智能助手,提供丰富的功能和自动化工具,包括持久记忆、文件感知上下文、浏览器自动化和语音对话
标签:AI Agent 龙虾工具大全Hermes Agent Hermes Agent官网 Hermes Agent官网入口hermes agent官网github入口:一款功能完备的自我改进型AI智能体,跨会话持久记忆能力
简介
Hermes Agent是一款功能完备的自我改进型AI智能体,核心能力涵盖智能任务执行、跨平台协作、自动化调度和技能生态四大板块。智能任务执行方面,系统配备40多个内置工具,包括网页搜索、浏览器自动化、视觉识别、图像生成、文本转语音、代码执行、子智能体委派等,支持多模型推理和复杂任务拆解。跨平台协作方面,用户可通过Telegram等消息应用与智能体交互,支持语音消息转录和跨平台会话连续性,实现”随时随地指挥AI做事”。自动化调度方面,内置cron调度器支持自然语言设置定时任务,如”每天上午9点发送昨日数据报告”,任务可推送至任意平台。技能生态方面,系统兼容agentskills.io开放标准,支持从ClawHub、LobeHub和GitHub安装社区技能,也能自主创建新技能并共享。此外,系统支持生成隔离子智能体进行并行工作流,通过Python RPC脚本将多步骤管道压缩为零上下文成本的单次调用。
hermes agent官网: https://hermes-agent.nousresearch.com/
hermes agent github项目地址: https://github.com/NousResearch/hermes-agent

Hermes Agent 深度评测:这个会”自我进化”的开源 AI 智能体,凭什么两个月涨到 19K Star?
2026 年 2 月 25 日,Nous Research 悄然在 GitHub 上推送了一个新项目。没有铺天盖地的营销,没有融资新闻,只有一行简单的描述——“The agent that grows with you”(随你成长的智能体)。
两个月后,这个项目已经拿下超过 19,000 个 Star,吸引了超过 207 位开发者贡献代码,社区讨论热度在 Reddit、X(推特)、国内各大技术社区持续攀升。
这不是一个靠 AI 炒作起来的明星项目。它的核心打法只有一个字:真。
它到底是什么
Hermes Agent 是由 Nous Research 开发的开源自主 AI 智能体框架。Nous Research 这个名字对普通用户来说可能有些陌生,但在开源 AI 社区里,他们早已是响当当的存在——Hermes 系列大语言模型、Nomos、Psyché,都出自这个实验室。他们不做云端 SaaS 产品,不做商业包装,专注做开源研究,把最有意思的技术扔给社区。
Hermes Agent 延续了这种风格。它不是一个你用完就扔的”一次性 AI 助手”,它是一个运行时间越长、能力越强的自主智能体。用项目官方文档的话说:内置了一个学习循环,能从经验中创建技能,在使用过程中不断改进这些技能,并在多次会话中建立对你这个用户越来越深入的理解。
这句话听起来像是营销话术,但它确实是 Hermes 与市面上绝大多数 AI Agent 的真正分野所在。

核心理念:自我进化而非一次性完成
要理解 Hermes,先得理解它与传统 AI Agent 的根本区别。
传统 AI Agent 是静态的。你给它写 Prompt,配置工具,它按照配置执行任务,执行完毕,结束。下次遇到类似任务,它从零开始,不记得上次怎么解决的,不记得你是谁,不记得你的技术栈偏好。
Hermes 的路径完全不同。它的设计逻辑是:每一次成功解决复杂问题,都是一次”学习机会”。任务完成后,Hermes 会自动将解决过程提炼为可复用的”技能”,写入 SKILL.md 文件。下次遇到类似问题,它首先检索已有技能库,直接调用现成经验,执行速度更快,结果更可靠。
这就是 Hermes 官方称之为“自我学习闭环(Learning Loop)”的核心机制。解决 → 提炼 → 记忆 → 复用,然后循环往复,技能库在迭代中不断扩充,对你个人的理解也在加深。
举个具体的例子:你第一次告诉 Hermes 如何清理 Docker 镜像,它完成任务后会自动生成一个”Docker 镜像管理”技能文件。下次你说”帮我清理一下容器”,它不会重新推理整个流程,而是直接调用该技能,执行效率翻倍。

四层记忆系统:不只是”记住了什么”
Hermes 的记忆系统是整个项目在技术上最值得细看的部分,也是它能做到”越用越懂你”的底层支撑。
这套记忆系统由四层构成,每一层解决的问题不同:
第一层:工作记忆(Working Memory)
也就是当前会话的上下文窗口。这一层所有 AI 系统都有,没什么特别之处。
第二层:持久化个人档案
这里是 Hermes 开始与众不同的地方。它维护两个持久化的 Markdown 文件:
MEMORY.md:Hermes 自己的”笔记本”,记录环境信息、项目结构、踩过的坑,上限约 2,200 字符USER.md:你的用户画像,记录你的偏好、沟通风格、技术栈偏好,上限约 1,375 字符
这两个文件不会随会话结束而消失,它们是跨会话持续存在的。每次启动新对话,Hermes 会自动加载这两个文件,瞬间”想起”你是谁、上次聊了什么。
第三层:技能库(Skills)
技能存储于 SKILL.md 文件中,是从实际解决经验中提炼出来的可复用操作模板。技能库的注入策略很聪明——Hermes 只在上下文窗口中加载技能索引(目录),需要用时才拉取完整内容,有效避免了 Token 膨胀的问题。
第四层:Honcho 深度用户建模层(可选)
在混合模式下,Hermes 可以接入 Honcho 提供跨会话、跨设备的语义用户画像,实现对用户和 AI 自身的双向建模。这一层适合有高度定制化需求的研究场景。
这四层叠加在一起,底层数据用 SQLite 存储,支持 FTS5 全文检索,检索历史对话时由 LLM 负责总结关键内容。这套组合拳让 Hermes 在”记住了什么”之外,还真正解决了”知道怎么做”——这正是传统记忆系统缺失的维度。

主要功能全景
除了核心的自学习能力,Hermes 的功能矩阵相当完整,几乎覆盖了一个开发者日常所需的全部 Agent 能力。
40+ 内置工具 + MCP 扩展
Hermes 开箱即带超过 40 个内置工具,涵盖:Shell 命令执行、文件系统操作、Git 调用、代码分析、网络请求等常见开发场景。更重要的是,它原生支持 MCP(Model Context Protocol),可以通过外部 MCP 服务器接入任意第三方工具,把能力边界大幅扩展。
多平台消息网关
Hermes 内置了针对 Telegram、Discord、Slack、WhatsApp 的消息网关支持。配置完成后,你可以直接通过手机上的 Telegram 发送指令,Hermes 在服务器端执行,结果推回你的手机——实现”手机下令 → 服务器执行 → 手机收结果”的完整闭环,完全不需要打开终端。
内置 Cron 调度器
这是很多用户意想不到的功能。Hermes 支持自然语言描述的定时任务:你说”每周一早上 9 点,分析我的 GitHub PR 摘要”,它自动转换为 Cron 任务,无需手写 Crontab 语法。结合子智能体委派,可以搭建”每天早晨自动执行三项并行分析并汇总简报”这类复杂周期性工作流。
灵活部署能力
Hermes 被明确设计为”从笔记本到 GPU 集群”都能运行的框架。个人用户在一台 5 美元 VPS 上可以跑起来,团队可以部署在共享服务器上,有算力需求时可以扩展到 GPU 集群——同一套代码,不同的资源规模。
模型无关性
Hermes 不绑定任何特定的大语言模型。只需通过 hermes model 命令切换,即可在 Claude、GPT、Gemini、本地 Ollama 模型之间自由更换,完全不影响上层工具调用和记忆系统的正常工作。
安全沙盒 + 5 种终端后端
代码执行环境有多种沙盒选项,支持 5 种不同的终端后端,既兼顾灵活性,也为安全敏感的场景提供了隔离保障。
技能社区生态
Hermes 的技能系统兼容 agentskills.io 开放标准,有独立的社区技能中心 Skills Hub,开发者可以上传、下载、共享技能。这意味着你不一定非得从零开始训练 Hermes,直接从社区装几个成熟技能,立刻就能用上别人积累的经验。

实际测评体验
从 GitHub 发布至今,Hermes 的真实用户体验如何?综合各平台的深度评测和社区讨论,可以归纳出以下几个维度的判断:
上手体验
对有 CLI 基础的开发者来说,Hermes 的安装部署相对流畅,文档覆盖了主要的配置场景。工具调用开箱即可使用,不需要手写复杂的 Prompt 工程。消息网关的配置略有门槛,但社区已经有相当多的教程覆盖。对非技术用户,Hermes 目前没有图形界面,这是明显的门槛。
记忆系统实际效果
这里有一个值得诚实说明的地方:Hermes 的”自我进化”在某些社区讨论中被认为有所夸大。有用户指出,技能的创建并非完全自动化——在许多情况下,你需要显式地告诉 Hermes “把这个任务的解法保存为技能”,而非完全被动触发。但这并不否定记忆系统本身的价值,MEMORY.md 和 USER.md 的跨会话持久化是货真价实的,FTS5 全文检索也切实解决了”失忆”问题。
工具调用稳定性
40+ 内置工具的整体稳定性得到了社区的正面评价。Shell 执行、文件操作、Git 调用这些高频场景表现优秀。工具调用在不同 LLM 后端之间略有差异——Claude 系列的工具调用兼容性普遍优于本地小模型。在只有 8GB 显存的 GPU 上跑本地模型时,工具调用的成功率会有所下降,这与底层 LLM 能力的上限直接相关。
定时任务
内置 Cron 调度器是这次测评中一致获得好评的功能。自然语言转 Cron 任务的转化准确率高,结合 Telegram 消息网关,整个定时自动化流程的配置体验远优于竞品。
性能与资源占用
单 Agent 运行时资源占用处于合理水平,在普通 VPS 上日常使用不存在性能问题。多并发场景下需要考虑 LLM API 的并发上限,Hermes 本身并不是性能瓶颈。

五款同类产品深度横评
AI Agent 赛道目前已经相当拥挤,Hermes 处于哪个位置?下面选取五款最具代表性的竞品,从多个维度进行对比。
OpenClaw
OpenClaw 是目前 GitHub 上标星最高的开源 AI Agent 项目之一,超过 33 万 Star。它与 Hermes 的定位形成了有趣的互补关系。
核心架构差异:OpenClaw 的设计思路是”控制面优先”——一个长期运行的中央控制进程,统一管理会话路由、工具执行、权限控制和多 Agent 协调。所有事情都流经这个控制平面。Hermes 则是”Agent 本身优先”——把自主执行循环放在核心,系统围绕这个核心构建。
记忆与学习:OpenClaw 通过社区技能市场(ClawHub,托管超过 13,700 个技能)解决技能扩展问题,但技能需要手动安装,不像 Hermes 能从使用过程中自动提炼。Hermes 的四层记忆系统在个性化深度上领先,OpenClaw 在多 Agent 场景下的状态协调能力更强。
多 Agent 支持:OpenClaw 天然支持多 Agent 编排,适合需要协调多个专用 Agent 分工协作的场景。Hermes 目前聚焦于单 Agent 深度优化,多 Agent 能力相对有限。
本地部署与隐私:OpenClaw 对”完全本地部署”的支持更彻底,配合 Ollama 可实现 100% 本地运行、数据零外传,适合极度重视数据主权的用户。
结论:需要多渠道工作流协调和多 Agent 编排,选 OpenClaw;需要长期深度个性化的单 Agent 助手,选 Hermes。二者不互斥,可以并行部署。
CrewAI
CrewAI 是开发者社区里最主流的 Python 开源 Agent 框架之一,GitHub 标星约 4.6 万,MIT 许可证。
核心定位:CrewAI 的核心卖点是多 Agent 协作编排,它提供两种模式:Crews(自主 Agent 协作)和 Flows(确定性工作流编排)。这让它非常适合构建多个专用 Agent 分工协作的复杂系统。
与 Hermes 的最大差异:CrewAI 是一个”框架”,你需要写 Python 代码来定义 Agent 的角色、目标、工具和协作方式。Hermes 是一个”可直接使用的 Agent”,安装完就能开始对话,不需要写框架代码。
记忆与学习:CrewAI 内置了基础的 RAG 记忆能力,但没有 Hermes 那套从经验中自动提炼技能的学习循环。
代码执行安全性:CrewAI 的 Agent 直接运行在 Python 进程中,没有沙盒隔离,这在多用户场景下存在安全风险。
生态成熟度:CrewAI 在工具集成、云端托管(AMP 平台)、文档完整度等方面都明显优于 Hermes,社区更大,第三方教程更丰富。
结论:需要构建生产级多 Agent 系统、团队有 Python 开发能力,选 CrewAI;需要开箱即用的个人智能助手并期望长期学习进化,选 Hermes。
Paperclip
Paperclip 是 GitHub 标星约 3.3 万的开源项目,在所有开源 Agent 框架中,它的野心是最大的。
核心理念:Paperclip 不是在构建一个 Agent,也不是在构建一套工作流——它在构建整个 AI 驱动型组织的基础设施。它的 Agent 按照”组织架构”来运转:CEO Agent 委派给 VP Agent,VP Agent 再委派给执行层 Agent,形成完整的层级委派链条。
与 Hermes 的定位差异:Hermes 是纵向深挖单个 Agent 的能力(记忆深度、技能积累),Paperclip 是横向扩展构建 AI 组织(多 Agent 层级协作)。两者几乎没有直接竞争。
技术成熟度:Paperclip 仍处于相对早期的阶段,文档不完整,部署和配置需要较高的技术能力。但其开创性的”AI 公司总部”概念无可替代,目前市场上没有任何其他平台在做同样的事情。
模型无关性:与 Hermes 一样,Paperclip 支持接入任意 LLM 模型。
结论:如果目标是构建一套能自主运转的 AI 运营层,Paperclip 是首选;如果只是需要一个高质量的个人 AI 助手或任务执行 Agent,Hermes 远比 Paperclip 成熟可用。
AutoGPT
AutoGPT 是整个 AI Agent 浪潮的早期代名词,曾经是 GitHub 增速最快的项目之一,如今已经演变为一个平台化的产品体系。
当前状态:AutoGPT 如今分为开源框架层和 AutoGPT Platform(托管平台)两部分。开源层聚焦于 Agent 执行引擎,平台层提供可视化的工作流搭建、监控和托管能力。
与 Hermes 的差距:在”自主学习”这个维度上,AutoGPT 与 Hermes 不在同一个层次。AutoGPT 的重心在于”让 Agent 完成指定任务”,Hermes 的重心在于”让 Agent 在完成任务的过程中变得更好”。AutoGPT 没有类似的从经验中自动提炼技能的机制。
优势方向:AutoGPT 在长任务自主执行、网页浏览、代码执行等方面的能力已经相当成熟,工具覆盖广,社区生态庞大。对于需要”一次性完成一项复杂长任务”的场景,AutoGPT 的执行稳定性更经过时间检验。
商业化:AutoGPT Platform 是托管产品,有付费套餐,而 Hermes 完全开源、自托管,无任何使用费用。
结论:Hermes 在个人长期伴侣式使用和持续学习方面领先;AutoGPT 在任务执行成熟度、社区生态体量和商业化场景方面积累更深。
Lindy AI
Lindy 是面向非技术用户的无代码 AI Agent 构建平台,已融资近 5,000 万美元,用户规模约 4 万人。
根本定位差异:Lindy 是封闭的 SaaS 产品,Hermes 是完全开源的自托管框架,二者服务的用户群体几乎不重叠。
Lindy 的独特设计:Lindy 做了一个有意思的架构取舍——从开放式 LLM Agent 转向受约束的工作流图。AI 只处理真正模糊的决策节点,其余确定性逻辑由传统软件执行。这个设计让 Lindy 的工作流执行更稳定可预测,适合重复性业务自动化。
Hermes 的对比优势:Hermes 的自适应学习能力是 Lindy 完全没有的。Lindy 的 Agent 不会随着使用积累变得更”懂你”,每次配置工作流都是从零开始的手动搭建。另外,Lindy 采用积分计费,用户对账单不可预测的投诉相当多,Trustpilot 评分仅 2.4/5。
Hermes 的对比劣势:Lindy 提供可视化的工作流构建器和预设集成(Salesforce、HubSpot、Gmail 等),对非技术用户极为友好,而 Hermes 目前没有图形界面,需要 CLI 操作。
结论:非技术用户需要快速搭建业务自动化流程,Lindy 更适合;技术用户追求零成本、长期个性化学习能力,Hermes 是更好的选择。

横向对比一览
| 维度 | Hermes Agent | OpenClaw | CrewAI | Paperclip | AutoGPT | Lindy AI |
|---|---|---|---|---|---|---|
| 开源/免费 | ✅ 完全开源 | ✅ 完全开源 | ✅ 开源 | ✅ 完全开源 | ⚠️ 框架开源/平台付费 | ❌ SaaS付费 |
| 自我学习能力 | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐ | ⭐⭐ | ⭐ | ⭐ |
| 多 Agent 协作 | ⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 非技术用户友好 | ⭐⭐ | ⭐⭐ | ⭐⭐ | ⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 持久记忆深度 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ |
| 本地部署 | ✅ 支持 | ✅ 强力支持 | ✅ 支持 | ✅ 支持 | ⚠️ 部分支持 | ❌ 仅云端 |
| 内置工具数量 | 40+ | 丰富 | 75+ | 中等 | 丰富 | 中等 |
| 定时任务 | ✅ 内置自然语言 Cron | ⚠️ 网关层支持 | ⚠️ 需配置 | ❌ | ⚠️ 需配置 | ✅ 支持 |
| 社区生态成熟度 | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 文档完整度 | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
谁应该用 Hermes Agent?
经过上面的分析,Hermes 适合的用户画像其实相当清晰。
最适合 Hermes 的场景:
- 独立开发者或技术创业者,希望有一个随着时间积累越来越懂自己工作习惯的 AI 助手,而不是每次都要重新”培训”它
- 研究人员和工程师,需要一个在特定技术领域(如代码管理、数据处理、文档分析)持续沉淀专业技能的 Agent
- 对数据隐私有要求的用户,本地部署 + 完全开源,数据不离开自己的环境
- 希望通过 Telegram 等消息平台远程控制 AI Agent 执行服务器端任务的场景
- 对 AI Agent 研究感兴趣的开发者,Hermes 提供了 RL 环境、轨迹生成等研究友好的接口
不适合 Hermes 的场景:
- 需要快速搭建、无需任何 CLI 操作的非技术用户
- 需要大规模多 Agent 协作和层级委派编排的企业系统
- 需要与 Salesforce、HubSpot 等 CRM 系统深度集成的销售团队
- 追求成熟稳定、有商业级 SLA 保障的生产环境
值得关注的几个细节
有几点在一般评测文章里容易被忽略,但实际使用时会有明显感知:
ACP 协议的前瞻性:Hermes 使用了专门为 Agent 设计的 ACP(Agent Communication Protocol)通信协议,而不是 HTTP REST 这类通用协议。这套协议支持初始化、认证、会话创建和流式响应的全链路,对 IDE 插件、桌面客户端等第三方集成提供了统一的接入接口,这是个长远布局。
技能系统的开放标准:Hermes 的技能系统基于 agentskills.io 开放标准,这意味着 Hermes 产生的技能文件不是私有格式,理论上可以在兼容该标准的其他平台上复用。这种标准化思路在整个 AI Agent 生态里是相对少见的。
RL 研究接口:这个功能可能大多数普通用户用不上,但它说明了 Hermes 的研究背景。Nous Research 把 Hermes 设计为一个强化学习友好的环境,支持轨迹生成和模型微调,这是 Nous Research 在大模型研究方向的延伸布局,不只是一个实用工具项目。
更新节奏:上线不到三个月,已经完成了数百次代码合并,207 位贡献者参与,这个更新速度在所有同类开源项目里都属于顶级,某种程度上也意味着接口变化快、需要保持关注。
当前局限与已知问题
诚实地说,Hermes 目前还是一个快速发展中的项目,有一些已知的短板。
文档厚度不足:与 CrewAI 或 AutoGPT 相比,Hermes 的文档仍然偏薄,进阶功能的说明不够详细,新手入门时常常需要靠阅读源代码和社区讨论来补充理解。
“自我进化”有一定夸大成分:如前文所述,技能的自动创建在实际使用中并不总是完全被动触发,部分情况下仍需要用户显式发起。这与官方宣传的”自动提炼”存在一定落差,需要对预期做适当管理。
对底层 LLM 能力高度依赖:工具调用的成功率、技能提炼的质量,都与底层语言模型的能力强相关。在 8GB 显存的 GPU 上运行本地小模型时,某些功能会出现不稳定。官方推荐的后端是 Claude 系列,这在一定程度上限制了完全脱离商业 API 的可能性。
社区规模相对小:相比 OpenClaw(33 万+ Star)和 CrewAI(4.6 万+ Star),Hermes 的 19K Star 在绝对量上仍是少数,遇到冷僻问题时能参考的社区讨论也更少。
技术发展方向推断
从 Hermes 目前的架构和 Nous Research 的研究方向来看,几个可能的演进路径值得关注:
技能自动提炼的提升:目前技能创建存在一定的手动触发成分,后续版本大概率会进一步强化自动化程度,让 Learning Loop 真正实现完全被动触发。
多 Agent 支持:目前 Hermes 聚焦于单 Agent 深度,但 ACP 协议的设计为多 Agent 通信留有接口,多 Agent 协作能力可能在未来版本中出现。
与 Nous Research 模型的深度整合:Nous Research 本身有成熟的开源 LLM 系列(Hermes 模型家族),让 Agent 框架与自家的模型深度协同,从而实现”Agent 使用专门为 Agent 优化的 LLM”的垂直整合,是非常自然的方向。
RL 驱动的持续优化:利用 Hermes 积累的轨迹数据来微调底层模型,是 Nous Research 作为研究机构能做、而其他纯产品公司不太可能做的事情。如果这个方向走通,Hermes 的”自我进化”可能会从提示词层面的技能积累,提升到参数层面的模型进化,这才是终极形态。
两个月,19K Star,207 位贡献者,从零开始。Hermes Agent 的快速崛起背后,是整个 AI Agent 领域对”真正自主学习”这一核心命题的集体渴望。大多数产品都宣称自己的 Agent 会越变越聪明,Hermes 是少数几个真的在架构层面把这件事做认真了的。
它目前还不完美,文档薄、部分功能仍需打磨,但它开创的那个模式——从经验中自动提炼技能、建立深度用户画像、真正实现跨会话知识积累——几乎可以确定是整个行业接下来几年的发展方向。
先入场,先占便宜。