hermes agent官网github入口:一款功能完备的自我改进型AI智能体,跨会话持久记忆能力|玩龙虾导航

hermes agent官网github入口:一款功能完备的自我改进型AI智能体,跨会话持久记忆能力

简介

Hermes Agent是一款功能完备的自我改进型AI智能体，核心能力涵盖智能任务执行、跨平台协作、自动化调度和技能生态四大板块。智能任务执行方面，系统配备40多个内置工具，包括网页搜索、浏览器自动化、视觉识别、图像生成、文本转语音、代码执行、子智能体委派等，支持多模型推理和复杂任务拆解。跨平台协作方面，用户可通过Telegram等消息应用与智能体交互，支持语音消息转录和跨平台会话连续性，实现”随时随地指挥AI做事”。自动化调度方面，内置cron调度器支持自然语言设置定时任务，如”每天上午9点发送昨日数据报告”，任务可推送至任意平台。技能生态方面，系统兼容agentskills.io开放标准，支持从ClawHub、LobeHub和GitHub安装社区技能，也能自主创建新技能并共享。此外，系统支持生成隔离子智能体进行并行工作流，通过Python RPC脚本将多步骤管道压缩为零上下文成本的单次调用。

hermes agent官网: https://hermes-agent.nousresearch.com/

hermes agent github项目地址: https://github.com/NousResearch/hermes-agent

Hermes Agent

Hermes Agent 深度评测：这个会”自我进化”的开源 AI 智能体，凭什么两个月涨到 19K Star？

2026 年 2 月 25 日，Nous Research 悄然在 GitHub 上推送了一个新项目。没有铺天盖地的营销，没有融资新闻，只有一行简单的描述——“The agent that grows with you”（随你成长的智能体）。

两个月后，这个项目已经拿下超过 19,000 个 Star，吸引了超过 207 位开发者贡献代码，社区讨论热度在 Reddit、X（推特）、国内各大技术社区持续攀升。

这不是一个靠 AI 炒作起来的明星项目。它的核心打法只有一个字：真。

它到底是什么

Hermes Agent 是由 Nous Research 开发的开源自主 AI 智能体框架。Nous Research 这个名字对普通用户来说可能有些陌生，但在开源 AI 社区里，他们早已是响当当的存在——Hermes 系列大语言模型、Nomos、Psyché，都出自这个实验室。他们不做云端 SaaS 产品，不做商业包装，专注做开源研究，把最有意思的技术扔给社区。

Hermes Agent 延续了这种风格。它不是一个你用完就扔的”一次性 AI 助手”，它是一个运行时间越长、能力越强的自主智能体。用项目官方文档的话说：内置了一个学习循环，能从经验中创建技能，在使用过程中不断改进这些技能，并在多次会话中建立对你这个用户越来越深入的理解。

这句话听起来像是营销话术，但它确实是 Hermes 与市面上绝大多数 AI Agent 的真正分野所在。

Hermes Agent

核心理念：自我进化而非一次性完成

要理解 Hermes，先得理解它与传统 AI Agent 的根本区别。

传统 AI Agent 是静态的。你给它写 Prompt，配置工具，它按照配置执行任务，执行完毕，结束。下次遇到类似任务，它从零开始，不记得上次怎么解决的，不记得你是谁，不记得你的技术栈偏好。

Hermes 的路径完全不同。它的设计逻辑是：每一次成功解决复杂问题，都是一次”学习机会”。任务完成后，Hermes 会自动将解决过程提炼为可复用的”技能”，写入 SKILL.md 文件。下次遇到类似问题，它首先检索已有技能库，直接调用现成经验，执行速度更快，结果更可靠。

这就是 Hermes 官方称之为“自我学习闭环（Learning Loop）”的核心机制。解决 → 提炼 → 记忆 → 复用，然后循环往复，技能库在迭代中不断扩充，对你个人的理解也在加深。

举个具体的例子：你第一次告诉 Hermes 如何清理 Docker 镜像，它完成任务后会自动生成一个”Docker 镜像管理”技能文件。下次你说”帮我清理一下容器”，它不会重新推理整个流程，而是直接调用该技能，执行效率翻倍。

Hermes Agent

四层记忆系统：不只是”记住了什么”

Hermes 的记忆系统是整个项目在技术上最值得细看的部分，也是它能做到”越用越懂你”的底层支撑。

这套记忆系统由四层构成，每一层解决的问题不同：

第一层：工作记忆（Working Memory）
也就是当前会话的上下文窗口。这一层所有 AI 系统都有，没什么特别之处。

第二层：持久化个人档案
这里是 Hermes 开始与众不同的地方。它维护两个持久化的 Markdown 文件：

MEMORY.md：Hermes 自己的”笔记本”，记录环境信息、项目结构、踩过的坑，上限约 2,200 字符
USER.md：你的用户画像，记录你的偏好、沟通风格、技术栈偏好，上限约 1,375 字符

这两个文件不会随会话结束而消失，它们是跨会话持续存在的。每次启动新对话，Hermes 会自动加载这两个文件，瞬间”想起”你是谁、上次聊了什么。

第三层：技能库（Skills）
技能存储于 SKILL.md 文件中，是从实际解决经验中提炼出来的可复用操作模板。技能库的注入策略很聪明——Hermes 只在上下文窗口中加载技能索引（目录），需要用时才拉取完整内容，有效避免了 Token 膨胀的问题。

第四层：Honcho 深度用户建模层（可选）
在混合模式下，Hermes 可以接入 Honcho 提供跨会话、跨设备的语义用户画像，实现对用户和 AI 自身的双向建模。这一层适合有高度定制化需求的研究场景。

这四层叠加在一起，底层数据用 SQLite 存储，支持 FTS5 全文检索，检索历史对话时由 LLM 负责总结关键内容。这套组合拳让 Hermes 在”记住了什么”之外，还真正解决了”知道怎么做”——这正是传统记忆系统缺失的维度。

Hermes Agent

主要功能全景

除了核心的自学习能力，Hermes 的功能矩阵相当完整，几乎覆盖了一个开发者日常所需的全部 Agent 能力。

40+ 内置工具 + MCP 扩展

Hermes 开箱即带超过 40 个内置工具，涵盖：Shell 命令执行、文件系统操作、Git 调用、代码分析、网络请求等常见开发场景。更重要的是，它原生支持 MCP（Model Context Protocol），可以通过外部 MCP 服务器接入任意第三方工具，把能力边界大幅扩展。

多平台消息网关

Hermes 内置了针对 Telegram、Discord、Slack、WhatsApp 的消息网关支持。配置完成后，你可以直接通过手机上的 Telegram 发送指令，Hermes 在服务器端执行，结果推回你的手机——实现”手机下令 → 服务器执行 → 手机收结果”的完整闭环，完全不需要打开终端。

内置 Cron 调度器

这是很多用户意想不到的功能。Hermes 支持自然语言描述的定时任务：你说”每周一早上 9 点，分析我的 GitHub PR 摘要”，它自动转换为 Cron 任务，无需手写 Crontab 语法。结合子智能体委派，可以搭建”每天早晨自动执行三项并行分析并汇总简报”这类复杂周期性工作流。

灵活部署能力

Hermes 被明确设计为”从笔记本到 GPU 集群”都能运行的框架。个人用户在一台 5 美元 VPS 上可以跑起来，团队可以部署在共享服务器上，有算力需求时可以扩展到 GPU 集群——同一套代码，不同的资源规模。

模型无关性

Hermes 不绑定任何特定的大语言模型。只需通过 hermes model 命令切换，即可在 Claude、GPT、Gemini、本地 Ollama 模型之间自由更换，完全不影响上层工具调用和记忆系统的正常工作。

安全沙盒 + 5 种终端后端

代码执行环境有多种沙盒选项，支持 5 种不同的终端后端，既兼顾灵活性，也为安全敏感的场景提供了隔离保障。

技能社区生态

Hermes 的技能系统兼容 agentskills.io 开放标准，有独立的社区技能中心 Skills Hub，开发者可以上传、下载、共享技能。这意味着你不一定非得从零开始训练 Hermes，直接从社区装几个成熟技能，立刻就能用上别人积累的经验。

Hermes Agent

实际测评体验

从 GitHub 发布至今，Hermes 的真实用户体验如何？综合各平台的深度评测和社区讨论，可以归纳出以下几个维度的判断：

上手体验

对有 CLI 基础的开发者来说，Hermes 的安装部署相对流畅，文档覆盖了主要的配置场景。工具调用开箱即可使用，不需要手写复杂的 Prompt 工程。消息网关的配置略有门槛，但社区已经有相当多的教程覆盖。对非技术用户，Hermes 目前没有图形界面，这是明显的门槛。

记忆系统实际效果

这里有一个值得诚实说明的地方：Hermes 的”自我进化”在某些社区讨论中被认为有所夸大。有用户指出，技能的创建并非完全自动化——在许多情况下，你需要显式地告诉 Hermes “把这个任务的解法保存为技能”，而非完全被动触发。但这并不否定记忆系统本身的价值，MEMORY.md 和 USER.md 的跨会话持久化是货真价实的，FTS5 全文检索也切实解决了”失忆”问题。

工具调用稳定性

40+ 内置工具的整体稳定性得到了社区的正面评价。Shell 执行、文件操作、Git 调用这些高频场景表现优秀。工具调用在不同 LLM 后端之间略有差异——Claude 系列的工具调用兼容性普遍优于本地小模型。在只有 8GB 显存的 GPU 上跑本地模型时，工具调用的成功率会有所下降，这与底层 LLM 能力的上限直接相关。

定时任务

内置 Cron 调度器是这次测评中一致获得好评的功能。自然语言转 Cron 任务的转化准确率高，结合 Telegram 消息网关，整个定时自动化流程的配置体验远优于竞品。

性能与资源占用

单 Agent 运行时资源占用处于合理水平，在普通 VPS 上日常使用不存在性能问题。多并发场景下需要考虑 LLM API 的并发上限，Hermes 本身并不是性能瓶颈。

Hermes Agent

五款同类产品深度横评

AI Agent 赛道目前已经相当拥挤，Hermes 处于哪个位置？下面选取五款最具代表性的竞品，从多个维度进行对比。

OpenClaw

OpenClaw 是目前 GitHub 上标星最高的开源 AI Agent 项目之一，超过 33 万 Star。它与 Hermes 的定位形成了有趣的互补关系。

核心架构差异：OpenClaw 的设计思路是”控制面优先”——一个长期运行的中央控制进程，统一管理会话路由、工具执行、权限控制和多 Agent 协调。所有事情都流经这个控制平面。Hermes 则是”Agent 本身优先”——把自主执行循环放在核心，系统围绕这个核心构建。

记忆与学习：OpenClaw 通过社区技能市场（ClawHub，托管超过 13,700 个技能）解决技能扩展问题，但技能需要手动安装，不像 Hermes 能从使用过程中自动提炼。Hermes 的四层记忆系统在个性化深度上领先，OpenClaw 在多 Agent 场景下的状态协调能力更强。

多 Agent 支持：OpenClaw 天然支持多 Agent 编排，适合需要协调多个专用 Agent 分工协作的场景。Hermes 目前聚焦于单 Agent 深度优化，多 Agent 能力相对有限。

本地部署与隐私：OpenClaw 对”完全本地部署”的支持更彻底，配合 Ollama 可实现 100% 本地运行、数据零外传，适合极度重视数据主权的用户。

结论：需要多渠道工作流协调和多 Agent 编排，选 OpenClaw；需要长期深度个性化的单 Agent 助手，选 Hermes。二者不互斥，可以并行部署。

CrewAI

CrewAI 是开发者社区里最主流的 Python 开源 Agent 框架之一，GitHub 标星约 4.6 万，MIT 许可证。

核心定位：CrewAI 的核心卖点是多 Agent 协作编排，它提供两种模式：Crews（自主 Agent 协作）和 Flows（确定性工作流编排）。这让它非常适合构建多个专用 Agent 分工协作的复杂系统。

与 Hermes 的最大差异：CrewAI 是一个”框架”，你需要写 Python 代码来定义 Agent 的角色、目标、工具和协作方式。Hermes 是一个”可直接使用的 Agent”，安装完就能开始对话，不需要写框架代码。

记忆与学习：CrewAI 内置了基础的 RAG 记忆能力，但没有 Hermes 那套从经验中自动提炼技能的学习循环。

代码执行安全性：CrewAI 的 Agent 直接运行在 Python 进程中，没有沙盒隔离，这在多用户场景下存在安全风险。

生态成熟度：CrewAI 在工具集成、云端托管（AMP 平台）、文档完整度等方面都明显优于 Hermes，社区更大，第三方教程更丰富。

结论：需要构建生产级多 Agent 系统、团队有 Python 开发能力，选 CrewAI；需要开箱即用的个人智能助手并期望长期学习进化，选 Hermes。

Paperclip

Paperclip 是 GitHub 标星约 3.3 万的开源项目，在所有开源 Agent 框架中，它的野心是最大的。

核心理念：Paperclip 不是在构建一个 Agent，也不是在构建一套工作流——它在构建整个 AI 驱动型组织的基础设施。它的 Agent 按照”组织架构”来运转：CEO Agent 委派给 VP Agent，VP Agent 再委派给执行层 Agent，形成完整的层级委派链条。

与 Hermes 的定位差异：Hermes 是纵向深挖单个 Agent 的能力（记忆深度、技能积累），Paperclip 是横向扩展构建 AI 组织（多 Agent 层级协作）。两者几乎没有直接竞争。

技术成熟度：Paperclip 仍处于相对早期的阶段，文档不完整，部署和配置需要较高的技术能力。但其开创性的”AI 公司总部”概念无可替代，目前市场上没有任何其他平台在做同样的事情。

模型无关性：与 Hermes 一样，Paperclip 支持接入任意 LLM 模型。

结论：如果目标是构建一套能自主运转的 AI 运营层，Paperclip 是首选；如果只是需要一个高质量的个人 AI 助手或任务执行 Agent，Hermes 远比 Paperclip 成熟可用。

AutoGPT

AutoGPT 是整个 AI Agent 浪潮的早期代名词，曾经是 GitHub 增速最快的项目之一，如今已经演变为一个平台化的产品体系。

当前状态：AutoGPT 如今分为开源框架层和 AutoGPT Platform（托管平台）两部分。开源层聚焦于 Agent 执行引擎，平台层提供可视化的工作流搭建、监控和托管能力。

与 Hermes 的差距：在”自主学习”这个维度上，AutoGPT 与 Hermes 不在同一个层次。AutoGPT 的重心在于”让 Agent 完成指定任务”，Hermes 的重心在于”让 Agent 在完成任务的过程中变得更好”。AutoGPT 没有类似的从经验中自动提炼技能的机制。

优势方向：AutoGPT 在长任务自主执行、网页浏览、代码执行等方面的能力已经相当成熟，工具覆盖广，社区生态庞大。对于需要”一次性完成一项复杂长任务”的场景，AutoGPT 的执行稳定性更经过时间检验。

商业化：AutoGPT Platform 是托管产品，有付费套餐，而 Hermes 完全开源、自托管，无任何使用费用。

结论：Hermes 在个人长期伴侣式使用和持续学习方面领先；AutoGPT 在任务执行成熟度、社区生态体量和商业化场景方面积累更深。

Lindy AI

Lindy 是面向非技术用户的无代码 AI Agent 构建平台，已融资近 5,000 万美元，用户规模约 4 万人。

根本定位差异：Lindy 是封闭的 SaaS 产品，Hermes 是完全开源的自托管框架，二者服务的用户群体几乎不重叠。

Lindy 的独特设计：Lindy 做了一个有意思的架构取舍——从开放式 LLM Agent 转向受约束的工作流图。AI 只处理真正模糊的决策节点，其余确定性逻辑由传统软件执行。这个设计让 Lindy 的工作流执行更稳定可预测，适合重复性业务自动化。

Hermes 的对比优势：Hermes 的自适应学习能力是 Lindy 完全没有的。Lindy 的 Agent 不会随着使用积累变得更”懂你”，每次配置工作流都是从零开始的手动搭建。另外，Lindy 采用积分计费，用户对账单不可预测的投诉相当多，Trustpilot 评分仅 2.4/5。

Hermes 的对比劣势：Lindy 提供可视化的工作流构建器和预设集成（Salesforce、HubSpot、Gmail 等），对非技术用户极为友好，而 Hermes 目前没有图形界面，需要 CLI 操作。

结论：非技术用户需要快速搭建业务自动化流程，Lindy 更适合；技术用户追求零成本、长期个性化学习能力，Hermes 是更好的选择。

Hermes Agent

横向对比一览

维度	Hermes Agent	OpenClaw	CrewAI	Paperclip	AutoGPT	Lindy AI
开源/免费	✅ 完全开源	✅ 完全开源	✅ 开源	✅ 完全开源	⚠️ 框架开源/平台付费	❌ SaaS付费
自我学习能力	⭐⭐⭐⭐⭐	⭐⭐	⭐⭐	⭐⭐	⭐	⭐
多 Agent 协作	⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
非技术用户友好	⭐⭐	⭐⭐	⭐⭐	⭐	⭐⭐⭐	⭐⭐⭐⭐⭐
持久记忆深度	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐	⭐⭐
本地部署	✅ 支持	✅ 强力支持	✅ 支持	✅ 支持	⚠️ 部分支持	❌ 仅云端
内置工具数量	40+	丰富	75+	中等	丰富	中等
定时任务	✅ 内置自然语言 Cron	⚠️ 网关层支持	⚠️ 需配置	❌	⚠️ 需配置	✅ 支持
社区生态成熟度	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
文档完整度	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐

谁应该用 Hermes Agent？

经过上面的分析，Hermes 适合的用户画像其实相当清晰。

最适合 Hermes 的场景：

独立开发者或技术创业者，希望有一个随着时间积累越来越懂自己工作习惯的 AI 助手，而不是每次都要重新”培训”它
研究人员和工程师，需要一个在特定技术领域（如代码管理、数据处理、文档分析）持续沉淀专业技能的 Agent
对数据隐私有要求的用户，本地部署 + 完全开源，数据不离开自己的环境
希望通过 Telegram 等消息平台远程控制 AI Agent 执行服务器端任务的场景
对 AI Agent 研究感兴趣的开发者，Hermes 提供了 RL 环境、轨迹生成等研究友好的接口

不适合 Hermes 的场景：

需要快速搭建、无需任何 CLI 操作的非技术用户
需要大规模多 Agent 协作和层级委派编排的企业系统
需要与 Salesforce、HubSpot 等 CRM 系统深度集成的销售团队
追求成熟稳定、有商业级 SLA 保障的生产环境

值得关注的几个细节

有几点在一般评测文章里容易被忽略，但实际使用时会有明显感知：

ACP 协议的前瞻性：Hermes 使用了专门为 Agent 设计的 ACP（Agent Communication Protocol）通信协议，而不是 HTTP REST 这类通用协议。这套协议支持初始化、认证、会话创建和流式响应的全链路，对 IDE 插件、桌面客户端等第三方集成提供了统一的接入接口，这是个长远布局。

技能系统的开放标准：Hermes 的技能系统基于 agentskills.io 开放标准，这意味着 Hermes 产生的技能文件不是私有格式，理论上可以在兼容该标准的其他平台上复用。这种标准化思路在整个 AI Agent 生态里是相对少见的。

RL 研究接口：这个功能可能大多数普通用户用不上，但它说明了 Hermes 的研究背景。Nous Research 把 Hermes 设计为一个强化学习友好的环境，支持轨迹生成和模型微调，这是 Nous Research 在大模型研究方向的延伸布局，不只是一个实用工具项目。

更新节奏：上线不到三个月，已经完成了数百次代码合并，207 位贡献者参与，这个更新速度在所有同类开源项目里都属于顶级，某种程度上也意味着接口变化快、需要保持关注。

当前局限与已知问题

诚实地说，Hermes 目前还是一个快速发展中的项目，有一些已知的短板。

文档厚度不足：与 CrewAI 或 AutoGPT 相比，Hermes 的文档仍然偏薄，进阶功能的说明不够详细，新手入门时常常需要靠阅读源代码和社区讨论来补充理解。

“自我进化”有一定夸大成分：如前文所述，技能的自动创建在实际使用中并不总是完全被动触发，部分情况下仍需要用户显式发起。这与官方宣传的”自动提炼”存在一定落差，需要对预期做适当管理。

对底层 LLM 能力高度依赖：工具调用的成功率、技能提炼的质量，都与底层语言模型的能力强相关。在 8GB 显存的 GPU 上运行本地小模型时，某些功能会出现不稳定。官方推荐的后端是 Claude 系列，这在一定程度上限制了完全脱离商业 API 的可能性。

社区规模相对小：相比 OpenClaw（33 万+ Star）和 CrewAI（4.6 万+ Star），Hermes 的 19K Star 在绝对量上仍是少数，遇到冷僻问题时能参考的社区讨论也更少。

技术发展方向推断

从 Hermes 目前的架构和 Nous Research 的研究方向来看，几个可能的演进路径值得关注：

技能自动提炼的提升：目前技能创建存在一定的手动触发成分，后续版本大概率会进一步强化自动化程度，让 Learning Loop 真正实现完全被动触发。

多 Agent 支持：目前 Hermes 聚焦于单 Agent 深度，但 ACP 协议的设计为多 Agent 通信留有接口，多 Agent 协作能力可能在未来版本中出现。

与 Nous Research 模型的深度整合：Nous Research 本身有成熟的开源 LLM 系列（Hermes 模型家族），让 Agent 框架与自家的模型深度协同，从而实现”Agent 使用专门为 Agent 优化的 LLM”的垂直整合，是非常自然的方向。

RL 驱动的持续优化：利用 Hermes 积累的轨迹数据来微调底层模型，是 Nous Research 作为研究机构能做、而其他纯产品公司不太可能做的事情。如果这个方向走通，Hermes 的”自我进化”可能会从提示词层面的技能积累，提升到参数层面的模型进化，这才是终极形态。

两个月，19K Star，207 位贡献者，从零开始。Hermes Agent 的快速崛起背后，是整个 AI Agent 领域对”真正自主学习”这一核心命题的集体渴望。大多数产品都宣称自己的 Agent 会越变越聪明，Hermes 是少数几个真的在架构层面把这件事做认真了的。

它目前还不完美，文档薄、部分功能仍需打磨，但它开创的那个模式——从经验中自动提炼技能、建立深度用户画像、真正实现跨会话知识积累——几乎可以确定是整个行业接下来几年的发展方向。

先入场，先占便宜。

暂无评论

暂无评论...

Hermes Agent

简介

它到底是什么

核心理念：自我进化而非一次性完成

四层记忆系统：不只是”记住了什么”

主要功能全景

40+ 内置工具 + MCP 扩展

多平台消息网关

内置 Cron 调度器

灵活部署能力

模型无关性

安全沙盒 + 5 种终端后端

技能社区生态

实际测评体验

上手体验

记忆系统实际效果

工具调用稳定性

定时任务

性能与资源占用

五款同类产品深度横评

OpenClaw

CrewAI

Paperclip

AutoGPT

Lindy AI

横向对比一览

谁应该用 Hermes Agent？

值得关注的几个细节

当前局限与已知问题

技术发展方向推断

相关导航

暂无评论

随机网址