Hermes Agent:AI Agentが自分で成長し始めたとき
はじめに
あなたのAIアシスタントはいつも同じままじゃないかと思ったことはありますか?
どれだけ長く使っても、能力の境界は固定されたまま。新しいことを教えれば、それは覚える——でも次に会うとき、彼女はやっぱり同じ彼女で、「成長」したわけじゃない。
Hermes Agentが目指すのは:AIが自分で新しいスキルを学び、本当に覚えて、本当に進化することです。
毎回ゼロから教えるんじゃなく、人間のように、タスクをこなすたびに経験を積んで、少しずつ強くなる。
これはNous Research(Nous ChatやHermesシリーズモデルを開発したチーム)がオープンソース化したプロジェクト。86.9k+ stars、もはやAI Agentの世界で小さい存在じゃない。
核心思想:自己進化
Hermesの野望は明確——自分で成長できるAgentフレームワークを作ること。
静的なスキルセットじゃなく、動的な能力の成長。ここに3つのキーメカニズムがある:
1. スキルの自動進化
従来のアプローチ:あなたがツール関数を書き、Agentはその preset 能力の中だけで動く。
Hermesのアプローチ:
- ランタイムでの自動生成:Agentがあるタスクを処理できないと気づいたら、自分で新しいスキルを書いて問題を解決する
- オフラインGEPA進化:定期的に遺伝的アルゴリズムで既存スキルを最適化し、より効率的で安定したものにする
簡単に言えば:ツールを呼び出すだけじゃなく、ツールを発明する。
2. 能動的な記憶管理
OpenClawの記憶は受動的——長く話すと、システムがコンテキストを圧縮する前にファイルにアーカイブする。
Hermesの記憶は能動的:
- 15ターンごとに強制的に「省察」を行い、対話から得た洞察を長期記憶に書き込む
- SQLite FTS5全文検索を使用し、記憶の検索は検索エンジンのように高速
- オプションでHonchoを統合し、深いユーザーモデリングを実現(あなたはどんな人か、どんな意思決定パターンか)
3. フルプラットフォームカバレッジ
- ゲートウェイ層:Telegram、Discord、Slack、WhatsApp、Signal… 20以上のプラットフォーム
- ターミナル層:ローカル、Docker、SSH、Daytona、Modal、AWS Lambda——6種類の実行環境
どこで動かしたいか、どのプラットフォームに接続したいか——選べる。
技術的実装の詳細
GEPA:遺伝的・パレート的最適化プロンプト進化
これがHermesの核心アルゴリズム。
- 遺伝的:スキルのプロンプトを「遺伝子」として扱い、変異や交叉で新しい変異体を生成
- パレート:一つの指標だけでなく、正確性、速度、コストなど複数の目標の最適バランスを同時に追求
- 進化:多轮の反復後、自動的に最も優れたスキルバージョンを選抜
難しそうに聞こえるが、実装にはDSPyフレームワークを使っていて、コードは実にすっきりしている。
4層の漸進的スキルローディング
Hermesのスキルシステムは4層に分かれる:
- Core:フレームワークに同梱の基礎能力
- Community:コミュニティが共有するスキルライブラリ
- Personal:ユーザーが自分で書いたスキル
- Evolved:Agentが自分で生成したスキル(進化によって生まれたもの)
ローディング順序は1→2→3→4で、後からロードされたものが前の同名スキルを上書きする。つまりいつでも上書きでき、いつでもカスタマイズできる。
SQLite + FTS5
記憶の保存にSQLiteを使用し、検索にはFTS5全文検索を使用。
ベクトルデータベースの意味的類似度を追わず、正確で、高速で、説明可能なキーワード検索を追求。能動的省察メカニズムと組み合わせることで、記憶は構造化され、明確な出典を持つ。
OpenClawとの重要な違い
私はOpenClawのヘビーユーザーなので、この2つのプロジェクトを比較するのは特に興味深い。
| 次元 | Hermes Agent | OpenClaw |
|---|---|---|
| スキルシステム | 自動生成 + GEPA進化 | 手動作成、人間のレビュー必須 |
| 記憶トリガー | 能動的な高頻度書き込み(15ターンごとに省察) | 受動的な圧縮前アーカイブ |
| ユーザーモデリング | オプションでHonchoによる深層モデリング | 長期嗜好ファイル |
| 介入度合い | ユーザーに代わって決定 | ユーザーにコントロール権を与える |
スキル:自動生成 vs 手動作成
Hermesは、あなたが処理できないことに気づいたら、黙ってスキルを書く。これはクールだが、リスクもある——書かれたコードが何をしているか、あなたはまったく知らないかもしれない。
OpenClawのスキルは人間が書き、人間がレビューし、人間がインストールする。遅いかもしれないが、各ツールが何をしているかは分かる。
私の判断:日常タスクはHermesに進化させせ、コアプロセスはOpenClawの手動スキルを使う。これは補完関係で、代替じゃない。
記憶:能動的 vs 受動的
Hermesの15ターンごとの強制省察は、GoogleのAlways-On Memory Agentにちょっと似てる。能動的に整理し、能動的に情報を接続する。
OpenClawは「長く話せば、アーカイブする」。より受動的だが、よりコントロール可能——AIがあなたの言葉を命令と誤解してあちこちで実行する心配はいらない。
介入:あなたに代わって決定する vs あなたにコントロールを与える
これは哲学的なレベルの違い。
Hermesの理念:Agentは十分賢くあるべきで、あなたに代わって決定を下す。あなたは彼女を信頼し、彼女に走らせる。
OpenClawの理念:Agentは実行を手伝うが、決定権はあなたにある。各ステップで確認を取り、重要な操作にはあなたの承認が必要。
正解も間違いもない。シナリオ次第。
- 週末に週報を整理?Hermesに任せて、気にしない。
- 本番DBを修正?絶対にOpenClawを使い、各ステップを確認する。
適用シナリオ分析
Hermesに適したシナリオ
- 日常的な反復タスク:週報の集計、天気の確認、ファイルの整理
- パーソナル自動化:自動メッセージ返信、スマートリマインダー、コンテンツレコメンド
- 探索的な作業:Agentにメソッドを発見させたい場合、プリセットフローに従わせたくない場合
適さないシナリオ
- コア契約のレビュー:自動生成されたスキルが重要な条項を見落とす可能性がある
- 低層コード監査:AIが書いたツールでコードを監査?再帰的リスクが大きすぎる
- 複雑な財務モデル:お金が絡む場合、各ステップに人間の確認が必要
一言でまとめる:Hermesは「間違っても問題ない」タスクに適し、OpenClawは「間違えると代償が大きい」タスクに適する。
クイックスタート
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
pip install -r requirements.txt
# 環境変数を設定
export OPENAI_API_KEY="your-key"
# または Anthropic、Gemini、ローカルモデル...
# 実行
python main.py
対話型セッションが起動し、すぐに会話を始められる。使っていくうちに、ゆっくりと「新しいスキル」が生えてくる。
いくつかのツッコミ
ドキュメントが不十分
86.9k starsのプロジェクトで、READMEは100 starsレベル。多くの詳細はコードを読まないと分からない。
スキルの進化には時間がかかる
即効性はない。数十ターンのタスクを実際に実行して、初めて進化したスキルが見える。せっかちな人は「これだけ?」と感じるかも。
Honcho統合はオプション
深いユーザーモデリングにはHonchoの追加設定が必要で、デフォルトではオフ。つまり、すぐ使えるHermesはそこまで「あなたを理解してる」わけじゃない。
結論
Hermes Agentが象徴する方向性:AIはツールであるだけでなく、自律的に進化するアシスタントであるべきだ。
自己進化メカニズム、能動的記憶管理、フルプラットフォームカバレッジ——どれも想像力に満ちた設計だ。
しかし現段階では、OpenClawの代替というより補完として使うのが適切:
- Hermesで日常の低リスク自動化タスクを処理する
- OpenClawで厳格なコントロールと人間の確認が必要なコアタスクを処理する
両エコシステムとも急速に進化している。HermesのGEPAアルゴリズムは次世代のスキル市場を生み出すかもしれないし、OpenClawの人間レビューメカニズムは依然としてエンタープライズアプリケーションの標準だ。
未来は両者の融合かもしれない:自動生成されたスキルは先に人間のレビューを経て、本番環境に入る。進化の可能性を保ちつつ、安全の底線を守る。
リンク
- 🐙 GitHub: https://github.com/NousResearch/hermes-agent
- 🌟 Stars: 86.9k+
- 🏢 開発チーム: Nous Research
- 📄 ライセンス: MIT
- 🔧 技術スタック: DSPy + SQLite FTS5 + GEPAアルゴリズム
この記事は技術観察の記録です。Hermes Agentの設計思想は、すべてのAgentフレームワーク開発者にとって注目に値する。