すべての Agent が非同期化へ向かっている
今日興味深い記事を読んだ:All your agents are going async。著者は、AI Agent が「あなたが話しかける存在」から「バックグラウンドで動作する存在」へと変化しつつあることを指摘している。
同期時代の Agent
これまで ChatGPT や Claude を使うときの感覚は何だっただろう?ブラウザを開いて、質問を打ち込み、回答を待つ。このインタラクションは同期型だった:画面を見つめ、ストリーミング出力を待ち、会話が終わればそれで終わり。
ほぼすべての AI SDK のデモは、このようなチャットインターフェースになっている。これが AI の全てだという錯覚を生みやすい。
だが実際は——チャットは始まりに過ぎない。
非同期化が広がっている
ここ数ヶ月で何が起きたか見てみよう:
OpenClaw:Agent を WhatsApp に組み込んだ。いつでもモバイルで話せるし、バックグラウンドで仕事もできる。ブラウザを常に開いておく必要はない。
Claude Code:
- Channels — 外部メッセージをセッションに非同期プッシュ可能
- /loop と /schedule — スケジュールタスク
- Routines — 定例ルーチン
- Remote Control — モバイルからの遠隔操作
ChatGPT:scheduled tasks を導入し、時間指定でタスクをトリガー可能に。
Cursor:background agents がクラウド上でバックグラウンド実行される。
これらの機能の共通点は:Agent のライフサイクルが HTTP 接続から切り離された。あなたがいなくても動き、完了後に結果をプッシュできる。
トランスポート層のジレンマ
ここに技術的な問題がある。
従来の chatbot は HTTP ベース:リクエストを送り、SSE で結果をストリーミング返却。ページを更新すると接続が切れ、会話も途切れる。
しかし非同期 Agent は、HTTP では対応できない 4 つのシナリオに直面する:
-
Agent が呼び出し元より長生き —— 5 分後に完了しても、あなたはオフライン。結果をどこに送る?
-
Agent からの能動的プッシュ —— 夜間コードレビューが完了し、3 つの PR レビューを依頼したい。だがあなたはリクエストしていない。
-
人間介入ポイント —— ワークフローが承認待ちになったとき、どう通知する?
-
マルチデバイス切り替え —— PC で開始したタスクをモバイルで継続するには?
これらの問題が、インフラの再設計を迫っている。
新しいアーキテクチャの兆し
Temporal、Vercel WDK、Relay.app などのワークフローエンジンが Agent のオーケストレーションに使われ始めた。これらは元から:
- 長時間実行をサポート
- 状態の永続化
- 人間介入ポイント
- 時間指定トリガー
要するに、Agent は分散システムのコンポーネントになりつつある。チャットウィンドウの対話相手ではなく。
これが意味すること
開発者にとって:
- 「ユーザーは常にオンライン」という前提を捨てる必要がある
- プッシュ、通知、状態同期の仕組みを設計する必要がある
- マルチデバイス、マルチセッションの連続性を考慮する必要がある
ユーザーにとって:
- Agent は「質問応答ロボット」ではなく「雇ったアシスタント」に近づく
- タスクを任せて離れ、完了したら連絡をもらう
- 真の「自動化」が始まる
最後に
HTTP の request-response モデルは数十年にわたってインターネットを支えてきたが、元々「長期実行型の自律プロセス」を想定していたわけではない。
Agent の非同期化は、AI 実用化のラストワンマイルを埋めるもの——人間が常に監視しなくても、本当に独立して仕事をできるようにする。
次は何だろう?もしかすると、Agent 間の相互委任:コード Agent がデザインリソースを必要としたとき、自動的に別のデザイン Agent を呼び出し、あなたは最終成果物を確認するだけ。
それが真の「Multi-Agent」時代だ。