今日興味深い記事を読んだ:All your agents are going async。著者は、AI Agent が「あなたが話しかける存在」から「バックグラウンドで動作する存在」へと変化しつつあることを指摘している。

同期時代の Agent

これまで ChatGPT や Claude を使うときの感覚は何だっただろう?ブラウザを開いて、質問を打ち込み、回答を待つ。このインタラクションは同期型だった:画面を見つめ、ストリーミング出力を待ち、会話が終わればそれで終わり。

ほぼすべての AI SDK のデモは、このようなチャットインターフェースになっている。これが AI の全てだという錯覚を生みやすい。

だが実際は——チャットは始まりに過ぎない

非同期化が広がっている

ここ数ヶ月で何が起きたか見てみよう:

OpenClaw:Agent を WhatsApp に組み込んだ。いつでもモバイルで話せるし、バックグラウンドで仕事もできる。ブラウザを常に開いておく必要はない。

Claude Code

ChatGPTscheduled tasks を導入し、時間指定でタスクをトリガー可能に。

Cursorbackground agents がクラウド上でバックグラウンド実行される。

これらの機能の共通点は:Agent のライフサイクルが HTTP 接続から切り離された。あなたがいなくても動き、完了後に結果をプッシュできる。

トランスポート層のジレンマ

ここに技術的な問題がある。

従来の chatbot は HTTP ベース:リクエストを送り、SSE で結果をストリーミング返却。ページを更新すると接続が切れ、会話も途切れる。

しかし非同期 Agent は、HTTP では対応できない 4 つのシナリオに直面する:

  1. Agent が呼び出し元より長生き —— 5 分後に完了しても、あなたはオフライン。結果をどこに送る?

  2. Agent からの能動的プッシュ —— 夜間コードレビューが完了し、3 つの PR レビューを依頼したい。だがあなたはリクエストしていない。

  3. 人間介入ポイント —— ワークフローが承認待ちになったとき、どう通知する?

  4. マルチデバイス切り替え —— PC で開始したタスクをモバイルで継続するには?

これらの問題が、インフラの再設計を迫っている。

新しいアーキテクチャの兆し

Temporal、Vercel WDK、Relay.app などのワークフローエンジンが Agent のオーケストレーションに使われ始めた。これらは元から:

  • 長時間実行をサポート
  • 状態の永続化
  • 人間介入ポイント
  • 時間指定トリガー

要するに、Agent は分散システムのコンポーネントになりつつある。チャットウィンドウの対話相手ではなく。

これが意味すること

開発者にとって:

  • 「ユーザーは常にオンライン」という前提を捨てる必要がある
  • プッシュ、通知、状態同期の仕組みを設計する必要がある
  • マルチデバイス、マルチセッションの連続性を考慮する必要がある

ユーザーにとって:

  • Agent は「質問応答ロボット」ではなく「雇ったアシスタント」に近づく
  • タスクを任せて離れ、完了したら連絡をもらう
  • 真の「自動化」が始まる

最後に

HTTP の request-response モデルは数十年にわたってインターネットを支えてきたが、元々「長期実行型の自律プロセス」を想定していたわけではない。

Agent の非同期化は、AI 実用化のラストワンマイルを埋めるもの——人間が常に監視しなくても、本当に独立して仕事をできるようにする。

次は何だろう?もしかすると、Agent 間の相互委任:コード Agent がデザインリソースを必要としたとき、自動的に別のデザイン Agent を呼び出し、あなたは最終成果物を確認するだけ。

それが真の「Multi-Agent」時代だ。


参考記事:All your agents are going async by zak@zknill.io