【AIエージェント】AIが「行動」し始めた!検索も計算もこなす「ReAct」の仕組みを解説
こんにちは。ゆうせいです。
前回の記事では、難しい問題を小さく分解する「Decomposition」についてお話ししましたね。あれは言わば、AIの頭の中を整理する技術でした。
でも、AIを使っていてこんなふうに思ったことはありませんか?
「今日の天気を聞いても、私の知識は2023年までです、とか言われる」
「簡単な計算なのに、桁数が多いと間違える」
そう、これまでのAIは「箱入り娘」ならぬ「箱入り天才」でした。知識はすごいけれど、外の世界(インターネット)を見たり、道具(電卓)を使ったりすることができなかったのです。
そこで登場した進化系が、今回解説する「AIエージェント」、そしてその頭脳となる仕組み「ReAct(リアクト)」です。
これを理解すると、AIが単なる「チャットボット」から、あなたの代わりに仕事をしてくれる「優秀な秘書」へと進化する様子が見えてきますよ!
AIエージェントってなに?
一言で言うと、「道具を使って、自分で考えながら行動するAI」のことです。
これまでのAI(LLM)とAIエージェントの違いを、人間に例えてみましょう。
従来のAI(LLM単体)
「辞書だけを持った物知り博士」です。
知識は豊富ですが、部屋から一歩も出られません。「今の総理大臣は?」と聞かれても、辞書が古ければ答えられません。「3948 × 5729は?」と聞かれても、暗算でやろうとして間違えることがあります。
AIエージェント(ReAct)
「スマホと電卓を持ったフットワークの軽い秘書」です。
わからないことがあれば、すぐにGoogle検索(スマホ)をして最新情報を調べます。計算が必要なら、無理に暗算せず電卓アプリを叩きます。
つまり、AIという「脳」に、検索やツールという「手足」がついた状態。これがAIエージェントなのです。
思考と行動のループ「ReAct」
このAIエージェントを動かすための中心的な技術が「ReAct(リアクト)」です。
これは「Reasoning(推論)」と「Acting(行動)」を組み合わせた造語です。
「考えて(Reasoning)、行動して(Acting)、その結果を見る」
このサイクルを繰り返すことで、AIは難問を解決します。
まるで、名探偵が現場で証拠を集めながら犯人を追い詰めていくようなプロセスです。
具体的な動きを見てみよう
例えば、「現在の東京の気温を2倍にすると何度ですか?」という質問をされたときの、ReAct型AIの頭の中を覗いてみましょう。
- Reasoning(思考):「まず、現在の東京の気温を知る必要があるな。自分の知識にはないから、検索しよう」
- Acting(行動):(外部ツール「Google検索」を実行)キーワード:「東京 気温 現在」
- Observation(観察):(検索結果が返ってくる)「結果:東京は晴れで、15度です」
- Reasoning(思考):「気温は15度だとわかった。次はこれを2倍にする計算が必要だ」
- Acting(行動):(外部ツール「電卓」を実行)計算式:
- Observation(観察):(計算結果が返ってくる)「答え:30」
- Reasoning(思考):「よし、答えが出た。ユーザーに報告しよう」
- Final Answer(回答):「現在の東京の気温は15度なので、2倍にすると30度です」
いかがですか?
自分で足りない情報を探しに行き、道具を使って確実に答えを出していますよね。これがReActの魔法です。
ReActの仕組みを数式でイメージしよう
このプロセスを、簡単な数式のイメージで表現してみましょう。
従来のAIの回答プロセスはシンプルです。
回答 知識
思考
自分の持っている「知識」だけで答えようとするので、知識が古かったり間違っていたりすると、答えも間違ってしまいます。
一方、ReAct(AIエージェント)のプロセスはこうなります。
回答 思考
(行動
観察)
(行動
観察) ...
ここで重要なのは、足し算( )のように、情報が積み重なっていくことです。
最初は知識がゼロでも、「行動(検索など)」をして「観察(結果を見る)」することで、新しい情報 を手に入れます。
次のステップの知識 元の知識
新しい情報
このように、動きながらリアルタイムで賢くなっていくのが、ReActの最大の特徴なのです。
メリットとデメリット
夢のような技術に見えるAIエージェントですが、もちろん弱点もあります。
メリット:「今」と「正確さ」に強い
- 最新情報にアクセスできる: 昨日のニュースや今日の株価など、学習データにない情報を扱えます。
- 正確な処理ができる: 苦手な計算やコード実行を、専用のツール(電卓やPython)に任せることで、ミスを劇的に減らせます。
- 透明性が高い: 「なぜその答えになったの?」という過程(検索履歴など)が残るため、人間がチェックしやすいです。
デメリット:コストと無限ループ
- 時間がかかる: いちいち検索したり計算したりするため、即答する通常のAIに比べて待ち時間が長くなります。
- コストが高い: 何度もAIを動かし、さらに外部ツールも使うため、API利用料などが高くなりがちです。
- 迷子になる: 検索結果が期待通りでないと、「検索→失敗→また検索→失敗」という無限ループに陥り、いつまでたっても答えが出ないことがあります。
今後の学習の指針
いかがでしたか?
AIエージェント(ReAct)とは、AIに「手足」と「現場判断力」を与える技術でした。
これからのエンジニアは、単にAIに文章を書かせるだけでなく、「AIにどんな道具(ツール)を持たせれば、仕事が楽になるか?」を設計する力が求められます。
「カレンダーアプリと連携させれば、秘書になるな」
「社内データベースと連携させれば、最強のヘルプデスクになるな」
そんな想像を膨らませてみてください。
さらに深く学びたい方は、以下のキーワードを調べてみることをおすすめします。
- LangChain(ラングチェーン): AIエージェントを簡単に作るための、大人気のプログラミングライブラリです。
- AutoGPT / BabyAGI: AIエージェントの有名なプロジェクト例です。
- Tool Use(ツールユース) / Function Calling: AIに道具を使わせるための具体的な技術仕様のことです。
次回は、3つ目の奥義、情報を極限まで濃縮する「Chain-of-Density」について解説します。文章力の限界に挑む技術ですので、お楽しみに!
それでは、またお会いしましょう。ゆうせいでした。
あなたの次の一歩
もしChatGPTの有料版(GPT-4)やBingチャットを使えるなら、「今のドル円相場を調べて、100ドルが何円になるか計算して」と頼んでみてください。「検索(Browsing)」と「計算(Analysis)」というツールを使って、まさにReActな動きをしてくれるはずですよ!