■概要■
AIエージェントは、複雑な環境において推論、計画、タスクの実行を行うことのできるインテリジェントシステムの基盤となるものである。AIエージェントは、環境と相互作用して意思決定を行ったり、自律的に動作・行動したり、自然言語を使用して人間や他のエージェントと相互作用したりする。
AIエージェントは、人間の介入を必要としない、より自律的で協調的なワークフローへのシフトアップであり、ワークフローの合理化から人間のようなタスクの代理実行まで、画期的な能力拡張を約束する。これは、人間を退屈で単純な作業から解放し、より付加価値の高い作業に集中させることを約束する。その意味で、AIエージェントは、企業、個人、組織の運営方法を再定義するものとなるだろう。
すでにAIエージェントは生成AIの統合により、テキスト、画像、デザインなどマルチモーダルなコンテンツをオンデマンドで生成できるようになっている。また、強化学習により、AIエージェントは動的な環境への適応能力が向上する他、ニューロモーフィック・コンピューティングや量子コンピューティングの進歩により、問題解決能力が飛躍的に向上し、前例のない革新と発見の時代を迎えることが期待されている。その意味でAIエージェントは、今後のAIアプリケーションのポートフォリオにおいて特に重要なものとなっている。
本白書では、こうしたAIエージェントの現状と課題点、今後の方向性を含め、包括的に扱った全書的なスタイルのレポートであり、AIエージェントの設計と実装、問題領域の特定、適切なアーキテクチャの選択、ゴールとアクションの定義、エージェントのロジックの実装、テストとデバッグ、企業業務効率化に活用するAIエージェント開発・リリースのあり方、責任あるAIエージェントのあり方、最新の研究開発動向、主要製品・サービス、プラットフォーマー、主要参入企業、スタートアップ企業まで、網羅的に取り上げ、解説している。
序
<1>AIエージェント 概説
・“AIエージェント”を広く、深く理解することが必要となる理由
・AIエージェントの主な特徴
・エージェント型AIがDXにもたらす新たな価値
・実世界への応用が開始されたエージェントAI
・デジタルワーカー時代を促進するAIエージェント
・責任あるAIに新たなソリューションをもたらすエージェント型AI
・分散型エコシステムにおけるプライベートAIエージェントの台頭
<2>AIエージェントの定義・再定義
・概説
-AIエージェント・アーキテクチャの概要
-エージェント型ワークフロ*C: *AI主導のタスク管理におけるパラダイムシフト
-AIエージェントの概念が定着するまでの経過
-チャットボット、AIアシスタントとAIエージェントの相互関係
-AIエージェントの利点
・AIエージェントとAIアシスタントの違い、オーバーラップする部分
・LLMエージェントの当面の優先課題
・AIエージェント志向のLLMの適用・適合
・AIエージェントのタイプ別特性
<3>AIエージェントの今後の動向と発展
・概説
・新たなエージェントの種類
・AIエージェント開発の現状
・技術的進歩のシナリオ
・業界予測
・AIエージェントの発展シナリオ
・AIエージェントの課題と今後の方向性
・次世代の推論型・自律型AIエージェントの現状・方向性
<4>AIエージェントの基本タイプ・タイプ別特性
・概説
・AIエージェントのタイプ別特性
-単純反射エージェント
-モデルベース反射エージェント
-目標ベースのエージェント
-効用ベースのエージェント
・AIエージェントの機能用途別特性
-シングルエージェント
-マルチエージェント
-反応型・反射型エージェント
-目標ベースのエージェント
-効用ベースのエージェント
-プロアクティブエージェント
-学習・適応型エージェント:
-非学習型エージェント
<5>AIエージェントの主な構成要素
・概説
・AIエージェントのアクションを構成する要素
-センサー
-アクチュエーター
-処理ユニット
-知識ベース
-フィードバックシステム
・AIエージェントの会話相互作用のメカニズムと構成要素
-会話コンポーネント
-自然言語処理(NLP)
-チェーンワークフローオーガナイザー
-エージェント自律体(エージェント・コンポーネント)
<6>AIエージェントのソフトウェア・アプリケーションと主要コンポーネント
・概説
・事例
-OpenHands
<7>AIエージェントの支援(アシスト)パターン・タイプ別特性
・ビジネス・アシスタント
・情報ニーズ診断
・知識コンテンツの生成
・コーディング・アシスタント
・ライフ・アシスタント
・学習エージェント
・タスク特化型エージェント
・マルチエージェントシステム(MAS)
・自律エージェント
<8>AIエージェントのワークフロー(エージェンティック・ワークフロー)
・概説
-概要
-エージェンティック・ワークフローの定義
-従来の自動化アプローチとの比較
-エージェントワークフローの利点
-今後の展望
・AIエージェント・ワークフローの構成要素
・ Anthropicの定義するAIエージェント・ワークフロー
・AIエージェント・ワークフローにおける大規模言語モデル(LLM)の役割
・マルチエージェントの連携メカニズムとワークフロー
・AIエージェント・ワークフローの業界別ユースケース
・AIエージェント・ワークフローの開発
<9>AIエージェントの設計アプローチ
・概説
-記憶(メモリストリーム)
-情報検索(IR)
-リフレクション
-計画
-オープンソースのAIエージェントフレームワーク
・AIエージェント設計に不可欠となるシステム2アプローチ
・ケーススタディ
-CAMEL
-LangChainの実装
-AutoGPT
<10>AIエージェントの応用カテゴリーと産業別活用
・概説
-オペレーション・生産性向上全般
-マーケティング
-営業
-カスタマーサービス
-人事
-法務
-研究開発
-製造業
-輸送
-小売・Eコマース
-金融
-保険業
-ヘルスケア
-教育
-ヘルスケア
-ホスピタリティ業関連
-サイバーセキュリティ
・データ駆動型のAIエージェント型ソリューションによる税務シミュレーション
-セールスフォース <AI Economist>
・機械学習エージェントによるゲーム空間の制御
-OpenAI <Hide & Seek Share>
・AIエージェントを媒介としたAIとゲーム産業の融合
<11>AIエージェントのインフラ、プラットフォーム
・概説
・AIエージェントのインフラ構成
・AIエージェントのプラットフォーム例
<12>AIエージェントの主な実装コンポーネント
・知覚
・処理ユニット
・知識ベース
・アルゴリズム(意思決定メカニズム)
・行動メカニズム
<13>AIエージェントの開発・構築
・AIエージェントの開発
・AIエージェントの構築
・ノーコードでAIエージェントを開発できるVertex AI Agent Builder
・AIエージェントの構築の流れ
<14>AIエージェントフレームワーク
・概説
・AutoGen
・CrewAI
・LangGraph
・非同期AIエージェントフレームワーク
<15>AIエージェント・オーケストレーション
・概説
・エージェントフレームワークの役割
・LangGraph
・CrewAI
・OpenAI Swarm
・LlamaIndex workflow
・AutoGen
<16>AIエージェント・インフラの進化
・概説
・AIのインファレンス(推論)フェーズに特化した分散型インフラの構築
<17>AIエージェントのエコシステム
・概説
・オープンソースのAIエージェント・エコシステム
・アプリ上でカード・トークナイゼーションを提供する「グーグルペイ」
<18>分散型AIエージェントの台頭
・概説
・分散型AIエージェントの最前線を牽引するスタートアップ企業群
・メタバースやゲームなどの仮想空間で稼働する分散型AIエージェント
<19>プロンプトエンジニアリングとAIエージェント
・概説
-LLMの行動や能力はプロンプトに大きく影響される
-プロンプティング思考連鎖型プロンプティング(CoT,Wei)
-思考の木(ToT)
-Plan-and-Solve Prompt ing (PS)
-ソフトプロンプティングアプローチ
-プロンプト最適化手法
-Automatic Prompt Engineer (APE )
-自己言及的自己改善
-自己参照メタ学習アプローチ
-オープンエンドとLLM
・プロンプトを自動的に進化させる自己言及的で自己改善的なAIシステム
・関連研究
-グーグル・ディープマインド 「迅速な進化による自己言及的自己改善」
<20>AIエージェントのベンチマーク
・概説
・関連研究
-清華大学/オハイオ州立大学/カリフォルニア大学バークレー校研究チーム 「大規模な言語モデル・エージェントを様々な環境で評価するために開発された多次元ベンチマーク」
<21>Agentic RAG
・概説
・Agentic RAGによるハイブリッドアプローチ
・Agentic RAGの応用
・今後の動向と展開
<22>自然言語を使った応答性の高いAIエージェント
・概説
・関連研究
-カーネギーメロン大学/NVIDIA/マイクロソフト/ボストン大学 「自然言語を使ってAIエージェントを構築するための機械学習フレームワーク」
<23>自然言語によるエージェント制御のベンチマーク
・概説
-現在の評価エージェント用環境
-自然言語によるエージェント制御のベンチマーク
-対話型意思決定エージェント
・関連研究
-カーネギーメロン大学 「自律型エージェント構築のための現実的なウェブ環境」
-浙江大学/テンセントAIラボ/ウェストレイク大学 「大規模なマルチモーダルモデルによるエンド・ツー・エンドのウェブエージェントの構築」
<24>コンピュータ・ビジョンと自然言語処理の統合によるマルチタスク学習、生成AI汎用エージェント
・概要
・タスクのグループ化
・マルチタスク・アーキテクチャー
・関連研究
<25>リアルタイムAIエージェントと非同期ツールの活用
・概説
・非同期コンピュータ・システムとAIエージェント
・リアルタイム・システムとAIエージェント
・自律型AIエージェントへの拡張
・マルチ・エージェント・システムへの拡張
・バーチャルアシスタント、アクセシビリティツールへの拡張
<26>マルチエージェントシステム
・モノリシックモデルからモジュール型AIエージェントへの移行
・サブエージェントによる専門化
・人間による適切な監督や調整を組み合わせたマルチエージェントシステム
・マルチエージェント強化学習
・シングルエージェントの模倣学習
・マルチエージェントの模倣学習
・逆ゲーム理論
・MALICE (Multi-agent Aggregation of Losses to Imitate Cached Experts)
・ヒューマン・イン・ザ・ループ
・LLMベースのマルチエージェントコラボレーション
・マルチエージェントAIシステムの構築支援ツール
-AutoGen/AutoGen Studio
-AutoGenの主要構成要素
-AutoGen Studio(バージョン2.0)のビルドセクション
・マルチエージェントRAGシステム
・関連ツール・フレームワーク
-マイクロソフトリサーチ 「AgentInstruct :マルチエージェントワークフローフレームワーク
・関連研究
-カーネギーメロン大学研究チーム「マルチエージェント模倣学習」
-マサチューセッツ工科大学(MIT) 「協調的・競争的なAIエージェントが最適な長期的解決策を見出すことを可能にする機械学習フレームワーク」
<27>マルチエージェント強化学習(MARL)
・概説
・強化学習の原理
・強化学習の応用
-LLMベースのエージェント
-LLMによる推論と仮説探索
-部分的に観測可能な環境における認知モデル
・研究チーム、参入企業動向
-スタンフォード大学研究チーム 「Hypothetical Mindsモデル」
<28>マルチAIエージェント/エージェント数のスケールアップ
・概説
-LMの事前知識とアクション/リアクション能力の組み合わせによるAIエージェントの開発
-エージェントの能力を様々な側面からベンチマークする研究
-AutoMLの言語モデル
-科学的発見を自動化するAI
-マルチエージェントシミュレータ
-エージェント数のスケールアップの課題
・関連研究
-スタンフォード大学 「MLAgentBench:機械学習実験で言語エージェントを評価する」
<29>マルチモーダル型AIエージェント
・概説
・注目を集めるモデル
・関連研究
-アリババ 「テキストや自然言語からリアルな3Dアバターを生成する‘LLM・視覚モデル」
-スタンフォード大学/マイクロソフト・リサーチ/カリフォルニア大学ロサンゼルス校 「ルチタスク・エージェント訓練パラダイムを用いた対話型エージェント基盤モデル」
<30>視覚言語モデル(VLM)/マルチモーダルAIエージェント
・概説
-マルチモーダルデジタルエージェント
-デバイス制御エージェントのための環境
-LLM/VLMのための強化学習
・関連研究
-UCバークレー校他研究チーム 「DigiRL:自律強化学習で野生のデバイス制御エージェントを訓練する」
<31>マルチモーダル・エージェントと視覚言語モデル(VLM)/対話環境の構築
・概説
-マルチモーダルエージェントのベンチマーク
-マルチモーダル・エージェントのための視覚言語モデル
・関連研究
-香港大学/CMU他研究チーム 「OSWORLD: 実際のコンピュータ環境におけるオープンエンドタスクのためのマルチモーダルエージェントのベンチマーク」
<32>AIアライメントの媒介役としてのAIエージェント
・概説
・価値調整プロセスの切り口で見たAIエージェント
-AIバリュー・アライメント
-価値調整と高度なAIアシスタント
<33>AIエージェントによるレコメンダー(推薦)システム
・概説
・関連研究
-RecMind:推論、行動、記憶を組み合わせ、様々な推薦タスクに対応する大規模言語モデル技術による自律型推薦エージェント」
<34>意思決定のためのLLMエージェント
・概説
・関連研究
-マサチューセッツ工科大学他研究チーム 「LLMエージェントは後悔するのか?オンライン学習とゲームのケーススタディ」
-復旦大学/マイクロソフト・リサーチ・アジア 「EVOAGENT: 進化アルゴリズムによるマルチエージェント自動生成を目指して」
-カリフォルニア大学バークレー校 「Goex:自律的なLLMアプリケーションのためのランタイムに向けた展望とデザイン」
<35>自動デジタルエージェントの構築と課題
・概説
・先行研究
・自律的な洗練と評価
・デジタルエージェントベンチマーク
・関連研究
-カリフォルニア大学バークレー校/ミシガン大学研究チーム 「デジタルエージェントの自律的評価と改良」
<36>限られた経験から効率的に学習し適応できるAIエージェントの開発
・概説
・拡散モデルによる画像生成
・ロボット工学における拡散モデルの利用
・関連研究
-インペリアル・カレッジ・ロンドン/グーグル ディープマインド 「拡散拡張エージェント:効率的な探索と転移学習のためのフレームワーク」
<37>データベース・エージェント
・自然言語を使用してデータベースからクエリの実行・抽出を行うAIエージェント
・Azure OpenAI Serviceの機能を使ったSQLエージェント
<38>エンタープライズ・オートメーションとAIマトリックス・エージェント
・概説
・プランニング・エージェント
・ワークフローエージェント
・マトリックス・エージェント
<39>AIコーディングエージェント
・概説
・AIエージェントを作成・展開できるノーコード/ローコード・ソリューション
・事例
-Plandex
<40>サイバーセキュリティのタスクに特化したAIエージェント
・コンピュータ・セキュリティとAIエージェントに関する背景
・AIエージェントとサイバーセキュリティ
・サイバーセキュリティとAIの交差領域における最近の研究
・AIエージェント自体のセキュリティ
・関連研究
-イリノイ大学アーバナ・シャンペーン校 「ゼロデイ脆弱性を悪用できるLLMエージェント」
<41>自律走行システムとAIエージェントによるソリューション
・概説
・関連研究
-ウェイモ 「MotionLM: 言語モデリングとしてのマルチエージェント運動予測」
<42>AIエージェントとロボティクス
・概説
・ソーシャルロボット、コラボレーションロボットとAIエージェント
・関連研究
-NVIDIA/UT Austin 「MimicGen:ロボティクスのための自律的データ生成システム」
<43>ロボット・エージェント/学習済みロボットエージェントの研究開発動向
・概説
-事前に訓練された大規模な言語モデルと視覚ベースの操作のギャップを埋める試み
-意思決定のためのトランスフォーマ
-コントロールのための視覚的事前トレーニング
-ゴール条件付きエージェント
-汎用ロボット・エージェント
・関連研究
-Google DeepMind 「ロボキャット:ロボット操作のための自己改善型ジェネラリスト・エージェント」
<44>デジタルアシスタントを介して動作するWebエージェントの開発
・概説
・関連研究
-ServiceNowリサーチ他研究チーム 「ワークアリーナウェブエージェントは一般的な知識労働タスクをどの程度解決できるか?」
<45>Web3.0とAIエージェント
・Web3におけるAIの役割
・Web3.0におけるAI活用の実例
<46>マルチAIエージェントによるジオポータルと地理空間ウェブサービス
・概説
・ジオポータルの分散アーキテクチ
・AIエージェント・プランニング技法
・最新の研究動向
<47>メタバース・空間コンピューティング向けAIエージェントと適応学習
・概説
・AIエージェントにおける適応学習の重要性
・仮想環境におけるAIエージェントの現状
・適応学習の理論とモデル実装
・AIエージェントにおける適応行動のモデル
<48>ビデオゲームAIエージェント
・AIとゲームの間の複雑な相互作用を媒介するAIエージェント
・AIエージェントを活用したシミュレーションゲーム
・AIエージェント型シミュレーションゲーム
-Proxi Gallium
-StarCraft II
-Halite 8 Halite 8
-Kindred Games Kindred for PC
-AI City Planner AI City Planner
<49>AIエージェント型SaaSの試み
・概説
・顧客のAIエージェントとベンダーのAIエージェントのコラボレーション
<50>責任あるAIエージェントの実施要件
・責任あるAIプラクティスとAIエージェントの統合
・責任あるAIエージェントのアーキテクチャパターン
・エンタープライズプラットフォームに組み込まれた LLMアプリの信頼性
・LLMの微調整/ドメイン固有のSLM
・AIエージェントとLLM オーケストレーション
・責任あるAIエージェント運用のフレームワーク
<51>Googleが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Gemini 2.0/Project Mariner
・NotebookLM
・Vertex AI Agentbuilder
・Gemini Deep Research
・Agentspace
・Project Astra
・Project Mariner
・Jules
・AlphaFold
・Google DeepMind 「SIMA」
<52>OpenAIが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・ChatGPT/GPTs
・Sora
・Swarm
・Operator
<53>Microsoftが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Microsoft Copilot Studio
・Microsoft Copilot Agents
・Azure AI Agent Service
・AutoGen
・AutoGen Studio
・AgentInstruct
・Sora
・Data Formulator
・Magnetic-One
<54>AWSが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Agents for Amazon Bedrock
・Multi Agent Orchestrator
・AWS Step Functions
・Amazon Connect Contact Lens
・Agents for Amazon Bedrock
・その他、AWSが推進するAIエージェントプロジェクト
<55>Salesforceが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Salesforce 「LLMエージェントを構築するための軽量フレームワーク:AgentLite」
・Salesforce 「BOLAA戦略」
・Salesforce AI Research 「AgentLite」
<56>Metaが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Habitat 2.0
・Habitat 3.0、Habitat Synthetic Scenes Dataset、HomeRobot
・Researchers Pearl
・Shepherd
<57>IBMが手掛けるAIエージェント関連のプロダクト/サービス
・IBM Watson
・Agent-101
<58>Anthropicが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Model Context Protocol
・Claude/Claude 3.5
・Sonnet
<59>Perplexity AIが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Perplexity AI Snap
<60>オラクルが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Miracle Agent
<61>SAPが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Joule Collaborative AI Agents
<62>富士通が手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Fujitsu Kozuchi AI Agent
<63>Hugging Faceが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・SmolAgents
<64>Databricksが手掛けるAIエージェント関連のプロダクト/サービス
・概要
・Mosaic/Agent Framework
<65>NVIDIAが手掛けるAIエージェント関連の研究/プロダクト/サービス
・概要
・Eureka Agent
・AgentKit
<66>Replitが手掛けるAIエージェント関連の研究/プロダクト/サービス
・概要
・Replit Agent
<67>AIエージェントの導入事例
・アクセンチュア
・デロイトトーマツ
・ブレインパッド
・AI inside(AIインサイド)
・博報堂DYホールディングス
・セゾンテクノロジー
<68>AIエージェント開発企業(メガIT企業以外)
・概要
・LeewayHertz
・Markovate
<69>注目を集めるAIエージェントのスタートアップ
・概況・近況
・Foundry
・Floworks
・Kanerika
・Hamming AI
・Vectorview
・Reworkd
・Fume
・Baselit
<70>注目すべきAIエージェント・プロジェクト
・概況・近況
・LaVague
・AutoGPT
・SWE-Agent
・OpenDevin
・BabyAGI