What are AI agents? Definition, examples, and types | Google Cloud
分析結果
- カテゴリ
- AI
- 重要度
- 78
- トレンドスコア
- 42
- 要約
- AI エージェントの定義、例、種類 | Google Cloud Google Cloud Next Tokyo :7/30、31 東京ビッグサイトにて開催! AI エージェントとは 最終更新日: 2026 年 4 月 2 日 AI エージェントは、AI を使用してユーザーの代わりに目標を追求し、タスクを完了させるソフトウェア システムです。推論、計画、メモリーが可能であることが示されており、意思決定、学習、適応を行うレベルの自律性を備
- キーワード
AI エージェントの定義、例、種類 | Google Cloud Google Cloud Next Tokyo :7/30、31 東京ビッグサイトにて開催! AI エージェントとは 最終更新日: 2026 年 4 月 2 日 AI エージェントは、AI を使用してユーザーの代わりに目標を追求し、タスクを完了させるソフトウェア システムです。推論、計画、メモリーが可能であることが示されており、意思決定、学習、適応を行うレベルの自律性を備えています。 これらの能力は、生成 AI と AI 基盤モデルのマルチモーダル機能によって実現されています。AI エージェントは、テキスト、音声、動画、音声、コードなどのマルチモーダル情報を同時に処理し、会話、推論、学習、意思決定を行うことができます。また、時間の経過とともに学習を重ね、取引やビジネス プロセスを促進できます。エージェントは他のエージェントと連携して、より複雑なワークフローを調整して実行することもできます。 Vertex AI のデモ 情報を入手 7:39 エージェントの紹介: 新機能と学んだこと AI エージェントの主な機能 前述のとおり、AI エージェントの主な機能は推論と行動ですが( ReAct フレームワーク で説明しています)、時間の経過とともにさらに多くの機能が進化しています。 推論: この中核的な認知プロセスでは、論理と利用可能な情報を使用して結論を導き出し、推論を行い、問題を解決します。推論能力に優れた AI エージェントは、データの分析、パターンの特定、証拠とコンテキストに基づく情報に基づく意思決定を行うことができます。 行動 : 意思決定、計画、外部入力に基づいて行動を起こしたり、タスクを実行したりする能力は、AI エージェントが環境とやり取りして目標を達成するうえで不可欠です。これには、具現化された AI の場合の物理的な行動や、メッセージの送信、データの更新、他のプロセスのトリガーなどのデジタル行動が含まれます。 観察 : AI エージェントがコンテキストを理解し、情報に基づいた意思決定を行うには、知覚やセンシングを通じて環境や状況に関する情報を収集することが不可欠です。これには、コンピュータ ビジョン、自然言語処理、センサーデータ分析など、さまざまな形態の認識が含まれます。 計画 : 目標を達成するための戦略的計画を立てることは、インテリジェントな行動の重要な側面です。計画機能を備えた AI エージェントは、必要なステップを特定し、考えられる行動を評価し、利用可能な情報と望ましい結果に基づいて最適な行動方針を選択できます。多くの場合、将来の状態を予測し、障害となる可能性のあるものを考慮する必要があります。 コラボレーション : 複雑でダイナミックな環境では、人間であれ他の AI エージェントであれ、他のエージェントと効果的に連携して共通の目標を達成することがますます重要になります。コラボレーションには、コミュニケーション、調整、他者の視点を理解し尊重する能力が必要です。 自己改善 : 自己改善と適応の能力は、高度な AI システムの特徴です。自己改善機能を備えた AI エージェントは、経験から学び、フィードバックに基づいて行動を調整し、時間の経過とともにパフォーマンスと機能を継続的に強化できます。これには、機械学習の手法、最適化アルゴリズム、その他の自己改変の形態が含まれる可能性があります。 AI エージェント、AI アシスタント、bot の違い AI アシスタント は、ユーザーと直接連携し、自然言語や入力を理解して応答することでタスクを実行するアプリケーションやプロダクトとして設計された AI エージェントです。ユーザーの監督のもと、ユーザーに代わって推論し、行動を起こすことができます。 AI アシスタントは、使用するプロダクトに組み込まれていることがよくあります。重要な特徴は、タスクのさまざまなステップを通じてアシスタントとユーザーの間でやり取りが行われることです。アシスタントはユーザーからのリクエストやプロンプトに応答し、推奨するアクションを提案できますが、意思決定はユーザーが行います。 AI エージェント AI アシスタント Bot 目的 自律的かつプロアクティブにタスクを実行 ユーザーの作業をサポート 単純なタスクや会話を自動化 機能 複雑な複数ステップのアクションを実行できる、学習して適応する、独立して意思決定できる リクエストやプロンプトに応答し、情報を提供して簡単なタスクを完了する。アクションを推奨できるが、決定はユーザーが行う 事前定義されたルールに従う。学習は限定的。基本的なやり取り インタラクション 予防型、目標指向 リアクション型: ユーザーのリクエストに応答する 受動的: トリガーやコマンドに応答する AI エージェント AI アシスタント Bot 目的 自律的かつプロアクティブにタスクを実行 ユーザーの作業をサポート 単純なタスクや会話を自動化 機能 複雑な複数ステップのアクションを実行できる、学習して適応する、独立して意思決定できる リクエストやプロンプトに応答し、情報を提供して簡単なタスクを完了する。アクションを推奨できるが、決定はユーザーが行う 事前定義されたルールに従う。学習は限定的。基本的なやり取り インタラクション 予防型、目標指向 リアクション型: ユーザーのリクエストに応答する 受動的: トリガーやコマンドに応答する 主な違い 自律性 : AI エージェントは、目標を達成するために、独立して動作し、意思決定を行うことができる、最高レベルの自律性を備えています。AI アシスタントは自律性が低く、ユーザーの入力と指示が必要です。Bot は最も自律性が低く、通常は事前にプログラムされたルールに従います。 複雑さ : AI エージェントは複雑なタスクやワークフローを処理するように設計されていますが、AI アシスタントや bot は単純なタスクやインタラクションに適しています。 学習 : AI エージェントは、多くの場合、機械学習を活用して、時間の経過とともに適応し、パフォーマンスを向上させます。AI アシスタントには学習機能が備わっている場合もありますが、bot には学習機能がほとんど、またはまったく備わっていないのが一般的です。 AI エージェントの仕組み 各エージェントは、利用可能なツールの具体的な指示や説明を含め、その役割、個性、コミュニケーション スタイルを定義します。 ペルソナ : ペルソナが明確に定義されていると、エージェントは一貫したキャラクターを維持でき、割り当てられた役割にふさわしい方法で行動できます。エージェントが経験を積み、環境とやり取りするにつれて、ペルソナは進化します。 メモリー : エージェントは通常、短期メモリー、長期メモリー、コンセンサスメモリー、エピソードメモリーを備えています。即時のやり取りのための短期記憶、過去のデータや会話のための長期記憶、過去のやり取りのためのエピソード記憶、エージェント間で共有する情報のためのコンセンサス記憶があります。エージェントは、過去のやり取りを思い出し、新しい状況に適応することで、コンテキストを維持し、経験から学び、パフォーマンスを向上させることができます。 ツール : ツールは、エージェントが環境とやり取りして機能を強化するために利用できる関数または外部リソースです。ツールを使用することで、エージェントは、情報へのアクセス、データの操作、外部システムの制御など、複雑なタスクを実行できます。ツールは、ユーザー インターフェース(物理、グラフィカル、プログラム ベースのインターフェースなど)に基づいて分類できます。ツールの学習では、エージェントにツールの機能と、ツールを適用すべきコンテキストを理解させることで、ツールを効果的に使用する方法を教えます。 モデル : 大規模言語モデル(LLM)は、AI エージェントを構築するための基盤として機能し、理解、推論、行動する能力をエージェントに提供します。LLM はエージェントの「頭脳」として機能し、言語の処理と生成を可能にします。他のコンポーネントは推論と行動を促進します。 AI エージェントの種類 AI エージェントは、その能力、役割、環境に基づいてさまざまな方法で分類できます。エージェントの主なカテゴリをいくつかご紹介します。 エージェントのタイプとエージェントのカテゴリには、さまざまな定義があります。 インタラクションに基づく エージェントを分類する方法の一つは、ユーザーとのやり取りの仕方です。エージェントは、直接会話するエージェントと、ユーザーの直接的な入力なしにタスクを実行するバックグラウンド エージェントに分かれます。 インタラクティブ パートナー (サーフェス エージェントとも呼ばれます) – カスタマー サービス、ヘルスケア、教育、科学的発見などのタスクを支援し、パーソナライズされたインテリジェントなサポートを提供します。会話型エージェントには、人間との Q&A、雑談、世界知識のやり取りが含まれます。通常はユーザーのクエリによってトリガーされ、ユーザーのクエリやトランザクションに対応します。 自動バックグラウンド プロセス (バックグラウンド エージェントとも呼ばれます) – バックグラウンドで動作し、ルーチン タスクの自動化、データ分析による分析情報の取得、プロセスの最適化による効率化、潜在的な問題の予防的特定と解決を行います。ワークフロー エージェントもその 1 つです。人間とのやり取りは限定的またはまったくなく、通常はイベントによって駆動され、キューに入れられたタスクやタスクの連鎖を実行します。 エージェント数に基づく 単一エージェント : 特定の目標を達成するために個別に動作します。外部ツールやリソースを活用してタスクを遂行し、さまざまな環境で機能性を高めています。他の AI エージェントとのコラボレーションを必要としない、明確に定義されたタスクに最適です。処理のためには 1 つの基盤モデルしか扱えません。 マルチエージェント : 共通の目標または個々の目標を達成するために、複数の AI エージェントが協力または競合します。これらのシステムは、個々のエージェントの多様な機能と役割を活用して、複雑なタスクに取り組みます。マルチエージェント システムは、インタラクティブなシナリオで人間の行動(対人コミュニケーションなど)をシミュレートできます。各エージェントは、ニーズに最適な基盤モデルを独自に持つことができます。 AI エージェントを使用するメリット AI エージェントは、自律性、タスクの自動化、ツールや具現化を通じて現実世界とやり取りする能力を提供することで、言語モデルの機能を強化できます。 すべて開く 効率性と生産性 生産性の向上 : エージェントは、専門分野に特化した作業者のようにタスクを分割し、全体的に多くの作業をこなします。 同時実行 : エージェントは、互いの邪魔をすることなく、同時に異なる作業を行うことができます。 自動化 : エージェントは、反復的なタスクを処理し、人間がよりリエイティブな作業に集中できるようにします。 意思決定の改善 コラボレーション : エージェントが協力してアイデアについて議論し、互いに学び合うことで、より良い意思決定につながります。 適応性 : エージェントは、状況の変化に応じて計画や戦略を調整でききます。 堅牢な推論 : エージェントは、ディスカッションとフィードバックを通じて推論を洗練し、エラーを回避できます。 充実した機能 複雑な問題解決 : エージェントは、それぞれの長所を組み合わせることで、現実の困難な問題に取り組むことができます。 自然言語によるコミュニケーション : エージェントは、人間の言語を理解して使用し、人間や他のエージェントとやり取りできます。 ツールの使用 : エージェントは、ツールを使用して情報にアクセスすることで、外部の世界とやり取りできます。 学習と自己改善 : エージェントは、経験から学び、時間の経過とともに改善します。 ソーシャル インタラクションとシミュレーション 現実に即したシミュレーション : エージェントは、人間のような社会的行動(関係の構築や情報の共有など)をモデル化できます。 創発的行動 : 個々のエージェントの相互作用から、複雑な社会的相互作用が有機的に生じます。 AI エージェントの使用に関する課題 AI エージェントには多くのメリットがありますが、使用に伴う課題もあります。 深い共感 / 感情的知性を必要とするタスク、または複雑な人間の相互作用と社会的ダイナミクスを必要とするタスク - AI エージェントは、人間の微妙な感情に苦労することがあります。セラピー、ソーシャル ワーク、紛争解決などのタスクには、AI に現在欠けている感情的な理解と共感のレベルが必要です。言葉にしない合図を理解することが求められる複雑な社会的状況では、うまく対処できないかもしれません。 倫理的に重大な状況 - AI エージェントはデータに基づいて意思決定できますが、倫理的に複雑な状況に必要な道徳観や判断力はありません。たとえば、法執行、医療(診断と治療)、司法の意思決定などです。 予測不可能な物理環境を持つドメイン - AI エージェントは、リアルタイムの適応と複雑な運動能力が不可欠な、非常に動的で予測不可能な物理環境で苦労することがあります。これには、手術、特定の種類の建設作業、災害対応などのタスクが含まれます。 リソースを大量に消費するアプリケーション – 高度な AI エージェントの開発とデプロイには、計算コストが高く、大量のリソースが必要になるため、小規模なプロジェクトや予算が限られている組織には適さない可能性があります。 Cloud Run で AI エージェントをデプロイして、スケーラビリティと効率性を実現 AI エージェントは、推論、計画、ツール使用を処理するための柔軟なコンピューティング能力を本質的に必要とするため、 Cloud Run に最適です。このフルマネージドのサーバーレス プラットフォームを使用すると、エージェントのコード(多くの場合、コンテナ内にパッケージ化されている)をスケーラブルで信頼性の高いサービスまたはジョブとしてデプロイできます。このアプローチでは、インフラストラクチャ管理が抽象化されるため、デベロッパーはエージェントのロジックの改良に集中できます。 Cloud Run には、高度な AI エージェントのアーキテクチャと要件を直接サポートする機能がいくつかあります。 スケーラビリティと費用対効果: Cloud Run は、ピーク時の需要に対応するためにコンテナ インスタンスの数を自動的にスケールアップし、そしてエージェントがアイドル状態のときはゼロにスケールダウンできます。つまり、エージェントがアクティブに実行されている間に実際に消費されたコンピューティング リソースに対してのみ料金が発生するため、目標指向の断続的なワークロードでは費用対効果が高くなります。 エージェントのオーケストレーションとサービス提供: モデル呼び出し、ツール選択、推論プロセスを管理するコア エージェント ロジックは、Cloud Run サービスとして実行されます。このサービスは安定した HTTPS エンドポイントを提供するため、ユーザー向けアプリケーションや他のエージェントとの通信において、API を介してエージェントに簡単にアクセスできます。 エージェント間(A2A): Agent Development Kit (ADK)などのフレームワークは、Cloud Run とシームレスに統合して簡単にデプロイできるように設計されています。 Cloud Run の安全で自動スケーリング可能なフレキシブル環境を活用することで、組織は複雑な単一エージェント システムまたはマルチエージェント システムを効率的に運用できます。 AI エージェントのユースケース 多くの組織が、さまざまな ユースケース に対応するエージェントをデプロイしています。Google では、それらを 6 つの主要なカテゴリに分類しています。 カスタマー エージェント カスタマー エージェントは、お客様のニーズの理解、質問への回答、お客様の問題の解決、適切な商品やサービスの推奨を行うことで、パーソナライズされた顧客体験を提供します。ウェブ、モバイル、POS などの複数のチャネルを横断してシームレスに機能し、音声や動画を使用した商品エクスペリエンスに統合できます。 従業員エージェント 従業員エージェントは、プロセスの合理化、反復作業の管理、従業員の質問への回答、重要なコンテンツやコミュニケーションの編集や翻訳を行うことで、生産性を向上させます。 クリエイティブ エージェント クリエイティブ エージェントは、コンテンツ、画像、アイデアを生成し、デザイン、ライティング、パーソナライズ、キャンペーンを支援することで、デザインとクリエイティブのプロセスを強化します。 データ エージェント データ エージェントは、複雑なデータ分析を行うために構築されます。データから有意な分析情報を検出して行動できる可能性があり、事実に基づく結果の整合性が確保されます。 コード エージェント コード エージェントは、AI 対応のコード生成やコーディングのサポートにより、ソフトウェア開発を加速させ、新しい言語やコードベースへの対応を向上させるのに役立ちます。多くの組織で生産性が大幅に向上し、デプロイの迅速化や、よりクリーンで明確なコードの作成につながっています。 セキュリティ エージェント セキュリティ エージェントは、攻撃の影響を軽減したり、調査のスピードを向上させたりすることで、セキュリティ ポスチャーを強化します。セキュリティ ライフサイクルのさまざまな領域とステージ(予防、検出、対応)にわたってセキュリティを監視できます。 Google Cloud と AI エージェント Google Cloud は、AI エージェント分野のプロダクトとソリューションのポートフォリオを提供しています。これには、統合された AI アシスタント、事前構築された AI エージェント、AI アプリケーション、カスタム AI エージェントを構築するためのエージェントとデベロッパー ツールのプラットフォームが含まれます。 Gemini Enterprise 組織全体で AI エージェントを検出、作成、実行、管理するための安全なプラットフォーム。 Vertex AI Agent Builder 自然言語またはコード ファーストのアプローチを使用して、AI エージェントとアプリケーションを作成します。さまざまなオプションを使用して、エージェントやアプリをエンタープライズ データに簡単にグラウンディングできます。 Customer Experience Agent Studio 決定論的 AI と生成 AI の両方の機能を備えたハイブリッドな会話エージェントを構築できます。 Vertex AI Agent Engine シンプルな SDK と API を使用してエージェントをデプロイおよび管理するフルマネージド ランタイム。任意の Python ベースのフレームワークで任意のエージェントをラップし、迅速にデプロイできます。 Vertex AI Agent Garden AI エージェントの開発とデプロイを加速させる、事前構築済みのエージェント サンプル、ソリューション、ツール、フレームワークの厳選されたコレクション。 Agent Development Kit(ADK) オープンソースの Python SDK で、オーケストレーション、メモリ、デベロッパー ツールを使用して高度なマルチエージェント システムを構築できます。 A2A プロトコル AI エージェントの構築を支援するために Google が開発したオープンソース フレームワーク。A2A プロトコルで構築された AI エージェントは、あらゆるサービス、プラットフォーム、インフラストラクチャと相互運用できます。 Cloud Run コンテナ化されたエージェントとアプリケーションをデプロイできるフルマネージドのサーバーレス プラットフォーム。自動スケーリングと従量課金制による効率性を実現します。 参考情報 追加のリソースで AI エージェントについてさらに学習しましょう。 GitHub の Google ADK Google エージェントのホワイト ペーパー(Kaggle 経由) Google エージェント コンパニオン ホワイト ペーパー(Kaggle 経由) Skillsboost デベロッパー向け高度な生成 AI 学習 次のステップ $300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。 無料で開始 開始にあたりサポートが必要な場合 お問い合わせ 信頼できるパートナーと連携する パートナーを探す もっと見る すべてのプロダクトを見る