新機能「ChatGPTエージェント」の徹底解説 – 研究とアクションをつなぐ次世代AI

keito

2025年7月17日(米国時間)、OpenAIはChatGPTに新たな機能「ChatGPT エージェント(agent)」を発表しました。従来は会話で情報を整理したり簡易な調査を行う「話すAI」だったChatGPTが、Webサイトの操作やデータ分析、スプレッドシートやスライドの作成など複雑なタスクを自律的に実行する“動くAI”へ進化したのです。本記事では、ChatGPTエージェントとは何か、従来の機能との違いや活用方法、利用可能なプラン、そして安全性まで徹底的に解説します。

動画での解説はこちら

ChatGPTエージェントとは?

ChatGPTエージェントは、OpenAIが開発した新しいエージェントモデルです。ChatGPTの会話能力に加え、今年初めに公開された「Operator」のブラウザ操作力と「Deep Research」の調査力を統合した一体型のシステムで、ユーザーの指示に応じて複雑なタスクを自律的に実行します。2025年7月17日の発表以降、Pro、Plus、Teamプランのユーザーに対して段階的に展開され、EnterpriseおよびEducationプランにも数週間以内に提供される予定です。

従来のOperatorはブラウザを操作して買い物や予約などのタスクを代行するエージェントでしたが、詳細な分析やレポート作成には限界がありました。Deep Researchは大量のWeb情報を分析・要約する機能を持つものの、Webサイトと対話しながら結果を絞り込んだりユーザー認証が必要なページにアクセスすることはできませんでした。ChatGPTエージェントは双方の弱点を補い、3種類のツール(テキストブラウザ、ビジュアルブラウザ、ターミナル)を状況に応じて使い分けながらタスクを遂行します。これにより、単なるチャットボットから複雑な業務をこなす“働くAI”へと進化しました。

主な特徴とメリット

  • 複数ツールによる高度なタスク処理 – 画面を視覚的に読み取り操作する「ビジュアルブラウザ」、テキスト中心のWebページを効率良く読解する「テキストブラウザ」、コード生成やファイル解析・API連携を行う「ターミナル」を備え、与えられたタスクを分析して最適なツールを組み合わせながら実行します。
  • マルチステップでの実行 – 例えば「シンガポールのテック企業向けオフィス物件を調査してスライドにまとめて」といった複雑な依頼でも、対象サイトを巡回して情報を収集し、スライドまで自動生成します。途中でユーザーが退席しても作業が続き、結果をまとめます。
  • 継続的な作業とスケジューリング – チャットを一度中断してもコンテキストを維持したまま再開でき、追加指示や修正も反映可能です。定期的にレポートを作成するなど、定期タスクのスケジュール設定もできます。
  • スプレッドシートやスライドの生成 – 公的資料からデータを収集し、スプレッドシートやグラフ、スライドを自動作成します。例として、アメリカの年次包括財務報告書(ACFR)の金額を年度別に整理して表を作成するデモが紹介されており、高度な情報整理能力を備えています。
  • ベンチマークで高い性能 – OpenAIによると、複雑なタスクの能力を測る「Humanity’s Last Exam」で43.1%、データサイエンス系ベンチマーク「DSBench」やSpreadsheetBenchでも従来モデルを大きく上回るスコアを記録しました。これにより、データ分析や実務処理でも人間を凌駕する性能を示しています。

エージェントの使い方とデモ

ChatGPTエージェントはチャット入力欄にある「ツール」ドロップダウンから選択して起動します。使い方は従来のチャット同様ですが、エージェントに任せるタスクを明確に指示するのがポイントです。

例えば次のような依頼が可能です。

  1. イベント出席の準備を丸ごと依頼する – 招待された結婚式のドレスコードに合う服を複数探し、会場と天候に合わせて提案し、ホテルの予約状況や価格まで確認するタスクを自動で行います。
  2. 写真からグッズを作成する – ペットの写真を元にステッカー用のイラストを生成し、オンライン印刷サービスへの発注まで準備することもできます。
  3. 旅行プランやデータ収集 – MLB全球場を効率的に巡る旅行プランの作成や、大量の資料からデータを抽出・整理するといったタスクをエージェントが自律的に処理します。

このように、単なる情報検索にとどまらず、複数のWebサービスを横断しながら具体的なアクションを実行できるのがエージェントの強みです。タスクが長時間に及ぶ場合や処理が行き詰まった場合には、一時停止や進捗サマリーの確認、部分的な成果の受け取りも可能です。

利用可能なプランと料金

ChatGPTエージェントは、

  • Proユーザー – ほぼ無制限にタスクを実行できます。
  • PlusおよびTeamプラン – 月あたり50件までタスクを実行でき、追加の利用はクレジットを購入する形で対応します。
  • Enterprise/Education – 数週間以内に提供開始予定です。

プランにかかわらず、エージェントはクラウド上の仮想環境で動作し、ユーザーのPCに直接アクセスすることはありません。そのため、企業環境でも安心して利用できます。

安全性とユーザー制御

OpenAIはエージェントの安全性を重視し、以下の対策を実施しています。

  • 明示的なユーザー確認と監視モード – 購入など重要なアクションの際には必ずユーザーの確認と承認を求めます。危険性の高い作業はいつでもユーザーに引き継ぐことができ、ユーザーが常に主導権を持ち続けられます。
  • リスク軽減とプライバシー管理 – 入力内容の秘匿やプライバシー保護に配慮し、不正利用やプロンプトインジェクション攻撃に対する防御策を強化しています。

おわりに – ChatGPTエージェントがもたらす未来

ChatGPTエージェントの登場により、チャットボットは対話にとどまらず、複雑な業務を自律的に遂行する“働くAI”へと進化しました。ブラウザ操作・データ分析・スプレッドシートやスライドの生成といったタスクを任せることで、ユーザーはより創造的な仕事や意思決定に集中できます。また、安全性にも配慮されており、重要なアクションでは必ず確認が求められるなど、安心して利用できる設計です。

今後、エージェントはさまざまなWebサービスやアプリと連携する「コネクター」により、さらに強力なサポートを提供する予定です。新機能の可能性をぜひ試してみてください。あなたの業務や生活を劇的に効率化してくれることでしょう。

タイトルとURLをコピーしました