2026年3月5日、OpenAIはプロフェッショナルな業務においてこれまでで最も高性能かつ効率的なフロンティアモデルであるGPT-5.4およびGPT-5.4 Proを発表しました。
本モデルは、推論、コーディング、そして自律型エージェントのワークフローにおける最新の進歩をひとつのモデルに統合したものであり、ChatGPT(GPT-5.4 Thinkingとして)、API、Codexを通じて提供されます。
以下に、今回のアップデートで注目すべき主要な新機能と特徴をまとめました。
1. 思考プロセスの提示と軌道修正が可能に
ChatGPTの「GPT-5.4 Thinking」では、モデルが事前に「思考の計画」を提示するようになりました。これにより、モデルが応答を生成している途中で方向性を調整(軌道修正)することが可能になり、余計なやり取りを繰り返すことなく、求める最終出力に素早くたどり着くことができます。長時間の思考が求められる複雑なタスクでも、文脈を維持する能力が向上しています。
2. ネイティブな「コンピューター操作(Computer-use)」機能
GPT-5.4は、ネイティブで最先端のコンピューター操作機能を備えた初の汎用モデルです。スクリーンショットを解析し、マウスやキーボードの操作コマンドを発行することで、人間のようにデスクトップ環境をナビゲートできます。
デスクトップ操作のベンチマークである「OSWorld-Verified」では、前モデルGPT-5.2の47.3%を大きく引き離し、人間のパフォーマンス(72.4%)をも超える75.0%の成功率を達成しました。
また、最大10.24メガピクセル(または最大6000ピクセル)のオリジナル画像をそのまま入力できる高解像度対応も追加され、詳細な視覚認識能力が大幅に向上しています。
3. トークンを劇的に節約する「ツール検索(Tool search)」機能
API開発者向けに、ツール検索機能が新たに導入されました。
これまで、多数の外部ツールをモデルに連携させる場合、すべてのツールの定義を事前にプロンプトに含める必要があり、膨大なトークンを消費していました。GPT-5.4では、モデルが必要なタイミングでツール定義を検索して会話に追加する仕組みになったため、トークン使用量を大幅に削減(テストでは47%削減)し、高速かつ低コストで大規模なツールエコシステムを扱えるようになりました。
4. 高度なナレッジワークと最大100万トークン対応
GPT-5.4は、最大100万トークンのコンテキストウィンドウをサポートしており、長期的な計画や実行が求められる複雑なワークフローに対応しています。
特にプロフェッショナル向けのナレッジワークに優れており、以下のような実績を残しています。
- 44の職種にわたる知識労働のテスト(GDPval)で、業界のプロフェッショナルと同等以上の成果を83.0%の割合で達成しました。
- スプレッドシートの作成や、視覚的に優れたプレゼンテーション資料の作成能力が大幅に向上しています。
- コーディングにおいても、Webアプリなどを視覚的にデバッグ・テストできるCodexの実験的機能「Playwright (Interactive)」に対応しています。
5. 利用プランと提供開始日
- ChatGPT: 本日より、ChatGPT Plus、Team、Proユーザー向けに「GPT-5.4 Thinking」の提供が開始されています。最高性能の「GPT-5.4 Pro」は、ProおよびEnterpriseプランで利用可能です。
- API / Codex: 開発者向けには、APIで
gpt-5.4およびgpt-5.4-proとして本日から利用可能です。