PLUS

生成AIコラム

一覧に戻る

うさぎでもわかるGPT-5.4完全ガイド ~ネイティブPC操作・100万トークン・Tool Searchで何が変わった?~

はじめに

2026年3月5日、OpenAIが最新フロンティアモデル GPT-5.4 をリリースしました。

GPT-5.4は、これまで別モデルだったGPT-5.3-Codexのコーディング能力をメインラインモデルに統合した初のモデルであり、ChatGPT・API・Codexの全プラットフォームに同時展開されています。知識労働ベンチマーク(GDPval)では44職種のプロフェッショナルと比較して 83%の場面で同等以上の成果 を達成しました。

この記事では、GPT-5.4の目玉機能の解説から、実際にAPIを触って検証した結果までお届けします🐰

この記事で分かること

  • GPT-5.4の提供形態と基本スペック
  • 4つの目玉機能(Computer Use / 100万トークン / Tool Search / ステアラビリティ)
  • Computer Use APIを実際に動かしたコード例と使用感
  • GPT-5.4 Pro APIの実力とコスト感
生成AIの社内利用をお考えの企業様へ 
ナレフルチャットは初心者でも使いやすい設計で、組織全体への生成AI浸透を支援するツールです。プロンプト自動生成機能や社内共有機能により、AIリテラシーに差があっても全員が活用できます。企業のAI導入を検討している方は、こちらをご覧ください。

GPT-5.4とは? モデル概要

GPT-5.4は、OpenAIが「プロフェッショナルの作業向けに設計された、最も有能で効率的なフロンティアモデル」と位置付けるモデルです。

3つの提供形態

名称対象特徴
GPT-5.4 ThinkingChatGPT Plus / Team / ProChatGPTでの普段使いモデル。思考計画の事前提示・途中修正が可能
GPT-5.4 ProChatGPT Pro / Enterprise / APIより多くの計算リソースで深く推論する最高精度モデル。高難度タスク向け
GPT-5.4(API)開発者向け(gpt-5.4100万トークン対応・Computer Use搭載

「5.4」という命名には意味があります。GPT-5.3-Codexで培ったコーディング能力をメインラインモデルに統合した大きなジャンプを反映しており、開発者がモデル選択で迷わないようにするための変更です。

知っておくべき基本情報

  • 知識カットオフ → 2025年8月31日
  • 最大出力 → 128,000トークン

GPT-5.4の4つの目玉機能

1. ネイティブComputer Use(PC操作能力)

AIがブラウザやデスクトップを人間のように操作できる機能うさよ🐰

GPT-5.4は、OpenAI初の汎用モデルでのネイティブPC操作に対応しています。Playwrightによるコード実行と、スクリーンショットを読み取ってのマウス・キーボード操作の2つのアプローチが使えます。

デスクトップ操作ベンチマーク OSWorld-Verified では 75.0% を達成し、人間のベースライン(72.4%)を超えました。GPT-5.2が47.3%だったことを考えると、一世代で大幅な進化を遂げています。

開発者はAPIのcomputerツールからアクセスでき、リスク許容度に応じたカスタム確認ポリシーも設定できます。

2. 100万トークンのコンテキストウィンドウ

AIが一度に読める情報量が一気に拡大したうさよ🐰

APIとCodexで最大1,050,000トークンに対応しました。GPT-5.2の400,000トークンから約2.6倍の拡大です。

大規模なコードベースや長文の法律文書、四半期分の財務記録なども一括で処理できるようになりました。ただし、272,000トークンを超えるリクエストでは入力が2倍・出力が1.5倍の料金になるので、コスト管理には注意が必要です。

3. Tool Search(ツール検索)

AIが必要なツールだけを効率よく探して使える仕組みうさよ🐰

従来は全ツール定義を毎回プロンプトに含める必要があり、ツールが増えるほどトークンを消費していました。GPT-5.4ではTool Searchが導入され、軽量なツールリストだけを保持し、必要なときにオンデマンドで定義を読み込む方式に変わりました。

OpenAIのMCP Atlas検証(36 MCPサーバー、250タスク)では、精度を維持しつつ47%のトークン削減を達成しています。10個以上のツールを扱う大規模エコシステムで特に効果的です。

ただし、ツールが2〜3個程度なら従来の定義方式で十分です。Tool Searchは大規模環境でこそ真価を発揮します🐰

4. ステアラビリティ(操作可能性)

AIの考えている方向を途中で修正できる機能うさよ🐰

GPT-5.4 Thinkingは、複雑なリクエストに対して思考計画を事前に提示します。ユーザーはその計画を見て、生成途中でも方向を修正できます。やり直しや追加の会話ターンなしに、意図に沿った結果に導けるのは大きな改善です。

法人向け生成AIサービス「ナレフルチャット」では定期的にアップデートを行っており、ChatGPT5.4をはじめ、Gemini3.1、Claude4.6などの最新モデルが利用可能です。
また、料金プランは企業単位の定額制を採用しており、何人で利用しても追加のコストは発生しないため、コスト管理の手間がかからないスムーズな全社導入を実現できます。
初月無料で生成AIが利用できるトライアル期間も用意しておりますので、生成AIの利活用を検討している企業様は、是非一度導入をご検討ください。

実際に触って検証

Computer Use を API で試す

GPT-5.4のComputer Useは、ざっくり言うと「AIがブラウザの画面を見て、マウスやキーボードを操作する」機能です。

公式ドキュメントでは3つの使い方が紹介されていますが、ポイントはシンプルです。

  • 方法1 → AIに「ここをクリックして」「ここに入力して」と1つずつ指示を出す方式
  • 方法2 → 自分で用意した自動操作ツール(Playwright等)をAIが呼び出す方式
  • 方法3AIが自分でコードを書いて実行する方式(GPT-5.4はこれ向けに訓練済み)

方法3が最も柔軟で、GPT-5.4が得意とするアプローチです。今回の検証では、OpenAI公式が提供しているサンプルアプリを使って体験してみます。

セットアップ

OpenAI公式のopenai-cua-sample-appはTypeScript製のWebアプリです。Next.jsの操作コンソール画面からシナリオを選んで実行する形式になっています。

必要なもの

  • Node.js 22.20.0
  • pnpm 10.26.0
  • OpenAI APIキー
git clone https://github.com/openai/openai-cua-sample-app
cd openai-cua-sample-app
corepack enable
pnpm install
cp .env.example .env

.envファイルを開いてOPENAI_API_KEYを設定します。

OPENAI_API_KEY=your_key_here

Playwrightのブラウザをインストールします。

pnpm playwright:install

起動は1コマンドでOKです。

pnpm dev

ブラウザで http://127.0.0.1:3000 を開くと、操作コンソール画面が表示されます。

実行モード

サンプルアプリには2つの実行モードがあります。

  • native → AIがマウスクリック・キー入力・スクロールなどを直接指示する方式。Computer Useそのものを体験できる
  • code → AIがPlaywrightのJavaScriptコードを書いてブラウザを操作する方式。より柔軟な制御が可能

検証1 お絵描き(Sketch Studio)

キャンバス上でAIがマウスカーソルを操作して絵を描くシナリオです。色の選択、カーソル移動、描画、保存までの一連の流れをAIが自律的にこなせるかを試します。

操作コンソールで Sketch Studio を選択し、以下のようなプロンプトを入力します。

Draw a simple house with a red roof and blue door on the canvas.
First select red from the palette, draw a triangle for the roof,
then select brown and draw a square for the walls,
then select blue and draw a small rectangle for the door.
Finally, save the drawing.

Sketch Studioでは、AIがカラーパレットから色を選択し、キャンバス上に描画するという一連の流れを確認できました。ピクセル単位の精密な描画は難しいものの、「色を選ぶ → 描く → 保存する」という手順をAIが自律的に進めていたのが印象的です。

検証2 ホテル予約(Northstar Stays)

ホテル予約サイトで、フィルター選択→ホテル閲覧→フォーム入力→予約確定までをAIが一気通貫で操作するシナリオです。マルチステップ操作の安定性を検証します。

操作コンソールで Northstar Stays を選択し、以下のようなプロンプトを入力します。

Book a hotel room with the following details:
- Filter: 4-star hotels, price under $200/night
- Guest name: Usagi Tanaka
- Check-in: 2026-04-01
- Check-out: 2026-04-03
- Special request: Late check-in after 10 PM
Complete the reservation and confirm the booking.
実行結果 - ホテル予約が完了した画面

Northstar Staysでは、フィルターの設定からフォーム入力、予約確定までの操作をAIが一気通貫でこなしました。特にフォームのテキスト入力やドロップダウン選択の精度が高く、実用的なレベルに達していると感じます。

検証結果まとめ

シナリオ内容モード結果
Sketch Studioお絵描きcode描画の手順は正確。ピクセル精度はやや粗い
Northstar Staysホテル予約codeフォーム入力・予約確定まで安定して完了

触ってみた所感

Computer Useは「AIにブラウザを任せる」という未来感のある体験でした。特にNorthstar Staysのようなフォーム入力系タスクは実用性が高く、定型的なWeb操作の自動化に使えるポテンシャルを感じます。

一方、Sketch Studioのような細かいカーソル制御が求められるタスクはまだ発展途上です。OSWorld-Verifiedで人間超えの75.0%を達成しているとはいえ、得意・不得意がはっきりしている印象です。

うさぎの結論としては、フォーム入力やボタンクリックなど構造化されたUI操作は得意、自由度の高いクリエイティブ操作はまだ苦手、というのが現時点の実力です🐰

GPT-5.4 Pro API の使用感

GPT-5.4 Proは「より多くの計算リソースを使って、より深く考える」モデルです。Responses APIのみで利用でき、reasoning.effortパラメータで推論の深さを制御できます。

通常版GPT-5.4との違いを体感するために、ビジネスでよくある「複数人のスケジュール調整」 を題材に比較検証してみます。

検証の題材

以下のような状況を想像してください。プロジェクトの打ち合わせを設定するため、3人のメンバーにメールで都合を聞いたところ、バラバラな返信が届きました。この中から全員が参加できる最適な日時を見つけてもらいます。

件名:Re: 【日程調整】Q2プロジェクト打ち合わせ

■ 山田部長
来週は月曜午後と木曜が空いています。火曜は出張で終日不可です。
水曜は午前中だけなら大丈夫ですが、できれば避けたいです。
金曜は午前なら対応可能ですが、午後は役員会です。

■ 佐藤さん(営業)
月曜と火曜は客先訪問で厳しいです。水〜金なら基本OKですが、
木曜15時からは別件の打ち合わせが入っています。
あと、会議は2時間確保してほしいです。

■ 鈴木さん(エンジニア)
水曜はスプリントレビューで終日埋まっています。
それ以外は比較的柔軟ですが、金曜午後はリリース対応の可能性あり。
月曜は午前のみ可能です。

3人だけですが、「午前のみ」「午後のみ」「終日不可」「できれば避けたい」など条件が微妙に絡み合っています。これを通常版GPT-5.4とGPT-5.4 Proに同じプロンプトで投げて、回答の質を比較します。

セットアップ

まずはOpenAI Pythonライブラリをインストールし、APIキーを環境変数に設定します。

pip install openai
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"

APIキーはOpenAIダッシュボードから発行できます。環境変数に設定しておけば、コード内にキーを直書きする必要はありません🐰

比較コード

from openai import OpenAI

client = OpenAI()  # 環境変数 OPENAI_API_KEY を自動で読み込み

schedule_prompt = """
以下は3人のメンバーから届いたスケジュール回答メールです。
来週の月曜〜金曜(9:00-18:00)の中で、全員が参加できる2時間の会議枠を見つけてください。

最適な候補を優先度付きで3つ提案し、それぞれの根拠も示してください。

(ここに上記のメール本文を貼り付け)
"""

# 通常版 GPT-5.4
response_normal = client.responses.create(
    model="gpt-5.4",
    input=[{"role": "user", "content": schedule_prompt}]
)

# GPT-5.4 Pro(深い推論)
response_pro = client.responses.create(
    model="gpt-5.4-pro",
    reasoning={"effort": "high"},
    input=[{"role": "user", "content": schedule_prompt}]
)

print("=== GPT-5.4 ===")
print(response_normal.output_text)
print("\n=== GPT-5.4 Pro ===")
print(response_pro.output_text)

比較結果

両モデルとも第1候補は木曜10:00〜12:00で一致しました。ただし、回答の質には明確な差がありました。それぞれの生の出力結果を見てみましょう。

通常版GPT-5.4の出力(13.0秒で完了)

3名の条件を突き合わせた結果、全員が参加できる2時間枠はかなり限られます。
結論として、有力候補は木曜午前〜昼過ぎのみです。

参加可能条件の整理

山田部長 → 月曜午後 可 / 木曜 可 / 火曜 不可 / 水曜午前 可(できれば避けたい) / 金曜午前 可
佐藤さん → 月曜・火曜 厳しい / 水〜金 基本OK / 木曜15:00以降 不可 / 2時間必要
鈴木さん → 水曜 終日不可 / 月曜午前のみ可 / 火・木 柔軟 / 金曜午後 不確定

重ね合わせ結果
月曜 → 全員揃わない / 火曜 → 全員揃わない / 水曜 → 全員揃わない / 木曜 → 2時間枠あり / 金曜 → 午前に2時間枠あり

第1候補 → 木曜 10:00〜12:00(3名とも参加可能、午前帯で集中しやすい)
第2候補 → 木曜 13:00〜15:00(佐藤さんの15:00別件にちょうど抵触しない)
第3候補 → 金曜 9:00〜11:00(木曜が難しい場合のバックアップ)

GPT-5.4 Proの出力(260.9秒で完了)

全員が2時間連続で参加できる共通枠は次の通りです。

  • 来週木曜(3/19)9:00〜15:00
  • 来週金曜(3/20)9:00〜12:00

※ 月〜水は共通の2時間枠がありません。
月曜 → 山田部長は午後、鈴木さんは午前のみで重ならない / 火曜 → 山田部長が終日不可 / 水曜 → 鈴木さんが終日不可

優先順位は、制約の少なさ・後続予定への余裕・避けたい時間帯の回避で付けています。

1. 来週木曜 10:00〜12:00 → 昼休みにかからず、誰の制約にも近すぎないため最も安定した候補
2. 来週木曜 9:00〜11:00 → 確実に2時間取れるが、1位より少し早い時間帯
3. 来週金曜 10:00〜12:00 → 山田部長が午前しか使えないため、木曜より柔軟性が低い

補足 → 木曜 13:00〜15:00も成立はしますが、佐藤さんの15:00からの別件と連続するため、優先度は下げています。

通常版とProの違い

比較項目GPT-5.4GPT-5.4 Pro
処理時間13秒261秒(約20倍)
第1候補木曜 10:00〜12:00木曜 10:00〜12:00
優先順位の根拠記載はあるがシンプル明確な基準を提示し、除外理由も丁寧
実用性十分使えるレベルそのまま社内メールに転記できるレベル

今回の検証では、最終的な答え(第1候補)は同じでした。ただし、Proは「なぜこの順番なのか」「なぜこの候補を外したのか」まで踏み込んだ回答を返してくれます。上司への報告や社内調整メールにそのまま使えるクオリティです。

感想としては、通常版でも十分正確な答えは出ます。ただ、Proの回答は「考え方の過程」が見えるので、判断の根拠を求められるビジネスシーンでは頼りになると感じました🐰

コスト感について

GPT-5.4 Proの料金は入力$30/1Mトークン、出力$180/1Mトークンです。通常版GPT-5.4($2.50/$15)の12倍になります。

項目GPT-5.4GPT-5.4 Pro
入力料金(1Mトークン)$2.50$30
出力料金(1Mトークン)$15$180
向いているタスク日常的な分析・要約・コード生成複雑な制約を含む推論・高難度タスク

うさぎの結論としては、Proは「ここぞ」という場面だけに使うのが賢いうさよ。今回のような複雑な条件の組み合わせ問題や、ミスが許されない重要な判断にはProの精度が光ります。まずは通常版で試して、品質が足りないときだけProに切り替える使い方がコスパ最強です🐰

処理が数分かかることもあるので、タイムアウトを避けるためにバックグラウンドモードの利用をおすすめします。

まとめ

GPT-5.4は「コーディングモデルと汎用モデルの統一」という大きな転換点を迎えたモデルです。特にComputer UseがOSWorld-Verifiedで人間を超えた75.0%を達成したことは、エージェント開発の可能性を大きく広げています。

用途別おすすめモデル

ユースケースおすすめモデル
日常業務・チャットGPT-5.4 Thinking(ChatGPT)
エージェント開発・自動化GPT-5.4 API
超高難度の数学・研究GPT-5.4 Pro

2026年3月現在、フロンティアモデルの競争は非常に激しく、各社の差は僅差です。「1つのモデルが全てで勝つ時代」は終わり、自分のユースケースに合ったモデルを選ぶことが最も重要な時代になりました。

ここまで読んでくれてありがとうございます!GPT-5.4、ぜひ試してみてくださいね🐰

あなたも生成AIの活用、始めてみませんか? 

生成AIを使った業務効率化を、今すぐ始めるなら
「初月基本料0円」「ユーザ数無制限」のナレフルチャット!
生成AIの利用方法を学べる「公式動画」や、「プロンプトの自動生成機能」を使えば
知識ゼロの状態からでも、スムーズに生成AIの活用を始められます。

アバター画像

taku_sid

https://x.com/taku_sid
AIエージェントマネジメント事務所「r488it」を創立し、うさぎエージェントをはじめとする新世代のタレントマネジメント事業を展開。AI技術とクリエイティブ表現の新たな可能性を探求しながら、次世代のエンターテインメント産業の構築に取り組んでいます。
ブログでは一つのテーマから多角的な視点を展開し、読者に新しい発見と気づきを提供するアプローチで、テックブログやコンテンツ制作に取り組んでいます。「知りたい」という人間の本能的な衝動を大切にし、技術の進歩を身近で親しみやすいものとして伝えることをミッションとしています。

ナレフルチャットアプリアイコン

スマートフォンでもAI活用!

アプリ版「ナレフルチャット」配信中

ナレフル_アプリ使用イメージ

iPhoneはこちら

App Store
iPhone QRコード

Androidはこちら

Google Play
Android QRコード
App Store App Store
Page Top