種々雑多な独り言

趣味や興味のあることの種々雑多な独り言。

GPT-5の変更点をChatGPTに聞いてみました

最近はGeminiを開くことが多かったけれどたまたまChatGPTを開いたらGPT-5に変わっていました。

何が変わったのかChatGPTに聞いてみました。

 

GPT-5 にアップグレードされた内容について、現時点で公表されている主なポイントを以下にまとめます(2025年8月7日時点):


GPT-5で変わったこと

1. 全体の刷新:モデルの統合と自動ルーティング

  • GPT-5 の登場により、従来の GPT-4 や GPT-4.5、o3 などはすべて廃止されました。GPT-5 が ChatGPT の標準モデルとして統合され、ユーザーは背後で複数の最適なサブモデル(例:Thinking や Mini)から自動で適切なものが選ばれて応答される仕組みになっています (ウィキペディア, Windows Central)。

  • 無料ユーザーにも標準版が開放され、Pro ユーザー(月額約200ドル)は「GPT-5-pro」や「GPT-5-thinking」など、より高度なバージョンにアクセス可能 (WIRED, The Washington Post, ガーディアン, Windows Central)。

2. 向上した性能:専門家レベル・高精度・高速化

3. モデルバリエーション:複数のサイズと性能レベル

  • APIでは「GPT-5」「GPT-5-mini」「GPT-5-nano」が提供され、それぞれ性能・コスト・応答速度のバランスが異なります (OpenAI, WIRED, Simon Willison’s Weblog)。

  • 各モデルに対して verbosity(応答の詳しさ)と reasoning_effort(推論の深さ)パラメータを指定できるようになり、開発者は応答の長さや速度、思考プロセスの詳細さを調整できるようになりました (OpenAI Cookbook, OpenAI)。

4. 長文コンテキストとマルチモーダル対応強化

5. エージェント機能とツール呼び出しの大幅強化

  • GPT-5 は複数のツール呼び出しを順次あるいは並列で行いながら複雑なタスクを完遂する「エージェント的」機能を備えています。ツールエラーへの対処や進捗の事前通知などで制御性も向上 (OpenAI, WIRED, Augment Code)。

  • ベンチマーク(例:τ²-bench telecom)では従来モデルを大きく上回る成功率を記録 (OpenAI)。

6. ChatGPT との連携強化:パーソナリティとツール統合

  • 会話に「パーソナリティ」を与える機能(例:「ロボット風」「シニカル」など)や、Gmail、Google カレンダーとの連携、チャットの色変更、音声応答のカスタマイズなどが導入されています (Cinco Días, The Verge, ガーディアン)。

7. マイクロソフト製品との統合

  • Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundry などに GPT-5 が搭載され、「スマートモード」によりタスクに応じたモデル選択が自動で行われます (The Verge, Source)。


まとめ表

領域 主な改善点
パフォーマンス 高速化・信頼性向上、複雑タスクへの対応強化
柔軟性 モデルサイズ・推論深度・応答長さの調整
多様性 マルチモーダル対応・ツール連携・エージェント機能強化
UX向上 パーソナリティ設定、UI拡張、外部サービス連携
エコシステム Microsoft 製品との深い統合による活用範囲拡大

基本的には、GPT-5 は従来よりもはるかに高度で、より「専門家らしい」応答を返せるモデルとして設計されています。ツールとの連携や応答スタイルの制御まで可能になり、ユーザー体験が一段と進化しました。

他にも気になる点や、実際に使ってみたい機能があれば、ぜひ具体的にお知らせください!

 

朝早くだったからか返答速度は速くなっているような。

イラストも描いてもらったけれど、それも速かった。

複雑なことは特にしていないのですが、今後GoogleOne AI Premiumの無料期間が終了するのでPlusに変更するかどうかを考えます。

 

 

 

ついでにGeminiとの違いを聞いてみました。

 

Gemini(Google DeepMindのAIモデル)とGPT-5(OpenAIの最新モデル)は、どちらも現代の先端AIを代表する存在ですが、それぞれに強みと特徴があり、用途に応じて使い分けがされています。以下に2025年夏時点(2025年8月)での主な違いをご紹介します。


主な違いと比較

1. マルチモーダル能力と文脈理解

  • Gemini は最初からマルチモーダル(テキスト、画像、音声、動画、コードなど)をネイティブに扱える設計で、特に長い文脈(最大100万トークン)に強い処理能力を持ちます (ウィキペディア, Medium)。

  • GPT-5 はテキストと画像を入力として受け付け、出力はテキストに限られるものの、応答の質や明瞭さ、推論能力に優れたモデルです (Simon Willison’s Weblog, Nitro Media Group, Vellum AI)。

2. 推論クオリティと速度

  • GPT-5 は推論モード(「thinking」モード)での応答精度が著しく高く、誤情報率も極めて低く抑えられていると報告されています (Vellum AI)。

  • Gemini 2.5 Pro / Ultra は「Deep Think」と呼ばれる高度な並列思考型推論機能を備えており、複雑な問題に対しても人間のように多角的に検討しながら解答を導き出します (Tom's Guide, Google DeepMind)。

3. 得意なタスクとユースケース

  • GPT-5 は創造的なタスク(ストーリーテリング、リサーチ、コーディングなど)で高い応答力を発揮し、応答も高速で安定している点が特徴です (aipanthers.com, Nitro Media Group, McNeece Web Design)。

  • Gemini は文脈記憶力が非常に優れており、長文分析、学習支援(教育)、ビジュアルやマルチメディアの統合など、複合的なインタラクションに強みがあります (Lifewire, Indiatimes, Gemini, aipanthers.com)。

4. ユーザー体験と連携環境

  • Gemini はGoogleサービスとの統合が深く、Gmail、カレンダー、Chrome、Workspaceなど、さまざまなプラットフォームで連携がスムーズです (Gemini, Googleブログ, Tom's Guide)。

  • GPT-5 は応答の速度や推論性能に重点が置かれており、多様なAPIやツールと組み合わせることで柔軟に利用できます (Simon Willison’s Weblog, Vellum AI, Nitro Media Group)。

5. アクセシビリティと料金体系

  • Gemini は一部は無料で利用可能(例えば「Flash」など)、学生向け無料提供やFreeプランも用意されており、Pro/Ultraへアップグレードすることで追加機能(Deep Think、Video生成など)にアクセスできる形になっています (Gemini, Cinco Días, Lifewire, Tom's Guide, Indiatimes)。

  • GPT-5 も標準モデルは無料ユーザー向けに提供され、Proユーザー向けにはより高度なバージョン(例:GPT-5-Pro モデル)が提供される予定です (Reddit, Simon Willison’s Weblog)。


まとめ表

項目 Gemini(2.5 Pro / Ultra) GPT-5
マルチモーダル対応 テキスト / 画像 / 音声 / 動画 / コードをネイティブに扱える テキスト入力+画像入力(出力はテキスト)
文脈ウィンドウ 最大 1 M トークン 入力約272,000トークン / 出力128,000トークン
推論力・精度 Deep Think による高精度な複雑タスク処理 Thinking モードで高い精度・低い誤情報率
得意分野 長文分析、学習支援、マルチメディア生成、Google統合 創造的タスク、リサーチ、迅速な応答、広汎なAPI連携
アクセス方法 一部無料+Pro/Ultra サブスクリプション 無料モデル+Pro版モデルあり(提供予定)

より詳しく知りたい点や、実際に試してみたいユースケースがあれば、ぜひ教えてください。たとえば教育シーンでの活用や創作支援など、より具体的な比較もできます

 

GPT-5で今日の天気を聞いても答えてくれたので初期の頃とは比べものにならないくらいに進化していると思います。

生成AIを活用していくことは重要なスキルだと思っているので、早めに慣れていってもらいたいと思っています。

 

<PR>