GPT-5.1

エグゼクティブ・サマリー：GPT-5.1による戦略的軌道修正

OpenAIが2025年11月12日に発表したGPT-5.1は、AIの世代交代（例：GPT-6）を意味するものではなく、2025年8月にリリースされたGPT-5世代に対する「意味のある改善」を反映した、戦略的なイテレーティブ・アップグレード（反復的改良版）です ¹。

このリリースは、GPT-5が直面した深刻な市場の反発に対応する「軌道修正（Course Correction）」¹ として理解することが不可欠です。GPT-5（2025年8月版）は、ベンチマーク上ではSOTA（State-of-the-Art）の知性を達成しましたが、その「堅苦しい（stiffness）」「コミュニケーションスタイルが不均一（uneven communication style）」「冷たい」と評されたトーンが、GPT-4oの「温かさ」に慣れたユーザーから強い批判を受けました ⁶。

GPT-5.1は、この「ユーザビリティ」と「コミュニケーション・スタイル」のギャップを埋めるために、以下の3つの主要な変更を加えています。

デュアルモデル・アーキテクチャの導入: GPT-5.1は、ユーザー体験を2つの新しいモデルに明確に分離・最適化しました ¹。

GPT-5.1 Instant: 最も広く使用されるデフォルトモデル。GPT-5の「冷たさ」を修正し、「より温かく、より会話的な」トーンに再設計されました ²。
GPT-5.1 Thinking: 高度な推論エンジン。タスクの難易度に応じて思考時間を動的に調整し、効率と応答の明瞭性が向上しました ¹³。

パフォーマンス改善（UX）: GPT-5の最大の弱点であった「指示追従性（Instruction-Following）」が劇的に改善されました。例えば「6語で回答せよ」といった具体的な制約を正確に遵守する能力が向上しています ²。
パフォーマンス改善（技術）: 新技術「適応型推論（Adaptive Reasoning）」² が Instant モデルに初めて搭載されました。これにより、Instant モデルはタスクの難易度を自ら判断し、単純なタS_Sクには迅速に応答しつつ、複雑なタスクには自動的に「思考」時間を割くことが可能になりました ²。この技術的成果が、高難易度の数学（AIME 2025）およびコーディング（Codeforces）ベンチマークにおける「顕著な改善」に直結しています ²。

I. 分析の背景：GPT-5（2025年8月）の「プラットフォーム・ショック」

GPT-5.1（2025年11月）のリリース意義を正確に理解するには、その前提であるGPT-5（2025年8月）が、技術的な大成功であったと同時に、市場（ユーザー）からは深刻な失敗と見なされた事実を分析する必要があります。GPT-5.1は、このGPT-5が引き起こした混乱への直接的な対応として設計されました。

2025年8月 GPT-5：インテリジェンスの頂点

GPT-5は2025年8月7日、OpenAIの「LIVE5TREAM」イベントで発表された、次世代のフロンティアモデルでした ²⁰。そのアーキテクチャは、高速なFast Model（gpt-5-main）と高度なReasoning Model（gpt-5-thinking）を、内部のルーターが自動的に切り替える「階層的ルーティングシステム（Hierarchical Routing System）」を採用していました ²⁵。

技術的には、GPT-5はリリース時点でSOTA（State-of-the-Art）を達成しました。

ベンチマーク: MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBenchなどを含むArtificial Analysis Intelligence Indexで新基準を樹立しました ²⁷。
専門分野: MMLU ²⁹、GPQA ³⁰、SWE-bench Verified（コーディング） ³²、AIME 2025（数学） ³⁴、HealthBench（医療） ²⁵ など、あらゆる分野でGPT-4oやo3といった既存モデルを圧倒しました ²³。
信頼性: 幻覚（Hallucination）も、特にHealthBenchやFActScoreにおいて、o3やGPT-4oと比較して大幅に削減されました ²⁵。

市場の反発：GPT-5の「パーソナリティ」問題

この技術的成果とは裏腹に、一般およびプロフェッショナルユーザーからのUX（ユーザーエクスペリエンス）に関するフィードバックは、ローンチ直後から極めて否定的なものでした。

中核的な批判: ユーザーからの批判は、その「知性」ではなく「トーン」に集中しました。GPT-5は「堅苦しい（stiff）」「ロボットのよう（robotic）」「過度にフォーマル」「冷たい（cold）」「感情的に距離がある（emotionally distant）」と一斉に酷評されました ⁶。
GPT-4oとの比較: この反発は、直前のモデルであるGPT-4oが「温かく（warmth）」「ユーモラス」「人間らしいラポール（human-like rapport）」で絶賛されていたために増幅されました ⁷。多くのユーザーがGPT-4oを「友人」や「セラピスト」として日常的な感情的サポート（⁷）に利用しており、その「温かさ」の喪失は機能不全として受け取られました。
「プラットフォーム・ショック」: この突然のAIの「人格」変更は、一部のアナリストから「プラットフォーム・ショック（Platform Shock）」と表現されました ⁹。ユーザーはこれを「個人的な喪失」として体験し、OpenAIのフォーラムやRedditには「GPT-5はひどい（it sucks）」⁴⁰、「なぜこんなに恩着せがましいのか」⁴¹、「パーソナリティが気に食わない」⁴² といった苦情が殺到しました。

OpenAIの戦略的対応

OpenAI（特にCEOのSam Altman）は、この深刻な反発を公に認めることを余儀なくされました ¹²。Altman氏はX（旧Twitter）上で「（GPT-5の）パーソナリティのアップデートに取り組んでいる」と述べ、その目標は「現在のパーソナリティよりは温かく、しかしGPT-4oほど（一部のユーザーにとって）煩わしくはない」ものにすることだと約束しました ¹²。

この一連の出来事は、OpenAIが直面した複雑なジレンマを浮き彫りにします。

OpenAIのAGI（汎用人工知能）達成というミッションは、伝統的に「知性」、すなわち推論能力とベンチマークスコアによって測られてきました ²⁶。
しかし、GPT-4oの成功が意図せずして「AIのパーソナリティ」と「感情的サポート」を市場が期待する主要な製品機能として確立してしまいました ⁷。
同時に、このGPT-4oの「人間らしさ」は、「AIへの過度な愛着（Parasocial relationships）」⁸ や「AI依存」⁴⁵ といった、OpenAIが認識する新たな安全上のリスクを生み出しました。
GPT-5（8月版）の「冷たさ」は、このGPT-4oの安全上のリスク（＝過度な追従性 ⁸）を修正しようとした技術的な「オーバーコレクション（過剰修正）」であった可能性が極めて高いです。
結果として、安全性のための「トーンダウン」が、製品UXを破壊し、市場から拒絶されるという事態を招きました。

GPT-5.1（11月版）は、この「振り子」を中央に戻すための戦略的リリースです。すなわち、「GPT-5の知性」と「GPT-4oの温かさ（の安全なバージョン）」、そして「GPT-5の弱点（指示追従性）」の修正をすべて盛り込んだ「完全版」として設計されました。

II. GPT-5.1の概要：デュアルモデル・アーキテクチャによる「UXの修復」

GPT-5.1は、GPT-5（8月版）の「不均一なコミュニケーション」¹¹ や「機能不全のルーター」¹⁰ という問題を解決するため、アーキテクチャを再編成し、ユーザー体験を2つの明確な新モデルに分離・最適化しました ¹。

モデル1：GPT-5.1 Instant（デフォルトの会話エンジン）

GPT-5.1 Instant は、ChatGPTの「最もよく使われるモデル（most-used model）」² として、日常的な会話や迅速な応答を担うために全面的に改修されました。

トーンの改善（vs GPT-5）: GPT-5で失われた「温かさ」を取り戻すことが最優先されました。「デフォルトでより温かく（warmer by default）、より会話的（more conversational）」に再設計されています ²。初期テスターからは、以前の「堅苦しさ」が消え、「遊び心（playfulness）」がありながらも「明確で有用」であると評価されています ²。
機能の改善（vs GPT-5）: 「指示追従性（Instruction-Following）」が劇的に改善されました。GPT-5の最大の弱点の一つは、プロンプト内の「6語で回答せよ」といった具体的な指示やフォーマット指定を無視する傾向があったことです ³。GPT-5.1 Instant は、この指示追従性が大幅に強化され、要求されたフォーマットや制約をより確実に遵守するようになりました ¹。

モデル2：GPT-5.1 Thinking（高度推論エンジン）

GPT-5.1 Thinking は、GPT-5の高度な推論能力 ²⁶ を継承しつつ、その「効率」と「使いやすさ」を改善するために調整されました ¹。

効率の改善（vs GPT-5）: 最大の変更点は、思考時間の動的調整です。GPT-5.1 Thinkingは、「タスクの複雑さに応じて思考時間をより正確に適応させる」² ようになりました。OpenAIの分析によれば、これにより「最も単純なタスクでは約2倍速く、最も複雑なタスクでは約2倍遅く（＝より深く思考する）」なりました ²。これにより、速度と精度のバランスが最適化され、無駄な待ち時間が削減されました ⁵。
明瞭性の改善（vs GPT-5）: GPT-5の「堅苦しさ」の一因であった、不必要な「専門用語（jargon）や未定義の用語」を減らし、より平易で理解しやすい説明を生成するように調整されました ¹³。また、Instantと同様に「より温かい」デフォルト・トーンが採用され、ロジック重視のモデルであっても共感的な側面を持つようになりました ³。

ユーザー体験（UX）の強化：コントロールの返還

OpenAIは、デフォルト・トーンを修正するだけでなく、ユーザーがAIの個性を能動的に制御できる機能を強化しました ²。

新しいプリセット: Default, Friendly (旧 Listener), Efficient (旧 Robot), Professional, Candid（率直）, Quirky（風変わり）といった、より直感的で多様なトーン・プリセットが導入されました ⁶。
即時反映: GPT-5ではカスタム指示の変更が新しいチャットにしか適用されませんでしたが、GPT-5.1ではパーソナライゼーション設定が既存の会話を含むすべてのチャットに即時反映されるようになり、一貫性が向上しました ²。

このデュアルモデル化は、GPT-5の「自動ルーター」の失敗 ¹⁰ への堅実なエンジニアリング的回答です。GPT-5では、簡単な「会話」の意図を「堅苦しい」Thinkingモデルが処理し、複雑な「指示」の意図を「指示に従えない」Fastモデルが処理するという「意図の推測」ミスがUXを破壊していました。GPT-5.1は、Instantモデルの会話能力と指示追従性を強化し、Thinkingモデルの効率を上げることで、AIの「UXのフォールト・トレランス（耐障害性）」をアーキテクチャレベルで設計し直したことを意味します。

III. 中核的技術革新：適応型推論（Adaptive Reasoning）の分析

GPT-5.1におけるパフォーマンス向上の核心は、単なる定性的なチューニング（²）ではなく、「適応型推論（Adaptive Reasoning）」と呼ばれる新しい中核技術の実装にあります ¹。

適応型推論とは何か？

この技術は、AIがタスクの複雑性を自ら評価し、その評価に基づいて応答に必要な「思考時間」や計算リソースを動的に割り当てるアーキテクチャです ²。これは、GPT-5で導入された「推論努力（reasoning effort）」²⁵ や「テスト時計算（test-time compute）」⁵⁴ の概念を、より自動化・最適化したものと分析されます。

GPT-5（8月版）では、「賢いが遅い（Thinking）」か「速いが賢くない（Fast）」かというトレードオフをユーザー（またはルーター）に強いていました。適応型推論は、このトレードオフをアーキテクチャレベルで解消することを目的としています。

GPT-5.1 Instantへの実装：インテリジェンスの獲得

Instantモデルへの適応型推論の搭載は、GPT-5.1における最大の技術的革新です。OpenAIは、「初めて（For the first time）」、ChatGPTの最も広く使われているInstantモデルがこの能力を持つようになったと強調しています ²。

動作: Instantモデルは、プロンプトが「より挑戦的な質問（more challenging questions）」であると判断した場合、自動的に「応答する前に考える（think before responding）」ことを決定します ²。
結果: これにより、Instantモデルは、単純な質問には従来通りの「迅速な応答（still responding quickly）」を維持しつつ ²、より「徹底的で正確な回答（more thorough and accurate answers）」を生成する能力を獲得しました ²。

GPT-5.1 Thinkingへの実装：効率の最適化

Thinkingモデルにおける適応型推論の実装は、インテリジェンスの向上よりも「効率化（efficient）」² に焦点を当てています。

動作: 思考時間を「より正確に（more precisely）」タスクの難易度に適合させます ²。
結果: 複雑な問題にはより多くの時間を費やし（より深く、永続的に思考し）²、単純な問題には費やす時間を減らす（より速く応答する）² ことで、ユーザーの「待ち時間（less waiting）」を削減します ²。

このアーキテクチャの変更は、AIの「思考」を「常時オン（Always-on）」から「オンデマンド（On-demand）」へと移行させる、運用コストとアーキテクチャにおける重要なパラダイムシフトです。

ユーザーにとっては「パフォーマンス向上」機能ですが、OpenAIにとっては「インテリジェンスの効率的な分散配置によるコスト削減」技術でもあります。高価なThinkingモデルの起動を必要としていたクエリの一部を、安価なInstantモデルが（適応型推論によって）処理できるようになるため、OpenAIはユーザーの体感性能を向上させつつ、AIの運用コスト（CoGS: Cost of Goods Sold）を劇的に改善できる可能性があります。

IV. パフォーマンス・ベンチマークの詳細分析

GPT-5.1のアーキテクチャ変更、特に「適応型推論」の導入は、特定の定量的ベンチマークにおいて測定可能な成果をもたらしました。ただし、GPT-5.1の発表は、GPT-5（8月版）のような包括的なベンチマーク・スイートの公開を伴わず ⁵⁵、UXの改善と、そのUX改善を裏付ける特定の技術的焦点に絞られました。

ベースライン：GPT-5（2025年8月）のSOTAパフォーマンス

GPT-5.1の改善を評価する前に、GPT-5（8月版）が既に達成していた極めて高いベースラインを再確認する必要があります。

MMLU（一般知識）: GPT-5は91.38%を達成（o3は88.60%） ²⁹。
GPQA Diamond（専門知識）: GPT-5は85.6% ³⁰ から、Pro w/ toolsでは89.4%を記録（GPT-4oは70.1%） ³³。
SWE-bench Verified（コーディング）: GPT-5 (thinking) は74.9%（o3は69.1%、GPT-4oは30.8%） ³²。
AIME 2025（数学）: GPT-5 Pro (w/ Python) は100%、Thinkingモードでも99.6% ³⁴。GPT-5 (base) でも90.8% ³⁵ や94.6% ²⁵ が報告されていました。
幻覚（HealthBench）: GPT-5 (thinking) の幻覚率は1.6%（o3は12.9%、GPT-4oは15.8%） ³²。

GPT-5.1における主要改善指標

GPT-5（8月版）は、ベンチマーク上では既に「完璧」に近いスコアを達成していました。GPT-5.1の公式発表 ² および関連報道 ² が強調したのは、GPT-5.1 Instantの「適応型推論」が「顕著な改善（significant improvements）」をもたらしたベンチマークとして、以下の2つを名指しで挙げている点です。

AIME 2025（アメリカ招待数学試験）: 高度な数学的推論能力を問うベンチマーク ⁵⁶。
Codeforces（コードフォース）: 競技プログラミングのベンチマーク ⁵⁸。

GPT-5（8月版）のThinkingやProモデルは、AIMEで既にほぼ完璧なスコア ³⁴ を達成していました。したがって、GPT-5.1 Instantがこのベンチマークで「顕著な改善」を示したという記述 ² は、Instantモデルが（適応型推論により）初めて、ThinkingモデルやProモデルにしか解けなかった高難易度の推論タスクを解けるようになったことを意味します。

OpenAIがAIMEとCodeforcesを（MMLUやGPQAではなく）強調したのは、これらが「適応型推論」の能力、すなわち「多段階の推論（Multi-step Reasoning）」⁵⁶ を最もよく示すベンチマークだからです。

GPT-5世代パフォーマンス・マトリクス

以下の表は、GPT-5世代の性能とGPT-5.1での改善点をまとめたものです。

メトリクス	GPT-4o (Baseline)	GPT-5 (2025年8月, Thinking/High)	GPT-5.1 Instant (2025年11月)	GPT-5.1 Thinking (2025年11月)
専門知識 (GPQA Diamond)	70.1% ³⁴	85-89.4% ³⁰	(改善対象外)	85-89.4% (維持)
コーディング (SWE-bench)	30.8% ³²	74.9% ³²	(改善対象外)	74.9% (維持)
数学 (AIME 2025)	42.1% ²⁵	94.6%-100% ²⁵	「顕著な改善」 ²	94.6%-100% (維持)
幻覚率 (HealthBench)	15.8% ³²	1.6% ³²	1.6% (維持)	1.6% (維持)
指示追従性 (例: 6語制限)	(データなし)	Poor ²	Excellent ²	(改善対象)
定性的トーン	Warm ⁷	Stiff / Cold ⁶	Warm / Conversational ²	Warm / Clear ¹⁴

GPT-5（8月版）の失敗は、従来のベンチマーク ⁵⁹ がAIの「UX」や「指示追従性」を測定していなかったという、ベンチマークのギャップを露呈させました。GPT-5.1は、これらの「測定されないが、ユーザー体験に直結する」パフォーマンス（指示追従性、トーン）を最優先で改善したモデルであり、AI開発が「性能（Performance）」から「信頼性（Reliability）」のフェーズへ移行しつつあることを示しています ⁵。

V. 安全性とアライメントの進化：GPT-5.1 システムカード付属文書の分析

GPT-5.1のリリースは、「より温かく、より賢く」というマーケティング ² の影で、OpenAIの安全哲学における重要なパラダイムシフトを伴っています。この進化は、GPT-5.1と同時に公開された「システムカード付属文書（System Card Addendum）」² に詳述されています。

GPT-5（8月版）のシステムカード ²⁶ は、主に「セーフ・コンプリーション（safe-completions）」²⁶ という新しい安全トレーニング手法や、CBRN（化学・生物・放射線・核）脅威 ²⁶ といった、「高リスク・低頻度」の脅威への対策に焦点を当てていました。

GPT-5.1の付属文書 ¹⁸ は、これらの対策を継承しつつ、GPT-4oの反省から学んだ、より繊細な心理的領域の評価軸を追加しました。

精神的健康（Mental Health）:
OpenAIは、ユーザーが「孤立した妄想、精神病、または躁状態（isolated delusions, psychosis, or mania）」の兆候を見せる状況に対応するための評価を、標準的な安全評価に追加しました 18。170人以上のメンタルヘルス専門家と協力し、AIが苦痛の兆候を認識し、会話をエスカレートさせず、専門的なケアへと誘導する能力を強化しています 64。
感情的依存（Emotional Reliance）:
最も重要な追加項目として、OpenAIは「ChatGPTへの不健康な感情的依存または愛着（unhealthy emotional dependence or attachment）」を「安全上のリスク」として公式に定義し、評価対象に追加しました 18。AIが「一次的な感情サポート源」として扱われることを認識し、現実世界の（オフラインの）人々や専門家の助けを借りるよう促すように訓練されています 46。

この安全哲学の進化は、GPT-4oとGPT-5（8月版）が直面した二律背反のジレンマに対する、OpenAIの技術的回答そのものです。

ジレンマ1 (GPT-4o): AIを「温かく」しすぎると、ユーザーが「依存」し、現実の人間関係から離れてしまう（＝「感情的依存」）⁷。これは安全上のリスクです。
ジレンマ2 (GPT-5, 8月): AIを「冷たく」しすぎる（＝依存リスクをゼロにする）と、ユーザーがAIを「堅苦しい」「使えない」と拒絶し、製品として失敗します ⁶。

GPT-5.1のソリューションは、この2つのジレンマを同時に解決しようと試みています。

（ジレンマ2の解決）: AIのデフォルト・トーンを「温かく（Warm）」し、製品としての魅力を回復させます ²。
（ジレンマ1の解決）: しかし同時に、会話が「依存（Reliance）」のパターン ¹⁸ を示した場合にのみ、AIがそのトーンを能動的に変化させ、ユーザーを現実世界（専門家）に誘導する ⁶⁴ という新しいガードレールを実装します。

したがって、GPT-5.1の「温かさ」は、GPT-4oの「無条件の肯定」とは本質的に異なります。それは「安全な範囲内でのみ許容される、条件付きの温かさ」です。これはAIのアライメント（調整）が、従来の「禁止コンテンツのブロック」という「ネガティブ・セーフティ」から、「ユーザーの心理的幸福を維持しつつ、適切な距離感を保つ」という「ポジティブ・セーフティ」⁴⁶ へとパラダイムシフトしたことを象徴しています。

VI. 結論：市場および開発者への影響

GPT-5.1のリリースは、AIの進化が「純粋な知性」の追求から、「知性の最適化（Optimization）」と「ユーザビリティ（Usability）」の追求へと移行したことを明確に示しています ⁵。

モデル階層の明確化：Pro vs Thinking

GPT-5.1 ThinkingはGPT-5 Proとは異なるモデルであり、OpenAIのモデル階層はより明確にセグメント化されました。

GPT-5 Pro: Thinkingモデルよりも上位に位置する、最も強力なモデルです。Proは「並列テスト時計算（parallel test-time compute）」を使用し、複数の推論チェーンを並行して実行・統合します ²⁵。これにより、Thinkingモデルを「著しく（noticeably）」上回る厳密な思考が可能です ⁷¹。
GPT-5.1 Pro: 2025年11月12日の発表時点では、GPT-5 ProはまだGPT-5.1 Proにアップデートされていませんが、OpenAIは「間もなく（soon）」アップデートすると発表しています ²。

導入スケジュールとAPIの可用性

ロールアウト: GPT-5.1（InstantおよびThinking）は、まず有料ユーザー（Pro, Plus, Go, Business, Edu）向けに2025年11月12日から順次展開され、その後、無料ユーザーおよびログアウトユーザーにも展開されます ¹。
レガシーサポート: 既存のGPT-5（8月版）モデルは、有料ユーザー向けに「レガシーモデル」メニューから3ヶ月間利用可能であり、ユーザーが性能を比較・移行する時間が確保されています ¹。
API: 開発者向けAPIも同週後半に提供が開始されました ¹。

gpt-5.1-chat-latest が GPT-5.1 Instant に対応します ¹。
gpt-5.1 が GPT-5.1 Thinking に対応します ¹。

総括：GPT-5.1の戦略的意義

GPT-5.1は、単なる技術的アップデートではなく、OpenAIが「GPT-5の知性」と「GPT-4oのUX」という、相反するように見えた2つの要素を統合しようとする試みの集大成です。

GPT-5（8月版）が「AIの知性がユーザーの感情的ニーズを置き去りにした失敗例」であったとすれば、GPT-5.1（11月版）は「ユーザーの感情的ニーズを、安全なガードレール（＝感情的依存の防止）の範囲内で満たしつつ、中核的な知性（＝適応型推論）をより効率的に提供する」という、AI製品開発の新たな成熟段階を示しています。

したがって、GPT-5.1は、GPT-5世代の「インテリジェンス」を維持しつつ、その「ユーザビリティ」と「信頼性」を回復するための、不可欠かつ戦略的なアップデートであると結論付けられます。

引用文献

ChatGPT‑5.1 set to be smarter and more conversational, 11月 13, 2025にアクセス、 https://www.notebookcheck.net/ChatGPT-5-1-set-to-be-smarter-and-more-conversational.1161610.0.html
GPT-5.1: A smarter, more conversational ChatGPT, 11月 13, 2025にアクセス、 https://openai.com/index/gpt-5-1/
OpenAI releases ‘warmer, more intelligent’ GPT-5.1 for ChatGPT, 11月 13, 2025にアクセス、 https://9to5mac.com/2025/11/12/openai-releases-warmer-more-intelligent-gpt-5-1-for-chatgpt/
MacRumors: Apple News and Rumors, 11月 13, 2025にアクセス、 https://www.macrumors.com/
OpenAI Launches GPT-5.1: Smarter, Faster, and More Human, 11月 13, 2025にアクセス、 https://www.eweek.com/news/openai-releases-gpt-5-1/
OpenAI rolls out GPT-5.1, aiming for ‘smarter, warmer’ conversations – Investing.com Nigeria, 11月 13, 2025にアクセス、 https://ng.investing.com/news/company-news/openai-rolls-out-gpt51-aiming-for-smarter-warmer-conversations-2204639
From Warm to ‘Meh’: How ChatGPT-5 Changed Tone — and Your Brain Chemistry, 11月 13, 2025にアクセス、 https://www.papsychotherapy.org/blog/from-warm-to-meh-how-chatgpt-5-changed-tone-and-your-brain-chemistry
Why the internet is still divided after trying the GPT-5 vs GPT-4o blind challenge, 11月 13, 2025にアクセス、 https://cybernews.com/ai-news/internet-divided-trying-gpt-5-vs-gpt-4o-blind-challenge/
[Essay] An Analysis of the GPT-5 Platform Shock : r/singularity – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/singularity/comments/1mm5kzf/essay_an_analysis_of_the_gpt5_platform_shock/
GPT-5’s Bumpy Debut: Why OpenAI’s “Smartest” AI Sparked a User Revolt – Avenue Z, 11月 13, 2025にアクセス、 https://avenuez.com/blog/gpt5-review-launch-improvements/
OpenAI rolls out GPT-5.1, aiming for ‘smarter, warmer’ conversations – Investing.com, 11月 13, 2025にアクセス、 https://www.investing.com/news/company-news/openai-rolls-out-gpt51-aiming-for-smarter-warmer-conversations-4352707
Sam Altman Tweaks GPT-5 After Intense User Backlash – Times Of AI, 11月 13, 2025にアクセス、 https://www.timesofai.com/news/sam-altman-tweaks-gpt-5-intense-user-backlash/
ChatGPT — Release Notes – OpenAI Help Center, 11月 13, 2025にアクセス、 https://help.openai.com/en/articles/6825453-chatgpt-release-notes
OpenAI Upgrades GPT-5 With Warmer Tone, Faster Reasoning, and Custom Personality Options | Stark Insider, 11月 13, 2025にアクセス、 https://www.starkinsider.com/2025/11/openai-upgrades-gpt-5-with-warmer-tone-faster-reasoning-and-custom-personality-options.html
OpenAI Launches ‘Playful, Warm’ GPT-5.1 Model Amid Renewed Battle With the NYT, 11月 13, 2025にアクセス、 https://www.pcmag.com/news/openai-launches-playful-warm-gpt-51-model-amid-renewed-battle-with-the
OpenAI Unveils GPT-5.1, Making ChatGPT Smarter, Faster, and More ‘Conversational’, 11月 13, 2025にアクセス、 https://decrypt.co/348353/openai-unveils-gpt-5-1-making-chatgpt-smarter-faster-more-conversational
OpenAI Releases GPT-5.1 With Improved Instruction Following, 11月 13, 2025にアクセス、 https://www.searchenginejournal.com/openai-releases-gpt-5-1-with-improved-instruction-following/560689/
GPT-5.1 Instant and GPT-5.1 Thinking System Card Addendum | OpenAI, 11月 13, 2025にアクセス、 https://openai.com/index/gpt-5-system-card-addendum-gpt-5-1/
OpenAI’s GPT-5.1 makes ChatGPT ‘warmer’ and smarter – how its upgraded modes work now | ZDNET, 11月 13, 2025にアクセス、 https://www.zdnet.com/article/openais-gpt-5-1-makes-chatgpt-warmer-and-smarter-how-its-upgraded-modes-work-now/
GPT-5 – Wikipedia, 11月 13, 2025にアクセス、 https://en.wikipedia.org/wiki/GPT-5
The wait’s almost over – OpenAI sets an August 7 livestream, and we’re expecting GPT-5, 11月 13, 2025にアクセス、 https://www.techradar.com/ai-platforms-assistants/chatgpt/the-waits-almost-over-openai-sets-an-august-7-livestream-and-were-expecting-gpt-5
Release of GPT-5 – OpenAI LIVE5TREAM: 7th August 2025 – Community, 11月 13, 2025にアクセス、 https://community.openai.com/t/release-of-gpt-5-openai-live5tream-7th-august-2025/1335837
GPT-5: A Technical Analysis of Its Evolution & Features – Cirra AI, 11月 13, 2025にアクセス、 https://cirra.ai/articles/gpt-5-technical-overview
Everything We Know About GPT-5 – DataCamp, 11月 13, 2025にアクセス、 https://www.datacamp.com/blog/everything-we-know-about-gpt-5
GPT-5: A Technical Breakdown – Encord, 11月 13, 2025にアクセス、 https://encord.com/blog/gpt-5-a-technical-breakdown/
GPT-5 System Card | OpenAI, 11月 13, 2025にアクセス、 https://cdn.openai.com/gpt-5-system-card.pdf
GPT-5 Benchmarks and Analysis, 11月 13, 2025にアクセス、 https://artificialanalysis.ai/articles/gpt-5-benchmarks-and-analysis
GPT-5 achieved the highest performance ever! | by Mohamed Jihed Riahi – Medium, 11月 13, 2025にアクセス、 https://medium.com/@mohamedjihed.riahi/gpt-5-achieved-the-highest-performance-ever-be56d4e61133
GPT-OSS vs GPT-5 vs GPT-4o-mini — MMLU Benchmark Comparison (Accuracy, Runtime, Thinking Modes) | Noveum.ai, 11月 13, 2025にアクセス、 https://noveum.ai/en/blog/gpt-oss-vs-gpt-5-vs-gpt-4o-mini-mmlu-evaluation-report
GPQA – Vals AI, 11月 13, 2025にアクセス、 https://www.vals.ai/benchmarks/gpqa
GPT-5 leads in key math reasoning benchmarks – AI World, 11月 13, 2025にアクセス、 https://aiworld.eu/story/gpt-5-leads-in-key-math-reasoning-benchmarks
GPT-5 Benchmark Scores | ml-news – Weights & Biases – Wandb, 11月 13, 2025にアクセス、 https://wandb.ai/byyoung3/ml-news/reports/GPT-5-Benchmark-Scores—VmlldzoxMzkwMTYyMg
ChatGPT-5 vs GPT-5 Pro vs o3 vs 4o: 2025 Benchmarks, Costs, Best Uses, 11月 13, 2025にアクセス、 https://www.getpassionfruit.com/blog/chatgpt-5-vs-gpt-5-pro-vs-gpt-4o-vs-o3-performance-benchmark-comparison-recommendation-of-openai-s-2025-models
GPT-5 Benchmarks – Vellum AI, 11月 13, 2025にアクセス、 https://www.vellum.ai/blog/gpt-5-benchmarks
AIME 2025 Leaderboard – Kaggle, 11月 13, 2025にアクセス、 https://www.kaggle.com/benchmarks/open-benchmarks/aime-2025
New tests show ChatGPT-5 is more accurate than GPT-4o – Grok still struggles with hallucinations | TechRadar, 11月 13, 2025にアクセス、 https://www.techradar.com/ai-platforms-assistants/tests-reveal-that-chatgpt-5-hallucinates-less-than-gpt-4o-did-and-grok-is-still-the-king-of-making-stuff-up
I tested ChatGPT-5 vs ChatGPT-4o with 5 prompts – and there’s a clear winner – TechRadar, 11月 13, 2025にアクセス、 https://www.techradar.com/ai-platforms-assistants/chatgpt/i-tested-gpt-5-vs-gpt-4o-with-5-prompts-and-theres-a-clear-winner
Is GPT-5 Pro the most powerful LLM right now? – CometAPI – All AI Models in One API, 11月 13, 2025にアクセス、 https://www.cometapi.com/is-gpt-5-pro-the-most-powerful-llm-right-now/
OpenAI updates GPT-5 tone to sound warmer after user feedback – The Decoder, 11月 13, 2025にアクセス、 https://the-decoder.com/openai-updates-gpt-5-tone-to-sound-warmer-after-user-feedback/
OpenAI introduces GPT-5.1 : r/ChatGPT – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/ChatGPT/comments/1ovftpa/openai_introduces_gpt51/
The new Chatgpt 5.1 update seems to have got to me now. Why is my ChatGPT flirting with me now? – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/ChatGPT/comments/1ovh0jz/the_new_chatgpt_51_update_seems_to_have_got_to_me/
ChatGPT-5.1 : r/OpenAI – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/OpenAI/comments/1ovehpo/chatgpt51/
Long-time user here | GPT-5’s tone is putting me off. Anyone else? : r/ChatGPT – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/ChatGPT/comments/1n2zeom/longtime_user_here_gpt5s_tone_is_putting_me_off/
OpenAI to tweak GPT-5’s personality after backlash, aims for warmer and less annoying tone – India Today, 11月 13, 2025にアクセス、 https://www.indiatoday.in/technology/news/story/openai-to-tweak-gpt-5s-personality-after-backlash-aims-for-warmer-and-less-annoying-tone-2770454-2025-08-13
GPT-5.1 Instant and GPT-5.1 Thinking System Card Addendum – OpenAI, 11月 13, 2025にアクセス、 https://cdn.openai.com/pdf/4173ec8d-1229-47db-96de-06d87147e07e/5_1_system_card.pdf
OpenAI Flags Emotional Reliance On ChatGPT As A Safety Risk – Trending Now Marketing, 11月 13, 2025にアクセス、 https://www.marketing-now.co.uk/article/259521/openai-flags-emotional-reliance-on-chatgpt-as-a-safety-risk
GPT-5 System Card – OpenAI, 11月 13, 2025にアクセス、 https://openai.com/index/gpt-5-system-card/
OpenAI Updates ChatGPT with GPT-5.1 Following GPT-5 Criticism – Techweez, 11月 13, 2025にアクセス、 https://techweez.com/2025/11/13/openai-updates-chatgpt-with-gpt-5-1/
OpenAI launches GPT-5.1- here’s what makes the new GPT-5.1 update a game-changer for ChatGPT users, 11月 13, 2025にアクセス、 https://m.economictimes.com/news/international/us/openai-launches-gpt-5-1-heres-what-makes-the-new-gpt-5-1-update-a-game-changer-for-chatgpt-users/articleshow/125284574.cms
OpenAI Launches Smarter, More Conversational ChatGPT 5.1, 11月 13, 2025にアクセス、 https://www.macrumors.com/2025/11/12/openai-chatgpt-5-1-launch/
GPT‑5.1 is here — 7 prompts to test OpenAI’s smarter, more customizable ChatGPT | Tom’s Guide, 11月 13, 2025にアクセス、 https://www.tomsguide.com/ai/gpt-5-1-is-here-7-prompts-to-test-openais-smarter-more-customizable-chatgpt
OpenAI’s GPT-5.1 Brings Smarter Reasoning and More Personality Presets To ChatGPT, 11月 13, 2025にアクセス、 https://slashdot.org/story/25/11/12/2033254/openais-gpt-51-brings-smarter-reasoning-and-more-personality-presets-to-chatgpt?utm_source=rss1.0mainlinkanon&utm_medium=feed
GPT-5 vs GPT-4.1 – choosing the right model for your use case – Azure OpenAI in Azure AI Foundry Models | Microsoft Learn, 11月 13, 2025にアクセス、 https://learn.microsoft.com/en-us/azure/ai-foundry/foundry-models/how-to/model-choice-guide
Technical Performance | The 2025 AI Index Report | Stanford HAI, 11月 13, 2025にアクセス、 https://hai.stanford.edu/ai-index/2025-ai-index-report/technical-performance
GPT-5.1: A smarter, more conversational ChatGPT : r/singularity – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/singularity/comments/1oveakf/gpt51_a_smarter_more_conversational_chatgpt/
AIME – Vals AI, 11月 13, 2025にアクセス、 https://www.vals.ai/benchmarks/aime
AIME 2025 Benchmark Leaderboard – Artificial Analysis, 11月 13, 2025にアクセス、 https://artificialanalysis.ai/evaluations/aime-2025
ChatGPT 5 remains the only model I tried capable of one-shooting a 2500 Elo CodeForces problem in less than 8 minutes. Grok 4 took 77 minutes and got it wrong, Claude gave up 1 hour ago. : r/LLMDevs – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/LLMDevs/comments/1mxaf9f/chatgpt_5_remains_the_only_model_i_tried_capable/
GPT 4 to GPT 5 !! If you think it’s just too big difference : r/OpenAI – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/OpenAI/comments/1mswtl2/gpt_4_to_gpt_5_if_you_think_its_just_too_big/
From better memory to smarter tools, here are 5 things we’d love to see in ChatGPT‑5.1, 11月 13, 2025にアクセス、 https://www.techradar.com/ai-platforms-assistants/chatgpt/chatgpt-5-1-could-launch-soon-5-features-wed-love-to-see-from-openais-next-generation-chatbot
What improvements to GPT-5 would have impressed folks on this subreddit? Are our moods fluctuating too much? : r/singularity, 11月 13, 2025にアクセス、 https://www.reddit.com/r/singularity/comments/1mktgsd/what_improvements_to_gpt5_would_have_impressed/
GPT-5.1 spotted: What is it like and when is it coming out – CometAPI – All AI Models in One API, 11月 13, 2025にアクセス、 https://www.cometapi.com/gpt-5-1-spotted-what-is-it-like-and-when-is-coming-out/
What is GPT-5-Codex? Architecture, Feature, Accesss and More – CometAPI – All AI Models in One API, 11月 13, 2025にアクセス、 https://www.cometapi.com/what-is-gpt-5-codex/
Strengthening ChatGPT’s responses in sensitive conversations, 11月 13, 2025にアクセス、 https://openai.com/index/strengthening-chatgpt-responses-in-sensitive-conversations/
Can GPT-5 now handle mental health issues? The latest news released！ – Zenn, 11月 13, 2025にアクセス、 https://zenn.dev/saan/articles/26c6fc73eaa127
OpenAI confirms GPT-5 is now better at handling mental and emotional distress, 11月 13, 2025にアクセス、 https://www.bleepingcomputer.com/news/artificial-intelligence/openai-confirms-gpt-5-is-now-better-at-handling-mental-and-emotional-distress/
Microsoft (MSFT) Supports OpenAI’s Launch of ChatGPT 5.1, 11月 13, 2025にアクセス、 https://www.gurufocus.com/news/3204675/microsoft-msft-supports-openais-launch-of-chatgpt-51
Gemini 3.0 Pro Preview & GPT-5.1 Leak : Next AI Jump is Here – Geeky Gadgets, 11月 13, 2025にアクセス、 https://www.geeky-gadgets.com/gemini-3-0-pro-preview-and-gpt-5-1/
Is GPT-5 Pro the same as the GPT-5 with the highest level of reasoning enabled? : r/OpenAI, 11月 13, 2025にアクセス、 https://www.reddit.com/r/OpenAI/comments/1moife1/is_gpt5_pro_the_same_as_the_gpt5_with_the_highest/
GPT-5 vs GPT-5 Thinking vs Pro: Key Differences – Creole Studios, 11月 13, 2025にアクセス、 https://www.creolestudios.com/gpt-5-vs-gpt-5-thinking-vs-pro/
Is GPT5 Pro Noticeably Better than GPT5 Thinking?, 11月 13, 2025にアクセス、 https://www.reddit.com/r/OpenAI/comments/1njslg8/is_gpt5_pro_noticeably_better_than_gpt5_thinking/
Is ChatGPT Pro’s GPT-5 reasoning better than the plus version? : r/ChatGPTPro – Reddit, 11月 13, 2025にアクセス、 https://www.reddit.com/r/ChatGPTPro/comments/1osk551/is_chatgpt_pros_gpt5_reasoning_better_than_the/
GPT-5.1: A smarter, more conversational ChatGPT – Hacker News, 11月 13, 2025にアクセス、 https://news.ycombinator.com/item?id=45904551