第11回　新しい生成AI「GPT-5」の登場

放送大学では、数理・データサイエンス・AI講座で「言語生成 AI の機能と社会への応用」を公開しています。本ニュースレターでは、山口先生の講義収録後のGPTの最新情報を随時みなさまへ提供します。生成AIに関する情報をupdateするためにぜひ活用してください。

山口先生は、放送大学 数理・データサイエンス・AI講座で「AIプロデューサ〜人とAIの連携〜」「言語生成 AI の機能と社会への応用」を担当しています。また、放送大学の総合科目「AIシステムと人・社会との関係（'20）」の主任講師です。

第10回ニュースレターでは、急速に普及が進んでいるAIエージェントの作り方と使い方を解説しました。

今回は、2025年8月8日に米国で公開され、その直後に日本でも利用できるようになった生成AI「GPT-5」について解説します。GPT-5は、今までに説明してきた生成AI「GPT-4o」と推論エンジンo3の統合を基に、さらに進化させたモデルと言われており、GPT-5を利用したAIシステムの開発が急速に進もうとしています。以下、専門的分野にも触れますが是非ご一読ください。

技術動向：GPT-4oとGPT-5の性能比較

まず、GPT-4oとGPT-5の性能を比較してみましょう。
図１は、GPT-5のモデル表示です。従来はユーザが機能を考えながらモデルを選択していましたが、各モデルでできる事が明示されています。「Auto」により思考時間を自動調整できたり、「Fast」により即時に応答できたり、「Thinking」で時間をかけて深く思考できたりします（Proは研究用でさらに深く推論できますが、一般ユーザには使えません）。なお、レガシーモデルをクリックするとGPT-4oを選択することができます。
次に表1をご覧ください。表1では、棄却率と正答率を誤答率の定量指標により、GPT-4oとGPT-5の性能を比較しています（Open-AI社によるベンチマークテストの結果です）。棄却率については、GPT-5が格段に高い値になっていますが、これは「十分なエビデンスがないため回答を控える」、すなわち、曖昧な質問に無理に答えず、慎重に「わからない」とするケースが増えているためです。正答率はほぼ同等ですが、GPT-5では、棄却率が高く、リスクの高い回答を控えることから正答率は高くなっていません。そのため誤答率は75 %から26 %と大幅に改善しており、GPTシリーズで問題視されていたハルシネーションが大幅に低減されたと言えます。

指標	GPT-4o	GPT-5(thinking)
棄却率	約1％	約52％
正答率	約24％	約22％
誤答率	約75％	約26％

表１　GPT-4oとGPT-5の性能比較
（Open-AI社によるベンチマークテスト）

GPT-4oとGPT-5の機能比較

表2にGPT-4oとGPT-5の機能比較を示します（これはGPT-5による回答です）。GPT-4oは簡単な推論ですがマルチモーダル（音声・画像・動画）処理が可能であるのに対して、GPT-5は深く考える思考型AIで、その特徴を生かしながら、現場で両者を使い分けていくことが重要になります。

GPT-4oとGPT-5の業務別使い分け

表3は、業務単位でGPT-4oとGPT-5の使い分けを説明した表になります。業務を「即時対応業務」「文書処理業務」「分析業務」「意思決定支援業務」「教育・研修業務」「開発業務」に分け、各業務でGPT-4oとGPT-5が有用な場面を整理しています。これは一般的ガイドラインであり、実際の現場では、既存情報システムの連携など、様々な要因を考慮し、トータルなAIシステムを設計し運用していくことになります。

次回の予告
次回の第12回ニュースレターは11月下旬に公開予定です。この2年間で急速に普及が進んできている配膳ロボットなどのAIサービスロボットについて解説します。どうぞお楽しみに！

中島震先生、山口高平先生のニュースレターバックナンバーはこちら

ニュースレター / バックナンバー

山口先生の「言語生成 AI の機能と社会への応用」講座（無料）

受講ご希望の方はこちら

一覧に戻る

第11回 新しい生成AI「GPT-5」の登場

GPTの進化と今後の展望