第5回 高画像生成AI「DALL-E3」の活用と課題

GPTの進化と今後の展望
山口 高平(神奈川大学 教授)
放送大学では、数理・データサイエンス・AI講座で「言語生成 AI の機能と社会への応用」を公開しています。
このニュースレターでは、山口先生の講義収録後のGPTの最新情報を随時みなさまへ提供することにしました。購読者がお持ちの生成AIに関する情報をupdateするためにぜひこのニュースレターを活用してください。
山口先生は、放送大学 数理・データサイエンス・AI講座で「AIプロデューサ〜人とAIの連携〜」「言語生成 AI の機能と社会への応用」を担当しています。また、放送大学の総合科目「AIシステムと人・社会との関係('20)」の主任講師です。
※この記事は神奈川大学の協力を得て作成しています。
本記事では、AI技術の最前線に立つ専門家である山口高平氏へのインタビューをもとに、2024年後半から機能拡充が続いているGPT-4oを中心に解説し、2025年前半までに公開予定のGPT-4.5およびGPT-5の最新動向についても言及します。今回は、GPT-4oで統合利用可能でデザイン制作の現場でも注目されている、画像生成AI「DALL-E3(ダリ・スリー)」について掘り下げます。
今回は画像生成AI「DALL-E3(ダリ・スリー)」について事例と共に、その利点と注意点を含めて山口先生に解説いただきます。
第5回 高画像生成AI「DALL-E3」の活用と課題
技術動向:GPTから画像生成へ—DALL-E3の登場
テキスト・画像・音声のマルチモーダル処理に対応したGPT-4oでは、画像生成AI「DALL-E3(ダリ・スリー)」を統合利用できます。プロンプト(指示文)を通じて、わずか30〜40秒ほどでオリジナルの画像が自動生成されるなど、ビジュアル制作の現場でも注目が集まっています。
事例紹介:プロンプトで生まれる“プロレスするゴリラと犬”
たとえば「ゴリラと犬がプロレスしている画像を作って」と入力すれば、右図のようなイラストが生成されます。さらに「犬を子犬にして」「背景を観客席に」などの細かな修正もプロンプトで指示できます。これにより、専門的なグラフィックスキルがなくてもビジュアル制作が可能に。

実際にイラスト制作を職業としているユーザーからは、初期アイデア出しやラフ案の生成において「大幅な時間短縮と創造的刺激が得られる」との声も上がっています。また、従来は外注していた初期スケッチの部分を内製化できるようになり、コスト削減にも寄与しています。一方で、構図やキャラクターのディテール精度については依然調整が必要であり、手動での最終仕上げとの併用が効果的です。
使い方のヒント:ニュースレター執筆時のものです。GPTが進化することで、使い方や使用上の注意点は変更されます。
使い方の注意事項: 著作権・商標侵害・個人情報に注意
画像生成AIを利用する場合、著作権・商標侵害に注意しなければなりません。商用キャラクターなどを利用する時は、利用規約をよく読み、必要ならライセンスを取得しなければなりません。また、個人情報を含めてはならず、顔写真や個人が特定できる情報を使わないようにして下さい。
今後の展望:動画生成へと広がる生成AIの可能性
現在はテキスト・画像・音声まで対応していますが、次に注目されているのは「動画生成」です。GPT-5では動画に対する理解や生成能力も搭載される予定で、今後は“動きのある創作”も生成AIが担う時代が到来します。
次回の予告
次回の第6回ニュースレターは5月中に公開予定です。様々な高次推論を自動化するAIに注目。推理小説で犯人を探し出すAIをご紹介予定です。お楽しみに!