第4回 野生の暴れ馬LLMを飼いならす 〜その1〜

AIの品質問題点をソフトウェア技術の観点から解説する
中島 震(国立情報学研究所 名誉教授)
中島先生は、放送大学大学院の情報学プログラムの中で「ソフトウェア工学(‘25)」を担当されています。先生の講義ではソフトウェア開発を工学的に行うためのプロセスや手法、品質や生産性、進化などに関する技術について学べます。ソフトウェア開発で生じる問題について学び、開発のプロセスに沿って問題点を整理し、問題解決への技術を理解していきます。
本記事では、ソフトウェア工学が専門で、「形式手法やソフトウェアテスティングの技術」「機械学習を対象としたAIリスクマネジメント」を研究されている中島震氏へのインタビューをもとに作成しています。
第3回では、LLMをソフトウェアシステムに組み込む際にユーザーとの対話の観点からどのような品質課題が発生するかを紹介しました。
今回は中島先生に、LLMを利用したアプリケーションシステム開発について、
LLMの特徴を生かしたシステムアーキテクチャの考え方を解説いただきます。
第4回 野生の暴れ馬LLMを飼いならす 〜その1〜
AI技術の急速な発展に伴い、私たちは日々その恩恵を受けています。特に大規模言語モデル(LLM)は、これまで困難だった自然言語の理解や生成機能を高精度で実現し、多様な分野で活用されています。その汎用性は魅力的であり、文章要約、自動翻訳、質問応答、対話助手システム、創作支援など、幅広い用途を支えています。一方で、その柔軟さゆえに予測不能な動作を示すこともあり、開発者の意図に反する応答や不要な情報を返すこともあります。プライバシーや安全性の懸念が指摘されることも少なくなく、この制御困難な性質をしばしば“野生の暴れ馬”と形容します。
近似的検索器としてのLLM
LLMは、膨大な学習コーパス(多種多様な用例)から得られた知識をもとに、確率的に「もっともらしい」出力を生成します。これは通常のプログラムが示す確定的な動作とは異なり、“アプロキシメイト・リトリーバー(近似的検索器)”と捉えると理解しやすいでしょう。この性質は、プロンプトのちょっとした違いによって出力が大きく変わる理由でもあります。入力プロンプトの設計や出力情報の検査が重要になります。
新しい情報と限定情報の欠落
LLMが抱える根本的な限界は、その機能振舞いが学習コーパスに依存している点です。学習後に発生した出来事や発見、あるいは組織内でのみ共有される限定情報は、公開情報から整備された学習データには含まれていません。最新情報を必要とする業務や機密情報を扱うシナリオでは、別途情報を補う仕組みが不可欠です。
RAGによる外部知識の補完
この欠点を補う代表的な技術に、RAG(Retrieval-Augmented Generation)があります。これは、ユーザの質問に関連する情報を外部データベースから検索・抽出し、その結果をプロンプトに組み込んだ上でLLMに入力する手法です。これにより、LLMが知らない情報を補いながら柔軟な自然言語生成を行うことが可能になります。つまり、検索情報を補完して出力生成する方法です。
コンポーネントアーキテクチャ
LLMは高性能ですが、それ単体が万能というわけではありません。外部コンポーネントを組み合わせることで、LLM利用ソフトウェアシステムを構築します(図)。先に述べたRAGに加えて、Web検索エンジン等の外部サービス連携や、プロンプト補完、生成出力の検査などの機能を実現したコンポーネントの開発が必要です。周辺を工夫することで「野生の暴れ馬」であるLLMを「飼い馴らす」というイメージでしょうか。LLM利用ソフトウェアシステム開発は、ロデオゲームですね。

図:LLM利用ソフトウェアシステム文献[1]の図2に加筆
LLM利用ソフトウェアシステム開発の参考になる品質マネジメントガイドラインが公開されています(文献[2])。
文献[1] 中島震,小西弘一,妹尾義樹,大岩寛:大規模言語モデル利用AIシステムの品質マネジメント,信学技報, vol.124, no.358, KBSE2024-43, pp.25-30, 2025年1月.
文献[2] 国立研究開発法人産業技術総合研究所. 生成AI品質マネジメントガイドライン 第1版. 2025年5月. IPRI-TR-2025-01 / CPSEC-TR-2025001. DOI: 10.50886/0002003354
次回の予告
次回は、LLMをソフトウェア部品として再利用する際の品質課題とその解決策を解説していきます。LLMを安全に活用していくために必要となる品質管理の枠組みを紹介します。
中島先生の著書はこちらです
■「AIアルゴリズムからAIセーフティへ」
中島 震 (訳) (原著:O.サントス, P.ラダニエフ)
丸善出版 2025年3月 (ISBN: 9784621310328)
■「AIリスク・マネジメント」
中島 震
丸善出版 2022年12月 (ISBN: 9784621307809)
■「ソフトウェア工学から学ぶ機械学習の品質問題」
中島 震
丸善出版 2020年11月 (ISBN: 9784621305737)