放送大学で学ぶデータサイエンス(DS)

ユーザー別講義利用方法

貴学からの受講(団体受講)を検討される方はこちら

他大学受講(団体受講)と受講の流れについて

放送大学が提供するデータサイエンスコンテンツは、ご利用大学のカリキュラムや状況に応じてご利用いただけます。

放送大学データサイエンスコンテンツは、一部を除き文部科学省の支援により制作されています。

A 利用大学の授業科目の構成に組み入れる

利用大学において指導教員を置き、授業科目を開設するに際し、当該授業科目の構成の一部に放送大学の教材を組み入れる。

B 授業科目の別教材として利用できる

利用大学において指導教員を置き、授業科目を開設するに際し、利用大学における授業科目の副教材として放送大学の教材を利用する。

C 自習教材として学生が利用可能

放送大学が提供するデータサイエンスに関する講座は、受講生が自由に視聴することができます。また、この中から必修講座を決めることもできます。

放送大学が提供するデータサイエンスコンテンツについて

コンテンツ内容

1 有料講座の内容(1コマ45分から60分)

※利用には利用契約が必要です。

2 無料講座の内容(1コマ45分)

※無料の利用者登録だけでご視聴いただけます。

学習認定プロセス

放送大学は「インターネット配信公開講座」としてコンテンツを提供しています。

受講生には、付与されたアカウントを利用して各講座を視聴して頂くことになります。

大学・高等専門学校等の学生は、以下のプロセスで学習認定を受けることができます。

学修の認定

利用に向けた手続きの流れ

  1. 受講生の人数を決めて申し込み
    (アカウント作成・認証状・デジタルバッジ発行に受講生名簿が必要となりますので、放送大学まで受講生の名簿をお送りください。名簿は、上記外の目的には使用しません。個人情報は厳密に管理致します。)
  2. 放送大学から見積書・請求書等を発行
  3. 利用大学等から受講料のお支払い
  4. 放送大学で、受講生のアカウントを作成し利用大学等へ配布
  5. 利用大学等から受講生へアカウント配布
  6. 受講生の受講・利用・修了
    (受講生の学習状況【視聴回数・最終視聴日時・小テストの受験状況・合否・得点】はインターネット配信公開講座サイトで、利用大学の教員等が確認することができます。小テストは何度でも受験できます。)
  7. 放送大学から、学修した受講者にデジタルバッジを発行

利用契約

利用期間
4月~9月、9月~翌年2月の半期毎の契約となります。
料金

リテラシーレベルのコンテンツのみ、以下の団体割引を選択頂けます。

5講座セットで40人まで20万円

初期契約の後でも随時受講生を追加できます。

40名を超える場合は1名毎に5000円の料金がかかります。

例)48名の受講生が「導入」1講座を受講する場合:20万円+5千円×8名=24万円の料金が必要となります。

その他のコンテンツのご利用料金はお問い合わせください。

受講方法の詳細もご覧下さい。

連絡先窓口

まずは資料請求など、メールにてご相談ください。

総合戦略企画室
sogo-senryaku@ouj.ac.jp
(メーラを使われるときは@を半角にしてください)

企業内教育(団体受講)を検討される方はこちら

企業内教育(団体受講)と受講の流れについて

放送大学が提供するデータサイエンスコンテンツは、ご利用企業様の社内教育の状況に応じてご利用いただけます。

放送大学データサイエンスコンテンツは、一部を除き文部科学省の支援により制作されています。

A講習会・セミナーの教材として利用できる

企業様において講師を置き、講習会・セミナーを開設するに際し、当該講習の一部に放送大学の教材を組み入れる。

B自習教材として社員の皆様が利用できる

放送大学が提供するデータサイエンスに関する講座は、受講生が自由に視聴することができます。

放送大学が提供するデータサイエンスコンテンツについて

主なコンテンツ内容

1 有料講座の内容(1コマ45分から60分)

※利用には利用契約が必要です。

2 無料講座の内容(1コマ45分)

※無料の利用者登録だけでご視聴いただけます。

これらの講座は例です。今後、コンテンツは追加されます。

学習認定プロセス

放送大学は「インターネット配信公開講座」としてコンテンツを提供しています。

受講生には、付与されたアカウントを利用して各講座を視聴して頂くことになります。

受講生は、以下のプロセスで学習認定を受けることができます。

学修の認定

利用に向けた手続きの流れ

  1. 受講生の人数を決めて申し込み
    (アカウント作成・認証状・デジタルバッジ発行に受講生名簿が必要となりますので、放送大学まで受講生の名簿をお送りください。名簿は、上記外の目的には使用しません。個人情報は厳密に管理致します。)
  2. 放送大学から見積書・請求書等を発行
  3. 企業様から受講料のお支払い
  4. 放送大学で、受講生のアカウントを作成しご利用企業様へ配布
  5. ご利用企業から受講生へアカウント配布
  6. 受講生の受講・利用・修了
    (受講生の学習状況【視聴回数・最終視聴日時・小テストの受験状況・合否・得点】はインターネット配信公開講座サイトで、企業のご担当者様にご確認いただけます。受講生には、小テストを何度でも受験いただけます。)
  7. 放送大学から、学修した受講者にデジタルバッジを発行

利用契約

利用期間
4月~9月、9月~翌年2月の半期毎の契約となります。
料金

リテラシーレベルのコンテンツのみ、以下の団体割引を選択頂けます。

5講座セットで40人まで20万円

初期契約の後でも随時受講生を追加できます。

40名を超える場合は1名毎に5000円の料金がかかります。

例)48名の受講生が「導入」1講座を受講する場合:20万円+5千円×8名=24万円の料金が必要となります。

その他のコンテンツのご利用料金はお問い合わせください。

受講方法の詳細もご覧下さい。

連絡先窓口

まずは資料請求など、メールにて事務局までご相談ください。

データサイエンス教育支援係
sogo-senryaku@ouj.ac.jp
(メーラを使われるときは@を半角にしてください)

講義コンテンツ

レベル別 講義コンテンツ

下記のレベル等は数理・データサイエンス・AI教育強化拠点コンソーシアムによるモデルカリキュラムに準拠しています。

リテラシーレベル

(導入)「データサイエンス 基礎から応用」

この講座では、データおよびデータサイエンスを学ぶ意義を理解し、社会調査法の基礎を学ぶと共に、多彩な話題に触れ、そこで使われている課題と技術を学びます。

全8コマ(1コマ45分程度)

第1回 データで社会を可視化する 課題解決のためのデータサイエンスサイクル
担当講師
渡辺美智子(立正大学 教授)
内容
データサイエンス(ライフ)サイクル(国際ガイドラインに準拠)に沿い、データサイエンススキルに基づいて社会課題解決と価値創造に至るプロセス(データストーリー)の基本を具体的に解説する。これによって、データサイエンスの社会における役割と共に、基本的な概念を理解する。
第2回 画像処理とAI AIの歴史と実社会応用に向けた取り組みを学ぶ
担当講師
長谷山美紀(北海道大学大学院 教授)
内容
AIの進化の歴史を振り返りながら、どのように実社会に応用されてきたのかを解説する。また、マルチメディア・データサイエンスの基礎技術と共にAIの実社会応用に向けた高度化について解説する。これによって、AIが新たな価値創出を実現していることを理解する。
第3回 画像処理とAI 人間センシングを通してAIの持続的高度化を学ぶ
担当講師
長谷山美紀(北海道大学大学院 教授)
内容
AI技術を利用した例を示しながら、認識精度の向上、説明性の高いAIについて解説する。さらに、AIの持続的高度化につながる人間センシングについて触れ、AIと人間の協働するための試みを紹介する。これらによって、AIに対する正しいイメージを持てるようになる。
第4回 ビッグデータ利活用のためのプライバシー保護技術
担当講師
南和宏(統計数理研究所 准教授)
内容
ビッグデータの利活用を念頭に、データの蓄積と品質について解説する。また、データ間の関連を定義することと、匿名化というトレードオフについても解説する。これらの解説によって、データガバナンス、倫理、セキュリティについて理解する。
第5回 社会調査法の基礎
担当講師
北川由紀彦(放送大学 教授)
内容
データを集めるためのアンケートの設計、調査、分析技術を紹介する。これによって、データ分析のためのデータ収集の方法における注意事項を説明できるようになる。
第6回 データマイニングの諸課題
担当講師
吉田健一(筑波大学大学院 教授)
内容
企業で活用が進むデータサイエンスの技術の一つであるデータマイニングを紹介する。また、データマイニングの活用事例として、機械の故障診断などを紹介する。これによって、データマイニングの諸課題を説明できるようになる。
第7回 AIによるデータサイエンスとシミュレーション
担当講師
倉橋節也(筑波大学大学院 教授) ゲスト 村田忠彦(関西大学 教授) 北村章(大和大学 教授)
内容
分析する対象領域をモデリングすることで、AIを用いたシミュレーションが行われている。ここでは、合成人工プロジェクトの概要を紹介すると共に、プラントの事故予知に適用した事例を示すことで、シミュレーションの有効性を説明できるようになる。
第8回 自動車へのデータデータサイエンスの応用 クルマはビッグデータで走る
担当講師
青山幹雄(南山大学 教授)
内容
自動車制御、自動運転におけるデータ収集と解析事例、IoTとセンサー技術、センサーネットワークを紹介する。これによって、自動運転におけるデータサイエンスの利活用を説明できるようになる。

(導入)「数理データサイエンスAIリテラシー講座~導入~」

データ・AIが現代社会において活用され、様々な変化が生じています。これらの実例を紹介し、データ・AI利活用のための諸技術の概要と応用例を学びます。

第1回 社会で起きている変化
担当講師
竹村彰通(滋賀大学 教授)、齋藤邦彦(滋賀大学 教授)、笛田薫(滋賀大学 教授)
内容
計算機の処理性能の向上にともない、デジタルデータが増加し、ビッグデータを分析するAI技術も非連続的な変化を示してきた。これらの変化の最近までの経緯や技術的な背景について解説する。今後のデータにもとづく社会の変化は、

第4次産業革命、Society 5.0、データ駆動型社会などさまざまな用語で説明されている。今後の社会では複数の技術を組み合わせたAIサービスが提供されると予想されている。これらの社会の変化の動向について解説する。AIの得手不得手を考え、AIを何に活用できるのか、そしてどのような仕事がAIに奪われるのかを説明する。過去の産業革命と対比することにより、ビッグデータとAIを活用して新たな価値を創造するために、人間がすべきことを解説する。
第2回 社会で起きている変化
担当講師
久野遼平(東京大学 講師)
内容
データサイエンスやAIとはどういう分野なのでしょうか?なぜ社会の関心を集めているのでしょうか?本節では社会で起きている変化を知り、データサイエンスやAIがどういう分野か理解することを目標とします。データサイエンティストとAIはどのように学術や社会で活用されているのでしょうか?本節では自然科学、社会科学、ビジネスと幅広く応用例を解説します。応用例を通じて技術の可能性に検討がつくようになることを目標とします。データサイエンティストとAIの関係はどのようなものでしょうか?AIの時代に活躍できるデータサイエンティストになるにはどのような知識が必要でしょうか?本節ではデータサイエンティストとAIの関係に焦点を当てます。
第3回 社会で活用されているデータ
担当講師
髙野渉(大阪大学 特任教授)、宮西吉久(信州大学 准教授)
内容
世の中にあるビッグデータの例を紹介するとともに、そのような膨大なデータを集めるための仕組みや仕掛け(センサー、社会インフラ、クラウドソーシング)、それら膨大なデータの活用例などを紹介する。1次データ、2次データ、データのメタ化:1次データ、2次データ、3次データの意味と違いを知る。これらを組み合わせて補完し分析することで、さらに有益な情報を得られることを認識する。また、データをメタ化し、メタデータにすることで,情報の整理が進むことを理解する。構造化データ、非構造化データ(文章、画像/動画、音声/音楽など): 構造化データと非構造化データの違いを知る。ビッグデータとしても扱われることのある、非構造化データの種類を知る。
第4回 データ・AIの活用領域
担当講師
久野遼平(東京大学 講師)
内容
データサイエンスの基本となる仮説検証、知識発見、原因究明とはどのようなものなのでしょうか?本節ではデータサイエンスの基本を解説します。データサイエンスの基本となる分析を経てそれらはどのように学術やビジネスでは役立てられるのでしょうか?本節では計画策定、判断支援、活動代替、新規生成に焦点を当てます。データサイエンスの技術は具体的に研究開発、調達、製造、物流、販売、マーケティング、サービスの分野でどのように役立てられているのでしょうか?改めて具体例をもって解説します。
第5回 データ・AI利活用のための技術1
担当講師
杉本知之(滋賀大学 教授)、市川治(滋賀大学 教授)、佐藤智和(滋賀大学 教授)
内容
数量化された教師ありデータもしくは教師なしデータに基づいて、数値予測やグルーピングを行うときに用いられる代表的な手法を解説する。データに基づく予測を理解するとともに、その中で用いられる領域知識の必要性や最適化などの考え方、特化型AIと汎用AIの違いなどを学ぶ。また、シミュレーションデータを活用したデータ同化の方法への応用例を紹介する。テキストデータと音声データについて、そのデータの形式と基本的な分析の手法を解説する。テキストも音声もコード化された数値データであることを理解し、分析によって意味へと変換されることを理解する。また、応用例についても、いくつか紹介する。画像/動画像データを扱う際のデータ構造について説明した上で、データから情報を抽出するために用いられる様々な技術を概観する。また、画像分野における現在のAIの応用範囲とその限界についても解説する。
第6回 データ・AI利活用のための技術2
担当講師
内田誠一(九州大学 教授)
内容
データの解析と可視化についてその概要を説明する。解析については、様々な解析課題(予測やグルーピングなど)の目的や必要性を、例を通して理解する。そして様々な可視化手法(グラフ化や多次元の可視化)の目的や必要性を、例を通して理解する。データ解析の対象が、表形式で表現された数値データだけでなく、音や画像、そして言語などのメディアデータも含まれることを理解する。また各メディアに、どのようなデータ解析課題があるかを概観する。データ解析におけるAIの利用について概観する。特に、データ解析的視点から見たAIの利用価値について述べる。関連して、特化型AIと汎用型AIの違いや、現状のAIにできることとできないことに触れる。
第7回 データ・AI利活用の現場
担当講師
髙野渉(大阪大学 特任教授)
内容
PDCA(P:計画、D:実行、C:評価、A:改善)サイクルの概要を説明する。実際のデータを活用したPDCAサイクルを用いたデータ解析を通じて、PDCAサイクルの重要性を理解する。製造現場における欠陥品の検知、ランディングページのA/Bテスト、購買推薦アルゴリズムなどの例を交えて、データ科学やAIの活用例を理解する。生産工学、経済などの分野に一般的な考え方を、在庫管理、マーケティング、産業構造と経済規模などのデータ例を交えて再考察する。
第8回 データ・AI利活用の最新動向
担当講師
髙野渉(大阪大学 特任教授)、宮西吉久(信州大学 准教授)
内容
神経ネットワークや計算機内部の論理回路との関係性を交えながら、ニューラルネットワークの簡単な構造や計算、利用法について理解する。AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など): 画像認識やパターン認識の分野で知られている深層生成学習モデルの例や基礎を学習する。AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など):2つのニューラルネットワークがお互いの評価をして競い合い学習していく」敵対的学習(Adversarial Training)の基礎を知る。機械学習の一領域としても知られる強化学習や転移学習の例を知る。

(基礎)「デジタル社会のデータリテラシー」

この講座では、デジタル社会の読み・書き・そろばんである『データ思考』を育むデータリテラシーの内容を身の回りの社会の実例に沿って、分かり易く解説します。

第1回 社会をデータで語る
担当講師
渡辺 美智子(立正大学 教授)
内容
A データサイエンスの第一歩 B ビジネスデータサイエンス1ゲスト:孝忠大輔(NEC) C 構造化データを作る D データサイエンスサイクル
第2回 質的データを活用した問題解決
担当講師
渡辺美智子(立正大学 教授)
内容
A データの表現技術 B ビジネスデータサイエンス2 ゲスト:孝忠大輔(NEC) C 質的データ処理 D 公平な比較か
第3回 量的データを活用した問題解決
担当講師
小野陽子(横浜市立大学 准教授)
内容
A データの計量化・可視化 B マネージメントデータサイエンス ゲスト:中川みゆき(帝国データバンク) C 量的データ処理
第4回 データのばらつき
担当講師
大橋洸太郎(文教大学 講師)
内容
A ばらつきの捉え方 B ヘルスケアデータサイエンス ゲスト:村上真(FiNC) C ばらつきの管理
第5回 相関分析
担当講師
竹内光悦(実践女子大 准教授)
内容
A 2つの量的データ間の関係 B スポーツデータサイエンス ゲスト:河野岳志、高橋朋孝(データスタジアム) C 相関
第6回 回帰予測
担当講師
小野陽子(横浜市立大学 准教授)
内容
A 予測モデルの考え方 B ①ファッションデータサイエンス1 B ②ファッションデータサイエンス2 ゲスト:エマ理永(エマリーエ) C 回帰分析
第7回 データ収集の方法
担当講師
大橋洸太郎(文教大学 講師)
内容
A 統計調査の基本 B マーケティングデータサイエンス ゲスト:萩原雅之(トランスコスモス) C 標本調査 D 質問作りのポイント
第8回 確率に基づく判断
担当講師
塩澤友樹(椙山女学園大学 講師)
内容
A ①クロス集計表とベイズの定理 A ②仮説検定の考え方 B 医療データサイエンス ゲスト:高橋邦彦(東京医科歯科大) C クロス集計表の利用と仮説検定の実践

(基礎)「数理データサイエンスAIリテラシー講座~基礎~」

データの特徴を読み解き、起きている事象の意味合いを理解できる能力(データリテラシー)の基礎を学びます。

第1回 データを読む
担当講師
山本章博(京都大学 教授)
内容
集められたデータを読んで理解するとは、見えないものをデータを通じて見ることである、という基本的な考え方を説明し、具体例として国勢調査などのアンケート調査や物理法則、公衆衛生政策などをあげる。見えないものを捉えるための考え方として、母集団からの標本抽出について説明する。標本抽出の方法として、単純無作為抽出、層別抽出、多段抽出をあげる。データ形式の代表的な分類として、連続データと離散データについて説明する。また、データの意味的分類として、量的データと質的データについて説明する。度数分布表とヒストグラムを例にしてこれらのデータの分類と違いについて説明する。集められたデータを読んで理解するとは、見えないものをデータを通じて見ることである、という基本的な考え方を説明し、具体例として国勢調査などのアンケート調査や物理法則、公衆衛生政策などをあげる。見えないものを捉えるための考え方として、母集団からの標本抽出について説明する。標本抽出の方法として、単純無作為抽出、層別抽出、多段抽出をあげる。データ形式の代表的な分類として、連続データと離散データについて説明する。また、データの意味的分類として、量的データと質的データについて説明する。度数分布表とヒストグラムを例にしてこれらのデータの分類と違いについて説明する。
第2回 データを読む
担当講師
林和則(京都大学 教授)
内容
量的データの性質は分布を用いることでよく理解できるが、データの特徴を一つの値に集約して表現できると大変便利である。このような値は代表値と呼ばれ、ここでは、基本的な代表値として平均値、中央値、最頻値について説明する。 代表値は一つの数字でデータ全体の特徴を表すことができる便利なものであるが、その特徴をよく理解して用いないとデータを大きく見誤る危険性がある。ここでは、各代表値の性質やそれらの違いについて箱ひげ図を用いて説明する。量的データは、代表値とそのばらつき表す指標をセットで用いることで、より正確にその特徴を捉えることができる。ここでは、ばらつきを表す指標として最も基本的かつ重要な、分散、標準偏差、偏差値について説明する。
第3回 データを読む
担当講師
中野直人(京都大学 特定講師)
内容
身長と体重のように、複数の変数のデータを同時に観測することもあるだろう。それらの変数間の関係を調べるための方法の一つとして、直線的な関係を調べる共分散とその定量的な指標である相関係数について説明する。相関関係と因果関係とは一般には関連がない。相関係数が大きくても因果関係がないことがある。交絡因子による擬似相関がその例である。また、相関係数が小さくても因果関係がある場合もある。相関に関する注意点について説明する。変数が3つ以上ある場合に変数間の関係性を調べるにはどうしたら良いだろうか。それには2変数間の相関を、全ての変数間の組み合わせに対して計算すればよい。そこで用いられる相関係数行列と散布図行列について説明する。
第4回 データを説明する
担当講師
鹿島久嗣(京都大学 教授)
内容
2つの質的変数の関係を調べるには、まずはクロス集計表や分割表の形にデータをまとめることで、その関係を大まかにつかむ。クロス集計表における関係の強さはχ二乗値で測ることができる。観測したデータをそのまま信じることはできない。観測データには、観測の誤差や、打ち切りや脱落などがありうる。統計情報は悪用すれば、ウソをもっともらしく述べるための道具にもなりうる。いくつかの有名な例を見てみる。
第5回 データを説明する
担当講師
木村真之(京都大学 特定講師)
内容
質的データに対する可視化手法について述べる。具体的には棒グラフ、円グラフについて描き方の注意点も含めて解説する。量的データに対する可視化手法について述べる。折れ線グラフ、散布図、ヒートマップなど代表的な可視化手法を解説した後、ヒストグラムによる可視化手法についても触れる。一般的なデータに対して様々な可視化が可能なこと、特にテレビやウェブなどのメディアで用いられるようなデータの図表表現ついて紹介しながら解説する。
第6回 データを説明する
担当講師
關戸啓人(京都大学 特定講師)
内容
データの比較の方法について、どのように比較を行えば何がわかったことになるのかを、相関や因果について復習をしながら説明する。例えば、条件を揃えることの必要性を述べ、具体例としてA/Bテストを紹介する。何を目的にどのような可視化を行うと良いのか、具体例を交えつつ説明する。このパートでは、目的にそぐわなかったり、誤解を招いたりしかねない、不適切な可視化の事例について紹介し、どのように改善すべきかを説明する。何を目的にどのような可視化を行うと良いのか、具体例を交えつつ説明する。このパートでは、実際に同じデータを複数の方法で可視化した場合に、どの可視化がどのような面で優れているのかを考えてみたり、可視化を行うことで新たな気づきが得られた例を紹介する。
第7回 データを扱う
担当講師
田村寛(京都大学 教授)
内容
データ解析を行う際に使用するツールについて学ぶ。特にデータの収集において欠かすことができないスプレッドシートについては、代表的な表計算ソフトであるExcel(エクセル)を例に挙げて理解を深められるように説明する。実際に代表的な表計算ソフトであるExcel(エクセル)を使い、自分でデータを入力したうえで、四則演算などの極めて初歩的なデータ処理を行えるように説明する。表的な表計算ソフトであるExcel(エクセル)を使い、データの並び替え・ランキング・絞り込みなどを行いつつ、作業を効率化するショートカットの有用性なども説明する。
第8回 データを扱う
担当講師
田村寛(京都大学 教授)
内容
引き続き、代表的な表計算ソフトであるExcel(エクセル)を使ったデータ処理を行うために、データの入力や四則演算その他の処方的な関数を使った処理の復習を説明する。代表的な表計算ソフトであるExcel(エクセル)を使い、平均、標準偏差、新たな変数作成をなどにも挑戦できるように説明する。汎用性が高いcsv形式のデータを入手してデータ加工処理をおこなってみる。またExcel(エクセル)からcsv形式のデータ保存の仕方についても説明する。

(心得)「数理データサイエンスAIリテラシー講座~心得~」

データサイエンスを活用した社会で心得ておくべき、個人情報保護、倫理、バイアス、社会的影響やリスク、情報セキュリティを学びます。

第1回 ELSI(Ethical,Legal and Social Issues)
担当講師
村上祐子(放送大学 客員教授/立教大学 教授)
内容
ELSI(Ethical, Legal and Social Issues)について学ぶ。
第2回 個人情報保護
担当講師
加藤尚徳(放送大学 客員准教授/KDDI総合研究所)
内容
個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウトについて学ぶ。
第3回 データ倫理:データのねつ造、改ざん、盗用、プライバシー保護
担当講師
森下壮一郎(放送大学非常勤講師/サイバーエージェント)
内容
データ倫理:データのねつ造、改ざん、盗用、プライバシー保護について学ぶ。 
第4回 AI社会原則
担当講師
久木田水生(放送大学客員准教授/名古屋大学 准教授)
内容
AI社会原則(公平性、説明責任、透明性、人間中心の判断)について学ぶ。
第5回 データバイアス・アルゴリズムバイアス
担当講師
森下壮一郎(放送大学非常勤講師/サイバーエージェント)
内容
データバイアス、アルゴリズムバイアスについて学ぶ。
第6回 AIサービスの責任論
担当講師
久木田水生(放送大学客員准教授/名古屋大学 准教授)
内容
AIサービスの責任論について学ぶ。
第7回 AI活用における負の事例
担当講師
村上祐子(放送大学 客員教授/立教大学 教授)
内容
データ・AI活用における負の事例紹介について学ぶ。
第8回 情報セキュリティ
担当講師
辰己丈夫(放送大学 教授)
内容
数理・データサイエンス・AIを学ぶ上で必要となる情報セキュリティについて学ぶ。情報セキュリティは、機密性、完全性、可用性の3つの概念からなり、情報を保護するための加工、暗号化や、権限を設定するためのパスワード、認証を扱う。また、悪意ある情報搾取や、情報漏洩等によるセキュリティ事故の事例紹介を行う。

(選択)「Rで学ぶDS入門」

統計解析ツールRを使って実際にデータを扱い、分析しながら、データサイエンスの分析手法の基礎と基本的な考え方を習得します。

第1回 統計解析ツールRの基本的な使い方
担当講師
浅井紀久夫(放送大学 教授)
内容
データサイエンスの必要性を説明し、統計解析ツールR及び統合開発環境RStudioの基本的な操作を説明する。
第2回 データ分析の基本
担当講師
浅井紀久夫(放送大学 教授)
内容
前半でデータ分析を行う上で基本的なことを説明し、後半で実際にデータを取得したり、Rでデータを読み書きしたりする。
第3回 統計処理の初歩
担当講師
浅井紀久夫(放送大学 教授)
内容
データの分布や基本統計量、変数間の関係など、統計処理の初歩を説明する。
第4回 回帰と分類と
担当講師
浅井紀久夫(放送大学 教授)
内容
前半で回帰分析について例示しながら説明し、後半で分類について決定木を例にして説明する。

発展・専門

「データサイエンス革命」

データサイエンスが仕事や社会を変えようとしています。データサイエンスには、単にデータを分析することだけではなく、社会の価値に結びつけることまでが要求されています。そのため、課題解決に至る道筋を描く力も必要です。専門家による講演を通してデータサイエンスを概観します。

第1回 データサイエンスことはじめ
担当講師
和泉志津恵(滋賀大学データサイエンス学部 教授)
内容
いまの社会はビッグデータの時代とよばれ、身近なデータが蓄積されるようになりました。大小様々なデータを対象として新たな価値を創造する学問分野が、データサイエンスです。例題やミニクイズをとおして、一緒に、データサイエンスの世界に触れてみませんか。
第2回 データサイエンスをいかす
担当講師
松井秀俊(滋賀大学データサイエンス学部 准教授)
内容
データを分析するための方法として、回帰分析や判別分析などの統計手法を紹介します。これらの方法がどのような場合に使われ、どのような結果を与え、それらをどのように解釈するかについて説明します。また、コンピュータ上で実際に分析を行う流れについても説明します。
第3回 経営における人工知能とデータサイエンス
担当講師
倉橋節也(筑波大学大学院 教授)
内容
ITの進展により、様々なデータが企業や組織に蓄積する中、データサイエンスや人工知能への期待が急速に高まっています。本講演では、データを扱うための基礎的な人工知能手法と経営分野における適用事例を紹介します。
第4回 マーケティングとデータサイエンス
担当講師
佐藤忠彦(筑波大学大学院ビジネス科学研究科 教授)
内容
企業は、市場における競争優位性を高めるべく、様々なデータの高度利用を模索しています。マーケティングも例外ではなく、POSデータやID 付POS データに代表されるビッグデータを活用し、消費者の理解を促進し、またその理解に基づく活動の高度化を狙っています。本講演では、マーケティングにおけるデータサイエンスの役割・考え方を示した上で、データの高度活用例を紹介します。
第5回 統計学の現代的役割とデータサイエンス
担当講師
中野純司(統計数理研究所 教授)
内容
統計学はデータを扱う科学として長い歴史を持ち、データサイエンスの学問的基盤の一つとなっています。統計学を概観し、データサイエンスにおいて統計学が果たす現代的な役割について説明します。また、いくつかのデータ可視化の手法を紹介すると共に、インフルエンザ流行予測の事例からその教訓を読み解きます。
第6回 ビッグデータのプライバシー保護技術
担当講師
南和宏(統計数理研究所 准教授)
内容
ビッグデータの安全な利活用には、個人や組織を特定できないようにする匿名化技術が必要です。匿名化では、個人の識別子情報(名前やID等)を削除するだけではなく、既に流通している外部情報との連結を防ぐための秘匿処理を行います。個人情報保護法を概観し、匿名化の安全性を評価するための代表的な指標について説明します。

「統計的因果推論の考え方と技術」

因果関係の確立は、ほぼすべての研究あるいは業務の目的と言っても過言ではないでしょう。統計を学ぶと、因果関係と相関関係は違うという注意がなされます。データサイエンスをより深く理解し、それを実践するために不可欠な、因果関係を確立するための正しい考え方とそれを活用するための技術を学びます。

第1回 統計的因果推論とは
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
因果推論とは何か。因果関係を統計的に評価するということはどういうことか。因果関係を示すための条件とは何か。という統計的因果推論のための基礎的な事項、そして変量の種類とそれらの関係について学ぶ。
第2回 統計的データ解析の諸側面
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
はじめに統計的因果推論で重要な役割を果たす独立性と条件付き独立性について述べ、それらの違いを表す例として有名なシンプソンのパラドクスを取り上げる。次に回帰分析を取り上げ、その特質について簡単に議論し、例を紹介する。最後に、原因と結果以外の変量であ第三の変量の果たす役割を、例を通じて吟味する。
第3回 統計的因果推論の枠組み
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
統計的因果推論にはいくつかのアプローチがあるが、ここでは、「潜在的アウトカム」の概念を用いたアプローチを採用する。はじめに潜在的アウトカムとは何かを説明し、それに基づいて処置効果を定義する。また、確率計算のもとになる確率的な変動がどこにあるのかという話題を、いくつかの統計手法とからめて講義する。
第4回 処置のランダム化と効果の推定
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
平均処置効果の推定法について学ぶ。ここではランダム割り付けが中心的な役割を果たす。最初に処置群と対照群を工夫なく設定したのでは、処置効果の推定はできないということを例によって示す。そして、処置のランダム割り付けがあれば処置の推定が偏りなくできるということを学習する。さらに、共変量がある場合の処置効果の推定法を学習する。
第5回 傾向スコアの定義と性質
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
観察研究における統計的因果推論で重要な役割を果たす傾向スコアについて解説する。また、傾向スコアの性質として条件付き独立性とバランシング性を紹介し、傾向スコアの使用法を、適用する研究の段階によって分類して話を進める。
第6回 マッチングの方法とその利用
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
処置効果の推定のための方策の一つであるマッチングについて解説する。マッチングは多くの統計解析の実際の場面でよく用いられる手法である。その特質、そしてマッチングをした後の解析について学習する。
第7回 層化解析法と重み付け法
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
処置効果の推定法である層化解析法と重み付け法について解説する。はじめに層化(層別)の効用について解説し、層化を用いた処置効果の推定法である層化解析法と、重み付け法について、例を交えながら解説する。
第8回 ノンコンプライアンスと操作変数法
担当講師
岩崎学(統計数理研究所 統計思考院 特任教授)
内容
ノンコンプライアンスと操作変数法について学習する。はじめにノンコンプライアンスの下での操作変数法の適用について述べ、その下での処置効果の推定法について学習する。最後にノンコンプライアンスが生じた場合の処置効果の推定法を例を挙げて理解を深める。

「ニューラルネットワーク概論」

この講座では、現代AIの基盤を支えるニューラルネットワーク(深層学習)技術の基礎を学びます。ニューラルネットワークは生物の情報処理様式からヒントを得た計算技術です。ここでは、ニューラルネットワークを構成する要素からはじめて、現代の画像処理技術の中心を担っている深層学習を学んで行きます。
※「ニューラルネットワーク概論」インターネット配信講座は近日公開の予定です。

第1回 ニューラルネットワークへの基本概念
担当講師
庄野逸(電気通信大学 教授)
内容
ニューラルネットワークを構成する要素を確認した後、例題として最初の世代のニューラルネットワークであるパーセプトロンについて解説する。
第2回 多層化ニューラルネットワークへの挑戦
担当講師
庄野逸(電気通信大学 教授)
内容
第二世代のニューラルネットワークである多層型パーセプトロンと多層パーセプトロンを運用するための学習方式である誤差逆伝搬法について解説する。
第3回 深層学習へのアプローチ(1)
担当講師
庄野逸(電気通信大学 教授)
内容
多層パーセプトロンの研究から分かってきた問題点とそれを解決するためのアプローチに関して説明する。
第4回 深層学習へのアプローチ(2)
担当講師
庄野逸(電気通信大学 教授)
内容
層畳み込みニューラルネットワークの発展を脳科学的な観点を踏まえて紹介する。

「機械学習概論Ⅰ」

機械学習概論は数学や計算機科学、脳科学といった分野の知識を結集した研究分野です。
この講義では、機械学習の基本的な手法や学習能力を向上させるための基本技術を理解するために、回帰モデルを題材として、汎化能力と正則化という技術を紹介します。最後に、正則化を応用したスパースモデリングについて学びます。
※「機械学習Ⅰ」インターネット配信講座は近日公開の予定です。

第1回 機械学習の歴史と要素技術
担当講師
赤穂昭太郎(産業技術総合研究所 上級主任研究員)
内容
機械学習の全体像を俯瞰する。機械学習の歴史を辿り、機械学習の基礎となる要素技術を、4つの大きな柱にまとめる考え方を紹介し、それぞれの概要を説明する。
第2回 回帰問題とモデル選択
担当講師
赤穂昭太郎(産業技術総合研究所 上級主任研究員)
内容
回帰問題とモデル選択について解説します。与えられる学習データが複雑だったり、高次元だったりする問題に対して、どのような手順で最適な答えを導き出すのか。そのアプローチの仕方の基本を解説する。また、次元の呪いと汎化能力という重要な考え方を解説する。
第3回 正則化と交差検証
担当講師
赤穂昭太郎(産業技術総合研究所 上級主任研究員)
内容
汎化能力についての数値実験による検証と汎化能力の高い学習モデルを選択するための正則化という考え方を紹介する。また、正則化の基本となるリッジ回帰という方法と、汎化能力の信頼性を高める交差検証についての基礎を解説し、正則化や交差検証を使って実際に学習モデルの選択がどのように行われるのかを示す。
第4回 スパースモデリング
担当講師
赤穂昭太郎(産業技術総合研究所 上級主任研究員)
内容
スパースモデリングについて講義する。多くの変数の中から重要な変数に絞り込む方法であるL0正則化について述べ、目的関数を最適化する勾配法を使った実用的なL1正則化をスパースモデリングに導入する方法について解説する。最後に現在、天文学や医療分野で注目を集めている圧縮センシングを紹介する。

「機械学習概論Ⅱ」

機械学習の基本となる4本の柱のうち「識別」、「次元圧縮」、「クラスタリング」といった柱について説明します。
これらの技術を理解するために、識別の方法と確率に関する知識を学んだ後、確率を使った一般的な手法である「ベイズモデリング」を紹介し、「教師なし学習」である次元圧縮とクラスタリングについて解説します。
※「機械学習概論Ⅱ」インターネット配信講座は近日公開の予定です。

第1回 識別と確立1
担当講師
赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
内容
文字や音声の認識など、パターン認識への応用の基礎となる識別の基本と、どのような誤差を最小化すればよいのかを解説します。さらに、条件付確率に基づいた識別手法である「ロジスティック回帰」について説明し、さらに、ロジスティック回帰とは違った立場から線形識別関数を学習する手法であるサポートベクターマシン(SVM)を紹介します。
第2回 識別と確立2
担当講師
赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
内容
識別の手法を紹介し、具体的な問題を例にあげながら機械学習の技術のベースとなる「確率」に関する知識を学びます。その後に、識別手法のなかでも性能の高い学習モデルである「ランダムフォレスト」を解説します。さらに、「我々人間がどのような行動をとればよいのか」という現実的な判断につながるという重要な意味を持つ識別結果の評価指標を紹介します。最後に、機械学習において確率を扱うのに非常に大きな役割を果たすベイズの定理について説明します。
第3回 ベイズモデリング
担当講師
赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
内容
回帰、識別、次元圧縮、クラスタリングの機械学習における4つの柱すべてに適用が可能な、確率計算に基づくモデリング手法であるベイズモデリングについて学びます。ここでは、ベイズモデリングの一般的な手順を説明し、単純ベイズ法という基本的なモデルで識別の問題を実践してみます。次に、線形回帰の問題をベイズモデリングの立場から見直すことで、正則化との関連性を述べます。
最後に、複雑なベイズモデリングを行うためのベイジアンネットワークについて説明します。
第4回 次元圧縮とクラスタリング
担当講師
赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
内容
機械学習の4本の柱のうち、教師なし学習である次元圧縮とクラスタリングを中心に学びます。次元圧縮やクラスタリングといった教師なし学習の手法が、これまで講義した教師あり学習も含めて、ベイズモデリングによって統一的に理解できることを説明します。
最後に、機械学習の枠組みの広がりの一端を紹介します。

「AIプロデューサー~人とAIの連携~」

AIプロデューサーとは、現場で有用なAIシステムを設計できる人材です。工学的な立場に加えて、経営学的な立場からもAI技術を考えられるようになるために、AI技術論と実践事例を交えて、実際の現場で役立つAIを説明します。
参考図書 山口高平著 AIプロデューサー 人とAIの連携 近代科学社Digital2022

第1回 AIプロデューサーとは
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
AI技術全体を俯瞰できるとともに、個々のAI技術の特色を理解し、様々な分野の現場でのAI技術を実践した時の有用性と限界を学習し、現実の場面に適したAI技術を選択し提言できるようになることを目指します。
第2回 製造業とAI
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
製造業の工場を取り上げ、オントロジーを利用した組立作業の支援、強化学習を利用したロボット自動組立作業について説明します。
第3回 社会インフラとAI
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
交通インフラである高速道路に関連しまして、ETCレーン点検業務、氷雪作業スケジューリングを取り上げ、知識ベース推論AIの仕組みと適用方法について説明します。
第4回 サービス業とAIロボット
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
複数のロボットが連携して業務をこなすロボット喫茶店を紹介し、特に、人がロボットの業務プロセスを記述して、それが、プログラムに自動的に変化され、ロボットが発話・動作を始める仕組みについて学習します。
第5回 教育とAIロボット
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
AIだけでなく拡張現実などの技術とも組み合わせて、小学校で、教師とロボットが連携する授業を紹介します。
第6回 観光とAI
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
高速道路の休憩施設であるSAから、人がその地域の観光名所に立寄ることを推薦するスマートフォンアプリの仕組みについて説明します。
第7回 間接業務とAI
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
大学の事務処理、会社の日報管理を取り上げ、適用可能なAI技術を説明します。
第8回 グループ討論とAI
担当講師
山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
内容
小学生と大学生のグループ討論を取り上げ、AIが知的パートナーになりうる可能性について説明します。

データ科学としての言語研究の可能性

データサイエンスが言語研究の可能性をどのように広げられるか、可能性を探っていく。早稲田大学の李在鎬教授と東北大学の木山幸子准教授を訪ね、李教授には人が意識する以前になされる脳内での言語処理を捉える手法としての実践例を、紹介・解説してもらう。

第1回 データ科学としての言語研究の可能性
担当講師
滝浦 真人(放送大学 教授)李 在鎬(早稲田大学 教授)木山 幸子(東北大学 准教授)
内容
データサイエンスが言語研究の可能性をどのように広げられるか、可能性を探っていく。早稲田大学の李在鎬教授と東北大学の木山幸子准教授を訪ね、李教授には人が書いたテキストを科学する手法としての、木山准教授には人が意識する以前になされる脳内での言語処理を捉える手法としての実践例を、紹介・解説してもらう。

心理学研究への応用

データサイエンスに関連した仕事に従事しようとしている学生やすでに業務としている技術者に、有益な知識を提供する専門レベルの講座。本講座では、数理・データサイエンス・AIの心理学研究への応用を扱う。認知心理学、社会心理学、臨床心理学の各専門領域から、データサイエンスの活用事例を丁寧に紹介する。

第1回 心理学に数理・データサイエンス・AIはいかに活用されるか
担当講師
清水 裕士(関西学院大学 教授)
内容
本講座の総論的な位置づけとして、心理学における実証研究、特に、因果関係の検討における統計的思考の活用について取り上げる。続いて、数理・データサイエンス・AIが心理学に与えた影響について、数理統計モデリング、統計的因果推論、そして、機械学習の応用という3つのトピックについて検討する。最後に、講師と企画者との対談を通して、心理学にデータサイエンスを応用する意義について考察する。
第2回 人の情報処理過程をモデル化する
担当講師
武藤 拓之(大阪公立大学 准教授)
内容
認知心理学の基本的なテーマである、人間の情報処理過程をモデル化する研究を紹介する。まず、人間の情報処理過程を研究するための認知心理学の方法論を解説した後で、情報処理過程に関する仮説を数式で表現する方法として、認知モデリングと呼ばれるいくつかの数理モデルを紹介する。最後に、AIと認知心理学との結びつきについて検討する。
第3回 表情運動を分析する
担当講師
難波 修史(広島大学 准教授)
内容
感情心理学の領域から、表情運動の分析におけるAIやデータサイエンスを適用した研究例を紹介する。まず、感情を伝える表情について概説し、次に、動画データから人の表情運動を推定するAIについて、その機械学習の技術について説明し、表情運動をモデリングする具体的な統計解析の手法について紹介する。最後に、表情運動の記録についての膨大なデータを分析することが、心理学にどのような影響を与えるかを検討する。
第4回 社会心理学のモデリングアプローチ
担当講師
小杉 考司(専修大学 教授)
内容
社会心理学の研究領域を概観し、統計法との相性が良いことに触れながら、社会心理学に統計モデルを適用することの意義を説明する。社会心理学の研究領域の中で、ミクロやマクロのレベルでのモデリングによる研究は進んでいるが、メゾレベルに相当する集団力学については、個人と社会のレベルがリンクする領域特有の問題がある。研究としては発展途上にあるといえるが、そのような研究例として、人間関係を可視化するモデルについて紹介する。
第5回 歩行者や自動車ドライバーの認知・行動プロセスの理解
担当講師
紀ノ定 保礼(静岡理工科大学 准教授)
内容
第2回の認知心理学の応用的な研究として、交通環境における行動研究の事例を紹介する。まず、交通環境という日常・現実的県境における人間の心理を研究する際の注意点を検討する。そして、歩行者が道路を横断するタイミングの意思決定メカニズムに関する研究、さらには、自動車運転中のドライバーの注意が阻害されるメカニズムに関する研究へのデータサイエンスの活用について紹介する。
第6回 臨床心理学とデータサイエンス
担当講師
国里 愛彦(専修大学 教授)
内容
本講座の第6回から第9回は、心理学の中でも、より応用的な領域になる臨床心理学とデータサイエンスとの関わりについて扱う。まず、臨床心理学とデータサイエンスの関わりについて概説しながら、第6回から第9回の位置づけを行う。続いて、数理モデルを用いて精神障害の病態や治療を理解する計算論的精神医学の歴史と可能性について説明し、数理モデルの活用とその意義、代表的な生成モデルについて紹介する。最後に、講師と企画者との対談を通して、臨床心理学にデータサイエンスを応用する意義について考察する。
第7回 心理情報学:基礎編
担当講師
横谷 謙次(徳島大学 准教授)
内容
心理学に機械学習などの人工知能を応用する「心理情報学」というアプローチについて、臨床心理学の領域から紹介する。第7回は、その基礎編と題して、臨床心理サービスに関する3つの課題を説明し、それぞれの課題に対応する解決策、すなわち、犯行を予防する解決策、顧客を獲得する解決策、心理的支援サービスの品質を明示する解決策のそれぞれについて、データサイエンスやAIの技術を応用した解決策を提示する。
第8回 心理情報学:応用編
担当講師
山本 哲也(徳島大学 准教授)
内容
心理学に機械学習などの人工知能を応用する「心理情報学」というアプローチについて、臨床心理学の領域から紹介する。第8回は、その応用編と題して、ライフログなどの大量のデータから機械学習をもちいた「幸福感・抑うつの予測」や「コロナ禍での国民のメンタルヘルスに影響する要因の検討」、さらに、「仮想現実技術(VR)を用いたセルフカウンセリング」や「AIによるアート生成」による人間の創造性の拡張といった研究開発の事例を紹介する。
第9回 N of 1 のデータサイエンス:シングルケースデザイン
担当講師
竹林 由武(福島県立医科大学 講師)
内容
臨床心理学の研究デザインである「シングルケースデザイン(単一事例実験計画法)」について、その概要を解説し、反復測定で得られた時系列データの分析方法としての視覚分析について、その問題点も合わせて説明する。そして、視覚分析の問題点を克服する方法として期待されている「人工ニューラルネット」というAIシステムを活用した分析方法の精度を検証した研究を紹介する。

多変量データ分析実践の基礎

数理・データサイエンス・AIの学修で応用基礎レベル教育を終えた人が、各領域で専門家としてデータから意味を抽出、現場にフィードバックして活用する能力の育成を目指す番組。課題の抽出からデータ分析、解決策の導出の流れを解説、実際のデータセットでその実践ができる技能の習得を可能なものとする。

第1回 重回帰分析
担当講師
渡辺 美智子(立正大学データサイエンス学部 教授)
内容
予測と要因分析の基本である重回帰分析に関して、適用する。データの構造、回帰モデルの意味、分析結果の解釈について、中古住宅の価格予測を例に平易に解説する。重回帰分析では変動を説明(予測)したい変数を目的変数、そのために使用される要因系の変数を説明変数というが、ここでは、各住宅の価格が目的変数、価格に影響する床面積や築年数などが説明変数となる。本講義では、具体的に分析結果の数値を事例に沿って解釈する方法を学習し、次に、エクセルや統計ソフトによって誰もが簡単に分析を実行できるように、その手順を解説する。最後に実際に社会でこのような分析手法が活用されている現場として不動産価格の予測ビジネスを展開する企業を訪問し、アナリスト達のデータ活用の背景の紹介を通して、データサイエンスの活用の実態と価値創造の効果を学ぶ。
第2回 クロス表と決定木分析
担当講師
藤井 良宜(宮崎大学教育学部 教授)
内容
クロス表と決定木分析を行うにあたり、取り扱うデータと解析の目的を示した後、クロス表解析および決定木分析の方法を説明する。また、決定木分析のメリットとデメリットを考察するために具体的な例を用いて、決定木分析の解説を行う。次に、コンピュータを使った分析の手順を示す。具体的なデータを用いてコンピュータによる分析の過程を示し、分析結果を解釈する。最後に、スポーツの現場で、これらのデータ分析が活用されていることを紹介する。
第3回 クラスター分析
担当講師
菅 由紀子(Rejoui 代表取締役)
内容
クラスター分析の目的と定義を示したあと、分類に用いる距離の概念について講義する。また、クラスター分析で使われる代表的な手法についても紹介する。次に、コンピュータでクラスター分析を行うにあたり、サンプルデータとしてPOSデータ、および、全国の食費の消費データを用いる。最後に、総務省統計局において公開されている教育用標準データセットから、クラスター分析に活用できるデータを紹介する。
第4回 主成分分析
担当講師
朝日 弓未(東京理科大学経営学部 教授)
内容
主成分分析で、どのようなデータを取り扱うのかを示した後、主成分分析の定義および分析手順について解説する。次に、コンピュータによって主成分分析を行うにあたり、教科の試験結果データ、警察官の能力評価データ、魚の形状データといった具体的なデータを用いる。分析結果の解釈の方法についても説明する。最後に、アナリティクスと呼ばれる仕事の目的と内容を紹介したあと、様々なエンジニアやアナリストを支援するコンピュータの活用方法を示す。
第5回 時系列分析
担当講師
黒田 正博(岡山理科大学経営学部 教授)
内容
時系列データの定義をした後、時系列データ分析の目的とその方法について解説する。ここでは、時系列データの視覚化、時系列に従ったデータの傾向変動(トレンド)と季節変動の抽出方法を紹介し、データの時点間の相関を分析する方法を講義する。次に、東京エリアの需要電力量データ、および訪日外客数のデータの説明を行ったあと、これらの具体的なデータを用いて、時系列分析を行う。その後、分析結果の解釈について解説する。最後に、時系列データがどのように社会で活用され、企業での取り組みへとつながっているかを紹介する。

ソフトウェア開発への応用

ソフトウェア開発に従事しようとする学生又はすでに従事している技術者を対象に、統計手法を用いたデータ分析・品質予測の技法や品質改善プロセスなどについて講義し、より高品質なソフトウェアを開発するための知識と技術の習得を目指します。

第1回 ソフトウェア開発における測定と分析
担当講師
小笠原 秀人(千葉工業大学 教授)
内容
ソフトウェア開発における測定と分析について解説する。最初にソフトウェア開発とデータサイエンスの関係について概説し、ソフトウェア開発にデータサイエンスが必要な理由、活用の実態、今後の方向を示す。次に、ソフトウェア開発の定量化・可視化を支える基本的な考え方であるソフトウェアメトリクスについて、その定義を行ったあと、様々なメトリクスを紹介する。最後に、メトリクスの測定と分析方法を学ぶ。メトリクスを用いて測定した結果は、ソフトウェアの品質の向上やプロジェクトでの生産性の向上の指針となることを、事例を用いて紹介する。
第2回 データ分析・品質予測の技法と統計手法
担当講師
小笠原 秀人(千葉工業大学 教授)
内容
測定されたデータの活用方法に焦点をあて、データ分析・品質予測の技法と統計手法について学ぶ。最初にソフトウェア開発におけるデータ分析の技法を学ぶ。目的に応じてさまざまな技法があることを説明し、個々の技法の具体的な使い方を学ぶ。次に、ソフトウェアの品質予測に関する技法を学ぶ。品質予測で利用するモデルは、予測する対象と目的によって異なることを理解し、実用性や開発現場での使用頻度を考慮して分類された閾値モデル、ゾーンモデル、関数モデル、トレンドモデルについて学ぶ。最後に、ソフトウェアメトリクスと統計手法について講義する。ソフトウェア開発をより良くするためには、プロジェクトの実行中と次のプロジェクトに向けて、メトリクスの継続的な測定と分析が必要となる。測定された値を比較するために統計手法を適用する。この講義によって、データ分析・品質予測の技法や統計手法を適用して客観的な結論を見いだすことが重要であることを理解する。
第3回 ソフトウェアの品質改善
担当講師
片峯 恵一(九州工業大学 准教授)
内容
ソフトウェアの品質改善におけるデータサイエンスの応用について講義する。ソフトウェアの不具合を取り除くためのソフトウェアのテストに、開発時間の3割から7割が当てられている例もある。最初に、ソフトウェアの品質について紹介する。続いて、ソフトウェアの品質を改善するための戦略を示す。この戦略を実践するための手法としてPSP、およびTSPがある。前者は個人における開発手法であり、後者はチーム開発における開発手法である。講義では両者における品質改善活動を説明し、複数の品質尺度に関してデータに基づいた事例を紹介する。これらの講義によって、ソフトウェアの品質改善には、データに基づいて評価基準や判断基準を活用し、レビューやインスペクションの効率を向上させることが重要であることを理解する。
第4回 レビューの測定と分析
担当講師
小笠原 秀人(千葉工業大学 教授)
内容
レビューの測定と分析について講義する。最初にソフトウェア開発の概要を紹介し、品質計画として、開発中に埋め込まれる欠陥数とバグ数を予測する必要性を説明する。また、レビューレポートから収集したデータを用いて、バグ予測を行った分析事例も紹介する。次に、レビュー実施計画のポイントとレビューの実施プロセスを紹介する。ここではレビューの準備が重要であることを示す。最後に、プロジェクトで収集・蓄積したレビューデータの分析方法を説明し、データ分析の基本が予定と実績の比較であることを示す。ここでは、目的に応じて分析方法を決めて活用する必要があることを理解できるように、分析・可視化手法の特徴を紹介する。
第5回 テストの測定と分析
担当講師
小笠原 秀人(千葉工業大学 教授)
内容
テストの測定と分析について講義する。最初に、ソフトウェア開発における品質計画という作業の目的を位置づけるために、具体的な品質計画の例を示す。ここでは、テスト設計の重要性と収集したデータから理解すべき事項を理解する。次に、膨大な条件の組み合わせへ対処するために、合理的にテスト項目数を減らす必要があることを示し、組み合わせテスト設計プロセスを事例と共に紹介する。最後に、テストデータの分析方法を学ぶ。テストデータの分析の起点は、開発計画である。また、データ分析の基本は予定と実績の比較である。テストの進捗確認、バグ原因の特定、品質状況の把握といった目的に応じた分析方法を紹介することで、状況に応じて分析方法を選択できるようになることを目指す。
第6回 個人とチームの能力向上
担当講師
片峯 恵一(九州工業大学 准教授)
内容
個人とチームの能力向上について講義する。最初にソフトウェア技術者に必要な能力を紹介し、ソフトウェアの品質を向上させるためには、個人とチームの能力を向上させる必要があることを示す。これによって、品質の改善には、ソフトウェアプロセスを定義し、活用することの重要性を理解する。次に、PSPで個人に求められる能力の向上として、プログラムの規模見積もりやスケジュール計画、タスク計画による計画立案と進捗管理、レビュー能力向上による品質改善への取り組みを示し、これらの活動の事例を紹介する。また、TSPによるチーム能力向上を目指すために、チームのゴールの設定と役割分担、チームによる開発計画の立案、次の開発サイクルに向けた改善提案について講義する。これによって、チームメンバー全員が定量的な評価に基づく継続的な改善を行えるようになることを示す。
第7回 ソフトウェア開発における統計モデル・機械学習の利用(1)
担当講師
阿萬 裕久(愛媛大学 特任教授)
内容
ソフトウェア開発における統計モデル・機械学習の利用例として、最初にFault-Prone モジュール分析を紹介する。Fault-Prone モジュールとは、バグがありそうなプログラムという意味である。Fault-Prone モジュール分析によって、実際にフォールトが見つかったモジュールの特徴を定量的に観測し、どのような特徴や傾向を持ったモジュールに「フォールトが潜んでいそうなのか」を明らかにする。次にメトリクスによる特徴の定量化について講義する。ここでは基本的なメトリクスを紹介し、これらのメトリクスを適用して得た測定値を用いて行う決定木分析、およびロジスティック回帰モデルによる分析事例を紹介する。最後に、予測モデルの構築と評価を学ぶ。これによって、様々な分析のモデルが、予測モデルとして使えることを理解する。
第8回 ソフトウェア開発における統計モデル・機械学習の利用(2)
担当講師
阿萬 裕久(愛媛大学 特任教授)
内容
リポジトリマイニングに関連する話題を紹介する。「ソフトウェアリポジトリ」には、ソフトウェア開発の成果物やそれに関するデータが蓄積されて管理されている。リポジトリマイニングでは、フォールトの修正で書き換えられた部分が、いつの時点で書かれたものであったのかを調べる。最初に、これらの用語の定義をして、リポジトリマイニングの意義を示す。次に、リポジトリマイニングによるフォールト混入予測の例を、基本的なプロセスメトリクスと共に紹介する。最後に、プログラム間の繋がりを分析する技術として、プログラム内の相関ルールマイニングを行って、ロジカルカップリングを検出する例を紹介する。

リハビリテーション科学のDX

本講座では、データサイエンスの手法が、リハビリテーション分野でどのように活用されるのか、豊富な事例を交えて解説を行うことで、当該分野に興味を持つ学生、または、すでに業務としている技術者にとって有益な知識を提供することを目指す。

第1回 機器による計測・評価
担当講師
片桐 祥雅(東京大学 上席研究員)川原 靖弘(放送大学 准教授)
内容
さまざまな機器を用いたデータ収集の方法とデータの分析方法、そこから読み取る事柄を講義し、この分野におけるデータの有効活用のための知識と技術を得られることを目指す。 最初に、呼吸リハビリテーションについて解説する。ここでは、肺機能を評価するためのスパイロメータと呼ばれる機器による観察と評価について解説する。次に、姿勢制御のメカニズムを解説した後、重心動揺計やモーションキャプチャーシステムを導入して姿勢バランスを評価する事例を紹介する。最後に発話運動と構音障害のリハビリテーションについて触れ、発話の特徴を評価するために、音声解析ソフトを用いた音響学的な音声解析を行う例を紹介する。
第2回 人間による計測・評価
担当講師
片桐 祥雅(東京大学 上席研究員)川原 靖弘(放送大学 准教授)
内容
医療者やセラピストなどリハビリテーションに携わる”人間”によるデータ収集や分析がテーマである。人間の経験知に基づく計測・評価をいかにデータサイエンスに結びつけ、実践に活かしていくかを考える。 最初に失語症における検査を数値化することで言語機能を把握する事例を紹介する。次に認知症を事例として取り挙げ、認知機能を検査するための音声対話AIエージェント・システム AIKoを紹介する。最後に音楽療法について解説する。音楽療法の効果を定量的に評価する指標にFIM(Functional independence measure)がある。これによって観測された評価結果を主成分分析すると、精神面、および身体面、それぞれの自立の度合いを評価できる。このような分析結果を得ることで、リハビリテーションの計画を立てることが可能となる。また、データを時系列でとることで、セラピストの介入による効果の推移を知ることもできる。
第3回 課題と将来の方向性
担当講師
片桐 祥雅(東京大学 上席研究員)川原 靖弘(放送大学 准教授)
内容
リハビリテーション科学におけるデータサイエンス活用の現状での課題と、将来の方向性・可能性について考える。 リハビリテーションでは、対象となる方の医学的情報とともに検査を行うことでリハビリ上の問題点を抽出し、機能回復に向けた訓練の立案実施を行っている。 本講義では,最初に、失語症の言語リハビリテーションの効果を知るために使われている脳機能計測の研究を紹介する。次に、近年リラクゼーションの効果があるとして、関心が高まっていアロマ療法について触れる。ある施術や訓練の効果に対する信頼性は、エビデンスレベルによってレベル分けされる。アロマに関する研究は多いが、エビデンスレベルを高めることが課題である。最後に医療現場で、臨床研究により明らかにされたエビデンスレベルの低い成果を、どのように治療に活用していくのかを考え、医療・リハビリテーションではSOAPという形式の診療記録が残されている。これらのデータを用いるデータサイエンスあるいはAIへの期待について解説する。

地理空間情報とデータサイエンス

地理空間情報とそれを扱う地理情報システム(GIS)の基礎を学んだ後、空間事象の特徴を把握するための視覚的な分析についての理解を深めます。また、機械学習や深層学習といった技術が地理空間情報分野でどのように活用されているかを、具体例を通じて学習します。

第1回 地理空間情報の基礎と可視化
担当講師
山田 郁穂(東京大学 教授)
内容
地理空間情報の基礎と可視化について解説する。最初に、地理空間情報について、それを扱うコンピュータシステムである地理情報システム(GIS)や基盤となる学問分野である空間情報科学など、関連する概念と併せて概説する。次に、地理空間情報として扱われる様々な空間データを紹介する。ベクタ型・ラスタ型という基本的な空間データの構造について説明した後、最近登場した新しいタイプの空間データについても紹介する。最後に、空間データの可視化について説明する。空間データを、地図として表現することは、空間データの分布の特徴を理解するための第一歩である。ここでは様々な可視化の手法を事例を交えて紹介する。
第2回 地理空間情報の統計分析
担当講師
山田 郁穂(東京大学 教授)
内容
地理空間情報を統計的に分析するためのさまざまな手法を、相関分析や回帰分析など一般の統計分析手法と関連づけながら学習する。 最初に、空間データを分析する際に大切な空間データの特性を解説したあと、空間データの分析によく用いられる領域分析を紹介する。次に、地物を点として表現した点データについて、その空間分布に着目した分析手法を事例を交えて説明する。最後に、面データに付加された人口や人口密度などの属性情報について、その空間分布の特性を分析する手法と属性間の関係性をモデル化する手法を紹介する。
第3回 地理空間情報とビッグデータ活用
担当講師
沖 拓弥(東京工業大学 准教授)
内容
近年、普及が進んでいる地理空間情報ビッグデータを概観した上で、それらの主要な分析方法について学習する。 最初に、地理空間情報ビッグデータ活用について、その意義、種類、現状について解説する。次に、地理空間情報ビッグデータ活用の分析手法を取り上げ、特に地理空間情報ビッグデータの主要な分析方法の中から、次元削減の手法について解説する。最後に、地理空間情報ビッグデータ活用の分析手法の中から、クラスタリング、回帰分析、異常値検知について講義する。
第4回 地理空間情報とAI・機械学習の活用
担当講師
沖 拓弥(東京工業大学 准教授)
内容
AIや機械学習の概要をおさえた上で、地理空間情報分野でAIや機械学習がどのように活用されているかを、具体例を通じて学習する。最初に機械学習に関する技術を概観し、建築・都市計画研究において、どのようにAIが活用されているのかを、現状と将来に対する展望を合わせて紹介する。また、実際の画像・映像処理技術の活用について、事例を用いて解説する。次に、建築・都市計画研究におけるAI活用の例として、深層学習を活用した判別・回帰について講義し、複数の事例を紹介する。AI活用の最後の例として、画像生成についても解説する。本講義で紹介した事例から、地理空間情報とAI・機械学習をベースに、より良い建築・都市づくりを行うためには、AIの強みと弱みを共に理解した上で、AIと私たち人間が共働していく姿勢が重要であることを学ぶ。

コミュニケーション学への応用

第1回 コミュニケーション学への応用
担当講師
高井 次郎(名古屋大学大学院 教授)
内容
数理・データサイエンス・AI専門講座は、応用基礎レベルの教育を終えた人々が、それぞれの領域でデータサイエンスを活用する専門家の入り口として学ぶ内容を含めるように企画している。 コミュニケーション学の研究において、先行研究などから導き出された仮説をアンケートで集めたデータによって検証する場合などによく用いられる統計的手法を紹介する。連続変数による正規分布の回答に基づくデータを前提とした上で、項目・尺度分析(項目分析、因子分析、信頼性係数)、平均値の差の検定(分散分析)、変数間の因果関係(相関係数、重回帰分析、構造方程式)について説明する。

企業経営における実際

企業におけるデータサイエンスの適用事例をデジタルトランスフォーメーションという側面から講義する。講義は、マーケティング、

営業活動への適用事例と適用技術の両側面から紹介する。

第1回 企業のデータ活用と求められる人材
担当講師
佐々木 宏(立教大学 教授)
内容
企業のデータ活用と求められる人材とはどのようなものなのかを複数の視点から捉えると共に、生産設備の制御事業をグローバルに展開する企業からDX の先端事例を紹介する。最初にDXで求められている事柄を、人材、技術、組織という3つの視点から論ずる。次に、データ活用という側面から、企業におけるデータ活用基盤を紹介する。最後に収集したデータを分析する時に使用するBI ツール(Business Intelligence Tool)の適用例を紹介する。
第2回 消費者理解のためのデータ活用
担当講師
柿原 正郎(東京理科大学 教授)
内容
私たちの回りで実際に体験しているデジタルによる変化を理解しながら、企業としてどのように消費者を理解していけばよいのか、また、それをどのように実際のビジネスにつなげていくべきなのかを議論する。講義では、最初に、デジタル技術の発展と普及によって、私たち自身の生活や消費行動に生じた変化を考察し、次に、これらの変化に対して、企業が収集すべきデータとデータ分析の方法と効果を講義する。最後に、実際のビジネスにインパクトを与えるような施策につなげるために必要となる「インサイト」という考え方について学ぶ。
第3回 機械学習のマーケティング応用
担当講師
生田目 崇(中央大学 教授)
内容
マーケティングにおけるデータサイエンス、特に、データ活用について講義する。最初に、マーケティングについて簡単に解説した後、マーケティング分野の分析で使われているデータと、収集方法をまとめる。また、ビッグデータの活用が期待される現代において、情報活用データ活用とデータ利用制限はトレードオフの関係にある。個人情報や情報プライバシーに関する各国の規制について触れる。また、機械学習の手法についても解説し、マーケティング分野における機械学習手法の活用の方向性を紹介する。最後に、 様々な機械学習の成果の活用状況を明らかにするために、マーケティング分野でのコンサルティングやシステム開発を行っている企業の方へのインタビューを紹介し、その「実際」と「課題」や「期待」を考察する。
第4回 営業活動におけるデータサイエンス
担当講師
北中 英明(拓殖大学 教授)
内容
本講義の目的は、営業活動におけるデータサイエンスの現状を学ぶことである。最初に営業活動を支える情報システムについて学ぶ。次に、営業活動におけるデータ活用の実態について学んだ後、企業の方へのインタビューを紹介しながら、実際の営業活動の状況を紹介する。最後に、営業活動の将来を展望する。

放送大学 データサイエンス5つの魅力

自己点検評価報告書 令和 3 年度 (2021年度)

放送大学における数理・データサイエンス・AI 教育プログラム
「データサイエンスリテラシープラン」「データサイエンスアドバンスプラン」 自己点検評価報告書

1. はじめに

本報告書は、令和 3 年度より本学の科目群履修認証制度におけるプランとして実施している数理・データサイエンス・AI 教育の実施状況に関する自己点検評価の結果をまとめたものである。 教育プログラム授業評価アンケートにおける個々の授業の理解度や難易度は、通常の授業に比べてほぼ同程度かやや低い程度といえる。プログラムを構成する科目の理解度や難易度が反映されているものと推察した。アドバンスプランで理解度が低下しているが、授業科目の内容自体がリテラシーレベルに比べて高度になっていることが反映されたのかもしれない。

我が国では現在、政府が定めた AI 戦略 2019、その改訂版というべき AI 戦略 2021 に基づき数理・データサイエンス・AI 教育が推進されている。これに則り、大学及び高等専門学校における数理・データサイエンス・AI 教育プログラムのうち、所定の条件を満たした優れたものを国が認定する「数理・データサイエンス・AI 教育プログラム認定制度」が既に実施されている。「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」は、同制度を念頭に置きつつ、放送大学の特質を踏まえ放送大学でも展開可能な形の教育プログラムとして令和 2 年度より検討が進められ、令和 3 年度より実施されているものである。

放送大学は、大学としての教育を実施するために、放送授業、あるいはオンデマンド型オンライン授業として良質なものを体系的に制作し提供し続けなければならない。そのような授業の制作には、企画立案、制作準備、印刷教材の執筆と編集・印刷、放送教材やオンライン教材の制作・収録・編集という手順を踏む必要があり、企画立案から授業の開設までおよそ 3 年を要する。今回実施する運びとなった「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」は、国が定める条件を満たすように既存の授業を組み合わせて教育プログラムとして編成したが、今後、このプログラムの点検評価を通じて改善点を明らかにし、プログラムの改善を進めるとともに、新規の授業の制作にも生かしていきたい。

2. 自己点検評価の項目

「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」の自己点検評価にあたっては、以下の各点を適切に評価することを通じて、教育プログラムとして改善すべき点を明らかにすることを目標とした。

① 履修・修得状況(3-1 節)

「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」の少なくとも一方で必修科目または選択必修科目に指定されている科目の履修者数の推移から、データサイエンスに関心を持つ学生の動向を把握する。また、「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」の修了者数の推移を、同プランの前身である「データサイエンスプラン」の修了者数の推移とあわせて比較検討し、数理・データサイエンス・AI について体系的に学んだ学生の動向を把握する。以上の結果から、履修者数の増加に向けた計画の達成・進捗状況を評価する。

② 学修成果(3-2 節)

本学で既に実施している学生による授業科目評価の結果と、各授業科目の成績に基づき、個々の授業科目の内容についての学生の理解度を把握する。また、学生による授業科目評価では、授業に関わる多様な項目について評価している。この結果から、「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」を構成する授業科目についての課題を抽出する。

③ 修了者アンケート結果の検討(3-3 節)

「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」を修了した学生を対象として実施しているアンケートから、同プランについて以下の各点を評価する。

④ 放送大学の数理・データサイエンス・AI 教育に対する学外からの意見(3-4 節)

放送大学は、授業とは別に、開発した教材を学外向けに広く提供している。これらの教材のうち、リテラシーレベルに対応するものの利用状況や、利用者からの意見を把握して、本学の数理・データサイエンス・AI 教材における学外から見た課題を検討する。今後、より上のレベルの教材の公開が始まったら、それらについての利用状況や意見も同様に判断材料とする。
また、学外の研究者に依頼して「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」について直接的な評価をいただくことも試みる。

3. 令和 3 年度実施内容に対する自己点検評価の概要

3-1 履修・修得状況ならびに修了者数の増加に向けた計画の達成・進捗状況

必修科目・選択必修科目履修者数から見た動向

「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」については、所定の科目を履修した学生に対してプラン(教育プログラム)の修了を認定する制度であるため、修了を目指して学ぶ学生の数をその都度把握することができない。そこで、両プランの少なくとも一方において必修科目または選択必修科目とされている科目の履修者数の動向から、データサイエンスに関心を持つ学生の動向を把握することを試みた(表 1)。この表から、社会統計学入門、Java プログラミングの基礎(オンライン授業科目)、C言語基礎演習(オンライン授業科目)の三科目を除き、履修者は増加傾向にあることがわかる。2020 年度ならびに 2021 年度はコロナウィルス感染症の世界的な流行により社会が大きな影響を受けた期間でもあり、そのことが履修者数の動向に影響を及ぼした可能性もなしとはしないが、理由はともあれ数理・データサイエンス・AI 関連分野の授業科目への関心はこの間高まっていたものと評価できる。必修ないし選択必修科目にオンライン授業科目は 4 科目が含まれている。このうち 2 科目は 2021 年度に新規に開設された科目のため、まだ増減の傾向を把握できない。残り 2科目は履修者が減少傾向にあり、オンライン授業科目が開設初年度に特に好まれる傾向があるのか、あるいは 授業内容が演習の要素を含んでいることから、単位取得の難易度が高いという評判が口コミで広がってしまうためなのか、今後検討を要する。

修了者数から見た動向

前身の「データサイエンスプラン」が平成 30 年度に開設されて以降、修了者数は年々着実に増加している(表 2)。本年度、「データサイエンスプラン」を見直し、国の「数理・データサイエンス・AI 教育プログラム認定制度」におけるリテラシーレベルに対応した「データサイエンス リテラシープラン」と、 同制度の応用基礎レベルに対応した「データサイエンス アドバンスプラン」の 2 つのプランに再編して新たに実施したところ、修了者数はさらに増加する傾向を示した。この 2 つの新しいプランが学習者の増加をもたらした効果については、実施初年度の状況のみでは十分に評価しがたいことから、今後も引き続き動向に注意していきたい。
表 2 修了者数の経年変化(科⽬等履修⽣を含む)
なお、⻑期にわたり計画的に履修する学生が多く在籍するという放送大学の特性を踏まえ、モデルカリキュラムに必ずしも適合していない「データサイエンスプラン」も引き続き履修可能としてある。増加傾向にあるとはいえ、2021 年度の修了者数でも本学の学生全体約 6 万人に対して0.1%、毎年の新入学者約 6 千人に対し 1%強に過ぎない。さらに多くの学生に履修を促す必要があると考える。履修者数・履修率の向上に向けた計画の達成・進捗状況履修者数について、計画では、2022 年度は「データサイエンス リテラシープラン」80名、「データサイエンス アドバンスプラン」40 名となっている。現在のペースで修了者が増加すれば達成可能な数字ではあるが、適宜広報を行うなどして計画の達成に努めることが望まれる。

3-2 学修成果

対象授業科目における成績分布から認められる傾向

「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」を構成する授業科目の成績分布を表 3(放送授業)ならびに表 4(オンライン授業)に示した。履修者に対する合格者の割合(合格率 1)の平均は約 67.4%、受験者に対する合格者の割合(合格率 2)の平均は約 85.4%である。2021 年度 2 学期は、コロナ禍の影響で従来通りの単位認定試験が実施できず、制限時間の遵守、テキストやノート等の参照禁止などを受験者の良心に委ねた自宅受験方式により単位認定試験を行ったものだが、履修者のうち受験に至らなかったものが相当数いたために、合格率 1 の値がこのように低くなっている。
表 3 教育プログラム構成科⽬(放送授業科⽬)の成績分布(2021 年度 2 学期)
表 4 教育プログラム構成科⽬(オンライン授業科⽬)の成績分布(2021 年度 2 学期)
自宅受験方式によりゆがめられた部分はあるとはいえ、合格率や、履修者のうち単位認定試験の受験に至る割合を科目別に検討することで、2 つのプログラムを構成する授業科目に対する受講者の理解度について、傾向を把握することができる。

オンライン授業など実技を伴う科目の合格率は低い。

表 4 に示した 4 科目と、「データの分析と知識発見(’20)」は、授業中に実習の要素を含んでいる。これらの実習や演習を含む科目の合格率はおしなべて低くなっている。合格率 2 が低いことから、実技を伴う科目では、学習に取り組んでも成果を得るに至らない学生が相対的に多いことがうかがえる。但し、オンライン授業科目と放送授業科目では「受験者」の定義が異なる点に注意が必要である。1 回授業を受けてその後学習を放棄する学生は、放送授業科目では(試験を受けていないため)未受験者にカウントされるが、オンライン授業科目では(オンライン授業のシステムにアクセスした履歴が残るため)受験者にカウントされる。

数学に関連する科目の合格率は低い。

「解析入門」「初歩からの数学」「入門線形代数」の合格率は非常に低い。これは、受験率が低いことに大きく影響されており、いずれの科目も 1/3 以上の履修者が単位認定試験の受験を行っていない(この 3 科目は、今回評価対象とした科目の中で、受験に至った率が小さい方から第 1,2,5 位である)。それだけでなく、受験した学生の合格率(合格率 2)も、3 科目平均で約 80%と、低めの値となっている。

統計学に関連する科目の合格率も低い。

「社会統計学入門」「心理学統計法」「統計学」の合格率も全体的に低めになっている。いずれの科目も 1/4 弱の履修者が単位認定試験を受験せず、受験した学生の合格率の平均もやはり約 80%となっている。数学と統計学については、数式を扱う必要があることが一部の学生にとって抵抗になっているのかもしれない。統計学的な内容の最初歩を、できるだけ数式を使わず、身近な例を通じて教授する「身近な統計」では、受験率 78.0%、受験者の合格率 93.1%となっており、この段階であれば、努力して最後まで学習すれば高い割合で成果を得られること、一方でそのような難易度であっても 2 得割以上の履修者が中途で学習を断念していることがうかがえる。

受験に至る履修者の割合(受験率)と合格した受験者の割合(合格率 2)の相関は低い。それぞれの授業科目を分析単位とすることの妥当性は問題ではあるが、機械的に相関係数を計算すると 0.167 という値が得られる。「身近な統計」のように脱落者はそれなりにいても試験を受ければ多くが合格するという科目がある、といった状況が関係していると考えられた。この点を詳細に検討するためには、各科目の試験問題について分析する必要があり、それは今後の課題とする。
以上の検討から、当面、履修を開始した学生が単位認定試験受験を行えるまで学習を継続させる取り組みが必要であり、特に数学や統計学、数理系の科目など、数式を用いて授業が進行する科目ではそうした取り組みが重要であろうと考えられた。一方、オンライン授業科目など実技を含む授業科目では、学生がどのようなところを理解できていないのか把握して,それを踏まえて授業を改善することが必要と考えられた。これらの点をより詳細に把握して授業や教育プログラムの改善に生かしていくために、Learning Analytics の活用なども検討課題となろう。

対象授業科目に対する授業評価アンケートから認められる傾向

全体的に、人文科学、社会科学系の科目に比べると評価が低い傾向が認められる。放送大学がこれまで実施してきた授業評価アンケートでは、授業科目の総合的な評価を、学習意欲や関心の増大、新たな知識や視野を得られたかどうか、科目全体の内容の理解度、科目に対する満足度の4項目から評価している。今回、「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」の少なくとも一方で必修科目ないし選択必修科目に指定されている 16 科目を対象に分析を行ったが、調査実施学期における対象科目の平均の評点を超えたのは、そのうち 3 科目に留まった。
放送授業について、評価項目間の評点の相関係数を計算した結果を表 5 に示す。表 5 教育プログラムにおける必修ないし選択必修科⽬(放送授業科⽬)の授業評価における評価項⽬間の相関(各授業科⽬の開設学期における調査結果)

明らかに認められるのは、履修者、受験者が多い科目はどの項目でも評価が低くなる傾向があったことである。履修者や受験者が多いということは、放送大学の場合、学習意欲が高い学生が集まったというよりは、何らかの理由により(例えば、心理学を学ぶためには心理統計学を勉強しないといけない、といった形で)学習しなければならないという動機付けがなされている科目であることが推察され、そのような科目では学習効果が低下することを示唆する結果である可能性がある。
次いで、難易度に関する評価が総合的な評価に強く影響している可能性を読み取ることができる。難易度が適切だと評価された科目ほど、授業内容の理解度や科目満足度が高く評価され、また、関心が高まったとされているということである。この調査では、難易度については適切であるかどうかという形で聞いており、適切でないことがすなわち難しすぎるというわけではないが、自由回答記述において難易度に言及したものの中で、易しすぎたという回答は少数に留まり、大半は、難しすぎた、もっと基本の所から説明してほしい、など履修者にとって難度が高かったとする意見であった。

難易度の他、教材の量が適切であること、放送授業や印刷教材の内容が適切である(わかりやすい)こと、通信指導の有用性や試験の妥当性が、評価に比較的強く関わっていたものと考えられた。
評価とあまり関係がないと認められたのは、合格率、放送授業を十分に視聴したかどうか、授業内容がメディア(テレビやラジオ)の特性を生かしたものであったか、の各項目であった。テキスト(放送大学では印刷教材と称している)を熱心に学んだことが評価と比較的強い相関を示したことと対比すると、数理・データサイエンス・AI 分野を学ぶ学生にとって、放送授業はそれほど重要ではなく印刷教材を重視して勉強している可能性が考えられた。

数学系の科目はいずれのプラン(教育プログラム)でも必修や選択必修ではないためここでは取り上げなかったが、統計学関連の科目は概して評価が低い傾向があった。ただ、理解度において「身近な統計」が「統計学」や「社会統計学入門」より低評価となったことについては、「身近な統計」では初学者の受講が多く内容を難しく感じる受講者が多かった点を考慮する必要がある。

3-3 修了者アンケート結果の検討

表 6 に、アンケートにおいて 5 段階評価された各項目について、評点の算術平均値を、授業評価アンケートと尺度を揃えるために 4 点満点(最低点は0点ではなく1点)に換算して示した。
表6 修了者アンケート結果の概要

理解度・難易度

授業評価アンケートにおける個々の授業の理解度や難易度とほぼ同程度かやや低い程度といえる。プログラムを構成する科目の理解度や難易度が反映されているものと推察した。アドバンスプランで理解度が低下しているが、授業科目の内容自体がリテラシーレベルに比べて高度になっていることが反映されたのかもしれない。

具体的事例

評価が低かった項目であり、今後改善を要する点である。問題は、学習者によって関心の方向性が大きく異なる点である。例えば、野球選手の打撃成績、投球成績などはデータ分析の材料とされやすく、「身近な統計」でも取り上げられているが、自由記述の中には、自分は野球には関心がないので何のことだかわからなかった、というものがあった。限られた時間の中で全ての学生が満足できる事例を取り上げることができるかどうか、あるいはそれぞれの学生に会った事例を題材に学ぶことができる教材や授業を制作できるかどうかが課題になると考える。

学習意欲の向上

授業評価アンケートにおける評価とほぼ同程度かやや低い評価になったと考える。理解度や難易度と同様に、プログラムを構成する科目についての評価が反映されているものと推察した。

他の学生に対する推奨度

評価が低かった項目であるが、自由記述を検討してもその理由は判然としなかった。修了者の進路、活躍状況等「データサイエンス リテラシープラン」「データサイエンス アドバンスプラン」の修了者の職業構成、年齢構成を表 7 に示した。
表7 修了者の年齢構成

放送大学の特性を反映し、既に職に就いているかたが大半を占め、現在の仕事に役立てたいという意図が、選択式で回答していただいた学修成果の活用可能性や(仕事での実務を挙げたかたが、リテラシープランで 24 名中 12 名、アドバンスプランで 14 名中 9名)、自由記述からはうかがえた。退職後のかたは 6 名であり、自由記述の内容からは純粋にこの分野の内容に関心をお持ちであることがうかがえた。「上記以外(無職)」は 40代が2名、60 代が3名であり、このかたがたは今後の就職に役立てることを意識している可能性があるが、職業や就職に関連する内容の回答は見られなかった。
なお、学修成果の活用可能性として仕事での実務を挙げたかたとそうでないかたの間で評価結果を比較したところ、理解度と学習意欲の向上において、仕事への実務を挙げたかたによる評価が高い傾向が認められた。アドバンスプランについてのみ、学修成果の活用可能性として仕事での実務を挙げたかたはそうでないかたと比べて、他の学生に対する推奨度が高い傾向が見られた。具体的事例の導入や実務に直結する内容の強化といった課題はあるものの、実務に生かすことを念頭に学んだ学生にとっては有意義な内容であったものと推察された。

学びの意義の理解

現時点では、数理・データサイエンス・AI の学習の意義をプログラムの修了者がどこまで理解できたかを十分に評価できていない。今後、質問項目を見直し、こうした点についても評価できるようにする工夫が必要だろう。回答を蓄積し、個別の授業科目に対するものも含めて自由記述をテキストアナリシスにより分析することで、現状の項目のままでも本件についても検討を行うことができるかもしれない。わかりやすい授業に向けての課題の抽出自由記述を見る限り、以下の点が問題にされていると判断できる。

これらについては、今後の検討課題とする。なお、初歩的な内容を求める意見については、現在の内容で既に大学の授業として最低限の難度になっており、これ以上の易化は大学の正規の授業としては不適切との意見もありえる。リメディアル教育の充実が求められるところであるが、リメディアル教育と銘打った授業を受けることに抵抗感を持つ学生もいると思われ、微妙な対応が必要になるかもしれない。

3-4 放送大学の数理・データサイエンス・AI 教育に対する学外からの意見

放送大学の数理・データサイエンス・AI 教材の利用状況

放送大学では、体系的に編集された公開講座を修了した方に対して、放送大学が独自の認証を行うキャリアアップ支援認証制度を展開している。現在、「数理・データサイエンス・AI 講座」として「データサイエンス基礎から応用」「数理・データサイエンス・AI
リテラシー講座 導入」「デジタル社会のデータリテラシー」「数理・データサイエンス・AI リテラシー講座 基礎」「数理・データサイエンス・AI リテラシー講座 心得」の 5 講座を開設している。これらはいずれも、数理・データサイエンス・AI モデルカリキュラムの
リテラシーレベルに対応するものである。詳細はhttps://aoba.ouj.ac.jp/rpv/home/default.aspx をご覧いただきたい。

令和 3 年度に開講したこれら5講座の受講者は、個人受講:延べ 1,414 人、集団受講:延べ 2,551 人、総計:延べ 3,965 人となっている。個人受講における科目別受講人数は、以下のとおりである。

現状では明確な判断は難しいが、集団受講には大学によるものと企業によるものが含まれていることから、放送大学の数理・データサイエンス・AI 教材が社会にも受け入れられつつある一つの証左とみることができると考える。

学外の研究者からの評価

本年度は、佐賀大学理工学部情報部門の掛下哲郎准教授にご意見を賜った。いただいたご意見の要点は以下の通りであった。

  1. 放送大学はテレビ放送やオンライン授業を中心とした教育を行っている.提供されている教育コンテンツはよく洗練されており,内容的にも充実している.高度なビデオ編集技術や完備したシナリオ等を駆使して,効率的に学習できるように工夫されている.
  2. 課題はあるが,リテラシープラン,アドバンスプランとも充実した内容である.
  3. 履修者がスキルを身につけるための演習課題の提供および,課題を提出した履修者に対する個別指導への対応が課題になっている.
  4. この問題を解決するために,(1) 他大学と連携した演習体制の構築および,(2) 履修者が提出した演習課題を自動点検するツール(例:Checkstyle 等のコードチェックツール,JUnit 等の自動テストツール)の活用を推進することが望まれる.
  5. 2021 年 2 月に大学設置基準が改訂され,複数の大学が連携して科目を開設することが可能になった(大学設置基準第 19 条の 2 第 1 項).また,複数大学が共同して課程を編成することも可能になった(大学設置基準第 43 条第 1 項).こうした制度を有効に活用することで,オンライン授業を得意とする放送大学の強みを活かすと同時に,演習の実施体制を強化することが期待される.
  6. 演習等の実施について課題があるため,この点の改善が望まれる.
  7. 実質的な必修科目および選択必修科目だけで必要な単位を修得できるため,学生が選択科目を履修するモチベーションが生まれにくい点について、今後の改善が必要である.

4 総括

プログラムは概ね適切に構成され、運用についても、初年度としては概ね順調に進捗していると評価したい。構成科目の履修者数、履修者の理解度、プログラム修了者の満足度など、主要な指標は概ね良好な結果を示した。但し、佐賀大学の掛下先生よりご指摘を賜ったように、個別の指導の実施、演習等の実施について、今後改善が必要と考える。通信制大学としての放送大学のあり方を考えると、個別指導、演習ともに、容易には対応しがたい事項ではある。しかしながら、同じく掛下先生のご指摘にあるように、2021 年の大学設置基準改定に伴い他大学との連携の可能性が拡大したことを踏まえるなら、連携を前提とした教育制度の導入など、新しい試みを今後検討し、学生の学習環境の改善を進めていくことが必要だろう。

資料 1 「データサイエンス リテラシープラン」修了者アンケートの結果

Q1 ご年齢を教えてください。
Q2 現在のご職業を教えてください。
Q3 アドバンスプランの学修を通じて、数理・データサイエンス・AI への理解が深まったと思いますか。(5:とてもそう思う〜1:全くそう思わない)
Q4 アドバンスプランの内容は分かりやすかったですか。(5:とてもそう思う〜1:全くそう思わない)
Q5.アドバンスプランの内容には、データサイエンスや AI の活用に関する事例が豊富に含まれていたと思いますか。(5:とてもそう思う〜1:全くそう思わない)
Q6.アドバンスプランの学修を通じて、もっと深い知識を学んでみたいと思いましたか。(5:とてもそう思う〜1:全くそう思わない)
Q7.本プランの学修を通して得た知識や考え方はどのように活用できると思いますか(複数回答可)
Q8.アドバンスプランの学修について、他の学生にも勧めたいと思いますか。(5:とてもそう思う〜1:全くそう思わない)
Q9.数理・データサイエンス・AI に関して、今後の講義に期待する内容があれば教えてください。(自由記述)

資料 2 「データサイエンス アドバンスプラン」修了者アンケートの結果

Q1 ご年齢を教えてください。
Q2 現在のご職業を教えてください。
Q3 アドバンスプランの学修を通じて、数理・データサイエンス・AI への理解が深まったと思いますか。(5:とてもそう思う〜1:全くそう思わない)
Q4 アドバンスプランの内容は分かりやすかったですか。(5:とてもそう思う〜1:全くそう思わない)
Q5.アドバンスプランの内容には、データサイエンスや AI の活用に関する事例が豊富に含まれていたと思いますか。(5:とてもそう思う〜1:全くそう思わない)
Q6.アドバンスプランの学修を通じて、もっと深い知識を学んでみたいと思いましたか。(5:とてもそう思う〜1:全くそう思わない)
Q7.本プランの学修を通して得た知識や考え方はどのように活用できると思いますか(複数回答可)
Q8.アドバンスプランの学修について、他の学生にも勧めたいと思いますか。(5:とてもそう思う〜1:全くそう思わない)
Q9.数理・データサイエンス・AI に関して、今後の講義に期待する内容があれば教えてください。(自由記述)

外部評価報告書 令和3年度(2021年度)

2022 年 5 月 15 日

放送大学・データサイエンス教育に対する評価報告書

掛下哲郎(佐賀大学 理工学部)

1.はじめに

本報告書は,放送大学が提供するデータサイエンス分野の科目群履修認証制度(学内学生向け)に対する評価結果をまとめたものである.2 節では科目群履修認証制度の全体的な事項に対する筆者の意見およびコメントを示す.3 節では数理・データサイエンス・AI 教育プログラム認定制度におけるリテラシーレベルに対応したデータサイエンスリテラシープラン(以下,リテラシープラン)の評価を,4 節では同認定制度における応用基礎レベルに対応したデータサイエンスアドバンスプラン(以下,アドバンスプラン)に対する筆者の意見・コメントをそれぞれ示す.
本報告書に示した意見・コメントを踏まえて今後の改善に努めることを期待する.

2.両プランに共通する事項に対する意見・コメント

  1. 放送大学はテレビ放送やオンライン授業を中心とした教育を行っている.提供されている教育コンテンツはよく洗練されており,内容的にも充実している.高度なビデオ編集技術や完備したシナリオ等を駆使して,効率的に学習できるように工夫されている.
  2. ほぼ全ての授業で毎年の受講者数が 100 名を超えており,中には 1000 名を超えるものもある.それだけ多くの受講者に支持されていることを示しており,高く評価できる.
  3. 後述する課題はあるが,リテラシープラン,アドバンスプランとも充実した内容である.両プランとも受講場所や受講時間帯の制約がないオンライン受講が可能なことから,学内学生向けのみならず,他大学の学生や現役のビジネスマン等にも両プランの履修機会を広く提供することが望まれる.これにより,日本におけるデータサイエンス教育の普及が進むことが期待される.
  4. 履修者がスキルを身につけるための演習課題の提供および,課題を提出した履修者に対する個別指導への対応が課題になっている.学生数に対する教員数が一般の大学と比較して少ないため,個別指導の体制を構築することも難しいことが想定される.この問題を解決するために,(1) 他大学と連携した演習体制の構築および,(2) 履修者が提出した演習課題を自動点検するツール(例:Checkstyle 等のコードチェックツール,JUnit 等の自動テストツール)の活用を推進することが望まれる.データサイエンス教育においては,IT 分野の授業科目が多いことを考慮すると,ツールによる自動点検も比較的進めやすいと考えられる.
  5. コロナ禍をきっかけに,一般の大学等でもオンライン授業やハイブリッド授業がかなり普及しており,先進的な大学では,Zoom 等を活用したオンラインでの実験・演習や個別指導,各種のソフトウェアツール等を活用した提出物の自動点検・フィードバックなども実践されている.他大学との連携を強めることを通じて,こうしたノウハウの導入を進めることが期待される.
  6. 2021年2月に大学設置基準が改訂され,複数の大学が連携して科目を開設することが可能になった(大学設置基準第 19 条の 2 第 1 項).また,複数大学が共同して課程を編成することも可能になった(大学設置基準第 43 条第 1 項).こうした制度を有効に活用することで,オンライン授業を得意とする放送大学の強みを活かすと同時に,演習の実施体制を強化することが期待される.

3.リテラシープランに対する意見・コメント

  1. リテラシープランでは 8 単位以上の履修を義務付けている.これは,「数理・データサイエンス・A(I リテラシーレベル)モデルカリキュラム 〜データ思考の涵養〜」(以下,リテラシーレベル・カリキュラム)が想定するコア学習項目の学修量(おおむね 2 単位相当程度)を十分にカバーしている.
  2. リテラシーレベル・カリキュラムでは,履修者に知識を身に付けさせることに留まらず,演習やグループワークを課すことも推奨されている.リテラシープランにおいては演習等の実施について課題があるため,この点の改善が望まれる.
  3. リテラシーレベル・カリキュラムは,高校学習指導要領の改訂や今後社会で求められるリテラシーの変化などを踏まえ,2023 年度を目途に見直される予定である.この点を踏まえて,リテラシープランの教育内容が継続的に改善されることが期待される.
  4. 「情報技術が拓く人間理解」「情報学へのとびら」「身近な統計」の 3 科目 6 単位が実質的に必修科目である.また,項目⑥(プログラミング)に対応する選択必修科目から少なくとも 1 科目(1〜2 単位)を履修しなければならない.これらの科目のシラバスを点検したが,いずれも充実した内容であり,大きな問題は見られない.
  5. リテラシープランでは選択科目が設定されているが,実質的な必修科目および選択必修科目だけで 7〜8 単位を修得するため,学生が選択科目を履修するモチベーションが生まれにくいことが想定される.そうした事態が観察される場合には,今後の改善が必要である.

4.アドバンスプランに対する意見・コメント

  1. アドバンスプランでは 12 単位以上の履修を義務付けている.これは,リテラシーレベル・カリキュラムおよび「数理・データサイエンス・AI(応用基礎レベル)モデルカリキュラム 〜AI×データ活用の実践〜」(以下,応用基礎レベル・カリキュラム)が想定する学修量(おおむね 4 単位相当程度)を十分にカバーしている.
  2. 応用基礎レベル・カリキュラムでは,履修者に知識を身に付けさせることに留まらず,演習や PBL 等を効果的に組み入れることにより,実践的スキルの習得を目指すことが推奨されている.アドバンスプランにおいては演習等の実施について課題があるため,この点の改善が望まれる.
  3. 応用基礎レベル・カリキュラムは,高校学習指導要領の改訂やリテラシーレベルの教育の進展,社会環境や求められる人材像の変化などを踏まえ,2024 年度頃を目途に見直される予定である.この点を踏まえて,アドバンスプランの教育内容が継続的に改善されることが期待される.
  4. アドバンスプランにおける 4 つの必修科目(計 8 単位),選択必修 a(2 単位),選択必修 b(2 単位)を合計すると 12 単位になり,応用基礎レベルの認証取得要件を満たす.そのため,設定されている選択科目を学生が履修するモチベーションが生まれにくいことが想定される.そうした事態が観察される場合には,今後の改善が必要である.
  5. 選択必修科目「心理学統計法」は,シラバス上では「心理学で用いる統計的手法」となっているが,その他の分野でも活用が期待できる統計的手法が幅広く解説されており,高く評価できる.
  6. データ構造とアルゴリズムの相互依存関係は極めて強いため,選択必修科目「アルゴリズムとプログラミング」の内容と,必修科目「データ構造とプログラミング」の内容がかなり類似している.ある程度の内容の重複は許容されるが,科目の教育内容を整理して,重複をなるべく減らすことが望まれる.また,両科目とも C 言語プログラミングを用いているが,最近の技術動向や利用状況を踏まえると,Python ないし Java に変えてゆくことが望まれる.
  7. 最近のマーケティング理論やビジネス動向を踏まえると,サプライチェーン・マネジメントに加えてサービスチェーンやバリューチェーン等のマネジメントの重要性が増している.この点を考慮して,選択科目「サプライチェーン・マネジメント」の一部でこれらについても紹介することが望まれる.