講義コンテンツ
レベル別 講義コンテンツ
下記のレベル等は数理・データサイエンス・AI教育強化拠点コンソーシアムによるモデルカリキュラムに準拠しています。
リテラシーレベル
(導入)「データサイエンス 基礎から応用」
この講座では、データおよびデータサイエンスを学ぶ意義を理解し、社会調査法の基礎を学ぶと共に、多彩な話題に触れ、そこで使われている課題と技術を学びます。
全8コマ(1コマ45分程度)
第1回 データで社会を可視化する 課題解決のためのデータサイエンスサイクル
- 担当講師
- 渡辺美智子(立正大学 教授)
- 内容
- データサイエンス(ライフ)サイクル(国際ガイドラインに準拠)に沿い、データサイエンススキルに基づいて社会課題解決と価値創造に至るプロセス(データストーリー)の基本を具体的に解説する。これによって、データサイエンスの社会における役割と共に、基本的な概念を理解する。
第2回 画像処理とAI AIの歴史と実社会応用に向けた取り組みを学ぶ
- 担当講師
- 長谷山美紀(北海道大学大学院 教授)
- 内容
- AIの進化の歴史を振り返りながら、どのように実社会に応用されてきたのかを解説する。また、マルチメディア・データサイエンスの基礎技術と共にAIの実社会応用に向けた高度化について解説する。これによって、AIが新たな価値創出を実現していることを理解する。
第3回 画像処理とAI 人間センシングを通してAIの持続的高度化を学ぶ
- 担当講師
- 長谷山美紀(北海道大学大学院 教授)
- 内容
- AI技術を利用した例を示しながら、認識精度の向上、説明性の高いAIについて解説する。さらに、AIの持続的高度化につながる人間センシングについて触れ、AIと人間の協働するための試みを紹介する。これらによって、AIに対する正しいイメージを持てるようになる。
第4回 ビッグデータ利活用のためのプライバシー保護技術
- 担当講師
- 南和宏(統計数理研究所 准教授)
- 内容
- ビッグデータの利活用を念頭に、データの蓄積と品質について解説する。また、データ間の関連を定義することと、匿名化というトレードオフについても解説する。これらの解説によって、データガバナンス、倫理、セキュリティについて理解する。
第5回 社会調査法の基礎
- 担当講師
- 北川由紀彦(放送大学 教授)
- 内容
- データを集めるためのアンケートの設計、調査、分析技術を紹介する。これによって、データ分析のためのデータ収集の方法における注意事項を説明できるようになる。
第6回 データマイニングの諸課題
- 担当講師
- 吉田健一(筑波大学大学院 教授)
- 内容
- 企業で活用が進むデータサイエンスの技術の一つであるデータマイニングを紹介する。また、データマイニングの活用事例として、機械の故障診断などを紹介する。これによって、データマイニングの諸課題を説明できるようになる。
第7回 AIによるデータサイエンスとシミュレーション
- 担当講師
- 倉橋節也(筑波大学大学院 教授) ゲスト 村田忠彦(関西大学 教授) 北村章(大和大学 教授)
- 内容
- 分析する対象領域をモデリングすることで、AIを用いたシミュレーションが行われている。ここでは、合成人工プロジェクトの概要を紹介すると共に、プラントの事故予知に適用した事例を示すことで、シミュレーションの有効性を説明できるようになる。
第8回 自動車へのデータデータサイエンスの応用 クルマはビッグデータで走る
- 担当講師
- 青山幹雄(南山大学 教授)
- 内容
- 自動車制御、自動運転におけるデータ収集と解析事例、IoTとセンサー技術、センサーネットワークを紹介する。これによって、自動運転におけるデータサイエンスの利活用を説明できるようになる。
(導入)「数理データサイエンスAIリテラシー講座~導入~」
データ・AIが現代社会において活用され、様々な変化が生じています。これらの実例を紹介し、データ・AI利活用のための諸技術の概要と応用例を学びます。
第1回 社会で起きている変化
- 担当講師
- 竹村彰通(滋賀大学 教授)、齋藤邦彦(滋賀大学 教授)、笛田薫(滋賀大学 教授)
- 内容
- 計算機の処理性能の向上にともない、デジタルデータが増加し、ビッグデータを分析するAI技術も非連続的な変化を示してきた。これらの変化の最近までの経緯や技術的な背景について解説する。今後のデータにもとづく社会の変化は、
第4次産業革命、Society 5.0、データ駆動型社会などさまざまな用語で説明されている。今後の社会では複数の技術を組み合わせたAIサービスが提供されると予想されている。これらの社会の変化の動向について解説する。AIの得手不得手を考え、AIを何に活用できるのか、そしてどのような仕事がAIに奪われるのかを説明する。過去の産業革命と対比することにより、ビッグデータとAIを活用して新たな価値を創造するために、人間がすべきことを解説する。
第2回 社会で起きている変化
- 担当講師
- 久野遼平(東京大学 講師)
- 内容
- データサイエンスやAIとはどういう分野なのでしょうか?なぜ社会の関心を集めているのでしょうか?本節では社会で起きている変化を知り、データサイエンスやAIがどういう分野か理解することを目標とします。データサイエンティストとAIはどのように学術や社会で活用されているのでしょうか?本節では自然科学、社会科学、ビジネスと幅広く応用例を解説します。応用例を通じて技術の可能性に検討がつくようになることを目標とします。データサイエンティストとAIの関係はどのようなものでしょうか?AIの時代に活躍できるデータサイエンティストになるにはどのような知識が必要でしょうか?本節ではデータサイエンティストとAIの関係に焦点を当てます。
第3回 社会で活用されているデータ
- 担当講師
- 髙野渉(大阪大学 特任教授)、宮西吉久(信州大学 准教授)
- 内容
- 世の中にあるビッグデータの例を紹介するとともに、そのような膨大なデータを集めるための仕組みや仕掛け(センサー、社会インフラ、クラウドソーシング)、それら膨大なデータの活用例などを紹介する。1次データ、2次データ、データのメタ化:1次データ、2次データ、3次データの意味と違いを知る。これらを組み合わせて補完し分析することで、さらに有益な情報を得られることを認識する。また、データをメタ化し、メタデータにすることで,情報の整理が進むことを理解する。構造化データ、非構造化データ(文章、画像/動画、音声/音楽など): 構造化データと非構造化データの違いを知る。ビッグデータとしても扱われることのある、非構造化データの種類を知る。
第4回 データ・AIの活用領域
- 担当講師
- 久野遼平(東京大学 講師)
- 内容
- データサイエンスの基本となる仮説検証、知識発見、原因究明とはどのようなものなのでしょうか?本節ではデータサイエンスの基本を解説します。データサイエンスの基本となる分析を経てそれらはどのように学術やビジネスでは役立てられるのでしょうか?本節では計画策定、判断支援、活動代替、新規生成に焦点を当てます。データサイエンスの技術は具体的に研究開発、調達、製造、物流、販売、マーケティング、サービスの分野でどのように役立てられているのでしょうか?改めて具体例をもって解説します。
第5回 データ・AI利活用のための技術1
- 担当講師
- 杉本知之(滋賀大学 教授)、市川治(滋賀大学 教授)、佐藤智和(滋賀大学 教授)
- 内容
- 数量化された教師ありデータもしくは教師なしデータに基づいて、数値予測やグルーピングを行うときに用いられる代表的な手法を解説する。データに基づく予測を理解するとともに、その中で用いられる領域知識の必要性や最適化などの考え方、特化型AIと汎用AIの違いなどを学ぶ。また、シミュレーションデータを活用したデータ同化の方法への応用例を紹介する。テキストデータと音声データについて、そのデータの形式と基本的な分析の手法を解説する。テキストも音声もコード化された数値データであることを理解し、分析によって意味へと変換されることを理解する。また、応用例についても、いくつか紹介する。画像/動画像データを扱う際のデータ構造について説明した上で、データから情報を抽出するために用いられる様々な技術を概観する。また、画像分野における現在のAIの応用範囲とその限界についても解説する。
第6回 データ・AI利活用のための技術2
- 担当講師
- 内田誠一(九州大学 教授)
- 内容
- データの解析と可視化についてその概要を説明する。解析については、様々な解析課題(予測やグルーピングなど)の目的や必要性を、例を通して理解する。そして様々な可視化手法(グラフ化や多次元の可視化)の目的や必要性を、例を通して理解する。データ解析の対象が、表形式で表現された数値データだけでなく、音や画像、そして言語などのメディアデータも含まれることを理解する。また各メディアに、どのようなデータ解析課題があるかを概観する。データ解析におけるAIの利用について概観する。特に、データ解析的視点から見たAIの利用価値について述べる。関連して、特化型AIと汎用型AIの違いや、現状のAIにできることとできないことに触れる。
第7回 データ・AI利活用の現場
- 担当講師
- 髙野渉(大阪大学 特任教授)
- 内容
- PDCA(P:計画、D:実行、C:評価、A:改善)サイクルの概要を説明する。実際のデータを活用したPDCAサイクルを用いたデータ解析を通じて、PDCAサイクルの重要性を理解する。製造現場における欠陥品の検知、ランディングページのA/Bテスト、購買推薦アルゴリズムなどの例を交えて、データ科学やAIの活用例を理解する。生産工学、経済などの分野に一般的な考え方を、在庫管理、マーケティング、産業構造と経済規模などのデータ例を交えて再考察する。
第8回 データ・AI利活用の最新動向
- 担当講師
- 髙野渉(大阪大学 特任教授)、宮西吉久(信州大学 准教授)
- 内容
- 神経ネットワークや計算機内部の論理回路との関係性を交えながら、ニューラルネットワークの簡単な構造や計算、利用法について理解する。AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など): 画像認識やパターン認識の分野で知られている深層生成学習モデルの例や基礎を学習する。AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など):2つのニューラルネットワークがお互いの評価をして競い合い学習していく」敵対的学習(Adversarial Training)の基礎を知る。機械学習の一領域としても知られる強化学習や転移学習の例を知る。
(基礎)「デジタル社会のデータリテラシー」
この講座では、デジタル社会の読み・書き・そろばんである『データ思考』を育むデータリテラシーの内容を身の回りの社会の実例に沿って、分かり易く解説します。
第1回 社会をデータで語る
- 担当講師
- 渡辺 美智子(立正大学 教授)
- 内容
- A データサイエンスの第一歩 B ビジネスデータサイエンス1ゲスト:孝忠大輔(NEC) C 構造化データを作る D データサイエンスサイクル
第2回 質的データを活用した問題解決
- 担当講師
- 渡辺美智子(立正大学 教授)
- 内容
- A データの表現技術 B ビジネスデータサイエンス2 ゲスト:孝忠大輔(NEC) C 質的データ処理 D 公平な比較か
第3回 量的データを活用した問題解決
- 担当講師
- 小野陽子(横浜市立大学 准教授)
- 内容
- A データの計量化・可視化 B マネージメントデータサイエンス ゲスト:中川みゆき(帝国データバンク) C 量的データ処理
第4回 データのばらつき
- 担当講師
- 大橋洸太郎(文教大学 講師)
- 内容
- A ばらつきの捉え方 B ヘルスケアデータサイエンス ゲスト:村上真(FiNC) C ばらつきの管理
第5回 相関分析
- 担当講師
- 竹内光悦(実践女子大 准教授)
- 内容
- A 2つの量的データ間の関係 B スポーツデータサイエンス ゲスト:河野岳志、高橋朋孝(データスタジアム) C 相関
第6回 回帰予測
- 担当講師
- 小野陽子(横浜市立大学 准教授)
- 内容
- A 予測モデルの考え方 B ①ファッションデータサイエンス1 B ②ファッションデータサイエンス2 ゲスト:エマ理永(エマリーエ) C 回帰分析
第7回 データ収集の方法
- 担当講師
- 大橋洸太郎(文教大学 講師)
- 内容
- A 統計調査の基本 B マーケティングデータサイエンス ゲスト:萩原雅之(トランスコスモス) C 標本調査 D 質問作りのポイント
第8回 確率に基づく判断
- 担当講師
- 塩澤友樹(椙山女学園大学 講師)
- 内容
- A ①クロス集計表とベイズの定理 A ②仮説検定の考え方 B 医療データサイエンス ゲスト:高橋邦彦(東京医科歯科大) C クロス集計表の利用と仮説検定の実践
(基礎)「数理データサイエンスAIリテラシー講座~基礎~」
データの特徴を読み解き、起きている事象の意味合いを理解できる能力(データリテラシー)の基礎を学びます。
第1回 データを読む
- 担当講師
- 山本章博(京都大学 教授)
- 内容
- 集められたデータを読んで理解するとは、見えないものをデータを通じて見ることである、という基本的な考え方を説明し、具体例として国勢調査などのアンケート調査や物理法則、公衆衛生政策などをあげる。見えないものを捉えるための考え方として、母集団からの標本抽出について説明する。標本抽出の方法として、単純無作為抽出、層別抽出、多段抽出をあげる。データ形式の代表的な分類として、連続データと離散データについて説明する。また、データの意味的分類として、量的データと質的データについて説明する。度数分布表とヒストグラムを例にしてこれらのデータの分類と違いについて説明する。集められたデータを読んで理解するとは、見えないものをデータを通じて見ることである、という基本的な考え方を説明し、具体例として国勢調査などのアンケート調査や物理法則、公衆衛生政策などをあげる。見えないものを捉えるための考え方として、母集団からの標本抽出について説明する。標本抽出の方法として、単純無作為抽出、層別抽出、多段抽出をあげる。データ形式の代表的な分類として、連続データと離散データについて説明する。また、データの意味的分類として、量的データと質的データについて説明する。度数分布表とヒストグラムを例にしてこれらのデータの分類と違いについて説明する。
第2回 データを読む
- 担当講師
- 林和則(京都大学 教授)
- 内容
- 量的データの性質は分布を用いることでよく理解できるが、データの特徴を一つの値に集約して表現できると大変便利である。このような値は代表値と呼ばれ、ここでは、基本的な代表値として平均値、中央値、最頻値について説明する。 代表値は一つの数字でデータ全体の特徴を表すことができる便利なものであるが、その特徴をよく理解して用いないとデータを大きく見誤る危険性がある。ここでは、各代表値の性質やそれらの違いについて箱ひげ図を用いて説明する。量的データは、代表値とそのばらつき表す指標をセットで用いることで、より正確にその特徴を捉えることができる。ここでは、ばらつきを表す指標として最も基本的かつ重要な、分散、標準偏差、偏差値について説明する。
第3回 データを読む
- 担当講師
- 中野直人(京都大学 特定講師)
- 内容
- 身長と体重のように、複数の変数のデータを同時に観測することもあるだろう。それらの変数間の関係を調べるための方法の一つとして、直線的な関係を調べる共分散とその定量的な指標である相関係数について説明する。相関関係と因果関係とは一般には関連がない。相関係数が大きくても因果関係がないことがある。交絡因子による擬似相関がその例である。また、相関係数が小さくても因果関係がある場合もある。相関に関する注意点について説明する。変数が3つ以上ある場合に変数間の関係性を調べるにはどうしたら良いだろうか。それには2変数間の相関を、全ての変数間の組み合わせに対して計算すればよい。そこで用いられる相関係数行列と散布図行列について説明する。
第4回 データを説明する
- 担当講師
- 鹿島久嗣(京都大学 教授)
- 内容
- 2つの質的変数の関係を調べるには、まずはクロス集計表や分割表の形にデータをまとめることで、その関係を大まかにつかむ。クロス集計表における関係の強さはχ二乗値で測ることができる。観測したデータをそのまま信じることはできない。観測データには、観測の誤差や、打ち切りや脱落などがありうる。統計情報は悪用すれば、ウソをもっともらしく述べるための道具にもなりうる。いくつかの有名な例を見てみる。
第5回 データを説明する
- 担当講師
- 木村真之(京都大学 特定講師)
- 内容
- 質的データに対する可視化手法について述べる。具体的には棒グラフ、円グラフについて描き方の注意点も含めて解説する。量的データに対する可視化手法について述べる。折れ線グラフ、散布図、ヒートマップなど代表的な可視化手法を解説した後、ヒストグラムによる可視化手法についても触れる。一般的なデータに対して様々な可視化が可能なこと、特にテレビやウェブなどのメディアで用いられるようなデータの図表表現ついて紹介しながら解説する。
第6回 データを説明する
- 担当講師
- 關戸啓人(京都大学 特定講師)
- 内容
- データの比較の方法について、どのように比較を行えば何がわかったことになるのかを、相関や因果について復習をしながら説明する。例えば、条件を揃えることの必要性を述べ、具体例としてA/Bテストを紹介する。何を目的にどのような可視化を行うと良いのか、具体例を交えつつ説明する。このパートでは、目的にそぐわなかったり、誤解を招いたりしかねない、不適切な可視化の事例について紹介し、どのように改善すべきかを説明する。何を目的にどのような可視化を行うと良いのか、具体例を交えつつ説明する。このパートでは、実際に同じデータを複数の方法で可視化した場合に、どの可視化がどのような面で優れているのかを考えてみたり、可視化を行うことで新たな気づきが得られた例を紹介する。
第7回 データを扱う
- 担当講師
- 田村寛(京都大学 教授)
- 内容
- データ解析を行う際に使用するツールについて学ぶ。特にデータの収集において欠かすことができないスプレッドシートについては、代表的な表計算ソフトであるExcel(エクセル)を例に挙げて理解を深められるように説明する。実際に代表的な表計算ソフトであるExcel(エクセル)を使い、自分でデータを入力したうえで、四則演算などの極めて初歩的なデータ処理を行えるように説明する。表的な表計算ソフトであるExcel(エクセル)を使い、データの並び替え・ランキング・絞り込みなどを行いつつ、作業を効率化するショートカットの有用性なども説明する。
第8回 データを扱う
- 担当講師
- 田村寛(京都大学 教授)
- 内容
- 引き続き、代表的な表計算ソフトであるExcel(エクセル)を使ったデータ処理を行うために、データの入力や四則演算その他の処方的な関数を使った処理の復習を説明する。代表的な表計算ソフトであるExcel(エクセル)を使い、平均、標準偏差、新たな変数作成をなどにも挑戦できるように説明する。汎用性が高いcsv形式のデータを入手してデータ加工処理をおこなってみる。またExcel(エクセル)からcsv形式のデータ保存の仕方についても説明する。
(心得)「数理データサイエンスAIリテラシー講座~心得~」
データサイエンスを活用した社会で心得ておくべき、個人情報保護、倫理、バイアス、社会的影響やリスク、情報セキュリティを学びます。
第1回 ELSI(Ethical,Legal and Social Issues)
- 担当講師
- 村上祐子(放送大学 客員教授/立教大学 教授)
- 内容
- ELSI(Ethical, Legal and Social Issues)について学ぶ。
第2回 個人情報保護
- 担当講師
- 加藤尚徳(放送大学 客員准教授/KDDI総合研究所)
- 内容
- 個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウトについて学ぶ。
第3回 データ倫理:データのねつ造、改ざん、盗用、プライバシー保護
- 担当講師
- 森下壮一郎(放送大学非常勤講師/サイバーエージェント)
- 内容
- データ倫理:データのねつ造、改ざん、盗用、プライバシー保護について学ぶ。
第4回 AI社会原則
- 担当講師
- 久木田水生(放送大学客員准教授/名古屋大学 准教授)
- 内容
- AI社会原則(公平性、説明責任、透明性、人間中心の判断)について学ぶ。
第5回 データバイアス・アルゴリズムバイアス
- 担当講師
- 森下壮一郎(放送大学非常勤講師/サイバーエージェント)
- 内容
- データバイアス、アルゴリズムバイアスについて学ぶ。
第6回 AIサービスの責任論
- 担当講師
- 久木田水生(放送大学客員准教授/名古屋大学 准教授)
- 内容
- AIサービスの責任論について学ぶ。
第7回 AI活用における負の事例
- 担当講師
- 村上祐子(放送大学 客員教授/立教大学 教授)
- 内容
- データ・AI活用における負の事例紹介について学ぶ。
第8回 情報セキュリティ
- 担当講師
- 辰己丈夫(放送大学 教授)
- 内容
- 数理・データサイエンス・AIを学ぶ上で必要となる情報セキュリティについて学ぶ。情報セキュリティは、機密性、完全性、可用性の3つの概念からなり、情報を保護するための加工、暗号化や、権限を設定するためのパスワード、認証を扱う。また、悪意ある情報搾取や、情報漏洩等によるセキュリティ事故の事例紹介を行う。
(選択)「Rで学ぶDS入門」
統計解析ツールRを使って実際にデータを扱い、分析しながら、データサイエンスの分析手法の基礎と基本的な考え方を習得します。
第1回 統計解析ツールRの基本的な使い方
- 担当講師
- 浅井紀久夫(放送大学 教授)
- 内容
- データサイエンスの必要性を説明し、統計解析ツールR及び統合開発環境RStudioの基本的な操作を説明する。
第2回 データ分析の基本
- 担当講師
- 浅井紀久夫(放送大学 教授)
- 内容
- 前半でデータ分析を行う上で基本的なことを説明し、後半で実際にデータを取得したり、Rでデータを読み書きしたりする。
第3回 統計処理の初歩
- 担当講師
- 浅井紀久夫(放送大学 教授)
- 内容
- データの分布や基本統計量、変数間の関係など、統計処理の初歩を説明する。
第4回 回帰と分類と
- 担当講師
- 浅井紀久夫(放送大学 教授)
- 内容
- 前半で回帰分析について例示しながら説明し、後半で分類について決定木を例にして説明する。
発展・専門
「データサイエンス革命」
データサイエンスが仕事や社会を変えようとしています。データサイエンスには、単にデータを分析することだけではなく、社会の価値に結びつけることまでが要求されています。そのため、課題解決に至る道筋を描く力も必要です。専門家による講演を通してデータサイエンスを概観します。
第1回 データサイエンスことはじめ
- 担当講師
- 和泉志津恵(滋賀大学データサイエンス学部 教授)
- 内容
- いまの社会はビッグデータの時代とよばれ、身近なデータが蓄積されるようになりました。大小様々なデータを対象として新たな価値を創造する学問分野が、データサイエンスです。例題やミニクイズをとおして、一緒に、データサイエンスの世界に触れてみませんか。
第2回 データサイエンスをいかす
- 担当講師
- 松井秀俊(滋賀大学データサイエンス学部 准教授)
- 内容
- データを分析するための方法として、回帰分析や判別分析などの統計手法を紹介します。これらの方法がどのような場合に使われ、どのような結果を与え、それらをどのように解釈するかについて説明します。また、コンピュータ上で実際に分析を行う流れについても説明します。
第3回 経営における人工知能とデータサイエンス
- 担当講師
- 倉橋節也(筑波大学大学院 教授)
- 内容
- ITの進展により、様々なデータが企業や組織に蓄積する中、データサイエンスや人工知能への期待が急速に高まっています。本講演では、データを扱うための基礎的な人工知能手法と経営分野における適用事例を紹介します。
第4回 マーケティングとデータサイエンス
- 担当講師
- 佐藤忠彦(筑波大学大学院ビジネス科学研究科 教授)
- 内容
- 企業は、市場における競争優位性を高めるべく、様々なデータの高度利用を模索しています。マーケティングも例外ではなく、POSデータやID 付POS データに代表されるビッグデータを活用し、消費者の理解を促進し、またその理解に基づく活動の高度化を狙っています。本講演では、マーケティングにおけるデータサイエンスの役割・考え方を示した上で、データの高度活用例を紹介します。
第5回 統計学の現代的役割とデータサイエンス
- 担当講師
- 中野純司(統計数理研究所 教授)
- 内容
- 統計学はデータを扱う科学として長い歴史を持ち、データサイエンスの学問的基盤の一つとなっています。統計学を概観し、データサイエンスにおいて統計学が果たす現代的な役割について説明します。また、いくつかのデータ可視化の手法を紹介すると共に、インフルエンザ流行予測の事例からその教訓を読み解きます。
第6回 ビッグデータのプライバシー保護技術
- 担当講師
- 南和宏(統計数理研究所 准教授)
- 内容
- ビッグデータの安全な利活用には、個人や組織を特定できないようにする匿名化技術が必要です。匿名化では、個人の識別子情報(名前やID等)を削除するだけではなく、既に流通している外部情報との連結を防ぐための秘匿処理を行います。個人情報保護法を概観し、匿名化の安全性を評価するための代表的な指標について説明します。
「統計的因果推論の考え方と技術」
因果関係の確立は、ほぼすべての研究あるいは業務の目的と言っても過言ではないでしょう。統計を学ぶと、因果関係と相関関係は違うという注意がなされます。データサイエンスをより深く理解し、それを実践するために不可欠な、因果関係を確立するための正しい考え方とそれを活用するための技術を学びます。
第1回 統計的因果推論とは
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- 因果推論とは何か。因果関係を統計的に評価するということはどういうことか。因果関係を示すための条件とは何か。という統計的因果推論のための基礎的な事項、そして変量の種類とそれらの関係について学ぶ。
第2回 統計的データ解析の諸側面
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- はじめに統計的因果推論で重要な役割を果たす独立性と条件付き独立性について述べ、それらの違いを表す例として有名なシンプソンのパラドクスを取り上げる。次に回帰分析を取り上げ、その特質について簡単に議論し、例を紹介する。最後に、原因と結果以外の変量であ第三の変量の果たす役割を、例を通じて吟味する。
第3回 統計的因果推論の枠組み
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- 統計的因果推論にはいくつかのアプローチがあるが、ここでは、「潜在的アウトカム」の概念を用いたアプローチを採用する。はじめに潜在的アウトカムとは何かを説明し、それに基づいて処置効果を定義する。また、確率計算のもとになる確率的な変動がどこにあるのかという話題を、いくつかの統計手法とからめて講義する。
第4回 処置のランダム化と効果の推定
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- 平均処置効果の推定法について学ぶ。ここではランダム割り付けが中心的な役割を果たす。最初に処置群と対照群を工夫なく設定したのでは、処置効果の推定はできないということを例によって示す。そして、処置のランダム割り付けがあれば処置の推定が偏りなくできるということを学習する。さらに、共変量がある場合の処置効果の推定法を学習する。
第5回 傾向スコアの定義と性質
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- 観察研究における統計的因果推論で重要な役割を果たす傾向スコアについて解説する。また、傾向スコアの性質として条件付き独立性とバランシング性を紹介し、傾向スコアの使用法を、適用する研究の段階によって分類して話を進める。
第6回 マッチングの方法とその利用
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- 処置効果の推定のための方策の一つであるマッチングについて解説する。マッチングは多くの統計解析の実際の場面でよく用いられる手法である。その特質、そしてマッチングをした後の解析について学習する。
第7回 層化解析法と重み付け法
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- 処置効果の推定法である層化解析法と重み付け法について解説する。はじめに層化(層別)の効用について解説し、層化を用いた処置効果の推定法である層化解析法と、重み付け法について、例を交えながら解説する。
第8回 ノンコンプライアンスと操作変数法
- 担当講師
- 岩崎学(統計数理研究所 統計思考院 特任教授)
- 内容
- ノンコンプライアンスと操作変数法について学習する。はじめにノンコンプライアンスの下での操作変数法の適用について述べ、その下での処置効果の推定法について学習する。最後にノンコンプライアンスが生じた場合の処置効果の推定法を例を挙げて理解を深める。
「ニューラルネットワーク概論」
この講座では、現代AIの基盤を支えるニューラルネットワーク(深層学習)技術の基礎を学びます。ニューラルネットワークは生物の情報処理様式からヒントを得た計算技術です。ここでは、ニューラルネットワークを構成する要素からはじめて、現代の画像処理技術の中心を担っている深層学習を学んで行きます。
※「ニューラルネットワーク概論」インターネット配信講座は近日公開の予定です。
第1回 ニューラルネットワークへの基本概念
- 担当講師
- 庄野逸(電気通信大学 教授)
- 内容
- ニューラルネットワークを構成する要素を確認した後、例題として最初の世代のニューラルネットワークであるパーセプトロンについて解説する。
第2回 多層化ニューラルネットワークへの挑戦
- 担当講師
- 庄野逸(電気通信大学 教授)
- 内容
- 第二世代のニューラルネットワークである多層型パーセプトロンと多層パーセプトロンを運用するための学習方式である誤差逆伝搬法について解説する。
第3回 深層学習へのアプローチ(1)
- 担当講師
- 庄野逸(電気通信大学 教授)
- 内容
- 多層パーセプトロンの研究から分かってきた問題点とそれを解決するためのアプローチに関して説明する。
第4回 深層学習へのアプローチ(2)
- 担当講師
- 庄野逸(電気通信大学 教授)
- 内容
- 層畳み込みニューラルネットワークの発展を脳科学的な観点を踏まえて紹介する。
「機械学習概論Ⅰ」
機械学習概論は数学や計算機科学、脳科学といった分野の知識を結集した研究分野です。
この講義では、機械学習の基本的な手法や学習能力を向上させるための基本技術を理解するために、回帰モデルを題材として、汎化能力と正則化という技術を紹介します。最後に、正則化を応用したスパースモデリングについて学びます。
※「機械学習Ⅰ」インターネット配信講座は近日公開の予定です。
第1回 機械学習の歴史と要素技術
- 担当講師
- 赤穂昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 機械学習の全体像を俯瞰する。機械学習の歴史を辿り、機械学習の基礎となる要素技術を、4つの大きな柱にまとめる考え方を紹介し、それぞれの概要を説明する。
第2回 回帰問題とモデル選択
- 担当講師
- 赤穂昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 回帰問題とモデル選択について解説します。与えられる学習データが複雑だったり、高次元だったりする問題に対して、どのような手順で最適な答えを導き出すのか。そのアプローチの仕方の基本を解説する。また、次元の呪いと汎化能力という重要な考え方を解説する。
第3回 正則化と交差検証
- 担当講師
- 赤穂昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 汎化能力についての数値実験による検証と汎化能力の高い学習モデルを選択するための正則化という考え方を紹介する。また、正則化の基本となるリッジ回帰という方法と、汎化能力の信頼性を高める交差検証についての基礎を解説し、正則化や交差検証を使って実際に学習モデルの選択がどのように行われるのかを示す。
第4回 スパースモデリング
- 担当講師
- 赤穂昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- スパースモデリングについて講義する。多くの変数の中から重要な変数に絞り込む方法であるL0正則化について述べ、目的関数を最適化する勾配法を使った実用的なL1正則化をスパースモデリングに導入する方法について解説する。最後に現在、天文学や医療分野で注目を集めている圧縮センシングを紹介する。
「機械学習概論Ⅱ」
機械学習の基本となる4本の柱のうち「識別」、「次元圧縮」、「クラスタリング」といった柱について説明します。
これらの技術を理解するために、識別の方法と確率に関する知識を学んだ後、確率を使った一般的な手法である「ベイズモデリング」を紹介し、「教師なし学習」である次元圧縮とクラスタリングについて解説します。
※「機械学習概論Ⅱ」インターネット配信講座は近日公開の予定です。
第1回 識別と確立1
- 担当講師
- 赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 文字や音声の認識など、パターン認識への応用の基礎となる識別の基本と、どのような誤差を最小化すればよいのかを解説します。さらに、条件付確率に基づいた識別手法である「ロジスティック回帰」について説明し、さらに、ロジスティック回帰とは違った立場から線形識別関数を学習する手法であるサポートベクターマシン(SVM)を紹介します。
第2回 識別と確立2
- 担当講師
- 赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 識別の手法を紹介し、具体的な問題を例にあげながら機械学習の技術のベースとなる「確率」に関する知識を学びます。その後に、識別手法のなかでも性能の高い学習モデルである「ランダムフォレスト」を解説します。さらに、「我々人間がどのような行動をとればよいのか」という現実的な判断につながるという重要な意味を持つ識別結果の評価指標を紹介します。最後に、機械学習において確率を扱うのに非常に大きな役割を果たすベイズの定理について説明します。
第3回 ベイズモデリング
- 担当講師
- 赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 回帰、識別、次元圧縮、クラスタリングの機械学習における4つの柱すべてに適用が可能な、確率計算に基づくモデリング手法であるベイズモデリングについて学びます。ここでは、ベイズモデリングの一般的な手順を説明し、単純ベイズ法という基本的なモデルで識別の問題を実践してみます。次に、線形回帰の問題をベイズモデリングの立場から見直すことで、正則化との関連性を述べます。
最後に、複雑なベイズモデリングを行うためのベイジアンネットワークについて説明します。
第4回 次元圧縮とクラスタリング
- 担当講師
- 赤穂 昭太郎(産業技術総合研究所 上級主任研究員)
- 内容
- 機械学習の4本の柱のうち、教師なし学習である次元圧縮とクラスタリングを中心に学びます。次元圧縮やクラスタリングといった教師なし学習の手法が、これまで講義した教師あり学習も含めて、ベイズモデリングによって統一的に理解できることを説明します。
最後に、機械学習の枠組みの広がりの一端を紹介します。
「AIプロデューサー~人とAIの連携~」
AIプロデューサーとは、現場で有用なAIシステムを設計できる人材です。工学的な立場に加えて、経営学的な立場からもAI技術を考えられるようになるために、AI技術論と実践事例を交えて、実際の現場で役立つAIを説明します。
参考図書 山口高平著 AIプロデューサー 人とAIの連携 近代科学社Digital2022
第1回 AIプロデューサーとは
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- AI技術全体を俯瞰できるとともに、個々のAI技術の特色を理解し、様々な分野の現場でのAI技術を実践した時の有用性と限界を学習し、現実の場面に適したAI技術を選択し提言できるようになることを目指します。
第2回 製造業とAI
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- 製造業の工場を取り上げ、オントロジーを利用した組立作業の支援、強化学習を利用したロボット自動組立作業について説明します。
第3回 社会インフラとAI
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- 交通インフラである高速道路に関連しまして、ETCレーン点検業務、氷雪作業スケジューリングを取り上げ、知識ベース推論AIの仕組みと適用方法について説明します。
第4回 サービス業とAIロボット
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- 複数のロボットが連携して業務をこなすロボット喫茶店を紹介し、特に、人がロボットの業務プロセスを記述して、それが、プログラムに自動的に変化され、ロボットが発話・動作を始める仕組みについて学習します。
第5回 教育とAIロボット
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- AIだけでなく拡張現実などの技術とも組み合わせて、小学校で、教師とロボットが連携する授業を紹介します。
第6回 観光とAI
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- 高速道路の休憩施設であるSAから、人がその地域の観光名所に立寄ることを推薦するスマートフォンアプリの仕組みについて説明します。
第7回 間接業務とAI
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- 大学の事務処理、会社の日報管理を取り上げ、適用可能なAI技術を説明します。
第8回 グループ討論とAI
- 担当講師
- 山口 高平(慶應義塾大学 教授)中谷 多哉子(放送大学 教授)
- 内容
- 小学生と大学生のグループ討論を取り上げ、AIが知的パートナーになりうる可能性について説明します。
データ科学としての言語研究の可能性
データサイエンスが言語研究の可能性をどのように広げられるか、可能性を探っていく。早稲田大学の李在鎬教授と東北大学の木山幸子准教授を訪ね、李教授には人が意識する以前になされる脳内での言語処理を捉える手法としての実践例を、紹介・解説してもらう。
第1回 データ科学としての言語研究の可能性
- 担当講師
- 滝浦 真人(放送大学 教授)李 在鎬(早稲田大学 教授)木山 幸子(東北大学 准教授)
- 内容
- データサイエンスが言語研究の可能性をどのように広げられるか、可能性を探っていく。早稲田大学の李在鎬教授と東北大学の木山幸子准教授を訪ね、李教授には人が書いたテキストを科学する手法としての、木山准教授には人が意識する以前になされる脳内での言語処理を捉える手法としての実践例を、紹介・解説してもらう。
心理学研究への応用
データサイエンスに関連した仕事に従事しようとしている学生やすでに業務としている技術者に、有益な知識を提供する専門レベルの講座。本講座では、数理・データサイエンス・AIの心理学研究への応用を扱う。認知心理学、社会心理学、臨床心理学の各専門領域から、データサイエンスの活用事例を丁寧に紹介する。
第1回 心理学に数理・データサイエンス・AIはいかに活用されるか
- 担当講師
- 清水 裕士(関西学院大学 教授)
- 内容
- 本講座の総論的な位置づけとして、心理学における実証研究、特に、因果関係の検討における統計的思考の活用について取り上げる。続いて、数理・データサイエンス・AIが心理学に与えた影響について、数理統計モデリング、統計的因果推論、そして、機械学習の応用という3つのトピックについて検討する。最後に、講師と企画者との対談を通して、心理学にデータサイエンスを応用する意義について考察する。
第2回 人の情報処理過程をモデル化する
- 担当講師
- 武藤 拓之(大阪公立大学 准教授)
- 内容
- 認知心理学の基本的なテーマである、人間の情報処理過程をモデル化する研究を紹介する。まず、人間の情報処理過程を研究するための認知心理学の方法論を解説した後で、情報処理過程に関する仮説を数式で表現する方法として、認知モデリングと呼ばれるいくつかの数理モデルを紹介する。最後に、AIと認知心理学との結びつきについて検討する。
第3回 表情運動を分析する
- 担当講師
- 難波 修史(広島大学 准教授)
- 内容
- 感情心理学の領域から、表情運動の分析におけるAIやデータサイエンスを適用した研究例を紹介する。まず、感情を伝える表情について概説し、次に、動画データから人の表情運動を推定するAIについて、その機械学習の技術について説明し、表情運動をモデリングする具体的な統計解析の手法について紹介する。最後に、表情運動の記録についての膨大なデータを分析することが、心理学にどのような影響を与えるかを検討する。
第4回 社会心理学のモデリングアプローチ
- 担当講師
- 小杉 考司(専修大学 教授)
- 内容
- 社会心理学の研究領域を概観し、統計法との相性が良いことに触れながら、社会心理学に統計モデルを適用することの意義を説明する。社会心理学の研究領域の中で、ミクロやマクロのレベルでのモデリングによる研究は進んでいるが、メゾレベルに相当する集団力学については、個人と社会のレベルがリンクする領域特有の問題がある。研究としては発展途上にあるといえるが、そのような研究例として、人間関係を可視化するモデルについて紹介する。
第5回 歩行者や自動車ドライバーの認知・行動プロセスの理解
- 担当講師
- 紀ノ定 保礼(静岡理工科大学 准教授)
- 内容
- 第2回の認知心理学の応用的な研究として、交通環境における行動研究の事例を紹介する。まず、交通環境という日常・現実的県境における人間の心理を研究する際の注意点を検討する。そして、歩行者が道路を横断するタイミングの意思決定メカニズムに関する研究、さらには、自動車運転中のドライバーの注意が阻害されるメカニズムに関する研究へのデータサイエンスの活用について紹介する。
第6回 臨床心理学とデータサイエンス
- 担当講師
- 国里 愛彦(専修大学 教授)
- 内容
- 本講座の第6回から第9回は、心理学の中でも、より応用的な領域になる臨床心理学とデータサイエンスとの関わりについて扱う。まず、臨床心理学とデータサイエンスの関わりについて概説しながら、第6回から第9回の位置づけを行う。続いて、数理モデルを用いて精神障害の病態や治療を理解する計算論的精神医学の歴史と可能性について説明し、数理モデルの活用とその意義、代表的な生成モデルについて紹介する。最後に、講師と企画者との対談を通して、臨床心理学にデータサイエンスを応用する意義について考察する。
第7回 心理情報学:基礎編
- 担当講師
- 横谷 謙次(徳島大学 准教授)
- 内容
- 心理学に機械学習などの人工知能を応用する「心理情報学」というアプローチについて、臨床心理学の領域から紹介する。第7回は、その基礎編と題して、臨床心理サービスに関する3つの課題を説明し、それぞれの課題に対応する解決策、すなわち、犯行を予防する解決策、顧客を獲得する解決策、心理的支援サービスの品質を明示する解決策のそれぞれについて、データサイエンスやAIの技術を応用した解決策を提示する。
第8回 心理情報学:応用編
- 担当講師
- 山本 哲也(徳島大学 准教授)
- 内容
- 心理学に機械学習などの人工知能を応用する「心理情報学」というアプローチについて、臨床心理学の領域から紹介する。第8回は、その応用編と題して、ライフログなどの大量のデータから機械学習をもちいた「幸福感・抑うつの予測」や「コロナ禍での国民のメンタルヘルスに影響する要因の検討」、さらに、「仮想現実技術(VR)を用いたセルフカウンセリング」や「AIによるアート生成」による人間の創造性の拡張といった研究開発の事例を紹介する。
第9回 N of 1 のデータサイエンス:シングルケースデザイン
- 担当講師
- 竹林 由武(福島県立医科大学 講師)
- 内容
- 臨床心理学の研究デザインである「シングルケースデザイン(単一事例実験計画法)」について、その概要を解説し、反復測定で得られた時系列データの分析方法としての視覚分析について、その問題点も合わせて説明する。そして、視覚分析の問題点を克服する方法として期待されている「人工ニューラルネット」というAIシステムを活用した分析方法の精度を検証した研究を紹介する。
多変量データ分析実践の基礎
数理・データサイエンス・AIの学修で応用基礎レベル教育を終えた人が、各領域で専門家としてデータから意味を抽出、現場にフィードバックして活用する能力の育成を目指す番組。課題の抽出からデータ分析、解決策の導出の流れを解説、実際のデータセットでその実践ができる技能の習得を可能なものとする。
第1回 重回帰分析
- 担当講師
- 渡辺 美智子(立正大学データサイエンス学部 教授)
- 内容
- 予測と要因分析の基本である重回帰分析に関して、適用する。データの構造、回帰モデルの意味、分析結果の解釈について、中古住宅の価格予測を例に平易に解説する。重回帰分析では変動を説明(予測)したい変数を目的変数、そのために使用される要因系の変数を説明変数というが、ここでは、各住宅の価格が目的変数、価格に影響する床面積や築年数などが説明変数となる。本講義では、具体的に分析結果の数値を事例に沿って解釈する方法を学習し、次に、エクセルや統計ソフトによって誰もが簡単に分析を実行できるように、その手順を解説する。最後に実際に社会でこのような分析手法が活用されている現場として不動産価格の予測ビジネスを展開する企業を訪問し、アナリスト達のデータ活用の背景の紹介を通して、データサイエンスの活用の実態と価値創造の効果を学ぶ。
第2回 クロス表と決定木分析
- 担当講師
- 藤井 良宜(宮崎大学教育学部 教授)
- 内容
- クロス表と決定木分析を行うにあたり、取り扱うデータと解析の目的を示した後、クロス表解析および決定木分析の方法を説明する。また、決定木分析のメリットとデメリットを考察するために具体的な例を用いて、決定木分析の解説を行う。次に、コンピュータを使った分析の手順を示す。具体的なデータを用いてコンピュータによる分析の過程を示し、分析結果を解釈する。最後に、スポーツの現場で、これらのデータ分析が活用されていることを紹介する。
第3回 クラスター分析
- 担当講師
- 菅 由紀子(Rejoui 代表取締役)
- 内容
- クラスター分析の目的と定義を示したあと、分類に用いる距離の概念について講義する。また、クラスター分析で使われる代表的な手法についても紹介する。次に、コンピュータでクラスター分析を行うにあたり、サンプルデータとしてPOSデータ、および、全国の食費の消費データを用いる。最後に、総務省統計局において公開されている教育用標準データセットから、クラスター分析に活用できるデータを紹介する。
第4回 主成分分析
- 担当講師
- 朝日 弓未(東京理科大学経営学部 教授)
- 内容
- 主成分分析で、どのようなデータを取り扱うのかを示した後、主成分分析の定義および分析手順について解説する。次に、コンピュータによって主成分分析を行うにあたり、教科の試験結果データ、警察官の能力評価データ、魚の形状データといった具体的なデータを用いる。分析結果の解釈の方法についても説明する。最後に、アナリティクスと呼ばれる仕事の目的と内容を紹介したあと、様々なエンジニアやアナリストを支援するコンピュータの活用方法を示す。
第5回 時系列分析
- 担当講師
- 黒田 正博(岡山理科大学経営学部 教授)
- 内容
- 時系列データの定義をした後、時系列データ分析の目的とその方法について解説する。ここでは、時系列データの視覚化、時系列に従ったデータの傾向変動(トレンド)と季節変動の抽出方法を紹介し、データの時点間の相関を分析する方法を講義する。次に、東京エリアの需要電力量データ、および訪日外客数のデータの説明を行ったあと、これらの具体的なデータを用いて、時系列分析を行う。その後、分析結果の解釈について解説する。最後に、時系列データがどのように社会で活用され、企業での取り組みへとつながっているかを紹介する。
ソフトウェア開発への応用
ソフトウェア開発に従事しようとする学生又はすでに従事している技術者を対象に、統計手法を用いたデータ分析・品質予測の技法や品質改善プロセスなどについて講義し、より高品質なソフトウェアを開発するための知識と技術の習得を目指します。
第1回 ソフトウェア開発における測定と分析
- 担当講師
- 小笠原 秀人(千葉工業大学 教授)
- 内容
- ソフトウェア開発における測定と分析について解説する。最初にソフトウェア開発とデータサイエンスの関係について概説し、ソフトウェア開発にデータサイエンスが必要な理由、活用の実態、今後の方向を示す。次に、ソフトウェア開発の定量化・可視化を支える基本的な考え方であるソフトウェアメトリクスについて、その定義を行ったあと、様々なメトリクスを紹介する。最後に、メトリクスの測定と分析方法を学ぶ。メトリクスを用いて測定した結果は、ソフトウェアの品質の向上やプロジェクトでの生産性の向上の指針となることを、事例を用いて紹介する。
第2回 データ分析・品質予測の技法と統計手法
- 担当講師
- 小笠原 秀人(千葉工業大学 教授)
- 内容
- 測定されたデータの活用方法に焦点をあて、データ分析・品質予測の技法と統計手法について学ぶ。最初にソフトウェア開発におけるデータ分析の技法を学ぶ。目的に応じてさまざまな技法があることを説明し、個々の技法の具体的な使い方を学ぶ。次に、ソフトウェアの品質予測に関する技法を学ぶ。品質予測で利用するモデルは、予測する対象と目的によって異なることを理解し、実用性や開発現場での使用頻度を考慮して分類された閾値モデル、ゾーンモデル、関数モデル、トレンドモデルについて学ぶ。最後に、ソフトウェアメトリクスと統計手法について講義する。ソフトウェア開発をより良くするためには、プロジェクトの実行中と次のプロジェクトに向けて、メトリクスの継続的な測定と分析が必要となる。測定された値を比較するために統計手法を適用する。この講義によって、データ分析・品質予測の技法や統計手法を適用して客観的な結論を見いだすことが重要であることを理解する。
第3回 ソフトウェアの品質改善
- 担当講師
- 片峯 恵一(九州工業大学 准教授)
- 内容
- ソフトウェアの品質改善におけるデータサイエンスの応用について講義する。ソフトウェアの不具合を取り除くためのソフトウェアのテストに、開発時間の3割から7割が当てられている例もある。最初に、ソフトウェアの品質について紹介する。続いて、ソフトウェアの品質を改善するための戦略を示す。この戦略を実践するための手法としてPSP、およびTSPがある。前者は個人における開発手法であり、後者はチーム開発における開発手法である。講義では両者における品質改善活動を説明し、複数の品質尺度に関してデータに基づいた事例を紹介する。これらの講義によって、ソフトウェアの品質改善には、データに基づいて評価基準や判断基準を活用し、レビューやインスペクションの効率を向上させることが重要であることを理解する。
第4回 レビューの測定と分析
- 担当講師
- 小笠原 秀人(千葉工業大学 教授)
- 内容
- レビューの測定と分析について講義する。最初にソフトウェア開発の概要を紹介し、品質計画として、開発中に埋め込まれる欠陥数とバグ数を予測する必要性を説明する。また、レビューレポートから収集したデータを用いて、バグ予測を行った分析事例も紹介する。次に、レビュー実施計画のポイントとレビューの実施プロセスを紹介する。ここではレビューの準備が重要であることを示す。最後に、プロジェクトで収集・蓄積したレビューデータの分析方法を説明し、データ分析の基本が予定と実績の比較であることを示す。ここでは、目的に応じて分析方法を決めて活用する必要があることを理解できるように、分析・可視化手法の特徴を紹介する。
第5回 テストの測定と分析
- 担当講師
- 小笠原 秀人(千葉工業大学 教授)
- 内容
- テストの測定と分析について講義する。最初に、ソフトウェア開発における品質計画という作業の目的を位置づけるために、具体的な品質計画の例を示す。ここでは、テスト設計の重要性と収集したデータから理解すべき事項を理解する。次に、膨大な条件の組み合わせへ対処するために、合理的にテスト項目数を減らす必要があることを示し、組み合わせテスト設計プロセスを事例と共に紹介する。最後に、テストデータの分析方法を学ぶ。テストデータの分析の起点は、開発計画である。また、データ分析の基本は予定と実績の比較である。テストの進捗確認、バグ原因の特定、品質状況の把握といった目的に応じた分析方法を紹介することで、状況に応じて分析方法を選択できるようになることを目指す。
第6回 個人とチームの能力向上
- 担当講師
- 片峯 恵一(九州工業大学 准教授)
- 内容
- 個人とチームの能力向上について講義する。最初にソフトウェア技術者に必要な能力を紹介し、ソフトウェアの品質を向上させるためには、個人とチームの能力を向上させる必要があることを示す。これによって、品質の改善には、ソフトウェアプロセスを定義し、活用することの重要性を理解する。次に、PSPで個人に求められる能力の向上として、プログラムの規模見積もりやスケジュール計画、タスク計画による計画立案と進捗管理、レビュー能力向上による品質改善への取り組みを示し、これらの活動の事例を紹介する。また、TSPによるチーム能力向上を目指すために、チームのゴールの設定と役割分担、チームによる開発計画の立案、次の開発サイクルに向けた改善提案について講義する。これによって、チームメンバー全員が定量的な評価に基づく継続的な改善を行えるようになることを示す。
第7回 ソフトウェア開発における統計モデル・機械学習の利用(1)
- 担当講師
- 阿萬 裕久(愛媛大学 特任教授)
- 内容
- ソフトウェア開発における統計モデル・機械学習の利用例として、最初にFault-Prone モジュール分析を紹介する。Fault-Prone モジュールとは、バグがありそうなプログラムという意味である。Fault-Prone モジュール分析によって、実際にフォールトが見つかったモジュールの特徴を定量的に観測し、どのような特徴や傾向を持ったモジュールに「フォールトが潜んでいそうなのか」を明らかにする。次にメトリクスによる特徴の定量化について講義する。ここでは基本的なメトリクスを紹介し、これらのメトリクスを適用して得た測定値を用いて行う決定木分析、およびロジスティック回帰モデルによる分析事例を紹介する。最後に、予測モデルの構築と評価を学ぶ。これによって、様々な分析のモデルが、予測モデルとして使えることを理解する。
第8回 ソフトウェア開発における統計モデル・機械学習の利用(2)
- 担当講師
- 阿萬 裕久(愛媛大学 特任教授)
- 内容
- リポジトリマイニングに関連する話題を紹介する。「ソフトウェアリポジトリ」には、ソフトウェア開発の成果物やそれに関するデータが蓄積されて管理されている。リポジトリマイニングでは、フォールトの修正で書き換えられた部分が、いつの時点で書かれたものであったのかを調べる。最初に、これらの用語の定義をして、リポジトリマイニングの意義を示す。次に、リポジトリマイニングによるフォールト混入予測の例を、基本的なプロセスメトリクスと共に紹介する。最後に、プログラム間の繋がりを分析する技術として、プログラム内の相関ルールマイニングを行って、ロジカルカップリングを検出する例を紹介する。
リハビリテーション科学のDX
本講座では、データサイエンスの手法が、リハビリテーション分野でどのように活用されるのか、豊富な事例を交えて解説を行うことで、当該分野に興味を持つ学生、または、すでに業務としている技術者にとって有益な知識を提供することを目指す。
第1回 機器による計測・評価
- 担当講師
- 片桐 祥雅(東京大学 上席研究員)川原 靖弘(放送大学 准教授)
- 内容
- さまざまな機器を用いたデータ収集の方法とデータの分析方法、そこから読み取る事柄を講義し、この分野におけるデータの有効活用のための知識と技術を得られることを目指す。 最初に、呼吸リハビリテーションについて解説する。ここでは、肺機能を評価するためのスパイロメータと呼ばれる機器による観察と評価について解説する。次に、姿勢制御のメカニズムを解説した後、重心動揺計やモーションキャプチャーシステムを導入して姿勢バランスを評価する事例を紹介する。最後に発話運動と構音障害のリハビリテーションについて触れ、発話の特徴を評価するために、音声解析ソフトを用いた音響学的な音声解析を行う例を紹介する。
第2回 人間による計測・評価
- 担当講師
- 片桐 祥雅(東京大学 上席研究員)川原 靖弘(放送大学 准教授)
- 内容
- 医療者やセラピストなどリハビリテーションに携わる”人間”によるデータ収集や分析がテーマである。人間の経験知に基づく計測・評価をいかにデータサイエンスに結びつけ、実践に活かしていくかを考える。 最初に失語症における検査を数値化することで言語機能を把握する事例を紹介する。次に認知症を事例として取り挙げ、認知機能を検査するための音声対話AIエージェント・システム AIKoを紹介する。最後に音楽療法について解説する。音楽療法の効果を定量的に評価する指標にFIM(Functional independence measure)がある。これによって観測された評価結果を主成分分析すると、精神面、および身体面、それぞれの自立の度合いを評価できる。このような分析結果を得ることで、リハビリテーションの計画を立てることが可能となる。また、データを時系列でとることで、セラピストの介入による効果の推移を知ることもできる。
第3回 課題と将来の方向性
- 担当講師
- 片桐 祥雅(東京大学 上席研究員)川原 靖弘(放送大学 准教授)
- 内容
- リハビリテーション科学におけるデータサイエンス活用の現状での課題と、将来の方向性・可能性について考える。 リハビリテーションでは、対象となる方の医学的情報とともに検査を行うことでリハビリ上の問題点を抽出し、機能回復に向けた訓練の立案実施を行っている。 本講義では,最初に、失語症の言語リハビリテーションの効果を知るために使われている脳機能計測の研究を紹介する。次に、近年リラクゼーションの効果があるとして、関心が高まっていアロマ療法について触れる。ある施術や訓練の効果に対する信頼性は、エビデンスレベルによってレベル分けされる。アロマに関する研究は多いが、エビデンスレベルを高めることが課題である。最後に医療現場で、臨床研究により明らかにされたエビデンスレベルの低い成果を、どのように治療に活用していくのかを考え、医療・リハビリテーションではSOAPという形式の診療記録が残されている。これらのデータを用いるデータサイエンスあるいはAIへの期待について解説する。
地理空間情報とデータサイエンス
地理空間情報とそれを扱う地理情報システム(GIS)の基礎を学んだ後、空間事象の特徴を把握するための視覚的な分析についての理解を深めます。また、機械学習や深層学習といった技術が地理空間情報分野でどのように活用されているかを、具体例を通じて学習します。
第1回 地理空間情報の基礎と可視化
- 担当講師
- 山田 郁穂(東京大学 教授)
- 内容
- 地理空間情報の基礎と可視化について解説する。最初に、地理空間情報について、それを扱うコンピュータシステムである地理情報システム(GIS)や基盤となる学問分野である空間情報科学など、関連する概念と併せて概説する。次に、地理空間情報として扱われる様々な空間データを紹介する。ベクタ型・ラスタ型という基本的な空間データの構造について説明した後、最近登場した新しいタイプの空間データについても紹介する。最後に、空間データの可視化について説明する。空間データを、地図として表現することは、空間データの分布の特徴を理解するための第一歩である。ここでは様々な可視化の手法を事例を交えて紹介する。
第2回 地理空間情報の統計分析
- 担当講師
- 山田 郁穂(東京大学 教授)
- 内容
- 地理空間情報を統計的に分析するためのさまざまな手法を、相関分析や回帰分析など一般の統計分析手法と関連づけながら学習する。 最初に、空間データを分析する際に大切な空間データの特性を解説したあと、空間データの分析によく用いられる領域分析を紹介する。次に、地物を点として表現した点データについて、その空間分布に着目した分析手法を事例を交えて説明する。最後に、面データに付加された人口や人口密度などの属性情報について、その空間分布の特性を分析する手法と属性間の関係性をモデル化する手法を紹介する。
第3回 地理空間情報とビッグデータ活用
- 担当講師
- 沖 拓弥(東京工業大学 准教授)
- 内容
- 近年、普及が進んでいる地理空間情報ビッグデータを概観した上で、それらの主要な分析方法について学習する。 最初に、地理空間情報ビッグデータ活用について、その意義、種類、現状について解説する。次に、地理空間情報ビッグデータ活用の分析手法を取り上げ、特に地理空間情報ビッグデータの主要な分析方法の中から、次元削減の手法について解説する。最後に、地理空間情報ビッグデータ活用の分析手法の中から、クラスタリング、回帰分析、異常値検知について講義する。
第4回 地理空間情報とAI・機械学習の活用
- 担当講師
- 沖 拓弥(東京工業大学 准教授)
- 内容
- AIや機械学習の概要をおさえた上で、地理空間情報分野でAIや機械学習がどのように活用されているかを、具体例を通じて学習する。最初に機械学習に関する技術を概観し、建築・都市計画研究において、どのようにAIが活用されているのかを、現状と将来に対する展望を合わせて紹介する。また、実際の画像・映像処理技術の活用について、事例を用いて解説する。次に、建築・都市計画研究におけるAI活用の例として、深層学習を活用した判別・回帰について講義し、複数の事例を紹介する。AI活用の最後の例として、画像生成についても解説する。本講義で紹介した事例から、地理空間情報とAI・機械学習をベースに、より良い建築・都市づくりを行うためには、AIの強みと弱みを共に理解した上で、AIと私たち人間が共働していく姿勢が重要であることを学ぶ。
コミュニケーション学への応用
第1回 コミュニケーション学への応用
- 担当講師
- 高井 次郎(名古屋大学大学院 教授)
- 内容
- 数理・データサイエンス・AI専門講座は、応用基礎レベルの教育を終えた人々が、それぞれの領域でデータサイエンスを活用する専門家の入り口として学ぶ内容を含めるように企画している。 コミュニケーション学の研究において、先行研究などから導き出された仮説をアンケートで集めたデータによって検証する場合などによく用いられる統計的手法を紹介する。連続変数による正規分布の回答に基づくデータを前提とした上で、項目・尺度分析(項目分析、因子分析、信頼性係数)、平均値の差の検定(分散分析)、変数間の因果関係(相関係数、重回帰分析、構造方程式)について説明する。
企業経営における実際
企業におけるデータサイエンスの適用事例をデジタルトランスフォーメーションという側面から講義する。講義は、マーケティング、
営業活動への適用事例と適用技術の両側面から紹介する。
第1回 企業のデータ活用と求められる人材
- 担当講師
- 佐々木 宏(立教大学 教授)
- 内容
- 企業のデータ活用と求められる人材とはどのようなものなのかを複数の視点から捉えると共に、生産設備の制御事業をグローバルに展開する企業からDX の先端事例を紹介する。最初にDXで求められている事柄を、人材、技術、組織という3つの視点から論ずる。次に、データ活用という側面から、企業におけるデータ活用基盤を紹介する。最後に収集したデータを分析する時に使用するBI ツール(Business Intelligence Tool)の適用例を紹介する。
第2回 消費者理解のためのデータ活用
- 担当講師
- 柿原 正郎(東京理科大学 教授)
- 内容
- 私たちの回りで実際に体験しているデジタルによる変化を理解しながら、企業としてどのように消費者を理解していけばよいのか、また、それをどのように実際のビジネスにつなげていくべきなのかを議論する。講義では、最初に、デジタル技術の発展と普及によって、私たち自身の生活や消費行動に生じた変化を考察し、次に、これらの変化に対して、企業が収集すべきデータとデータ分析の方法と効果を講義する。最後に、実際のビジネスにインパクトを与えるような施策につなげるために必要となる「インサイト」という考え方について学ぶ。
第3回 機械学習のマーケティング応用
- 担当講師
- 生田目 崇(中央大学 教授)
- 内容
- マーケティングにおけるデータサイエンス、特に、データ活用について講義する。最初に、マーケティングについて簡単に解説した後、マーケティング分野の分析で使われているデータと、収集方法をまとめる。また、ビッグデータの活用が期待される現代において、情報活用データ活用とデータ利用制限はトレードオフの関係にある。個人情報や情報プライバシーに関する各国の規制について触れる。また、機械学習の手法についても解説し、マーケティング分野における機械学習手法の活用の方向性を紹介する。最後に、 様々な機械学習の成果の活用状況を明らかにするために、マーケティング分野でのコンサルティングやシステム開発を行っている企業の方へのインタビューを紹介し、その「実際」と「課題」や「期待」を考察する。
第4回 営業活動におけるデータサイエンス
- 担当講師
- 北中 英明(拓殖大学 教授)
- 内容
- 本講義の目的は、営業活動におけるデータサイエンスの現状を学ぶことである。最初に営業活動を支える情報システムについて学ぶ。次に、営業活動におけるデータ活用の実態について学んだ後、企業の方へのインタビューを紹介しながら、実際の営業活動の状況を紹介する。最後に、営業活動の将来を展望する。