京都大学国際高等教育院附属 データ科学イノベーション教育研究センター

menu

文部科学省 数理・データサイエンス・AI教育プログラム認定制度(応用基礎レベル) 準拠
データ科学群応用基礎プログラム

本プログラムは、「文部科学省 数理・データサイエンス・AI教育プログラム認定制度(応用基礎レベル)」に認定されました。

認定の有効期限:2027年3月31日まで

実施体制

プログラムの運営責任者 国際高等教育院長
プログラムを改善・進化させるための体制 国際高等教育院 附属データ科学イノベーション教育研究センター 企画評価委員会
プログラムの自己点検・評価の体制 国際高等教育院 附属データ科学イノベーション教育研究センター 企画評価委員会

プログラムを構成する科目

「データ分析基礎」「統計と人工知能」「データ分析演習Ⅰ」「データ分析演習Ⅱ」

授業概要 (http://ds.k.kyoto-u.ac.jp/subjects/)

関連教材

全学ガイダンス動画「ビッグデータの時代データ科学を学ぼう」(学内限定)
学内MOOC「統計の入門」
情報倫理デジタルビデオ小品集(学内限定)
データ科学のためのPython入門教材(学内限定)

プログラムの修了要件

「データ分析基礎」「統計と人工知能」「データ分析演習Ⅰ」「データ分析演習Ⅱ」のいずれかの単位(2単位)を取得すること

(注意) 修了証の取得については別途通知する方法に従うこと.

「データ分析基礎」の概要

授業の概要・目的

本授業の目的は、データ分析の基本的な事項を学び、実際に大規模データ解析を行うための基礎的な技術を身につけることである。大規模データ解析や最新のデータ分析手法の適用は、既存のソフトウェアを用いて簡単に実行できるとは限らない。そこで、本授業では、データ分析の基礎となる線形代数と最適化手法についても講義する。ただし、厳密な数学的証明は必要最小限に抑え、直観的な理解を深めることを目標とする。本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の、データサイエンス基礎・データエンジニアリング基礎・AI 基礎をバランスよくカバーする形で構成されている。
はじめに、データを扱う上で必要不可欠な確率変数・平均・分散などの統計の基礎的な概念について解説する。また、仮説検定の考え方を述べ、いくつかの例を用いて解説する。
その後、複数の変数の関係性を調べる多変量解析を行う際に必要となる線形代数について講義する。特に、連立一次方程式の解法であるガウスの消去法とLU分解、回帰分析において必要となるQR分解、主成分分析などで重要となる固有値分解・特異値分解について解説する。
次に、多変量解析の基礎である回帰分析と主成分分析について講義する。また、回帰分析、主成分分析について理解を深めるためExcelと統計ソフトRを使って演習を行う。
最後に、スパース推定を題材にして、最適化手法についての講義と演習を行う。最急降下法や共役勾配法などの無制約最適化手法を解説した後、Lasso回帰に現れる最適化問題の解法として近接勾配法について講義する。

到達目標

  1. 確率変数・平均・分散など統計の基礎的な内容、および、仮説検定について理解する。

  2. 多変量解析の基礎である回帰分析、主成分分析についての概念を理解し、データ分析に応用できるようになる。

  3. Excelと統計ソフトRを使いこなす知識を身につけ、実際に簡単なデータ分析を行えるようになる。

  4. データ分析に登場する最適化問題とそれを解くアルゴリズムについて、基本的な考え方を理解する。

「統計と人工知能」の概要

授業の概要・目的

本講は、研究や、生活、社会・経済活動に不可欠な統計を、集計・分析し、理解する力を養うことをひとつめの目的として、科目「統計入門」で扱えなかった、やや発展的な話題を中心に講義することで、より発展的な統計・統計学の学習への礎となることを目指す。
本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の、データサイエンス基礎・データエンジニアリング基礎・AI 基礎をバランスよくカバーする形で構成されている。
具体的には、平均の差の検定、分散分析、相関と回帰・判別分析の基礎について解説するとともに、一般化線形モデルによるこれらの統一的な理解を行う。さらに、因果推論の基本的な考え方と、具体的な方法についても解説を行う。
さらに、本講では第二の目的として、近年注目されている人工知能について、その基本的な考え方や応用について理解することで、現在も目まぐるしい早さで発展している当該分野への橋渡しを行う。近年の人工知能技術は膨大なデータをもとにした統計的なアプローチに基づいており、統計学がどのような形でその基礎を形作っているかを中心に学ぶ。
具体的には、機械学習における基本的な統計的手法をはじめ、ニューラルネットワーク、深層学習など、近年大きく発展している技術、また、それらの応用として自然言語処理や画像処理などの話題について解説する。
本講は、統計分析手順や人工知能手法の機械的な利用や解釈だけを講義するのではなく、その基礎となる考え方を学ぶことを目指しているが、あくまで直感的な理解を目指すことを主な目標とし、厳密な数学的証明等は避ける。

到達目標

  1. 統計的検定と推定の考え方、とくに平均の差の検定・分散分析の考え方を理解し、これを実施できる。

  2. 相関と回帰について理解し、これを実施できる。

  3. 因果推論の基本的な考え方と手法を理解する。

  4. 人工知能・機械学習の基本的な考え方と手法を理解する。

  5. 統計と人工知能の手法と応用について幅広く知り、今後の学習につなげる。

「データ分析演習Ⅰ」の概要

授業の概要・目的

「データ分析演習I」は、ICT(情報通信技術)の進展とビッグデータ、さらにデータ表現の基礎等を確認したうえで、原則としてプログラミング言語を用いた経験のない学生を対象として、データ解析の基礎を習得する実践科目である。
本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の内、データサイエンス基礎とデータエンジニアリング基礎、AI基礎をバランスよくカバーする形で構成されている。
具体的には、データを扱うために必要なプログラミングスキル、データの取得・整形、種々の可視化手 法、機械学習の基礎について学ぶ。まず、データ科学の分野で広く用いられているPython の導入法や基礎文法を修得し、データの取得方法や整形、可視化など、データ科学に必要不可欠な技術を学ぶ。続いて回帰分析や教師あり/教師なし機械学習の基礎理論と実装法を修得する。具体的には、重回帰、ロジスティック回帰、Ridge、Lasso、サポートベクターマシン、ランダムフォレストなどの決定木、ニューラルネットワーク、k近傍法、k平均法、多様体学習、主成分分析などを学ぶ。

到達目標

  1. データ分析の理論的基礎となる確率論や統計学、線形代数学の基礎を理解する。

  2. Python 言語を用いてデータ分析に必要な基礎的な統計処理ができるようになる。

  3. 回帰分析、機械学習、クラスタリングについて概要を理解し、プログラミング言語による実装方法を理解する。

「データ分析演習Ⅱ」の概要

授業の概要・目的

「データ分析演習Ⅱ」は、ICT(情報通信技術)の進展とビッグデータ、さらにデータ表現の基礎等を確認したうえで、原則としてプログラミング言語を用いた経験のない学生を対象として、データ解析の基礎を習得する実践科目である。
本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の、データサイエンス基礎とデータエンジニアリング基礎AI基礎をバランスよくカバーする形で構成されている。
具体的には、データサイエンス活用事例 (仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替など)として 医学・医療を中心とした実社会のデータを用いた実習を行う。Excelや統計解析ソフトR等の入手が容易な統計ソフトを用いて「統計入門」等で学んだ分析⽬的の設定に始まり、様々なデータ分析⼿法や様々なデータ可視化⼿法等の統計処理(統計検定2~3級レベルの内容)を実践する。
その中では、データの収集、加⼯、分割/統合、標本調査や、サンプルサイズ、ランダム化比較試験についても知識を深めつつ、AI・機械学習についても学ぶ。

到達目標

  1. データ分析の理論的基礎となる確率論や統計学等の基礎を理解したうえで、データから意味を抽出し現場にフィードバックできるようになる。

  2. Excel、R言語等を用いてデータ分析に必要な基礎的な統計処理ができるようになる。

  3. 自らの専門分野に数理・デー1タサイエンス・AIを応用するために、回帰分析などのデータ解析について概要を理解し、GUIを経て、CUIベースでの効率的な解析を習得する。

自己点検・評価

京都大学 国際高等教育院 附属データ科学イノベーション教育研究センター 令和3年度自己点検・評価報告書 --全学共通教育編- (リテラシーレベル・応用基礎レベル)

Contact

〒606-8315 京都市左京区吉田近衛町69 近衛館202, 301, 302号室
Tel. 075-753-9691
E-mail : contact@ds.k.kyoto-u.ac.jp