京都大学国際高等教育院附属 データ科学イノベーション教育研究センター

menu

データ分析基礎

開講時期 年度 後期
担当教員 国際高等教育院 教授 原 尚幸
授業情報 (群) 自然 群 (分野(分類)) データ科学(基礎) (使用言語) 日本語
(旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 講義
(開講年度・開講期) 2023・後期 (配当学年) 全回生 (対象学生) 全学向
(曜時限) 火5
(教室) 情報メ203(情報処理室)
授業の概要・目的

本講義は、近年のビッグデータ解析において重要な役割を果たしている機械学習・AIの基礎理論である多変量解析の諸手法を理論・実践の両面から学習し、多次元データが与えられたときに、適切な手法を選んで能動的にデータ分析を行い、結果を正しく解釈できるようになることを目的とする。
具体的には、回帰分析、クラスター分析、判別分析、主成分分析、対応分析、正準相関分析などの手法について、実用例とともに解説を行う。また、近年の機械学習・AIへの接続として、スパース法やカーネル法の初歩的な考え方についても解説を行う。
線形代数・(高校数III程度の)微積分のごく基本的な知識があることが望ましい。
また、統計入門は受講済であることが望ましい。

本講義は文部科学省の「数理・データサイエンス・AI教育プログラム認定制度(応用基礎レベル)」の認定科目である。本講義を履修することで「応用基礎レベル」の修了証が発行される。

到達目標 1. 多変量解析の諸手法についての概念と使いどころを理解し、データ分析に応用できるようになる。
2. 統計ソフトRを使いこなす知識を身につけ、実際に簡単なデータ分析を行えるようになる。
3. 多変量解析における「データ縮約」の概念を数理的に理解する。
授業計画と内容

授業回数はフィードバックを含め全15回とする。
開講にあたっては、受講生の所属するキャンパスの配置や受講形態にも配慮し、一部メディア授業を取り入れることがある。

・ガイダンス(1回)
授業の概要を確認するとともに、本講義で主として学習する多変量解析の考え方を概説する。

・データリテラシー1(1回)
近年のAI技術の利活用と課題について解説を行う。

・回帰分析(3回)
機械学習・AIを用いた予測の基礎技術である回帰分析について学習する。最小二乗法を用いたデータ分析の方法について詳しく解説を行った後、機械学習への接続としてスパース法や非線形回帰などについても実践的に学ぶ。

・クラスター分析(2回)
教師なし学習の代表的な技術であるクラスター分析の考え方について学習する。階層的クラスター分析・非階層的クラスター分析に加え、多次元尺度構成法について学習する。

・主成分分析(2回)
多変量解析の基礎である主成分分析について学習する。基本的な線形代数を用いて「データ縮約」の考え方を学ぶ。

・判別分析(2回)
古典的な正準判別分析の初概念を線形代数を用いて解説する。また、サポートベクターマシンのような機械学習的な手法についても概説する。

・対応分析(2回)
質的データの多変量解析手法である対応分析と結果の可視化の手法について概説を行う。

データリテラシー(2)(1回)
データ駆動型社会、Society 5.0、ビッグデータ、プライバシー保護、個人情報の取り扱いについて解説する。

・フィードバック(1回)

履修要件 特になし

Contact

〒606-8315 京都市左京区吉田近衛町69 近衛館202, 301, 302号室
Tel. 075-753-9691
E-mail : contact@ds.k.kyoto-u.ac.jp