京都大学国際高等教育院附属 データ科学イノベーション教育研究センター

menu

データ分析基礎

開講時期 年度 前期
担当教員 国際高等教育院 教授 原 尚幸
授業情報 (群) 自然 群 (分野(分類)) データ科学(基礎) (使用言語) 日本語
(旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 講義
(開講年度・開講期) 2024・前期 (配当学年) 全回生 (対象学生) 全学向
(曜時限) 火5
(教室) 情報メ203(マルチメディア演習室)
授業の概要・目的

 本講義は、近年のビッグデータ解析において重要な役割を果たしている機械学習・AIの基礎理論である多変量解析の諸手法を理論・実践の両面から学習し、多次元データが与えられたときに、適切な手法を選んで能動的にデータ分析を行い、結果を正しく解釈できるようになることを目的とする。
具体的には、回帰分析、クラスター分析、判別分析、主成分分析、対応分析、正準相関分析などの手法について、実用例とともに解説を行う。また、近年の機械学習・AIへの接続として、スパース法やカーネル法の初歩的な考え方についても解説を行う。
線形代数・(高校数III程度の)微積分のごく基本的な知識があることが望ましい。
また、統計入門は受講済であることが望ましい。

本講義の単位(2単位)を修得することで、文部科学省が定める数理・データサイエンス・AI教育プログラム応用基礎レベル(MDASH Advanced Literacy)修了証の取得が可能である。
修了証取得の手続きについては、講義内で担当教員より指示がある。

到達目標 1. 近年における多次元データの重要性について理解をする。
2. 多変量解析の諸手法について概念、特に「次元縮約の概念」と、その使いどころを理解し、多次元のデータ分析に応用できるようになる。
3. 統計ソフトRを使いこなす知識を身につけ、実際に簡単なデータ分析を行えるようになる。
4. 近年の機械学習における多変量解析の展開を理解する。
授業計画と内容

授業回数はフィードバックを含め全15回とする。
開講にあたっては、受講生の所属するキャンパスの配置や受講形態にも配慮し、一部メディア授業を取り入れることがある。

・ガイダンス(1回)
授業の概要を確認するとともに、本講義で主として学習する多変量解析の考え方を概説する。

・データリテラシー1(1回)
近年のAI技術の利活用と課題について解説を行う。

・回帰分析(3回)
機械学習・AIを用いた予測の基礎技術である回帰分析について学習する。最小二乗法を用いたデータ分析の方法について詳しく解説を行った後、機械学習への接続としてスパース法や非線形回帰などについても実践的に学ぶ。

・クラスター分析(2回)
教師なし学習の代表的な技術であるクラスター分析の考え方について学習する。階層的クラスター分析・非階層的クラスター分析に加え、多次元尺度構成法について学習する。

・主成分分析(2回)
多変量解析の基礎である主成分分析について学習する。基本的な線形代数を用いて「データ縮約」の考え方を学ぶ。

・判別分析(2回)
古典的な正準判別分析の初概念を線形代数を用いて解説する。また、サポートベクターマシンのような機械学習的な手法についても概説する。

・対応分析(2回)
質的データの多変量解析手法である対応分析と結果の可視化の手法について概説を行う。

データリテラシー(2)(1回)
データ駆動型社会、Society 5.0、ビッグデータ、プライバシー保護、個人情報の取り扱いについて解説する。

・フィードバック(1回)

履修要件 全学共通科目の統計入門、あるいは数理統計で学習した知識を一部前提とするので、これらのいずれかを受講済であることを推奨する。

Contact

〒606-8315 京都市左京区吉田近衛町69 近衛館202, 301, 302号室
Tel. 075-753-9691
E-mail : contact@ds.k.kyoto-u.ac.jp