京都大学国際高等教育院附属 データ科学イノベーション教育研究センター

menu

データ分析基礎

開講時期 年度 後期
担当教員 国際高等教育院 特定講師 關戸 啓人
授業情報 (群) 自然 群 (分野(分類)) データ科学(基礎) (使用言語) 日本語
(旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 講義
(開講年度・開講期) 2018・後期 (配当学年) 全回生 (対象学生) 全学向
(曜時限) 火5
(教室) 情報メ203(情報処理室)
授業の概要・目的 本授業の目的は、データ分析の基本的な事項を学び、実際に大規模データ解析を行うための基礎的な技術を身につけることにある。なお、大規模データ解析や最新のデータ分析手法を行うにあたっては、既存のソフトウェアを用いて簡潔にできるとは限らない。そこで、本授業では、実際にはどのように計算機を用いて計算されているのかについても軽く述べる。ただし、厳密な数学的証明は必要最小限に抑え、直感的な理解を深める事を目標とする。
 はじめに、データを扱う上で必要不可欠な確率変数・平均・分散などの統計の基礎的な概念について解説する。また、仮説検定の考え方を述べ、いくつかの例を用いて解説する。
 その後、複数の変数の関係性を調べる多変量解析を行う際に必要となる数値線形代数について講義する。特に、連立一次方程式の解法であるガウスの消去法、回帰分析において必要となるQR分解、主成分分析などで重要となる固有値分解・特異値分解について解説する。
 次に、多変量解析の基礎である回帰分析と主成分分析について講義する。また、回帰分析、主成分分析について理解を深めるためExcelと統計ソフトRを使って実習を行う。
 時間が許せば、大規模データ解析を行うための数値線形代数についても講義を行う。
到達目標 1. 確率変数・平均・分散など統計の基礎的な内容、および、仮説検定について理解する。
2. 多変量解析の基礎である回帰分析、主成分分析についての概念を理解し、データ分析に応用できるようになる。
3. 数値線形代数の基礎的な知識を習得し、回帰分析、主成分分析を計算機で行う方法について理解する。
4. Excelと統計ソフトRを使いこなす知識を身につけ、実際に簡単なデータ分析を行えるようになる。
授業計画と内容 全14回の予定は以下の通りである。

・ガイダンス、統計の基礎(關戸、1回)
授業の概要について説明する。その後、確率変数・平均・分散など統計の基礎的な内容について講義する。

・仮説検定(關戸、1回)
仮説検定について、その基本的な考え方について講義する。

・数値線形代数の基礎(木村、4回)
二分法やニュートン法など基本的な数値計算の内容を題材に、計算科学の考え方を講義する。その後、連立一次方程式の解法であるガウスの消去法、回帰分析において必要となるQR分解、主成分分析などで重要となる固有値分解について解説する。

・統計処理(關戸、7~8回)
多変量解析の基礎である回帰分析、主成分分析について講義する。Excelと統計ソフトRを用いて実習も行う。

・大規模データ解析のための数値線形代数(木村、0~1回)
計算機を用いて、絶対値の大きいほうからいくつかの固有値とその固有ベクトル、または、特異値とその特異ベクトルを計算する方法について講義する。なお、授業の進行状況によっては、省略する可能性がある。

履修要件 特になし

Contact

〒606-8315 京都市左京区吉田近衛町69 近衛館202, 301, 302号室
Tel. 075-753-9691
E-mail : contact@ds.k.kyoto-u.ac.jp