データ分析基礎
開講時期 | 2022年度 前期 |
---|---|
担当教員 | 情報学研究科 特定准教授 佐藤 寛之 |
授業情報 | (群) 自然 群 (分野(分類)) データ科学(基礎) (使用言語) 日本語 (旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 講義 (開講年度・開講期) 2022・前期 (配当学年) 全回生 (対象学生) 全学向 (曜時限) 火5 |
授業の概要・目的 | 本授業の目的は、データ分析の基本的な事項を学び、実際に大規模データ解析を行うための基礎 的な技術を身につけることである。大規模データ解析や最新のデータ分析手法の適用は、既存のソ フトウェアを用いて簡単に実行できるとは限らない。そこで、本授業では、データ分析の基礎とな る線形代数と最適化手法についても講義する。ただし、厳密な数学的証明は必要最小限に抑え、直 観的な理解を深めることを目標とする。本講義は、文部科学省のモデルカリキュラム(応用基礎レ ベル)の、データサイエンス基礎・データエンジニアリング基礎・AI 基礎をバランスよくカバーす る形で構成されている。 はじめに、データを扱う上で必要不可欠な確率変数・平均・分散などの統計の基礎的な概念につ いて解説する。また、仮説検定の考え方を述べ、いくつかの例を用いて解説する。 その後、複数の変数の関係性を調べる多変量解析を行う際に必要となる線形代数について講義す る。特に、連立一次方程式の解法であるガウスの消去法とLU分解、回帰分析において必要となる QR分解、主成分分析などで重要となる固有値分解・特異値分解について解説する。 次に、多変量解析の基礎である回帰分析と主成分分析について講義する。また、回帰分析、主成 分分析について理解を深めるためExcelと統計ソフトRを使って演習を行う。 最後に、スパース推定を題材にして、最適化手法についての講義と演習を行う。最急降下法や共 役勾配法などの無制約最適化手法を解説した後、Lasso回帰に現れる最適化問題の解法として近接勾 配法について講義する。 |
到達目標 | 1. 確率変数・平均・分散など統計の基礎的な内容、および、仮説検定について理解する。 2. 多変量解析の基礎である回帰分析、主成分分析についての概念を理解し、データ分析に応用 できるようになる。 3. Excelと統計ソフトRを使いこなす知識を身につけ、実際に簡単なデータ分析を行えるよう になる。 4. データ分析に登場する最適化問題とそれを解くアルゴリズムについて、基本的な考え方を理 解する。 |
授業計画と内容 |
授業回数はフィードバックを含め全15回とする。 データ分析基礎(2) |
履修要件 | 特になし |