データ分析演習I
開講時期 | 2021年度 前期 |
---|---|
担当教員 | 国際高等教育院 特定講師 木村 真之 |
授業情報 | (群) 自然 群 (分野(分類)) データ科学(発展) (使用言語) 日本語 (旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 演習 (開講年度・開講期) 2021・前期 (配当学年) 全回生 (対象学生) 全学向 (曜時限) 火5 (教室) 情報メ204(情報処理室) |
授業の概要・目的 | コンピュータやネットワーク,様々なセンサなどの技術の進歩により,日々膨大なデータが蓄積されるようになった.よって今日ではデータの活用が課題となり,データを適切に分析し,その結果から適切な判断を下すことが重要である.「データ分析演習I」では,データ科学の基礎をなすデータ解析手法の理論や実装法などを実践的に学び身につけることを目的とする.まず,データ科学の分野で広く用いられているPython の導入法や基礎プログラミングを修得し,データの取得方法や整形,可視化など,データ科学に必要不可欠な技術を学ぶ.続いて回帰分析や教師あり/教師なし機械学習の基礎理論と実装法を修得する.具体的には,重回帰,ロジスティック回帰,Ridge,Lasso,サポートベクターマシン,ランダムフォレストなどの決定木,ニューラルネットワーク,k近傍法,k平均法,多様体学習,主成分分析などを学ぶ. |
到達目標 | 1. データ分析の理論的基礎となる確率論や統計学,線形代数学の基礎を理解する. 2. Python 言語を用いてデータ分析に必要な基礎的な統計処理ができるようになる. 3. 回帰分析,機械学習,クラスタリングについて概要を理解し,プログラミング言語による実装方法を理解する. |
授業計画と内容 | 第1回 データサイエンス概観とPythonの導入 第2-4回 Pythonプログラミング入門 第5回 NumPy入門 第6回 pandas入門 第7回 データの入出力・整形 第8回 データの可視化 第9回 時系列データの解析 第10回 機械学習の基礎 第11回 回帰分析 (重回帰, ロジスティック回帰, Ridge, Lasso) 第12回 教師あり機械学習 (サポートベクターマシン,ランダムフォレストなどの決定木,ニューラルネットワーク,k近傍法) 第13回 教師なし機械学習 (k平均法,多様体学習,主成分分析) 第14回 テキストデータの解析 第15回 レポート解説およびフィードバック |
履修要件 | 共通教育における微積分,線形代数,確率,統計程度の内容を理解していることが望ましい.また,プログラミングの初歩的技術を習得していることが望ましい. |