データ分析演習I
開講時期 | 2022年度 前期 |
---|---|
担当教員 | 非常勤講師 木村 真之 |
授業情報 | (群) 自然 群 (分野(分類)) データ科学(発展) (使用言語) 日本語 (旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 演習 (開講年度・開講期) 2022・前期 (配当学年) 全回生 (対象学生) 全学向 (曜時限) 火2 (教室) 共北24(CALL) |
授業の概要・目的 | 今日では、コンピュータやネットワーク、様々なセンサなどの技術の進歩により、日々膨大なデータが蓄積されるようになった。これらのデータの活用への期待は大きく、データを適切に分析し、その結果から適切な判断を下すことが重要である。 「データ分析演習I」は、ICT(情報通信技術)の進展とビッグデータ、さらにデータ表現の基礎等を確認したうえで、原則としてプログラミング言語を用いた経験のない学生を対象として、データ解析の基礎を習得する実践科目である。 本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の内、データサイエンス基礎とデータエンジニアリング基礎、AI基礎をバランスよくカバーする形で構成されている。 具体的には、データを扱うために必要なプログラミングスキル、データの取得・整形、種々の可視化手 法、機械学習の基礎について学ぶ。まず、データ科学の分野で広く用いられているPython の導入法や基礎文法を修得し、データの取得方法や整形、可視化など、データ科学に必要不可欠な技術を学ぶ。続いて回帰分析や教師あり/教師なし機械学習の基礎理論と実装法を修得する。具体的には、重回帰、ロジスティック回帰、Ridge、Lasso、サポートベクターマシン、ランダムフォレストなどの決定木、ニューラルネットワーク、k近傍法、k平均法、多様体学習、主成分分析などを学ぶ。 |
到達目標 | 1. データ分析の理論的基礎となる確率論や統計学、線形代数学の基礎を理解する。 2. Python 言語を用いてデータ分析に必要な基礎的な統計処理ができるようになる。 3. 回帰分析、機械学習、クラスタリングについて概要を理解し、プログラミング言語による実装方法を理解する。 |
授業計画と内容 |
フィードバックを含め全15回の授業で、Python言語を用いてデータ分析を実践する。本演習の前半ではデータ科学分野で広く使用されているPython言語の基礎プログラミングと外部モジュールを用いたデータの整形や可視化について、後半では機械学習モジュールを用いた教師あり/教師なし機械学習の実装と演習を予定している。 第1回 データサイエンス概観とPythonの導入(データ駆動型社会・データサイエンス活用事例、ビッ なお、講義の進度・文科省のモデルカリキュラム等を反映して内容順序の変更や省略・追加を行うことがある。 |
履修要件 | 「統計入門」あるいは同等の科目を履修していることがのぞましい。 また、共通教育における線形代数の基礎知識(ベクトルや行列など)や高校レベルの数学の知識を必要とする。 |