京都大学国際高等教育院附属 データ科学イノベーション教育研究センター

menu

データ分析演習II

開講時期 年度 後期
担当教員 国際高等教育院 教授 田村 寛
授業情報 (群) 自然 群 (分野(分類)) データ科学(発展) (使用言語) 日本語
(旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 演習
(開講年度・開講期) 2022・後期 (配当学年) 全回生 (対象学生) 全学向
(曜時限) 木1
(教室) 情報メ203(情報処理室)
授業の概要・目的

今日では、コンピュータやネットワーク、様々なセンサなどの技術の進歩により、日々膨大なデータが蓄積されるようになった。これらのデータの活用への期待は大きく、データを適切に分析し、その結果から適切な判断を下すことが重要である。 「データ分析演習Ⅱ」は、ICT(情報通信技術)の進展とビッグデータ、さらにデータ表現の基礎等を確認したうえで、原則としてプログラミング言語を用いた経験のない学生を対象として、データ解析の基礎を習得する実践科目である。
本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の、データサイエンス基礎とデータエンジニアリング基礎AI基礎をバランスよくカバーする形で構成されている。
具体的には、データサイエンス活用事例 (仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替など)として 医学・医療を中心とした実社会のデータを用いた実習を行う。Excelや統計解析ソフトR等の入手が容易な統計ソフトを用いて「統計入門」等で学んだ分析⽬的の設定に始まり、様々なデータ分析⼿法や様々なデータ可視化⼿法等の統計処理(統計検定2~3級レベルの内容)を実践する。
その中では、データの収集、加⼯、分割/統合、標本調査や、サンプルサイズ、ランダム化比較試験についても知識を深めつつ、AI・機械学習についても学ぶ。

到達目標 1.データ分析の理論的基礎となる確率論や統計学等の基礎を理解したうえで、データから意味を抽出し現場にフィードバックできるようになる。
2. Excel、R言語等を用いてデータ分析に必要な基礎的な統計処理ができるようになる。
3. 自らの専門分野に数理・デー1タサイエンス・AIを応用するために、回帰分析などのデータ解析について概要を理解し、GUIを経て、CUIベースでの効率的な解析を習得する。
授業計画と内容

フィードバックを含め全15回の授業で、統計ソフトを用いてデータ分析を実践する。本演習の前半ではビジネスの現場での使用頻度が圧倒的で「統計検定 データサイエンス基礎」の公式ソフトでもある「Excel(分析ツール)」、後半では研究の場での活用頻度が高い「R」をベースに医学向けGUIを実装した「EZR」を用いたデータ分析を予定している。

また、演習の中では、e-learning教材の活用や統計検定2~3級レベル、データサイエンス基礎レベルの課題への取り組みも予定している。

受講者の関心領域によってはゲストスピーカーの協力を得ることもある。

なお開講にあたっては、受講生の所属するキャンパスの配置や受講形態にも配慮し、一部メディア授業も取り入れる。

1.導入・統計の基礎(データ駆動型社会・データサイエンス活用事例、ビッグデータ、データの種類の概説、プライバシー保護、個人情報の取り扱いを含む) 1回 
2. 「Excel, Rの基礎」、データの可視化 2回 
3.クロス集計表 2回 
4. データ分析手法 2回 
5. 相関 2回 
6. 群間比較 2回 
7. 回帰分析 2回
8. 「AI・機械学習の基礎と展望」1回
9. レポート課題について まとめ フィードバック等 1回 

なお、講義の進度・文科省のモデルカリキュラム等を反映して内容順序の変更や省略・追加を行うことがある。

履修要件 「統計入門」あるいは同等の科目を履修していることがのぞましい。
主に文系の学生が高校で履修したレベルの数学の知識を必要とする。

Contact

〒606-8315 京都市左京区吉田近衛町69 近衛館202, 301, 302号室
Tel. 075-753-9691
E-mail : contact@ds.k.kyoto-u.ac.jp