京都大学 国際高等教育院附属データ科学イノベーション教育研究センター

075-753-9691075-753-9691 お問い合せお問い合せ
facebook

京都大学 国際高等教育院附属データ科学イノベーション教育研究センター

MENU

データ分析演習I

開講時期 年度 前期
担当教員 国際高等教育院 特定講師 木村 真之
授業情報 (群) 自然 群 (分野(分類)) データ科学(発展) (使用言語) 日本語
(旧群) B群 (単位数) 2単位 (週コマ数) 1コマ (授業形態) 演習
(開講年度・開講期) 2019・前期 (配当学年) 全回生 (対象学生) 全学向
(曜時限) 火5
(教室) 情報メ204(情報処理室)
授業の概要・目的 コンピュータやネットワーク,様々なセンサなどの技術の進歩により,日々膨大なデータが蓄積されるようになった.よって今日ではデータの活用が課題となり,データを適切に分析し,その結果から適切な判断を下すことが重要である.「データ分析演習I」では,データ科学の基礎をなすデータ解析手法の理論や実装法などを実践的に学び身につけることを目的とする.まず,データ科学の分野で広く用いられている Python の導入法や基礎プログラミングを修得し,データの取得方法や整形,可視化など,データ科学に必要不可欠な技術を学ぶ.次に,確率論や統計学,線形代数の基礎を学び,続いて回帰分析や機械学習,クラスタリングの基礎理論と実装法を修得する.キーワード: データの記述(統計表・グラフ(一般), 分布を表す統計表・グラフ, 基本統計量), 多変量データの記述・可視化(相関関係, 分割表(クロス集計表), 回帰分析, 主成分分析, クラスター分析), 確率と確率分布(疑似乱数), 母集団と標本(統計量, 標本分布, ブートストラップ), 統計的推測(区間推定, 単回帰分析, 重回帰分析, 変数選択・モデル選択, ロジスティック回帰), データ構造(リスト, 辞書), クラスタリングアルゴリズム(階層型クラスタリング, 分割型クラスタリング, K-平均法), 特徴抽出(特徴量, 主成分分析, Bag of Words, フーリエ変換), 識別(K-近傍法, サポートベクターマシン, 決定木, ブースティング, ランダムフォレスト, ニューラルネットワーク), ソフトウェア(インタープリタ言語, テキストファイル, バイナリファイル, Python, 型・変数, 配列, 関数, 制御文, 入出力)
到達目標 1. データ分析の理論的基礎となる確率論や統計学,線形代数学の基礎を理解する.
2. Python 言語を用いてデータ分析に必要な基礎的な統計処理ができるようになる.
3. 回帰分析,機械学習,クラスタリングについて概要を理解し,プログラミング言語による実装方法を理解する.
授業計画と内容 統計の基礎(1回)
Python の導入と初歩的プログラミング (2回)
データの取得と操作 (1回)
データの可視化 (1回)
統計処理入門 (2回)
回帰分析 (2回)
機械学習 (2回)
クラスタリング (2回)
まとめと演習 (1回)
履修要件 共通教育における微積分,線形代数,確率,統計程度の内容を理解していることが望ましい.また,プログラミングの初歩的技術を習得していることが望ましい.