講習会

for 塾生

募集中

機械学習入門

回数:全5回

形式:オンデマンド

主催:AIC

1)講習会概要

本講習会では、AI技術である機械学習を体験を通して理解する講座である。受講者は初めてのプログラミング受講済み、またはそれと同じレベルでPythonを扱えることを前提とする。主に機械学習ライブラリscikit-learnを用いて機械学習アルゴリズムを使い、回帰、分類、クラスタリングなどをサンプルデータを用いて学習する。深層学習は本講習会では扱わないが、深層学習を学ぶ上で必要となる前提知識を体験的に獲得できる。内部の具体的なアルゴリズムには深くは踏み込まず、機械学習はどのようなことができるかについて理解できることを目標とする。

2)各回の実施内容

第1回 「機械学習の基礎基本・回帰」

 受講生の想定が機械学習について初めて触れることを想定し、まずはAI技術における機械学習の立ち位置、機械学習の種類、機械学習の扱う問題などといった機械学習という分野の基礎概念について説明する。また、機械学習入門、深層学習入門両者で使用するライブラリ、scikit-learnについての説明を行う。最後に回帰について説明し、実際にデータセットを用いて機械学習について体験してもらう。

第2回 「分類」

第2回は分類問題を扱う。具体的には分類問題にはどのようなものがあるか,またそのための方法であるロジスティック回帰,サポートベクトルマシン,決定木などを扱い、scikit-learnのデータセットを用いて其々のモデルのしくみとその特性を理解する。またk最近傍法といった怠惰学習のアルゴリズムもここで扱う。

第3回 「クラスタリング」

第1回,第2回では答えがすでに分かっているデータで機械学習モデルを構築してきたが,第3回では教師なし学習法に属する,正しい答えが分かっていないデータの中から隠れた構造を見出す方法であるクラスタ分析を扱う。クラスタリングに関連する用語や指標について説明し、階層的クラスタリングについても扱う。プログラミングパートではscikit-learnを使ったk-meansクラスタリングを実際のデータセットで体験して頂く。

第4回 「前処理と特徴量エンジニアリング」

第3回までは機械学習のアルゴリズムを学んでいたが、機械学習で学習させるデータセットを工夫することでより高い精度での予測が可能になる。第4回では欠損値を含むデータの扱い方、データセットの分割といった前処理、特徴量エンジニアリングについて学ぶ。また主成分分析などを利用した次元削減によるデータの圧縮方法についても説明し、実際のデータセットで体験して頂く。

第5回 「アンサンブル学習」

これまでに学んだ学習モデルを組み合わせ、より良い分類器を作成するアンサンブル学習、及びそれに関わるバギング、ブースティングといった用語を学習する。勾配ブースティングアルゴリズムを扱うフレームワークであるLightGBMについてもここで触れる。またこれまでの講義の復習も行うことを予定している。また付録として強化学習に関する以下の講義を行う。

付録 「強化学習」

これまでの教師あり学習、教師なし学習とは異なる機械学習である強化学習について学ぶ。簡単なシミュレータを用いて、エージェントが環境との相互作用を通じて適切な行動方針を獲得する様子を視覚的に理解する。主としてQ学習を中心に、学習の仕組みや強化学習の応用例、そして単純な実装の問題点について説明する。ライブラリを用いないため、コード・数式の説明も他の回に比べ多くなるが、単純化して入門者でも概要を理解できることを目指す。

ページトップ