講習会

for 塾生

募集終了

生成AI理論と実装

8/1(木)、8/2(金)13:00-15:00

回数:全4コマ(1日2コマx2日間)

形式:対面

主催:AIC

【申込締切 7/31(水)12:00】講習会について

講習会概要

深層学習を用いた生成モデル(主に拡散モデルによる画像生成)について、『ゼロから作るDeep Learning ❺―生成モデル編 (斎藤 康毅 著)』を参考図書にして、理論と実装を合わせて講義します。
拡散モデル(Diffusion model)は近年、Stable DiffusionやOpenAIのDALL・E2、Google社のImagenなど多くの画像生成モデルで活用されています。本講習会では文字通りゼロから画像生成モデルを作れるようになることを学習目標とし、生成モデルの基本的指針の理解を目指します。
理論の学習と実装を通じて、実際に扱えるようになりましょう。

形式

対面(日吉 協生館2階 AICラウンジ)
※録画およびオンライン配信の予定はありません。

受講条件

基本的な確率統計に関する知識、Pythonの経験などがあれば問題なく受講できます。
参考文献のステップ3までの内容を任意の書籍・方法で学習しておくことをお勧めします。
全くそれらに関して経験がない方も、少しペースは早いですが全ての内容の復習を適宜行うので、十分に学習することで最終回まで受講できるかと思います。またアンケートによって難易度を調整していく予定なので、遠慮なくご参加ください。

参考文献

『ゼロから作るDeep Learning ❺―生成モデル編 (斎藤 康毅 著)
※AICオフィスに数冊ご用意があります。参照希望の方はAICオフィスにお申し出ください。

ご持参いただかなくても受講できるように資料を準備します。

講師

村松 亮(環境情報学部)

昨年度実施『機械学習上級講座』講師。
2020年より深層学習を用いた音響信号処理に関して研究活動を開始。
現在は自身の事業、一般企業等にて深層学習に関する研究を行う。
RegeneronISEF2022日本代表、文部科学大臣特別表彰等。

各回の実施内容

第1回
講義の全体像、

および復習
8月1日 (木)
13:00-14:00
講習会の概要説明及び基礎的な内容の復習をしていきます。参考文献におけるステップ3までの内容について、Pythonで可視化できるものを中心に実装しながら確認します。GMMによるデータ生成の実装ののち、GMMとの関係を見ながらEMアルゴリズムの導出を行います。少し形式が変わりますが、ここでニューラルネットワークについてPyTorchと呼ばれるPythonライブラリを用いて学習します。活性化関数やオプティマイザについても扱います。
第2回
変分オートエンコーダ
8月1日 (木)
14:00-15:00
混合ガウスモデルやEMアルゴリズムと言った過去の学習を振り返りながら、変分オートエンコーダ(VAE)についての基本概念、その数学的背景、そしてネットワークの構造について学びます。EMアルゴリズムの問題点をもとに、EMアルゴリズムからVAEへ進化させるように理論及び実装と進めていきます。最終的には、この段階で新しい画像の生成をできるように実装をします。
第3回
拡散モデルの理論、

実装①
8月2日 (金)13:00-14:00VAEから拡散モデルへ、さらに進化させていきましょう。潜在変数の階層化、拡散過程と逆拡散過程、拡散モデルのELBOとその近似解へと進みます。理論の学習後は、U-Netを交えて実装へ進みます。せっかくなので、講師が行なっているU-Netに関連する研究の紹介もします。また、ここまでの講義における質問事項もここで回答していきたいと思っています。
第4回
拡散モデルの実装②、応用
8月2日 (金)
14:00-15:00
前回に引き続き、拡散モデルの実装を行い完成を目指します。最後に、拡散モデルの現在の研究動向や将来的な展望についても触れ、生成モデルの最前線を理解するための基盤を築きます。時間に余裕があれば、いわゆるGPTの方面に話を進めていきたいと思います。
ページトップ