予告どおり、『はじめてのディープラーニング』の続編を読みました。
まだVAEとGANの部分しか読了できておりませんが、
一番気になるところでしたので、先に書評をします。
『はじめてのディープラーニング2』
出版社:SBクリエイティブ 、著者:我妻幸長
おススメ度:★★★★★
「生成系モデル」が本著のテーマです。
ディープラーニングというと認識能力(画像、文章)のイメージが強いですが、
画像生成、文章生成の「生成系」分野でも活躍が見込まれています。
クリエイティブ感が強いので、やっていてもワクワク感がありますね。
どんどん機械が画像を作ってくれます。
一方で著作権的にも問題になりやすい領域です。
有名な「手書き文字データセット」を利用し、
各種の生成系モデルを実験する内容です。
あくまで実験レベルですので、
ただちに実装できるものでは当然ありませんが、
逆にいえば根幹部分の理論、数学は簡潔に把握できるので、
その意味で有益かと感じます。
生成系の概要をざっくりと知りたい人にはおススメです。
概要
章立て
1、2章・・・概要、Python、数学
3章・・・ディープラーニングの基礎
4章・・・RNN
5章・・・LSTM
6章・・・GRU
7章・・・VAE
8章・・・GAN
9章・・・付録
1、2、3章は前著『はじめてのディープラーニング』の復習でした。
それ以降は独立した構成になっており、
自分は時系列データより先に、VAEとGANを読んでみた感じです。
ラインナップどおり、
画像認識で有名なCNNは入っておりませんでした。
そちらは前著で精読するのがおススメです。
7章:VAEパート
画像の特徴を変数に圧縮し、
その後に変数を入力として画像を再構成する技術です。
という関係性です。
うまくいけば、連続的な変化のある画像を機械が作ってくれます。
手書き文字で実行したのですが圧巻でした。
8章:GANパート
ノイズから本物に似せた画像を出力するGeneratorと、
ノイズから作られた画像と本物を鑑定するDiscriminator。
両者を競わせるように学習させることで、
「本物に似せた画像」を量産させることが可能です。
こちらも圧巻でして、エポックが進むごとに、
より本物らしい文字画像が量産されていきます。
活性化関数tanhの微分について
P269のGeneratorの出力層ですが、
活性化関数にtanhを利用しております。
では導出がありませんでした。
調べたところ、
f'(x) = 1 - f(x)**2
となります。
δを求める際に必要なので、ここは要補足ですね。
個人的見解
一見複雑そうな生成モデルも、
前著のディープラーニングの基本が理解できれば、
さほど理解に難渋しないかと考えます。
VAEに関心があるので、そちらの専門書を読んでみようかと思います。
RNNは無茶苦茶むずそうなので、一度放置プレイします。
語郎