有給医のライフハック記録

医師の語る人生最適化戦略

書籍『はじめてのディープラーニング2』VAEとGANパートのみ【ディープラーニング関連】

 

予告どおり、『はじめてのディープラーニング』の続編を読みました。

 

まだVAEとGANの部分しか読了できておりませんが、

一番気になるところでしたので、先に書評をします。

 

『はじめてのディープラーニング2』

出版社:SBクリエイティブ 、著者:我妻幸長

おススメ度:★★★★★

 

「生成系モデル」が本著のテーマです。

 

ディープラーニングというと認識能力(画像、文章)のイメージが強いですが、

画像生成、文章生成の「生成系」分野でも活躍が見込まれています。

 

クリエイティブ感が強いので、やっていてもワクワク感がありますね。

どんどん機械が画像を作ってくれます。

 

一方で著作権的にも問題になりやすい領域です。

 

有名な「手書き文字データセット」を利用し、

各種の生成系モデルを実験する内容です。

 

あくまで実験レベルですので、

ただちに実装できるものでは当然ありませんが、

逆にいえば根幹部分の理論、数学は簡潔に把握できるので、

その意味で有益かと感じます。

 

生成系の概要をざっくりと知りたい人にはおススメです。

 

概要

章立て

1、2章・・・概要、Python、数学

3章・・・ディープラーニングの基礎

4章・・・RNN

5章・・・LSTM

6章・・・GRU

7章・・・VAE

8章・・・GAN

9章・・・付録

 

1、2、3章は前著『はじめてのディープラーニング』の復習でした。

 

それ以降は独立した構成になっており、

自分は時系列データより先に、VAEとGANを読んでみた感じです。

 

ラインナップどおり、

画像認識で有名なCNNは入っておりませんでした。

そちらは前著で精読するのがおススメです。

 

7章:VAEパート

画像の特徴を変数に圧縮し、

その後に変数を入力として画像を再構成する技術です。

 

オートエンコーダーディープラーニング版がVAE、

という関係性です。

 

うまくいけば、連続的な変化のある画像を機械が作ってくれます。

 

手書き文字で実行したのですが圧巻でした。

 

8章:GANパート

ノイズから本物に似せた画像を出力するGeneratorと、

ノイズから作られた画像と本物を鑑定するDiscriminator。

 

両者を競わせるように学習させることで、

「本物に似せた画像」を量産させることが可能です。

 

こちらも圧巻でして、エポックが進むごとに、

より本物らしい文字画像が量産されていきます。

 

活性化関数tanh微分について

P269のGeneratorの出力層ですが、

活性化関数にtanhを利用しております。

 

その微分については、前著『はじめてのディープラーニング

では導出がありませんでした。

 

調べたところ、

tanh導関数は、tanhをf(x)として

 f'(x) = 1 - f(x)**2

となります。

 

δを求める際に必要なので、ここは要補足ですね。

 

個人的見解

一見複雑そうな生成モデルも、

前著のディープラーニングの基本が理解できれば、

さほど理解に難渋しないかと考えます。

 

VAEに関心があるので、そちらの専門書を読んでみようかと思います。

 

RNNは無茶苦茶むずそうなので、一度放置プレイします。

 

語郎