書籍『はじめてのディープラーニング２』VAEとGANパートのみ【ディープラーニング関連】

『はじめてのディープラーニング２』
概要
個人的見解

予告どおり、『はじめてのディープラーニング』の続編を読みました。

まだVAEとGANの部分しか読了できておりませんが、

一番気になるところでしたので、先に書評をします。

『はじめてのディープラーニング２』

出版社：SBクリエイティブ　、著者：我妻幸長

おススメ度：★★★★★

「生成系モデル」が本著のテーマです。

ディープラーニングというと認識能力（画像、文章）のイメージが強いですが、

画像生成、文章生成の「生成系」分野でも活躍が見込まれています。

クリエイティブ感が強いので、やっていてもワクワク感がありますね。

どんどん機械が画像を作ってくれます。

一方で著作権的にも問題になりやすい領域です。

有名な「手書き文字データセット」を利用し、

各種の生成系モデルを実験する内容です。

あくまで実験レベルですので、

ただちに実装できるものでは当然ありませんが、

逆にいえば根幹部分の理論、数学は簡潔に把握できるので、

その意味で有益かと感じます。

生成系の概要をざっくりと知りたい人にはおススメです。

概要

章立て

１、２章・・・概要、Python、数学

３章・・・ディープラーニングの基礎

４章・・・RNN

５章・・・LSTM

６章・・・GRU

７章・・・VAE

８章・・・GAN

９章・・・付録

１、２、３章は前著『はじめてのディープラーニング』の復習でした。

それ以降は独立した構成になっており、

自分は時系列データより先に、VAEとGANを読んでみた感じです。

ラインナップどおり、

画像認識で有名なCNNは入っておりませんでした。

そちらは前著で精読するのがおススメです。

７章：VAEパート

画像の特徴を変数に圧縮し、

その後に変数を入力として画像を再構成する技術です。

オートエンコーダーのディープラーニング版がVAE、

という関係性です。

うまくいけば、連続的な変化のある画像を機械が作ってくれます。

手書き文字で実行したのですが圧巻でした。

８章：GANパート

ノイズから本物に似せた画像を出力するGeneratorと、

ノイズから作られた画像と本物を鑑定するDiscriminator。

両者を競わせるように学習させることで、

「本物に似せた画像」を量産させることが可能です。

こちらも圧巻でして、エポックが進むごとに、

より本物らしい文字画像が量産されていきます。

活性化関数tanhの微分について

P２６９のGeneratorの出力層ですが、

活性化関数にtanhを利用しております。

その微分については、前著『はじめてのディープラーニング』

では導出がありませんでした。

調べたところ、

tanhの導関数は、tanhをf(x)として

f'(x) = 1 - f(x)**2

となります。

δを求める際に必要なので、ここは要補足ですね。

個人的見解

一見複雑そうな生成モデルも、

前著のディープラーニングの基本が理解できれば、

さほど理解に難渋しないかと考えます。

VAEに関心があるので、そちらの専門書を読んでみようかと思います。

RNNは無茶苦茶むずそうなので、一度放置プレイします。

語郎

有給医のライフハック記録

医師の語る人生最適化戦略