有給医のライフハック記録

医師の語る人生最適化戦略

書籍『はじめてのディープラーニング』【ディープラーニング関連】

 

最近になって読了した、機械学習関連の書籍の紹介です。

 

ディープラーニング関連のものになります。

 

『はじめてのディープラーニング

出版社:SBクリエイティブ 、著者:我妻幸長

おススメ度:★★★★★

 

フレームワークを使用せずに、

ディープラーニングを実装する書籍です。

 

似たような書籍も多いのですが、

なんとなく本書のレイアウトが見やすいのと、

続編(VAE、RNN、GANなどがメイン)も出ているので、

こちらを先に読了した次第です。

 

コードについてはGoogle Colaboratoryですべて動作しており、

互換性は問題なさそうです。

サンプルコードを解凍してGoogleドライブに保存し、

Colaboratoryですべて動くことは確認しました。

フレームワークを全く使用しないので、当たり前っちゃ当たり前ですが)

 

図表も多く、コードの解説も丁寧なので、おススメ。

 

以下、ざっとレビューします。

 

概要

章立て

1、2,3章・・・概要、Python微積分と行列

4章・・・ニューラルネットワーク

5章・・・バックプロパゲーション誤差逆伝播法)

6章・・・ディープラーニング

7章・・・CNN

8章・・・関連分野の概要

 

こんな感じ。

 

5章:バックプロパゲーションがキモ

通読してみて、一番のキモが5章なのだと感じます。

 

入力データから行列計算で出力したデータと、

あらかじめ用意された正解データがありますが、

その誤差を出力層から入力層に向かって反映させ、

重みとバイアスを更新するプロトコルが、

バックプロパゲーションです。

 

文字にすると上記のとおりではありますが、

実際のコードや数式に落とし込むまでが、

すこし難しいのです。

 

書籍のP.156とP.157の図表が全てで、

最終章のCNNの画像認識でも同じ計算で

学習できます。

 

ディープラーニングのキモがある意味で、この章であり、

あとは発展形というか、データの処理次第なのだと

通読して思いました。

 

6章、7章

6章は有名なアヤメの分類を、ディープラーニングで判別します。

従来の機械学習で行うよりも、個人的には面白い感じでした。

興味深いのは、ニューロンの数やエポック数を増やせばいいわけでもなく、

むしろ過学習で正答率が落ちること。

 

7章は手書き数字の画像認識です。

むずいっす、普通に。

ですが、画像データを行列に変換、逆変換する箇所以外は、

いままでのディープラーニングと同じですね。

 

ご存じの方も多いと思いますが、

コンピュータで画像を処理する際には、

ピクセルごとに(R、G、B)が振られますよね。

カラー画像を識別しようとすると、

縦、横、チャンネル数3(R、G、B)、データ数

と4次元になります。

 

今回の手書き数字や、漫画みたいな白黒やレントゲン写真は、

単純なグレースケールで、チャンネル数1ですが、

実際のカラー画像ではRGBのデータだけ処理が増えちまい、

かなり処理負担がかかりそうです。

 

個人的見解

かなりおススメできます。

 

ディープラーニング関連の書籍は、オライリー本ではかなり

敷居が高いですし、一般書でも少ないです。

 

年末年始は、かなりヒマになりそうなので、

『2』も読もうと思います。

 

語郎