ニューラルネットワークとディープラーニング-8
ニューラルネットワークとディープラーニング
amazon kindle版を出版しました。
プーリング層
プーリング層は畳み込み層から出力された値を、さらに圧縮するものです。これによって、多少の位置ずれやゆがみを解消します。プーリング層での計算は、最大値を出力する方法と、平均値を出力する方法などがありますが、ここでは最大値を選択する方法について説明します。2×2のカーネル(範囲)でプーリングの計算を行うことが多いので、ここでも2×2のカーネルを用います。図に示すように畳み込み層から出力された値の図の赤枠部分の最大値は「0」となります。2つスライドさせた、プーリングでの計算は最大値の「5.3」となります。図に示すように、プーリング層の出力の結果は、縦方向に「5.3」が3つ並ぶような、数字「1」の特徴が抽出され、8×8から3×3へ圧縮されています。このように、数字だけでなく画像は、畳み込み層とプーリング層で特徴量が抽出・圧縮されます。
図5.2.3 プーリングでの計算
図5.2.4に畳み込み層に別のカーネルを用いて計算した結果を用います。この場合プーリング層の出力は、画像の特徴をうまく表現できていないことが分かります。このため、畳み込み層のカーネルは適切な値にする、または、カーネル自身を学習させるようにする必要があります。
図5.2.4 畳み込み層とプーリング層計算例