ゼロから作るDeep Learning
誤差逆伝搬法（バックプロパゲーション）の導出

文責：遠藤理平（2017年4月18日）カテゴリ：ゼロから作るDeep Learning(49)

昨今注目を集めているAI（人工知能）を学びたいと思い立ち、ディープラーニング（Deep Learning、深層学習）と呼ばれるAIの数理モデルである多層構造のニューラルネットワークを書籍「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」を参考にを独習していきたいと思います。本書籍ではプログラミング言語としてPythonが利用されていますが、本項ではJavaScriptで実装していきます。

誤差逆伝搬法（バックプロパゲーション）の導出

書籍「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」では誤差逆伝搬法の概念を直感的に解説を行うため「計算グラフ」と呼ばれるダイアグラムを用いています。この方法は概念を把握する際には有用ですが、実際にプログラミングを行う際には具体的な表式を与えません。本項では、プログラミングに必要な漸化式の導出を行います。

復習

第l層i番目のニューロンを $X_i^{(l)}$ と表わすとします。第l+1層i番目ニューロン $X_i^{(l+1)}$ は第l番目の各パラメータを用いて

$X^{(l+1)}_i=f\left(x^{(l+1)}_i\right)=f\left(\sum\limits_{j} W^{(l)}_{ij}X^{(l)}_j+b_i^{(l)}\right)$

と表すことができます。は活性化関数、 $x_i^{(l+1)}$ は活性化関数を通す前のニューロン値、 $W^{(l)}_{ij}$ と $b_i{(l)}$ は重みとバイアスです。重みとバイアスは損失関数（本項ではLではなくEと表します）が小さくなる方向へ学習ごとに更新させます。具体的には各重みとバイアスに対する勾配（偏微分）が与えられれば、次のアルゴリズムで重みとバイアスを更新させることができます。

$W^{(l)}_{ij}\leftarrow W^{(l)}_{ij}-\eta \, \frac {\partial E}{\partial W^{(l)}_{ij}}$
$b^{(l)}_{i}\leftarrow b^{(l)}_{i}-\eta \, \frac {\partial E}{\partial b^{(l)}_{i}}$

各勾配は重みあるいはバイアスをほんの僅かずらすことで得られる損失関数値の増減から見積ることができますが、各勾配を計算するたびに入力から出力を得るための全計算を行う必要がでてきます。そこで、効率よく勾配を計算するために考案されたのが誤差逆伝搬法（バックプロパゲーション）と呼ばれる計算アルゴリズムです。誤差逆伝搬法は損失関数を各層ごと入出力関数の合成関数とみなして損失関数の微分値を計算する手法です。合成関数の微分の特性を利用することで、出力層から入力層に向かう方向で漸化式を導くことができ、この逆向きの漸化式から「逆伝搬」の名称がついていると考えられます。着目するのは次の量です。

$\delta_i^{(l)} \equiv \frac{\partial E}{\partial X^{(l)}_{i}}$

この量は第l層i番目のニューロン値に対する損失関数の勾配を表します。本書ではデルタ値と呼ぶことにします。このデルタ値はネットワーク上のすべてのニューロンごとに定義することができ、第l層と第l+1層のデルタ値には次の関係を導くことができます（ここで合成関数の微分が活躍します）。

$\delta_i^{(l)}= \frac{\partial E}{\partial X^{(l)}_{i}} = \sum\limits_{j} \frac{\partial E}{\partial X^{(l+1)}_{j}} \,\frac{\partial X^{(l+1)}_{j}}{\partial X^{(l)}_{i}}$ $= \sum\limits_{j} \delta_j^{(l+1)} f'\left(x_j^{(l+1)}\right) W_{ji}^{(l)}$

これは $\delta_i^{(l)}$ と $\delta_i^{(l+1)}$ の関係式を表す漸化式です。その他の変数は通常の「入力→出力」の計算時（以後、順伝搬と呼ぶことにします）に計算済みなので、出力層におけるデルタ値が与えられれば、すべての層のデルタ値を計算することができます。あとはこのデルタ値を用いて、重みとバイアスに対する損失関数の勾配を計算するだけです。それぞれ、合成関数の微分を利用すると次のとおりに得られます。

$\frac{\partial E}{\partial W^{(l)}_{ij}} = \frac{\partial E}{\partial X^{(l+1)}_{i}}\, \frac{\partial X^{(l+1)}_{i}}{\partial W^{(l)}_{ij}}=\delta^{(l+1)}_i X^{(l)}_j f'\left(x_i^{(l+1)}\right)$
$\frac{\partial E}{\partial b^{(l)}_{i}}=\frac{\partial E}{\partial X^{(l+1)}_{i}}\, \frac{\partial X^{(l+1)}_{i}}{\partial b^{(l)}_{i}}=\delta^{(l+1)}_i f'\left(x_i^{(l+1)}\right)$

この誤差逆伝搬法を用いると重みと勾配の計算を層数やニューロン数によらず、１回の逆伝搬計算で各層のデルタ値が得られるため、層数とニューロン数が大きくなるほど効果は絶大となります。以上誤差逆伝搬法の計算アルゴリズムの一般論です。具体的な活性化関数に対する計算アルゴリズムは次項で示します。

	MEMSパークコンソーシアム設立20周年記念シンポジウムにおいて「国際イノベーションコンテスト」世界１位入賞アプリを展示しました 2024.12.29 【大草芳江｜TOPICS】
	【受講生募集】『natural science 科学・技術講座』新講座のご案内 2024.01.09 【大草芳江｜TOPICS】
	サイエンス・デイオブザイヤー2023贈賞式（文部科学大臣賞表彰等）を開催しました 2023.11.07 【大草芳江｜TOPICS】
	■「natural science 科学・技術講座」夏休み短期講座のご案内 2023.07.14 【遠藤理平｜TOPICS】
	「国際イノベーションコンテスト2022世界大会」でnatural science『科学・技術講座』チームが世界3等入賞 2023.07.12 【大草芳江｜TOPICS｜パブリシティ】
	サイエンス・デイ限定『学都「仙台・宮城」サイエンスマップ～光編～』第7版プレゼント申込開始（先着500名）！ 2023.07.08 【遠藤理平｜TOPICS】
	学都「仙台・宮城」サイエンス・デイ2023　7月16日（日）開催！ 2023.07.08 【大草芳江｜TOPICS】
	人材募集のご案内 2022.08.19 【大草芳江｜TOPICS】
	学都「仙台・宮城」サイエンス・デイ2022　7月17日（日）開催！ 2022.07.01 【大草芳江｜TOPICS】
	「第13回国際イノベーションコンテスト2022」国内予選大会　natural science チームが第３位入賞、４年連続通算８回目の世界大会出場へ 2022.05.23 【大草芳江｜TOPICS】
	「キャンパスベンチャーグランプリ2021」東北大会で最優秀賞、全国大会で日刊工業新聞社賞を受賞 2022.03.09 【大草芳江｜TOPICS】
	【プレスリリース】「第12回国際イノベーションコンテスト2021」世界大会　natural science チームが世界３等入賞 2022.01.17 【大草芳江｜TOPICS】
	【第８話】有限の高さの障壁へ照射アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.29 【遠藤理平｜仮想物理実験室】
	【第７話】無限に高い障壁に向けた電子パルスの照射アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.24 【遠藤理平｜仮想物理実験室】
	【第６話】無限に高い障壁へ照射アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.23 【遠藤理平｜仮想物理実験室】
	【第５話】電子パルスの運動アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.21 【遠藤理平｜仮想物理実験室】
	【第４話】電子パルスの作り方【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.20 【遠藤理平｜仮想物理実験室】
	【第３話】自由粒子の運動アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.19 【遠藤理平｜仮想物理実験室】
	【第２話】自由粒子のスナップショット【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.18 【遠藤理平｜仮想物理実験室】
	【第１話】プログラムの動作確認【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.17 【遠藤理平｜仮想物理実験室】

ゼロから作るDeep Learning
誤差逆伝搬法（バックプロパゲーション）の導出

目次

誤差逆伝搬法（バックプロパゲーション）の導出

復習

関連記事