ゼロから作るDeep Learning
準備３：多変数関数の数値微分と極小値の探索

文責：遠藤理平（2017年4月12日）カテゴリ：ゼロから作るDeep Learning(49)

昨今注目を集めているAI（人工知能）を学びたいと思い立ち、ディープラーニング（Deep Learning、深層学習）と呼ばれるAIの数理モデルである多層構造のニューラルネットワークを書籍「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」を参考にを独習していきたいと思います。本書籍ではプログラミング言語としてPythonが利用されていますが、本項ではJavaScriptで実装していきます。

Deep Learning では、損失関数と呼ばれる正解からのズレを最小化することを学習と位置づけています。損失関数はパラメータの数分の引数をもつ多変数関数で定義され、入力に対して多変数関数が小さくなるようにパラメータを調整します。その際に必要となるのが多変数関数の数値微分です。本項では次の２変数関数の数値微分の計算方法と最小値を探索する計算アルゴリズムについて解説します。

多変数関数の数値微分

多変数関数の数値微分の題材として次の２変数関数を取り上げます。

f(x,y) = x^2 + y^2

多変数関数の数値微分の定義

多変数関数の微分の定義は次のとおりです。

$\frac{\partial f(x,y)}{\partial x} = \lim_{d\to0} \frac{f(x+d,y)-f(x,y)}{d}$
$\frac{\partial f(x,y)}{\partial y} = \lim_{d\to0} \frac{f(x,y+d)-f(x,y)}{d}$

上記の関数のように関数形があらかじめ分かっている場合には微分を解析的に計算することができますが、関数形が未知の場合には数値的に計算するしかありません。コンピュータでは無限小を扱うことができないため、微分をdを小さな値として次のとおりに定義します。

$\frac{\partial f(x,y)}{\partial x} = \frac{f(x+d,y)-f(x,y)}{d}$
$\frac{\partial f(x,y)}{\partial y} = \frac{f(x,y+d)-f(x,y)}{d}$

これで(x,y)地点における勾配を得ることができます。原理的にはdは小さいほど真の値に近づくはずですが、コンピュータが扱うことのできる有効桁数が倍精度で１５桁程度なので、小さすぎると桁落ちのために精度が反対に悪化します。ニューラルネットワークでは正確な勾配は必要ないので探索する領域の1/1000程度で十分たと思います。ただし、上記のアルゴリズムは(x,y)地点の勾配を(x,y)と(x+d,y)と(x,y+d)の地点の値を用いていて対称性が悪いです。次のように定義を変更することで対称性を良くなり、計算精度がdの１次分だけ上がります。

$\frac{\partial f(x,y)}{\partial x} = \frac{f(x+d/2,y)-f(x-d/2,y)}{d}$
$\frac{\partial f(x,y)}{\partial y} = \frac{f(x,y+d/2)-f(x,y-d/2)}{d}$

先の計算アルゴリズムは前進差分による数値微分、後は中心差分による数値微分と呼ばれます。

勾配法による極小値の探索

勾配を計算することができると、任意の地点から出発して勾配の下向きに向かって移動することで極小値にたどり着くことができます。具体的には初期値 (x_0, y_0) からスタートして次の計算アルゴリズムに従って計算します。

$x_{n+1}=x_{n}-\eta\left.\frac{\partial f(x,y)}{\partial x}\right|_{x=x_n,\ y=y_n}$
$y_{n+1}=y_{n}-\eta\left.\frac{\partial f(x,y)}{\partial y}\right|_{x=x_n,\ y=y_n}$

上記の計算アルゴリズムを用いて極小値の探索を実行してみましょう。極小値 $(x_\min, y_\min)$ からのズレを

$L_n = \frac{1}{2}\left[(x_n-x_\min)^2+(y_n-y_\min)^2\right]$

で評価した結果が次のグラフです。

２つのグラフは前進差分と中心差分における結果です。中心差分の方が極小値の真の値へ向うことが確認できました。

	MEMSパークコンソーシアム設立20周年記念シンポジウムにおいて「国際イノベーションコンテスト」世界１位入賞アプリを展示しました 2024.12.29 【大草芳江｜TOPICS】
	【受講生募集】『natural science 科学・技術講座』新講座のご案内 2024.01.09 【大草芳江｜TOPICS】
	サイエンス・デイオブザイヤー2023贈賞式（文部科学大臣賞表彰等）を開催しました 2023.11.07 【大草芳江｜TOPICS】
	■「natural science 科学・技術講座」夏休み短期講座のご案内 2023.07.14 【遠藤理平｜TOPICS】
	「国際イノベーションコンテスト2022世界大会」でnatural science『科学・技術講座』チームが世界3等入賞 2023.07.12 【大草芳江｜TOPICS｜パブリシティ】
	サイエンス・デイ限定『学都「仙台・宮城」サイエンスマップ～光編～』第7版プレゼント申込開始（先着500名）！ 2023.07.08 【遠藤理平｜TOPICS】
	学都「仙台・宮城」サイエンス・デイ2023　7月16日（日）開催！ 2023.07.08 【大草芳江｜TOPICS】
	人材募集のご案内 2022.08.19 【大草芳江｜TOPICS】
	学都「仙台・宮城」サイエンス・デイ2022　7月17日（日）開催！ 2022.07.01 【大草芳江｜TOPICS】
	「第13回国際イノベーションコンテスト2022」国内予選大会　natural science チームが第３位入賞、４年連続通算８回目の世界大会出場へ 2022.05.23 【大草芳江｜TOPICS】
	「キャンパスベンチャーグランプリ2021」東北大会で最優秀賞、全国大会で日刊工業新聞社賞を受賞 2022.03.09 【大草芳江｜TOPICS】
	【プレスリリース】「第12回国際イノベーションコンテスト2021」世界大会　natural science チームが世界３等入賞 2022.01.17 【大草芳江｜TOPICS】
	【第８話】有限の高さの障壁へ照射アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.29 【遠藤理平｜仮想物理実験室】
	【第７話】無限に高い障壁に向けた電子パルスの照射アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.24 【遠藤理平｜仮想物理実験室】
	【第６話】無限に高い障壁へ照射アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.23 【遠藤理平｜仮想物理実験室】
	【第５話】電子パルスの運動アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.21 【遠藤理平｜仮想物理実験室】
	【第４話】電子パルスの作り方【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.20 【遠藤理平｜仮想物理実験室】
	【第３話】自由粒子の運動アニメーション【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.19 【遠藤理平｜仮想物理実験室】
	【第２話】自由粒子のスナップショット【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.18 【遠藤理平｜仮想物理実験室】
	【第１話】プログラムの動作確認【Pythonコピペで量子力学完全攻略マニュアル】 2021.09.17 【遠藤理平｜仮想物理実験室】

ゼロから作るDeep Learning
準備３：多変数関数の数値微分と極小値の探索

目次

多変数関数の数値微分

多変数関数の数値微分の定義

勾配法による極小値の探索

関連記事