「AlphaGoのベイズ最適化」の論文

12月17日に「AlphaGoのベイズ最適化」に関する論文が公開された。(こちらのPDFを参照)
機会学習をする前、ニューラルネットワークの層の数などの数値を人間が設定します。
これはハイパーパラメータと呼ばれ、この数値次第で学習による成果が変わります。

今回の論文はハイパーパラメータをベイズ最適化により決めたことが記されてます。
ベイズ最適化は最適化する枠組みの中から未知のものと既に良いと言われたものを比較し、
次に何をすべきかを探る手法で、これをハイパーパラメータの設定に応用したようです。

学習の設定を洗練して、自己対戦での勝率が50%から66.5%に上がったと記録されてます。
機会学習は他分野でも用いられており、ベイズ最適化で応用範囲が広がるかもしれません。
※ただし、実際は機会学習の成功例が少なく、必ずしも万能な方法ではないようです。

「編集後記」
AlphaGoの高度なチューニングの一端が公開されました。
理屈を形にするのは難しく、高いレベルで応用できるかが課題かもしれません。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする