2016年03月17日

Alpha碁に関する理科系的考察

再挑戦、再勝利を目指しているプロ棋士、トップアマチュアの方々のために。

一般にソフトウェアのプログラムは企業特許重要機密ですので、部外者に公開されることはありませんが、科学誌向けなどメディア向け広告宣伝のためにある程度の概要は告知されます。Alpha碁に関しては次の情報がWeb上からわかりました。

(1)Alpha碁のハードはCPU1202個+GPU176枚

(2)Alpha碁では、従来より洗練された総当りの方法(モンテカルロ法)と深層神経(ディープ・ニューラル)ネットワーキングを組み合わせています。これらの深層神経ネットワークは、基盤の情報を入力として受け取り、数百万の神経回路に似た接続を持つ12の異なるネットワーク層で処理しています。ポリシーネットワークが次の手筋を選択し、バリューネットワークがゲームの勝者を予測しています。人間のベテラン棋士がかつて用いた3,000万の手を覚えさせることで、AlphaGoは人間の次の1手を57%の確率で予測できるよう至りました。神経ネットワーク間同士で何千回と勝負をさせ、教科学習法として知られる試行錯誤処理を使い接続を調整することで、AlphaGo自身が新しい戦略を発見させるまで訓練を行ない、AlphaGoは、他の人工知能プログラムとの対戦では499勝1敗という成績を収めました。

これらの情報をもとに一人の工学者として、このソフトウェアがどのような思考を行っているかを以下に類推致しました。

(1)GPU(画像処理)をどう使用しているのか? というプロ棋士の先生の疑問をお聞きしました。手順や形表示であれば従来モンテカルロで行ってきた座標表示で十分なはずです。画像として盤面認識するのと座標認識ではどこが違うのか? を考えてみるとわかることがいくつかあります。

@手順が違っても同じ形ができることはよくありますので、形そのものを画像として認識評価しているということです。

A画像直接認識でできることの一つは、形勢判断です。(現在のネット対局場でも形勢判断プログラムは使用しています。)

B画像直接認識でできることの二つ目は、定石検索、定型検索です。その後の選択肢記憶探索条件を画像直接認識から選ぶことできます。

C他には終局のチェックです。

Dプロ棋士やトップアマチュアが行う画像認識には希望想定結果図から逆算して手順を選択する方法があります。未来から過去に逆に読む方法です。これをAlpha碁ができるとさらに強くなるでしょう。あるいはもうやっているかもしれません。


(2)12の異なるネットワーク層には何があるか? も気になるところです。これらの多くは従来からあるものやあるいはその改良作の組み合わせだと思います。従来のモンテカルロ囲碁製作者が課題としてきたのは多数PCの並列化問題でした。ここにニューラルネットワークの自己学習を用いることで、膨大な変数にかかる膨大な諸係数と選択肢選択を自己学習修正できるようにしたということです。ここがこのプログラムが格段に強くなった秘密です。

(3)今後も対局学習を繰り返すたびに諸係数や選択肢経路は、より人間の思考に近づいて行きます。ただしそれがパーフェクトな解(人間そっくり)に結びつくかどうかはまだわかっていません。コンピュータ同士対決だけですと、人工知能の学習が人間から離れて暴走してしまう可能性もあります。過去にはこのような事態がありませんでしたから単純に学習できましたが、これからは人間もコンピュータを意識して、あるいはコンピュータから学んだ手を考慮して打ち進めますので、コンピュータの自己暴走(間違った手でも強い手)に人間が巻き込まれるという現象も起こり得ます。これらはシンギュラリティ(技術特異点)という未知の未来がどうなるかということと関連します。これらの分析をしたくて、複雑系囲碁ゲームと強いプロ棋士を研究相手に選んでいるとも言えるのです。
posted by きんちゃんブログ at 02:17| Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする

Alpha碁に関する文科系的考察

ここ一週間はずいぶんブログやTweet、Facebookコメントを読みましたし、書きました。プロ棋士では、メディアに多数出演なさった大橋先生の他、三村先生、高尾先生、謝先生、藤澤先生、竹清先生、万波先生、冨士田先生のコメント内容は本格的で参考になりました。若手の大熊先生のTweet(ファミレスで書いていたらしい)は面白かったです。トップアマでは永代(ながよ)さんのブログは有名プロでは言えない鋭いところまで書いていてピカ一でした。人類囲碁史上に残る鬼手とされる第4局のイセドル九段のワリコミは、実は正しく応じれば不発弾だったという万波先生の解説を丁寧に紹介しています。あ、これを書いちゃうとまずいのかな? あれはわざと間違った手を打ったのか? それとも局所で不発でも全局的な流れには意味があるのか? いずれにしてもあの手によってAlpha碁の暴走が始まり自滅してゆきました。暴走させるために打ったとしたら超天才です!

ここ1週間、プロ棋士の先生は落胆と感動を繰り返しつつ、リベンジに燃える先生と、そんなの人間の囲碁には関係ないという先生に分かれているようですが、日本棋院での話題はどの先生もこれに尽きるようです。じり貧ぎみだった日本囲碁界にとっては宣伝効果抜群で、これほど囲碁に関心を集めたのはヒカルの碁以来10数年ぶりじゃないでしょうか。韓国でも視聴率は野球中継の1.5倍もあったという記事もありました。

それ以上に驚くべきことは、韓国の棋士を日本人や中国人がこれほど応援したのは、近年なかったのではないでしょうか? ここ数年日中韓のライバル争いが熾烈でしたからね。相手が英米だったからでしょうか? アヘン戦争か黒船襲来かということで、東アジアが団結したと言うべきか? いや待ってください! このプログラム製作者もアジア系の人なのです! つまりは人類対機械の構図、もっと言えば人類対エイリアンみたいな構図で、人類が危機に瀕して一致団結したという感動なのでしょうか? プロ棋士の中には敗北のくやしさの涙もあったことでしょうが、それ以上に人間として連帯しようという愛の心も芽生えたようです。大熊先生は、アルファ碁にマザーテレサのような慈愛を感じたらしいです。そうですね。囲碁の強さに関する個人的競争心をチームとしての団結心に変えてくれたマザーの愛ですよね。

でも我々人類の敵は一体何なんでしょうか? コンピュータを不気味だと感じるコメントをたくさん目にしますが、それは単なる機械で、それを作ったハスピス氏も慈愛ある人間です。「地球環境問題解決やガン治療に応用したい。」とおっしゃってます。何が怖くて、不気味で、何が知能競争の敵なのでしょうか?

そうです。その敵とは、私たち人間が競争に負けた過去の悔しさという感情を累々と蓄積することなのです。悔しさの蓄積という亡霊と戦っているのです。囲碁以外の分野まで普及すると、その敵とは人間の欲、煩悩、原罪とも言えます。それを一身に引き受けてくれるのが機械です。イエスの贖罪でもわら人形でもなく、コンピュータという箱が犠牲や悪役を負うことによって、ネガティブ感情の浄化が行われているような現象を今回感じました。プロ棋士の山城先生は「囲碁の本質は楽しむこと。AIのおかげで囲碁のレベルが上がることを期待しています。」とTBSニュースでおっしゃっていました。よく考えるとそこに敵はおりません。

人類が連帯し、勝負や競争、欲望に関わるネガティブ感情を浄化して、人類生存のため、幸福のために調和することができるとしたら、人工知能はバラ色の未来を創ることでしょう。ただし、負の感情の露呈は一過性の必須条件として許容できるのか? が問われます。そんな愛と慈悲の視点で、AI(人工知能)に関わる人々を温かく見守っていきましょう。

言い過ぎ御免なさい。
posted by きんちゃんブログ at 02:15| Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする