ベストアンサー
更新。新しいタイプのチェスマシンが登場し、100ゲームの試合で世界最高のエンジンであるStockfish8を打ち負かしました。その名前はアルファゼロです。 28試合に勝ち、72を引き、0を失い、100点満点中64点でした。
Stockfishは純粋な力ずくのアプローチを使用していませんが、スコアが非常に高い理由の1つは、毎秒驚くべき70,000,000ポジション。しかし、Alpha Zeroはそれを打ち負かし、1秒あたり80,000の位置しか計算しません。
Alpha Zeroはニューラルネットを使用したAIです。チェスのルール(オープニングブック、プログラムされた戦略、グランドマスターゲーム、エンディングテーブルなし)が与えられ、そこから4時間対戦するだけで、チェスについて何ができるかを学びました。それはStockfishを打ち負かすのに十分でした。実際、この4時間の練習で、Alpha Zeroは、チェスの知恵を蓄積してきた約1、500年の間に、人間よりもチェスの勝利について多くを学びました。
回答
チェスゲームに基づいて質問に答えようとします私が見て分析したStockfish8とAlphaZero。
DeepMindの自己学習AIであるAlphaZeroは、4時間以内にStockfishとのゲームのトレーニングを行い、100ゲームの試合でStockfishを破壊しました。
ほとんどのゲームでは、素材をそれほど気にしていないことがわかりました。位置とピースのアクティビティに関心があります。そのゲームは攻撃のように見えます。黒い部分があっても、開いているファイルを取得してその部分を適切に開発するために、いくつかのポーンを犠牲にします。
私たちは人間として、マテリアルがチェスでより重要であることを知っています。ポジションも重要ですが、ミドルゲームでボード上に魔法をかける代わりに、ピースを交換し、アドバンテージを得て、エンドゲームを楽しみにしています。 たとえば、ルークはビショップ/ナイトよりも優れていることがわかっています。ビショップ/ナイトが十分に発達していてその地位を維持している場合でも、それを未発達のルークに交換します。
チェスエンジンでさえ、ハードコードされた部分の優先順位があります。チェスエンジンはまた、より良い位置チェスをします。また、作品の優先順位は位置によって異なります。ただし、確実な利点がない場合、チェスエンジンのいずれも材料を犠牲にすることはありません。逆に、AlphaZeroはそれを行います。ゲームの1つでは、約3つのポーンが犠牲になります。
ここでゲームを見ることができます(クレジット:Anna RudolfとYouTube)
主なものは、AlphaZeroが「相手を麻痺させる」です。対戦相手のほとんどが動かされていないか、開発が進んでいないことがわかります。
これは、私たち人間がAlphaZeroから学ぶことができることです。これはチェスの新しい考え方です。
どうやってそうするのか:-チェスの基本的なルールを知っているだけです。それはそれ自身で多くのことを理解しました。 -ルークがより多くのポイントを持っているか、ビショップまたはナイトを持っているかはわかりません。それは知っている、キングは重要な人です。 –AlphaZeroは優秀な人物のようで、教師もメンターもいません。彼はチェスを独自の方法で見て、上手になります。