ベストアンサー
詰碁は、Goで強くなるための最も効率的な方法の1つです。目標は、対戦相手があなたの特定の動きで答える可能性のある特定の方法に関係なく、最適な結果を得ることです。通常、与えられた詰碁の問題に対する最適で実用的な解決策は1つだけです。場合によっては、2つ以上の解決策があり、すべてが地域の状況で可能な限り最良の結果に向けて最適に機能することがあります。
考えられる詰碁の状況は、生死の問題である可能性があります。それが2つの目を作るのを防ぐことによって。または、正しい動きをして自分のグループを生き生きとさせる必要があります。他の考えられる詰碁の問題は、自分自身を捕まえる前に相手の石を捕らえなければならないセメアイ(いわゆる自由の戦い)、コを勝ち取るために正しい動きの順序を見つける必要があるコの状況などをカバーするかもしれません。
詰碁の問題で必要となる可能性のある移動の数は、通常、対戦相手の可能な回答によって異なります。詰碁の最終的な結果が明らかになる前に、15回以上の一連の動きを再生する必要がある場合があります。でも心配しないでください。比較的簡単な詰碁は、ほんの少し考えて深くなるかもしれません。
これまでのところ、詰碁と手筋から中毒のスタートを切りたい場合は、手筋が好きかもしれません。 15〜5級程度のプレイヤー向けのMarkDaviesによる。 Goを学んだばかりなので、9×9のボードゲームで発生する可能性のあるすべての面白くて魅力的なパターンに最初に慣れることをお勧めします。次に、いくつかのゲームをプレイした後、どこでプレイするかを決める前に、1つまたはいくつかの動きを考えることに慣れ始めるかもしれません。そして、自分のゲームでたくさんの詰碁を解決していることに気付く前に。
それなら、食べたり、飲んだり、考えたり、夢を見たりするなら、24時間年中無休で(時々)Goを続行できます。あなたがプレイしている現在のレベルで他のソースからますます多くの詰碁。世界最強の選手(李世ドル9pなど)でさえ、先読みレベルを最大限に維持するために毎日何時間も練習しています。
最後に、どこでプレーするかを決めるのが難しいと感じた場合、何をすべきか。対戦相手が次々に2つの動きをする場合、どこで対戦するかを考えることから始めます。ですから、対戦相手の代わりにどこでプレーするか想像してみてください。対戦相手が詰碁(または囲碁)の状況で、(通常は1つではなく)2つの動きを続けて達成できることを確認すると、これをどのように防止したいかについて多くのアイデアが得られます!
詰碁で頑張って、地球上、そしておそらく私たちが実際に住んでいる宇宙全体に存在する、生涯で最も魅力的で刺激的なボードゲームを楽しんでください…
答え
AlphaGoは深層強化学習に基づいています。彼らは、人間と同じように、単に「画面を見る」だけで、古いAtariゲームを最初からプレイする方法をアルゴリズムに教えることから始めました。次に、GoとChessがはるかに複雑なタスクを実行し、Goが受け入れた「知恵」は、コンピューターが人間を殴打することから遠く離れているというものでした。さまざまなANNアーキテクチャを使用して報酬関数を評価する方法。
したがって、少なくとも理論的には、この同じアプローチは、「仮想」だけでなく、ほとんどすべての現実世界のタスクに使用できます。たとえばに適用される現実の世界でロボット工学。たとえば、ロボットにオムレツを作るように教える。またはCivilization6の遊び方。またはバイオリンの遊び方。基本的に、最終的に「成功」の明確な定義があり、各ステップで同様のパターンを識別する能力があるものはすべて、ANNを介して報酬を評価するために使用されます。
また、1つAlphaGoの非常に興味深い点は、AlphaGoをプレイした人々が、人間としてプレイしたが、非人間的な方法でプレイしたことに気づいたことです。創造的な動きの意味での人間として、そして非人間的なものとして-それが行った動きは時々完全に、人間のプレイヤーにとって絶対に予想外だったからです。つまり、アルゴリズムは、人間が冒険することさえなかった多くのGo位置空間を探索したことを意味します!
同様の効果が実際の問題に現れるかどうか想像してみてください。例:戦争?かなり怖い。