Meilleure réponse
Tsumego est lun des moyens les plus efficaces de devenir plus fort avec Go. Le but est dobtenir un résultat optimal indépendamment de la manière spécifique dont votre adversaire pourrait répondre sur votre coup spécifique. Habituellement, il nexiste quune seule solution optimale et efficace à un problème tsumego donné. Parfois, il peut y avoir deux ou plusieurs solutions qui fonctionnent toutes de manière optimale vers le meilleur résultat possible dans une situation locale.
Une situation de tsumego possible peut être un problème de vie ou de mort: soit vous essayez de tuer votre groupe dadversaires en lempêchant de faire deux yeux. Ou vous devez faire vivre votre propre groupe en jouant le bon coup. Dautres problèmes possibles de tsumego peuvent couvrir les semeai où vous devez capturer les pierres de votre adversaire avant dêtre capturé vous-même (ce quon appelle les combats de libertés), les situations de ko où vous devez trouver le bon ordre de coups pour gagner un ko, etc.
Le nombre de coups quun problème de tsumego peut exiger dépend généralement des réponses possibles de votre adversaire. Parfois, une séquence de plus de 15 coups peut être nécessaire pour jouer avant que le résultat final dun tsumego ne devienne clair. Mais bon, ne vous inquiétez pas, tsumego relativement facile peut être juste quelques réflexions profondes.
Jusquici tout va bien, si vous voulez un début addictif avec tsumego et tesuji à un moment donné, vous aimerez peut-être Tesuji par Mark Davies qui est pour les joueurs autour de 15 – 5 kyu. Puisque vous venez dapprendre Go, cest peut-être une bonne idée de dabord vous habituer à tous les modèles intéressants et fascinants qui peuvent se produire dans un jeu de société 9×9. Ensuite, après plusieurs parties jouées, vous pouvez commencer à vous habituer à penser à un ou plusieurs coups avant de décider où jouer. Et avant de savoir que vous résolvez de très nombreux tsumego dans vos propres jeux.
Ensuite, si vous commencez à manger, boire, réfléchir, rêver Allez 24/7 (de temps en temps), vous pouvez continuer de plus en plus de tsumego provenant dautres sources au niveau actuel auquel vous jouez. Même les joueurs les plus forts du monde (par exemple Lee Sedol 9p) sentraînent quotidiennement pendant des heures pour maintenir leur niveau de lecture anticipée au maximum.
Enfin, si vous constatez que vous avez du mal à décider où jouer ou ce quil faut faire. Commencez par penser à lendroit où votre adversaire jouerait sil avait deux coups lun après lautre. Alors imaginez où vous joueriez si vous étiez à la place de votre adversaire. Si vous voyez ce que votre adversaire serait capable daccomplir dans une situation de tsumego (ou de nimporte quel plateau de Go) en effectuant deux coups daffilée (au lieu dun normalement), alors vous avez beaucoup didées sur la façon dont vous voulez éviter cela!
Bonne chance avec tsumego et profitez de toute une vie du jeu de société le plus fascinant et inspirant qui existe sur Terre et peut-être dans tout lUnivers dans lequel nous vivons réellement…
Réponse
AlphaGo est basé sur lapprentissage par renforcement profond. Ils ont commencé par enseigner à lalgorithme comment jouer à partir de zéro aux anciens jeux Atari, comme le font les humains – en «regardant simplement lécran». Ensuite, il y a eu Go et Chess en tant que tâches beaucoup plus complexes, avec la «sagesse» acceptée par Go selon laquelle les ordinateurs sont à des éternités de battre les humains.
Toutes ces réalisations sont basées sur le même algorithme de base, avec des ajustements dans comment évaluer la fonction de récompense à laide de différentes architectures ANN.
Donc, au moins en théorie, cette même approche peut être utilisée pour à peu près nimporte quelle tâche du monde réel, et pas seulement «virtuelle», mais aussi dans le monde réel appliqué à par exemple la robotique. Apprendre à un robot à faire une omelette par exemple. Ou comment jouer à Civilization 6. Ou comment jouer du violon. Fondamentalement, tout ce qui a une définition claire du «succès» à la fin et une certaine capacité à identifier des modèles similaires à chaque étape – qui sont utilisés pour évaluer une récompense en les exécutant via un ANN.
De plus, un Le point extrêmement intéressant dAlphaGo était que les gens qui y jouaient ont remarqué quil jouait en tant quêtre humain, mais dune manière inhumaine . En tant quhumain dans un sens de mouvements créatifs, et comme inhumains – parce que les mouvements quil a faits étaient parfois complètement, absolument inattendus par les joueurs humains. Ce qui signifie que lalgorithme a exploré de nombreux espaces de position Go où les humains ne se sont même jamais aventurés!
Imaginez si un effet similaire se manifestait dans certains problèmes du monde réel? Par exemple, la guerre? Assez effrayant.