Beste antwoord
Tsumego is een van de meest efficiënte manieren om sterker te worden met Go. Het doel is om een optimaal resultaat te krijgen, onafhankelijk van de specifieke manier waarop uw tegenstander zou kunnen antwoorden op uw specifieke zet. Gewoonlijk is er slechts één optimale en werkende oplossing voor een bepaald tsumego-probleem. Soms zijn er twee of meer oplossingen die allemaal optimaal werken voor het best mogelijke resultaat in een lokale situatie.
Een mogelijke tsumego-situatie kan een probleem op leven en dood zijn: ofwel probeer je de groep van je tegenstanders te doden door te voorkomen dat het twee ogen maakt. Of je moet je eigen groep levend maken door de juiste zet te spelen. Andere mogelijke tsumego-problemen kunnen betrekking hebben op semeai waar je de stenen van je tegenstander moet slaan voordat je zelf wordt gevangen (zogenaamde vrijheidsgevechten), ko situaties waarin je de juiste volgorde van zetten moet vinden om een ko te winnen, enz.
Het aantal zetten dat een tsumego-probleem kan vereisen, hangt meestal af van de mogelijke antwoorden van je tegenstander. Soms is een reeks van meer dan 15 zetten nodig om te spelen voordat de uiteindelijke uitkomst van een tsumego duidelijk wordt. Maar maak je geen zorgen, relatief gemakkelijke tsumego is misschien maar een paar denkbewegingen diep.
Tot nu toe goed, als je ooit een verslavende start met tsumego en tesuji wilt, vind je Tesuji misschien leuk door Mark Davies, voor spelers rond de 15 – 5 kyu. Aangezien je Go net hebt geleerd, is het misschien een goed idee om eerst te wennen aan alle interessante en fascinerende patronen die kunnen voorkomen in een bordspel van 9×9. Daarna, na verschillende gespeelde spellen, kan het zijn dat je eraan begint te wennen om een of meerdere zetten vooruit te denken voordat je besluit waar je gaat spelen. En voordat je het weet los je heel veel tsumego op in je eigen spellen.
Als je dan begint te eten, drinken, nadenken, dromen Go 24/7 (af en toe), kun je doorgaan met steeds meer tsumego uit andere bronnen op het huidige niveau dat je speelt. Zelfs de sterkste spelers van de wereld (bijv. Lee Sedol 9p) oefenen dagelijks uren om hun leesvooruitspraken maximaal te houden.
Tot slot, als je ervaart dat je het moeilijk vindt om te beslissen waar je wilt spelen of wat moeten we doen. Begin met te bedenken waar je tegenstander zou spelen als hij / zij twee zetten na elkaar zou hebben. Dus stel je voor waar je zou spelen als je in de plaats van je tegenstander zou zijn. Als je ziet wat je tegenstander zou kunnen bereiken in een tsumego (of een ander Go-bord) situatie door twee zetten achter elkaar te doen (in plaats van normaal één), dan krijg je genoeg ideeën over hoe je dit wilt voorkomen!
Veel succes met tsumego en geniet een leven lang van het meest fascinerende en inspirerende bordspel dat er op aarde bestaat en misschien wel in het hele universum waarin we leven …
Antwoord
AlphaGo is gebaseerd op Deep Reinforcement Learning. Ze begonnen met het algoritme te leren hoe je oude Atari-spellen helemaal opnieuw kunt spelen, zoals mensen dat doen – door alleen maar “naar het scherm te kijken”. Toen waren er Go en Chess als veel complexere taken, waarbij Go aanvaarde wijsheid dat computers eeuwen verwijderd zijn van het verslaan van mensen.
Al deze prestaties zijn gebaseerd op hetzelfde basisalgoritme, met aanpassingen in hoe de beloningsfunctie te evalueren met behulp van verschillende ANN-architecturen.
Dus, tenminste in theorie, kan dezelfde benadering worden gebruikt voor vrijwel elke echte wereldtaak, en niet alleen virtuele, maar ook in de echte wereld zoals toegepast op bijv robotica. Een robot leren om bijvoorbeeld een omelet te maken. Of hoe je Civilization 6 speelt. Of hoe je viool speelt. Kortom, alles waar er uiteindelijk een duidelijke definitie van succes is en een bepaald vermogen om vergelijkbare patronen bij elke stap te identificeren – die worden gebruikt om een beloning te evalueren door ze door een ANN te halen.
Ook een buitengewoon interessant punt bij AlphaGo was dat mensen die het speelden, merkten dat het speelde als een mens, maar op een onmenselijke manier . Als mens in de zin van creatieve bewegingen, en als onmenselijk – omdat de bewegingen die het maakte soms volledig, absoluut onverwacht waren door menselijke spelers. Wat betekent dat het algoritme veel van de Go-positieruimten heeft verkend waar mensen zelfs nooit naar toe waagden!
Stel je voor dat een soortgelijk effect zich zou manifesteren in sommige echte problemen? Bijv. Oorlogvoering? Best eng.