Beste antwoord
Update. Een nieuw TYPE schaakmachine is op het toneel en heeft s werelds beste engine – Stockfish 8 – verslagen in een match van 100 spellen. Zijn naam is Alpha Zero. Het won 28 games, speelde 72 gelijk en verloor 0, voor een score van 64 van de 100.
Stockfish gebruikt geen pure brute force-benadering, maar een van de redenen waarom het zo hoog scoort, is omdat het een verbazingwekkende 70.000.000 posities per seconde. Maar Alpha Zero versloeg het en berekent slechts 80.000 posities als seconde.
Alpha Zero is AI, gebruikmakend van een neuraal net. Het kreeg de regels van het schaakspel (geen openingsboek, geen geprogrammeerde strategie, geen grootmeesterspellen en geen eindtafels) – en van daaruit leerde het wat het deed met schaken door simpelweg 4 uur tegen zichzelf te spelen. Dat was genoeg om Stockfish te verslaan. In feite heeft Alpha Zero in die 4 uur oefenen meer geleerd over het winnen van schaken dan mensen in de ~ 1500 jaar dat ze schaakwijsheid hebben vergaard.
Antwoord
Ik zal proberen de vraag te beantwoorden aan de hand van schaakpartijen tussen Stockfish 8 vs AlphaZero die ik heb bekeken en geanalyseerd.
AlphaZero, de zelflerende AI van DeepMind, trainde zichzelf binnen 4 uur voor de games met Stockfish en vernietigde Stockfish in 100 games-match.
In de meeste spellen konden we zien dat het materiaal niet zo veel om het materiaal geeft. Het geeft om de positie en de activiteit van de stukken. Zijn spel lijkt aan te vallen. Zelfs met de zwarte stukken, offert het weinig pionnen op om open bestanden te krijgen en zijn stukken goed te ontwikkelen.
Wij, als mens, weten dat materiaal belangrijker is bij schaken. We weten dat positie ook belangrijk is, maar in plaats van magie op het bord te creëren in het middelste spel, hebben we de neiging om stukken te wisselen, wat voordeel te behalen en uitkijken naar het eindspel. We weten bijvoorbeeld dat een toren beter is dan een loper / een ridder; zelfs als de bisschop / ridder goed ontwikkeld is en de positie vasthoudt, ruilen we deze in voor onderontwikkelde toren.
Zelfs schaakmachines hebben de prioriteit van de hardgecodeerde stukken. Schaakmachines spelen ook beter positioneel schaak. Ook varieert de prioriteit van de stukken afhankelijk van de positie. Maar geen van de schaakmachines zou enig materiaal opofferen als er geen zeker voordeel is. Integendeel, AlphaZero doet dat. In een van de spellen offert het ongeveer 3 pionnen op.
Je zou het spel hier kunnen zien (tegoed: Anna Rudolf en YouTube)
Het belangrijkste is dat AlphaZero speelt voor is “zijn tegenstander verlammen”. We kunnen zien dat de meeste van zijn tegenstanders niet verplaatst of onderontwikkeld zijn.
Dit is wat wij mensen zouden kunnen leren van AlphaZero. Dit is een nieuwe manier van denken in schaken.
Hoe het erin slaagt: – Het kent gewoon de basisregel van schaken. Het heeft zelf een heleboel dingen bedacht. – Het weet niet dat Rook meer punten of loper of paard heeft. Het weet gewoon dat King degene is die ertoe doet. – AlphaZero is als een briljant persoon, die geen leraar of mentor heeft, hij kijkt op zijn eigen manier naar schaken en wordt er beter in.