Beste svaret
Oppdatering. En ny TYPE sjakkmaskin er på banen og har slått verdens beste motor – Stockfish 8 – i en 100-kamp. Det heter Alpha Zero. Den vant 28 kamper, spilte 72 og tapte 0 for en poengsum på 64 av 100.
Stockfish bruker ikke en ren brute force-tilnærming, men en grunn til at den scorer så høyt, er fordi den beregner en fantastiske 70.000.000 stillinger per sekund. Men Alpha Zero beseiret den, og beregner bare 80.000 posisjoner i andre.
Alpha Zero er AI, ved hjelp av et nevralt nett. Det ble gitt sjakkreglene (ingen åpningsbok, ingen programmert strategi, ingen stormesterspill og ingen sluttbord) – og derfra lærte det hva det gjorde med sjakk ved å spille mot seg selv i 4 timer. Det var nok til å slå Stockfish. Faktisk, i løpet av de 4 timene med øvelse, lærte Alpha Zero mer om å vinne sjakk enn mennesker gjorde i de ~ 1500 årene de har samlet sjakkvisdom.
Svar
Jeg vil prøve å svare på spørsmålet på grunnlag av sjakkspill mellom Stockfish 8 vs AlphaZero som jeg har sett på og analysert.
AlphaZero, den selvlærende AI fra DeepMind, trente seg innen 4 timer for spillene med Stockfish og ødela Stockfish i 100 kamper.
I de fleste spill kunne vi se at det ikke bryr seg så mye om materialet. Den bryr seg om posisjonen og brikkenes aktivitet. Spillet ser ut som å angripe. Selv med de svarte brikkene ofrer det få bønder for å få åpne filer og utvikle brikkene sine skikkelig.
Vi som mennesker vet at Materiell betyr mer i sjakk. Vi vet at posisjon også betyr noe, men i stedet for å skape magi på brettet i midtspillet, pleier vi å bytte brikker, få noen fordeler og ser frem til sluttspillet. For eksempel vet vi at en Rook er bedre enn en biskop / en ridder; selv om biskopen / ridderen er godt utviklet og innehar posisjonen, bytter vi den til underutviklet Rook.
Selv sjakkmotorer har prioriteten til brikkene som er hardkodet i dem. Sjakkmotorer spiller også bedre posisjonssjakk. Også, bitenes prioritet varierer avhengig av posisjonen. Men ingen av sjakkmotoren ville ofre noe materiale hvis det ikke er noen sikker fordel. Tvert imot, AlphaZero gjør det. I et av spillene ofrer det rundt tre bønder.
Du kan se spillet her, (kreditt: Anna Rudolf og YouTube)
Det viktigste, AlphaZero spiller for er “lammende motstanderen”. Vi kan se at de fleste av motstanderstykkene ikke blir flyttet eller er underutviklede.
Dette er hva vi mennesker kunne lære av AlphaZero. Dette er en ny måte å tenke i sjakk på.
Hvordan den klarer å gjøre det: – Den kjenner bare den grunnleggende regelen om sjakk. Det fant ut mange ting alene. – Det vet ikke at Rook har flere poeng eller biskop eller ridder. Det vet bare, King er den som betyr noe. – AlphaZero er som en strålende person, som ikke har noen lærer eller mentor, han ser på sjakk på sin egen måte og blir bedre på det.