Paras vastaus
Päivitä. Uusi TYYPPI shakkiautomaatti on näyttämöllä ja on voittanut maailman parhaan moottorin – Stockfish 8: n – 100 pelin ottelussa. Sen nimi on Alpha Zero. Se voitti 28 peliä, tasapeli 72 ja hävisi 0 pisteillä 64/100.
Stockfish ei käytä puhdasta raakaa voimaa -lähestymistapaa, mutta yksi syy siihen, että se saa niin korkean tuloksen, on se, että se laskee hämmästyttävä 70 000 000 asemaa sekunnissa. Mutta Alpha Zero kukisti sen ja laskee vain 80 000 sijaintia sekunnissa.
Alpha Zero on tekoäly, käyttäen hermoverkkoa. Sille annettiin shakkisäännöt (ei avaamiskirjaa, ohjelmoitua strategiaa, ei suurmestaripelejä eikä loppupöytiä) – ja sieltä oppittiin shakin suhteen pelaamalla itseään vastaan 4 tuntia. Se riitti voittamaan Stockfishin. Itse asiassa näiden neljän tunnin harjoittelun aikana Alfa Zero sai tietää shakin voittamisesta enemmän kuin ihmiset ~ 1500 vuoden aikana, jolloin he ovat keränneet shakkiviisautta.
Vastaa
Yritän vastata kysymykseen shakkipelien perusteella Stockfish 8 vs AlphaZero, jonka olen katsonut ja analysoinut.
DeepMindin itseoppiva tekoäly AlphaZero koulutti itsensä 4 tunnin kuluessa Stockfish-peleihin ja tuhosi Stockfishin 100 ottelussa.
Useimmissa peleissä voimme nähdä, että se ei välitä materiaalista niin paljon. Se välittää asemasta ja kappaleiden toiminnasta. Sen peli näyttää hyökkäävältä. Jopa mustien palojen kanssa se uhraa muutaman pelinappulan saadakseen avoimet tiedostot ja kehittämään kappaleitaan kunnolla.
Me ihmisinä tiedämme, että materiaali on tärkeämpää shakissa. Tiedämme, että sijainnilla on myös merkitystä, mutta sen sijaan, että luisimme taikuutta pöydälle keskipelissä, meillä on tapana vaihtaa nappuloita, saada jonkin verran etua ja odotamme loppupeliä. Tiedämme esimerkiksi, että torni on parempi kuin piispa / ritari; vaikka piispa / ritari onkin hyvin kehittynyt ja hänellä on asema, vaihdamme sen alikehittyneeksi Rookiksi.
Jopa shakkimoottoreilla on etusija kovasti koodatuissa kappaleissa. Shakkimoottorit pelaavat myös parempaa shakkia. Myös kappaleiden prioriteetti vaihtelee sijainnin mukaan. Mutta mikään shakkimoottorista ei uhraa mitään materiaalia, jos ei ole etua sureshotista. Päinvastoin, AlphaZero tekee sen. Yhdessä pelistä se uhraa noin 3 pelinappulaa.
Voit nähdä pelin täältä (luotto: Anna Rudolf ja YouTube)
Tärkein asia, jota AlphaZero soittaa on ”halvaantunut vastustajansa”. Voimme nähdä, että suurinta osaa sen vastustajakappaleista ei ole siirretty tai ne ovat kehittyneitä.
Tämän voimme oppia AlphaZerolta. Tämä on uusi tapa ajatella shakissa.
Kuinka se onnistuu: – Se tietää vain shakin perussäännön. Se selvitti paljon asioita yksin. – Se ei tiedä, että Rookilla on enemmän pisteitä tai piispa tai ritari. Se vain tietää, että kuningas on se, jolla on merkitystä. – AlphaZero on kuin loistava ihminen, jolla ei ole opettajaa tai mentoria, hän katsoo shakkia omalla tavallaan ja paranee siinä.