Legjobb válasz
Frissítés. Új TÍPUSÚ sakkgép jelenik meg a helyszínen, és 100 meccsen megverte a világ legjobb motorját – a Stockfish 8-at. Alfa Zero neve. 28 mérkőzést nyert, 72 döntetlent és 0-t veszített a 100-ból 64 pontszámért.
A Stockfish nem használ tiszta durva erő megközelítést, de az egyik oka annak, hogy ilyen magas pontszámot jelent, mert kiszámít egy elképesztő 70 000 000 pozíció másodpercenként. De az Alpha Zero legyőzte, és csak 80 000 pozíciót számít ki másodpercenként.
Az Alpha Zero AI, neurális hálót használva. Megadták a sakk szabályait (se nyitókönyv, se programozott stratégia, se nagymesterjátékok, se befejező asztalok) – és onnan tudta meg, hogy mit tett a sakkról, egyszerűen 4 órán keresztül saját maga ellen játszva. Ez elég volt Stockfish megverésére. Valójában ebben a 4 órás gyakorlatban az Alfa Zero többet tudott meg a sakknyerésről, mint az emberek a ~ 1500 év alatt, amikor sakkbölcsességet halmoztak fel.
Válasz
Megpróbálom megválaszolni a kérdést a következő sakkjátékok alapján: Stockfish 8 vs AlphaZero, amelyeket megnéztem és elemeztem.
Az AlphaZero, a DeepMind önállóan tanuló mesterséges intelligenciája 4 órán belül kiképezte magát a Stockfish játékokra, és 100 játék során megsemmisítette a Stockfish-t.
A legtöbb játékban láthattuk, hogy annyira nem érdekli az anyag. Törődik a pozícióval és a darabok tevékenységével. A játék támadásnak tűnik. Még a fekete darabok mellett is kevés gyalogot áldoz fel, hogy nyiss fájlokat kapjon, és megfelelően fejlessze darabjait.
Emberként tudjuk, hogy a sakkban az anyag számít. Tudjuk, hogy a helyzet is számít, de ahelyett, hogy varázslatot teremtenénk a táblán a középső játékban, hajlamosak vagyunk darabokat cserélni, némi előnyt szerezni és várom a végjátékot. Például tudjuk, hogy egy Rook jobb, mint egy püspök / lovag; még akkor is, ha a püspök / lovag jól fejlett és megtartja a pozíciót, kicseréljük az alulfejlett Rook-ra.
Még a sakkmotoroknak is elsőbbséget élveznek a bennük keményen kódolt darabok. A sakkmotorok jobb pozíciósakkot is játszanak. Emellett a darabok prioritása a pozíciótól függően változik. De a sakkmotorok egyike sem áldozna fel anyagot, ha nincs sureshot előny. Épp ellenkezőleg, az AlphaZero ezt teszi. Az egyik játékban 3 gyalog körül áldoz.
A játékot itt láthatod (jóváírás: Anna Rudolf és a YouTube)
A legfontosabb, amiért az AlphaZero játszik „megbénítja ellenfelét”. Láthatjuk, hogy az ellenfél legtöbb darabja nincs elmozdítva vagy nem elég fejlett.
Ezt mi emberek megtanulhattuk az AlphaZero-tól. Ez egy újfajta gondolkodásmód a sakkban.
Hogyan sikerül: – Csak ismeri a sakk alapszabályát. Sok mindent kitalált egyedül. – Nem tudja, hogy Rooknak több pontja van, vagy püspöknek vagy lovagnak. Csak tudja, King az, aki számít. – Az AlphaZero olyan, mint egy ragyogó ember, akinek nincs tanára vagy mentora, a maga módján nézi a Sakkot, és jobbá válik benne.