Mejor respuesta
Actualización. Un nuevo TIPO de máquina de ajedrez está en escena y ha vencido al mejor motor del mundo, Stockfish 8, en una partida de 100 partidas. Su nombre es Alpha Zero. Ganó 28 juegos, empató 72 y perdió 0, con una puntuación de 64 sobre 100.
Stockfish no usa un enfoque de fuerza bruta pura, pero una de las razones por las que obtiene una puntuación tan alta es porque calcula un asombrosas 70.000.000 posiciones por segundo. Pero Alpha Zero lo derrotó y calcula solo 80,000 posiciones por segundo.
Alpha Zero es IA, usando una red neuronal. Se le dieron las reglas del ajedrez (sin libro de aperturas, sin estrategia programada, sin juegos de gran maestro y sin mesas finales), y de ahí aprendió lo que hacía con el ajedrez simplemente jugando contra sí mismo durante 4 horas. Eso fue suficiente para vencer a Stockfish. De hecho, en esas 4 horas de práctica, Alpha Zero aprendió más sobre ganar ajedrez que los humanos en los ~ 1500 años que han acumulado sabiduría en el ajedrez.
Responder
Intentaré responder la pregunta basándome en partidas de ajedrez entre Stockfish 8 vs AlphaZero que he visto y analizado.
AlphaZero, la IA de autoaprendizaje de DeepMind, se entrenó en 4 horas para las partidas con Stockfish y destruyó Stockfish en 100 partidas.
En la mayoría de los juegos, pudimos ver que no le importa mucho el material. Se preocupa por la posición y la actividad de las piezas. Su juego parece atacar. Incluso con las piezas negras, sacrifica pocos peones para obtener archivos abiertos y desarrollar sus piezas correctamente.
Nosotros, como humanos, sabemos que el material importa más en el ajedrez. Sabemos que la posición también importa, pero en lugar de crear magia en el tablero en el medio juego, tendemos a intercambiar piezas, ganar algo de ventaja y esperar el final del juego. Por ejemplo, sabemos que una torre es mejor que un alfil / un caballo; incluso si el alfil / caballo está bien desarrollado y mantiene la posición, lo cambiamos por una torre subdesarrollada.
Incluso los motores de ajedrez tienen la prioridad de las piezas codificadas en ellos. Los motores de ajedrez también juegan un mejor ajedrez posicional. Además, la prioridad de las piezas varía según la posición. Pero ninguno de los motores de ajedrez sacrificaría material si no hay una ventaja segura. Al contrario, AlphaZero hace eso. En uno de los juegos, sacrifica alrededor de 3 peones.
Puedes ver el juego aquí, (crédito: Anna Rudolf y YouTube)
Lo principal, AlphaZero juega para es «Paralizar a su oponente». Podemos ver que la mayoría de las piezas de sus oponentes no se mueven o están subdesarrolladas.
Esto es lo que los humanos podríamos aprender de AlphaZero. Esta es una nueva forma de pensar en el ajedrez.
Cómo se las arregla para hacerlo: – Simplemente conoce la regla básica del ajedrez. Descubrió muchas cosas por sí solo. – No sabe que Rook tiene más puntos ni Bishop o Knight. Simplemente lo sabe, King es el que importa. – AlphaZero es como una persona brillante, que no tiene ningún maestro o mentor, mira al Ajedrez a su manera y lo hace mejor.