Melhor resposta
Atualizar. Um novo TIPO de máquina de xadrez está em cena e venceu o melhor motor do mundo – Stockfish 8 – em uma partida de 100 jogos. Seu nome é Alpha Zero. Venceu 28 jogos, empatou 72 e perdeu 0, para uma pontuação de 64 em 100.
Stockfish não usa uma abordagem de força bruta pura, mas uma das razões pelas quais pontua tão alto é porque calcula um incríveis 70 milhões de posições por segundo. Mas Alpha Zero o derrotou e calcula apenas 80.000 posições em segundo lugar.
Alpha Zero é AI, usando uma rede neural. Recebeu as regras do xadrez (sem livro de abertura, sem estratégia programada, sem jogos de grande mestre e sem tabelas finais) – e daí aprendeu o que fazia sobre o xadrez simplesmente jogando contra si mesmo por 4 horas. Isso foi o suficiente para vencer Stockfish. Na verdade, nessas 4 horas de prática, Alfa Zero aprendeu mais sobre como vencer no xadrez do que os humanos em aproximadamente 1.500 anos em que acumularam sabedoria no xadrez.
Resposta
Tentarei responder à pergunta com base em jogos de xadrez entre Stockfish 8 vs AlphaZero, que eu assisti e analisei.
AlphaZero, a IA de autoaprendizagem da DeepMind, treinou-se em 4 horas para os jogos com Stockfish e destruiu Stockfish em 100 jogos.
Na maioria dos jogos, pudemos ver que ele não se preocupa muito com o material. Ele se preocupa com a posição e a atividade das peças. Seu jogo parece um ataque. Mesmo com as peças pretas, ele sacrifica poucos peões para abrir arquivos e desenvolver suas peças adequadamente.
Nós, como humanos, sabemos que o material é mais importante no xadrez. Sabemos que a posição também importa, mas em vez de criar mágica no tabuleiro no meio do jogo, tendemos a trocar peças, ganhar alguma vantagem e aguardar o fim do jogo. Por exemplo, sabemos que uma Torre é melhor do que um bispo / um cavalo; mesmo se o Bispo / Cavalo estiver bem desenvolvido e segurando a posição, nós o trocamos por Torre subdesenvolvida.
Mesmo os motores de xadrez têm a prioridade das peças embutidas neles. Os motores de xadrez também jogam melhor o xadrez posicional. Além disso, a prioridade das peças varia de acordo com a posição. Mas nenhum mecanismo de xadrez sacrificaria qualquer material se não houvesse vantagem sureshot. Pelo contrário, AlphaZero faz isso. Em um dos jogos, ele sacrifica cerca de 3 peões.
Você pode ver o jogo aqui, (crédito: Anna Rudolf e YouTube)
O principal, AlphaZero joga para é “paralisar seu oponente”. Podemos ver que a maioria de suas peças oponentes não são movidas ou estão subdesenvolvidas.
Isso é o que nós humanos podemos aprender com AlphaZero. Esta é uma nova maneira de pensar no xadrez.
Como consegue fazer isso: – Ele apenas conhece as regras básicas do xadrez. Ele descobriu muitas coisas sozinho. – Não sabe que Torre tem mais pontos ou Bispo ou Cavalo. Ele simplesmente sabe, King é quem importa. – AlphaZero é como uma pessoa brilhante, que não tem nenhum professor ou mentor, ele olha o xadrez à sua maneira e fica melhor nele.