최상의 답변
업데이트. 새로운 유형의 체스 머신이 등장하며 100 경기에서 세계 최고의 엔진 인 Stockfish 8을 제치고 있습니다. 이름은 Alpha Zero입니다. 100 점 만점에 64 점으로 28 승 72 무 0 패를 기록했습니다.
Stockfish는 순수한 무차별 대입 방식을 사용하지 않지만 점수가 높은 이유 중 하나는 초당 70,000,000 개의 위치를 차지합니다. 하지만 Alpha Zero가 이길 수 있었고 두 번째로 80,000 개의 위치 만 계산했습니다.
Alpha Zero는 신경망을 사용하는 AI입니다. 그것은 체스의 규칙 (개봉 책, 프로그램 된 전략, 그랜드 마스터 게임, 엔딩 테이블 없음)이 주어졌고 거기에서 단순히 4 시간 동안 자신과 대결하여 체스에 대해 무엇을했는지 배웠습니다. Stockfish를 이기기에 충분했습니다. 사실, 그 4 시간의 연습에서 Alpha Zero는 체스 지혜를 쌓아온 ~ 1,500 년 동안 인간보다 체스 우승에 대해 더 많이 배웠습니다.
답변
나는 다음 사이의 체스 게임을 기반으로 질문에 답하려고합니다. 내가보고 분석 한 Stockfish 8 vs AlphaZero.
DeepMind의자가 학습 AI 인 AlphaZero는 Stockfish로 게임을 위해 4 시간 이내에 스스로 훈련하고 100 게임 매치에서 Stockfish를 파괴했습니다.
대부분의 게임에서 자료에 그다지 신경 쓰지 않는다는 것을 알 수 있습니다. 위치와 조각의 활동에 관심이 있습니다. 그 게임은 공격적인 것처럼 보입니다. 검은 색 조각으로도 파일을 열고 적절하게 개발하기 위해 폰을 거의 희생하지 않습니다.
우리는 인간으로서 머티리얼이 체스에서 더 중요하다는 것을 알고 있습니다. 우리는 위치도 중요하다는 것을 알고 있지만 중간 게임에서 보드에 마법을 만드는 대신 조각을 교환하고 약간의 이점을 얻고 최종 게임을 고대하는 경향이 있습니다. 예를 들어, 우리는 루크가 비숍 / 기사보다 낫다는 것을 알고 있습니다. Bishop / Knight가 잘 발달되어 있고 지위를 유지하더라도 우리는 그것을 저개발 Rook으로 교환합니다.
체스 엔진조차도 그 안에 하드 코딩 된 조각의 우선권을 가지고 있습니다. 체스 엔진은 또한 더 나은 위치 체스를합니다. 또한 작품의 우선 순위는 위치에 따라 다릅니다. 그러나 확실한 이점이 없다면 어떤 체스 엔진도 재료를 희생하지 않습니다. 반대로 AlphaZero는 그렇게합니다. 게임 중 하나에서는 폰 3 개 정도를 희생합니다.
여기에서 게임을 볼 수 있습니다 (출처 : Anna Rudolf 및 YouTube).
중요한 것은 AlphaZero가 “상대를 마비시키는 것”입니다. 대부분의 상대 부품이 움직이지 않거나 미개발 상태임을 알 수 있습니다.
이것이 우리 인간이 AlphaZero에서 배울 수있는 것입니다. 이것은 체스에서 생각하는 새로운 방법입니다.
그렇게하는 방법 :-체스의 기본 규칙 만 알고 있습니다. 스스로 많은 것을 알아 냈습니다. -루크가 더 많은 포인트를 가지고 있거나 비숍이나 나이트가 있다는 것을 모릅니다. 그것은 단지 알고 있습니다, 왕이 중요한 사람입니다. -AlphaZero는 선생님이나 멘토가없는 뛰어난 사람 같고 나름대로 Chess를 바라보고 더 잘합니다.