Mejor respuesta
Tsumego es una de las formas más eficientes de fortalecerse con Go. El objetivo es obtener un resultado óptimo independientemente de la forma específica en que su oponente pueda responder a su movimiento específico. Por lo general, existe una única solución óptima y funcional para un problema de tsumego determinado. A veces, puede haber dos o más soluciones que funcionen de manera óptima para obtener el mejor resultado posible en una situación local.
Una posible situación de tsumego puede ser un problema de vida o muerte: o intentas matar al grupo de tus oponentes evitando que haga dos ojos. O tienes que hacer que tu propio grupo esté vivo jugando el movimiento correcto. Otros posibles problemas de tsumego pueden cubrir semeai donde tienes que capturar las piedras de tu oponente antes de ser capturado tú mismo (las llamadas luchas de libertades), situaciones de ko en las que necesitas encontrar el orden correcto de movimientos para ganar un ko, etc.
La cantidad de movimientos que puede requerir un problema de tsumego generalmente depende de las posibles respuestas de tu oponente. A veces, es posible que se requiera una secuencia de más de 15 movimientos para jugar antes de que el resultado final de un tsumego sea claro. Pero no te preocupes, tsumego relativamente fácil puede ser solo un par de movimientos de pensamiento profundo.
Hasta ahora todo bien, si quieres un comienzo adictivo con tsumego y tesuji en algún momento, es posible que te guste Tesuji de Mark Davies, que es para jugadores de entre 15 y 5 kyu. Ya que acaba de aprender Go, quizás sea una buena idea acostumbrarse primero a todos los patrones interesantes y fascinantes que pueden ocurrir en un juego de mesa 9×9. Luego, después de varios juegos jugados, puede comenzar a acostumbrarse a pensar en uno o varios movimientos antes de decidir dónde jugar. Y antes de que te des cuenta de que estás resolviendo muchos, muchos tsumego en tus propios juegos.
Entonces, si comienzas a comer, beber, pensar, soñar Ve 24/7 (de vez en cuando), puedes continuar con más y más tsumego de otras fuentes en el nivel actual que estás jugando. Incluso los jugadores más fuertes del mundo (por ejemplo, Lee Sedol 9p) practican horas diarias para mantener su nivel de lectura anticipada al máximo.
Por último, si experimenta eso, le resultará difícil decidir dónde jugar o qué hacer. Empiece por pensar dónde jugaría su oponente si tuviera dos movimientos seguidos. Así que imagina dónde jugarías si estuvieras en el lugar de tu oponente. Si ves lo que tu oponente podría lograr en una situación de tsumego (o cualquier tablero de Go) con dos movimientos seguidos (en lugar de uno normalmente), ¡entonces tienes muchas ideas de cómo quieres evitar esto!
Buena suerte con tsumego y disfruta durante toda la vida del juego de mesa más fascinante e inspirador que existe en la Tierra y quizás en todo el Universo en el que vivimos…
Respuesta
AlphaGo se basa en el aprendizaje por refuerzo profundo. Comenzaron con enseñarle al algoritmo cómo jugar viejos juegos de Atari desde cero, como lo hacen los humanos, simplemente «mirando la pantalla». Luego estaba Go y Chess como tareas mucho más complejas, con la «sabiduría» aceptada por Go de que las computadoras están a eones de distancia de vencer a los humanos.
Todos estos logros se basan en el mismo algoritmo básico, con ajustes en cómo evaluar la función de recompensa con la ayuda de diferentes arquitecturas ANN.
Entonces, al menos en teoría, este mismo enfoque se puede utilizar para prácticamente cualquier tarea del mundo real, y no solo «virtual», sino también en el mundo real aplicado a eg robótica. Enseñar a un robot a hacer una tortilla, por ejemplo. O cómo tocar Civilization 6. O cómo tocar un violín. Básicamente, cualquier cosa en la que haya una definición clara de «éxito» al final y cierta capacidad para identificar patrones similares en cada paso, que se utilizan para evaluar una recompensa al ejecutarlos a través de una ANN.
Además, una Un punto extremadamente interesante en AlphaGo fue que las personas que lo jugaron notaron que jugaba como un humano, pero de una manera no humana . Como humano en el sentido de movimientos creativos, y como inhumano, porque los movimientos que realizó fueron a veces completa y absolutamente inesperados para los jugadores humanos. ¡Lo que significa que el algoritmo exploró muchos de los espacios de posición de Go donde los humanos ni siquiera se aventuraron!
¿Imagínese si un efecto similar se manifestaría en algunos problemas del mundo real? E.g., warfare? Bastante aterrador.