Jak rozwiązać problem tsumego


Najlepsza odpowiedź

Tsumego to jeden z najskuteczniejszych sposobów wzmacniania się w Go. Celem jest uzyskanie optymalnego wyniku niezależnie od konkretnego sposobu, w jaki przeciwnik mógłby odpowiedzieć na Twoje konkretne posunięcie. Zwykle istnieje tylko jedno optymalne i działające rozwiązanie danego problemu tsumego. Czasami mogą istnieć dwa lub więcej rozwiązań, z których wszystkie działają optymalnie, aby uzyskać jak najlepszy wynik w lokalnej sytuacji.

Możliwa sytuacja tsumego może być problemem życia i śmierci: albo spróbujesz zabić grupę przeciwników zapobiegając zrobieniu dwojga oczu. Albo musisz ożywić swoją własną grupę, wykonując właściwy ruch. Inne możliwe problemy tsumego mogą obejmować semeai, w których musisz zbić kamienie przeciwnika, zanim sam zostaniesz złapany (tak zwane walki o wolności), ko sytuacje, w których musisz znaleźć prawidłową kolejność ruchów, aby wygrać ko itp.

Liczba ruchów, których może wymagać zadanie tsumego, zwykle zależy od możliwych odpowiedzi przeciwnika. Czasami może być wymagana sekwencja więcej niż 15 ruchów, zanim ostateczny wynik tsumego stanie się jasny. Ale hej, nie martw się, stosunkowo łatwe tsumego może być tylko kilkoma głębokimi myślami.

Jak dotąd dobrze, jeśli chcesz uzależnić początek z tsumego i tesuji w pewnym momencie, możesz polubić Tesuji Mark Davies, czyli dla graczy w wieku około 15 – 5 kyu. Ponieważ właśnie nauczyłeś się Go, być może dobrym pomysłem jest najpierw przyzwyczaić się do wszystkich interesujących i fascynujących schematów, które mogą wystąpić w grze planszowej 9×9. Następnie, po kilku rozegranych meczach, możesz zacząć przyzwyczaić się do myślenia o jednym lub kilku ruchach do przodu, zanim zdecydujesz, gdzie grać. Zanim się zorientujesz, rozwiążesz wiele, wiele tsumego we własnych grach.

Jeśli zaczniesz jeść, pić, myśleć, marzyć Go 24/7 (od czasu do czasu), możesz kontynuować coraz więcej tsumego z innych źródeł na obecnym poziomie gry. Nawet najsilniejsi gracze na świecie (np. Lee Sedol 9p) ćwiczą wiele godzin dziennie, aby maksymalnie utrzymać swój poziom czytania z wyprzedzeniem.

Wreszcie, jeśli zauważysz, że trudno Ci zdecydować, gdzie grać lub co robić. Zacznij od zastanowienia się, gdzie grałby twój przeciwnik, gdyby miał dwa ruchy po sobie. Więc wyobraź sobie, gdzie byś zagrał, gdybyś był na miejscu przeciwnika. Jeśli widzisz, co twój przeciwnik byłby w stanie osiągnąć w sytuacji tsumego (lub dowolnej planszy Go), wykonując dwa ruchy z rzędu (zamiast normalnego), masz mnóstwo pomysłów, jak chcesz temu zapobiec!

Powodzenia z tsumego i ciesz się przez całe życie najbardziej fascynującą i inspirującą grą planszową, jaka istnieje na Ziemi i być może w całym Wszechświecie, w którym aktualnie żyjemy…

Odpowiedź

AlphaGo opiera się na głębokim uczeniu się o wzmocnieniu. Zaczęli od nauczenia algorytmu, jak grać w stare gry Atari od zera, tak jak ludzie – po prostu „patrząc na ekran”. Potem było Go and Chess jako znacznie bardziej złożone zadania, przy czym Go przyjęła „mądrość” głosząca, że ​​komputery są eony daleko od pokonania ludzi.

Wszystkie te osiągnięcia opierają się na tym samym podstawowym algorytmie, z dostosowaniami jak ocenić funkcję nagrody za pomocą różnych architektur ANN.

Tak więc, przynajmniej w teorii, to samo podejście można zastosować do praktycznie każdego zadania w świecie rzeczywistym, a nie tylko „wirtualnego”, ale także w świecie rzeczywistym w zastosowaniu np robotyka. Na przykład uczenie robota, jak zrobić omlet. Albo jak grać w Civilization 6. Albo jak grać na skrzypcach. Zasadniczo wszędzie tam, gdzie na końcu istnieje jasna definicja „sukcesu” i pewna możliwość zidentyfikowania podobnych wzorców na każdym kroku – które są używane do oceny nagrody poprzez przepuszczenie ich przez SSN.

Ponadto jeden niezwykle interesującym punktem w AlphaGo było to, że ludzie, którzy go grali, zauważyli, że grał jako człowiek, ale w nieludzki sposób . Jako człowiek w sensie twórczych ruchów i jako nieludzki – ponieważ ruchy, które wykonywał, były czasami całkowicie, absolutnie nieoczekiwane przez ludzi. Co oznacza, że ​​algorytm zbadał wiele przestrzeni pozycji Go, do których ludzie nigdy się nie odważyli!

Wyobraź sobie, że podobny efekt przejawiałby się w niektórych rzeczywistych problemach? Np. Wojna? Dość przerażające.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *