Ниже я использую метафору. Она не точная, но достаточно понятная.
Поиск решения по методу Монте-Карло – это оптимизация предыдущего алгоритма дерева решений. Предыдущий алгоритм, даже если он предоставлял качественный вариант решения задачи, должен был быть единственным в каждой точке для того, чтобы выбрать следующую ветвь с бесконечным множеством менее рациональных вариантов решения.
Метод Монте-Карло основывается на тонкостях теории вероятности. Представим шахматную ситуацию, где сеть глубокого обучения дает три возможных варианта на ход – А, В, С. Три точки в качестве корневого узла можно представить, как три дерева, каждое из которых имеет бесконечное число ветвей. Метод Монте-Карло не проверяет каждую из ветвей, но отправляет три миллиона муравьев по одному на каждую ветвь, чтобы те быстро поднялись на верхушку дерева (то есть, чтобы они шли до тех пор, пока не доберутся до варианта, который обеспечит победу). Некоторые из них доберутся до победной точки. Предполагается, что все муравьи ищут наиболее эффективное решение, а не вариант, в котором партия завершится поражением.
Предположим, что из 1 миллиона муравьев, которые отправились по ветке А, только 300 тысяч дошли до победного конца. По ветке В – 500 тысяч. По ветке С – 400 тысяч. Система понимает, что вероятность победы на ветке В гораздо выше, и выбирает именно этот вариант хода. Таким образом, вероятностный метод значительно сокращает количество вычислений по сравнению с методом исчерпывания.
Почему мы отправляем именно 1 миллион муравьев для исследований, а не 100 тысяч или не 10 миллионов? Это зависит от вычислительной мощности компьютера и приблизительной оценки конкурентов. Если в данной ситуации, чтобы получить более высокий коэффициент выигрыша нам требуется только 100 тысяч муравьев, мы отправим 100 тысяч. Но чем больше муравьев отправляются на дерево в одно и то же время, тем выше требования к вычислительной мощности компьютера.
Чип процессора и графический процессор (GPU), нейронные сети и метод Монте-Карло создают возможности, которые не могут сравниться с человеческими. В результате глубокого обучения искусственный интеллект моделирует способности человека, которые аналогичны сумме способностей 10 миллионов шахматистов.
Умные читатели, даже не понимая математическую теорию, способны уловить механизм работы AlphaGo. Хотя алгоритмы и стратегии гораздо сложнее, чем описано выше. AlphaGo на своем примере демонстрирует уровень развития глубокого обучения и искусственного интеллекта. Но на самом деле, на сегодняшний день существует множество научно-исследовательских институтов и талантливых ученых, которые делают сверхъестественные вещи в данном направлении.