Программист продемонстрировал работу искусственного интеллекта, созданного специально для прохождения уровня в игре Super Mario World. Заложенный в основу самообучающегося приложения метод проб и ошибок показал требуемый результат на 34-й попытке, сообщает CNET.
Основное отличие представленной самообучающейся программы от аналогов заключается, как заметил автор опубликованного на YouTube ролика, в том, что до первой попытки пройти уровень она не имела игрового или какого-либо другого опыта. Искусственный интеллект даже не знал цели игры и не представлял, какой именно требуется результат.
Принцип действия программы оказался основан на переборе возможных вариантов — искусственный интеллект пробовал различное поведение в игре. Удачные шаги сохранялись и в точности повторялись в следующих попытках. Проигрышные пополняли список неудачных и больше не применялись.
Автор алгоритма, управляющего развитием искусственного интеллекта, признает, что смена уровня приведет к необходимости очередного обучения. Программа не реагирует на окружающую среду, а выполняет определенные действия в заданные промежутки времени. Однако он не оставляет надежды, что вскоре от этого недостатка удастся избавиться. В дополнение к видеоролику, объясняющему принципы работы самообучающейся программы, программист опубликовал ее исходный код.
Someone wrote a program to 'kick butt at Super Mario World' and called it MarI/O <3 https://t.co/Hk9HsGyyY0 @jongold
— Holly Brockwell (@holly) June 16, 2015
В начале 2015 года специалисты Google создали искусственный интеллект Deep-Q-Network, который похожим методом проб прошел 49 ретро-игр. В ходе исследования программа поставила несколько абсолютных рекордов и показала себя успешнее игроков-людей. Однако если сравнивать число попыток, которые потребовались для набора максимального числа очков, живые игроки заметно выигрывают.