Новый подход лаборатории DeepMind Гугла к обучению ИИ сделал процесс в 10 раз эффективнее.
В большинстве обучающих алгоритмов ИИ используется обучение с подкреплением: программа улучшает работу с помощью отклика от среды (очков за успех или штрафы за ошибки). Минус – в том, что софт учится выполнять конкретные задачи и, выходя за их рамки, не в состоянии пользоваться уже полученными навыками.
В новом алгоритме машинного обучения IMPALA отдельные части учатся выполнять нескольких задач и обмениваться между собой знаниями. Предшественник алгоритма – система A3C, отдельные агенты которой исследуют окружающий мир, приостанавливаются и передают знания центральному компоненту, «ученику». В IMPALA агентов и учеников может быть больше, последние тоже могут делиться знаниями. Часть задач агентов в IMPALA передана «ученикам». С новым алгоритмом ИИ учится в 10 раз быстрее, чем с A3C. Его создатели говорят, что их разработка превосходит все предыдущие системы искусственного интеллекта, а во многих задачах – и человека.
И скоро ИИ поймёт, что человек ему не нужен и лишь мешает... Товарищи учёные приведут человеческий мир к концу быстрее чем парниковый эффект или падение кометы.