Искусственный интеллект Google DeepMind получил «ускоритель» процесса обучения
Кaк глaсит нaрoднaя мудрoсть, «учeньe свeт, a нeучeньe тьмa». Видимo, этoгo а принципа придерживаются и специалисты компании Google, ответственные вслед за развитие DeepMind. Им, скорее всего, показалось, как будто ИИ недостаточно быстро усваивает новую информацию и приобретает новые знания, поэтому они разработали алгоритм, ускоряющий процессы распознавания, узнавания и систематизации новых знаний.
«Ускоритель» получил слово UNREAL (Unsupervised Reinforcement and Auxiliary Learning), и его продукт уже прошла успешную серию тестов на больше чем 50 играх для компьютера Atari и среде трехмерного лабиринта Labyrinth, состоящей из 13 уровней. Вотан из авторов технологии UNREAL Лиам Танг указывает:
«В основу работы алгоритма были заложены тёцка же самые принципы познавания и самообучения, которые в свое время позволили искусственному интеллекту завоевать победу над Ли Сеголем, мировым чемпионом согласно древней китайской игре го. Наши самообучаемые системы сделано добились значительных успехов в игре го и в играх интересах старых компьютеров. Однако на их подготовку, первоначальное обучение и последующее самообучение тратится ультра- много времени».
Ускорение процесса обучения было достигнуто ради счет внедрения двух инновационных моментов. Во первых, был изменен упрощенство, отвечающий за изучение того, как те или иные поступки взаимодействуют с отображаемым на экране. Если раньше в процессе обучения DeepMind учился прогнозировать, к чему может привести так или иное действие, то сейчас ИИ хорошенького понемножку основываться на предыдущем опыте и с похожими по свойствам объектами (к примеру, с яблоком и грушей), уже не нужно будет проводить (на)столь(ко) много времени на изучение. Свойства одного будут продолжаться на свойства другого, дополняясь там, где лакомиться значительные различия.
Вторая технология основана на возможности повторного анализа еще произошедших ситуаций, в ходе которых системой был приобретен оный или иной опыт. При этом система может вспоминать и теточка моменты, когда ей был получен отрицательный произведение, что помогает избежать тех же ошибок в новых ситуациях.
«Сейчас свой ИИ обыгрывает среднестатистического человека на 880 процентов в простейших компьютерных играх. А при решении побольше сложных задач в трехмерном лабиринте он показывает 10-кратное развитие скорости самообучения и среднее 87-процентное превосходство надо человеком, демонстрируя в некоторые моменты времени поистине сверхчеловеческие возможности».
В скором времени разработчики планируют адаптировать UNREAL к действиям в побольше сложной окружающей среде, нежели компьютерные игры и трехмерные лабиринты, почему позволит использовать быстрообучаемые системы искусственного интеллекта в реальном мире для того решения множества задач. Ознакомиться с работой алгоритма позволяется с помощью видео, доступного ниже.