Искусственный интеллект Google DeepMind получил «ускоритель» процесса обучения и познавания
Спeциaлисты пoдрaздeлeния DeepMind кoмпaнии Google рaзрaбoтaли и испытaли рaбoту свoeгo рoдa ускoритeля прoцeссa сaмooбучeния и пoзнaвaния исполнение) разрабатываемых ими систем искусственного интеллекта. Этот катализатор получил название агент UNREAL (Unsupervised Reinforcement and Auxiliary Learning) и его страдная) пора уже была проверена на 57 простейших играх интересах компьютера Atari и среде трехмерного лабиринта Labyrinth, которая насчитывает 13 уровней.
Лиэм Танг (Liam Tung), рассказывая об агенте UNREAL, указал, точно в основу его работы были заложены те а самые принципы познавания и самообучения, которые в свое время позволили искусственному интеллекту завоевать победу над Ли Сеголем, мировым чемпионом соответственно древней китайской игре Го. А создавался этот агент с целью ускорения жатва алгоритмов искусственного интеллекта и нейронных сетей, разрабатываемых сотрудниками подразделения DeepMind.
«Наши самообучаемые системы поуже добились значительных успехов в игре Го и в играх к старых компьютеров» — пишут исследователи в официальном блоге DeepMind, — «Все, на их подготовку, первоначальное обучение и последующее самообучение тратится больно много времени».
Прорыв в скорости самообучения и познавания был достигнут следовать счет внедрения в алгоритм двух новых ключевых моментов, двух процессов. Первым моментом является изучение того, что те или иные действия затрагивают отображаемое держи экране компьютера изображение, которое является единственным типом данных, подаваемых получай вход систем искусственного интеллекта. «Раньше в процессе обучения наши системы учились прогнозировать, к чему может привести в таком случае или иное действие. Теперь же система хорош достоверно знать это с достаточной точностью. Этот с иголочки процесс весьма напоминает то, как ребенок учится находиться во главе своими руками, двигая ими и наблюдая за результатом».
Вторым моментом, ускоряющим разработка обучения, является возможность повторного анализа уже произошедших ситуаций, в ходе которых системой был приобретен оный или иной опыт. «Это походит на так, как человек иногда прокручивает у себя в голове часть из моментов компьютерных игр, в которых ему посчастливилось добиться успеха или совершить желаемое действие. При этом массы склонен вспоминать и те моменты, когда им был получен меньший результат и отрицательный опыт».
«Сейчас наш агент обыгрывает среднестатистического человека для 880 процентов в простейших компьютерных играх. А при решении паче сложных задач в трехмерном лабиринте, он показывает 10-кратное рост скорости самообучения и среднее 87-процентное превосходство надо человеком, демонстрируя в некоторые моменты времени поистине сверхчеловеческие возможности».
В ближайшем времени специалисты DeepMind планируют адаптировать агента UNREAL к действиям в побольше сложной окружающей среде, нежели простейшие компьютерные игры и трехмерные лабиринты. А сие, в свою очередь, позволит использовать быстрообучаемые системы искусственного интеллекта в реальном мире про решения реальных задач.