Как научить искусственный интеллект делать всё в цифровой вселенной?
Мнoгиe из нaс пoмнят и знaют, кaкими бывaют дeтскиe сaды. Кoмнaты чтобы oбучeния нaпичкaны игрушкaми и пaзлaми, музыкoй и книгaми, цвeтaми и дaжe инoгдa кoтaми, являя тaким oбрaзoм бoгaтый и толстотелый мир, с кoтoрым дeти мoгут игрaть и учиться игрaя. Нo вoпрeки рaсxoжeму мнeнию, игрa дeтeй в отдалении не проста. Они не просто веселятся — они обучаются, приобретают осмысление мира. За счет игры в разнообразной и восхитительной вселенной я лелеем многогогранный интеллект ребенка.
Почему бы маловыгодный учить ИИ таким же образом?
Не (до давно некоммерческий институт OpenAI открыл виртуальный круг для ИИ, чтобы он его исследовал и играл с ним. Функци проекта Universe (Вселенная) такая же большая, (как) будто и его название: научить отдельный ИИ выполнять любую задачу, которую смертный может выполнить при помощи компьютера.
Обучая отдельных агентов ИИ преуспевать в различных задачах реального решетка, OpenAI надеется привести нас на шаг ближе к ровно по-настоящему разумным ботам — которые обладают гибкими навыками рассуждения вроде тех, которые имеем мы.
Интеллект общего уровня
На гумне — ни снопа никаких сомнений в том, что ИИ становится пугающе умным.
В (настоящий компьютеры могут точно видеть, слышать и переводить языки, иногда хотя (бы) опережая людей. Только в начале этого года, в серии громких игр в го, AlphaGo через DeepMind разгромил 18-кратного чемпиона мира Ли Седоля, для десять лет раньше, чем ожидали некоторые эксперты.
Же правда в том, что ИИ хороши ровно в такой мере, насколько их научили. Попросите AlphaGo сыграть в шахматишки, и программа вероятнее всего по-машинному растеряется, аж если вы объясните ей правила в мельчайших подробностях.
В (то что наши системы ИИ — сверхэффективные лошадки в целях одного трюка. Виновен в этом отчасти метод обучения: исследователи начинают с чистого листа ИИ, проводя его по вине миллионы испытаний, пока он не преуспеет в одной задаче и никак не решит ее. ИИ никогда не испытывает яко-то еще, так как он узнает, вроде решить любую другую проблему?
Чтобы добраться задолго. Ant. с интеллекта общего уровня — способного на человеческом уровне использовать вырученный опыт для решения новых проблем — ИИ нужно откладывать свой опыт в решение других задач. И вот в этом им поможет Universe. Испытывая мироздание, полный различных сценариев, ученые OpenAI надеются, будто ИИ получит знание о мире и гибкие навыки решения проблем, которые позволят ему «думать», а далеко не застревать навечно в единственной петле.
Дивный новый мир
За своей сути, Universe это мощная платформа, которая включает тысячи сред, обычно обеспечивающих стандартные методы исполнение) обучения агентов ИИ. Будучи программной платформой, Universe обеспечивает площадку ради запуска чужого программного обеспечения, чтобы программы обучались в разных средах — Atari и флеш-игры, приложения и веб-сайты, на выдержку, уже приняты.
Впереди будут и другие.
В теории Universe может лукнуть любое программное обеспечение под любой компьютер, позволяя ученым вставлять и обучать домашние ИИ по желанию. Это как отправить ребенка в холодный лагерь: выбираешь свою нишу, тип деятельности, ждешь, того) (времени он ее освоит, затем другую и так после того, искупаться и повторить.
В Universe ИИ взаимодействует с виртуальным артельно так, как люди используют компьютер: он «видит» пиксели сверху экране и использует виртуальную клавиатуру и мышь, чтобы вводить команды.
Сие стало возможным благодаря Virtual Network Computing (VNC), соответственно сути, систему совместного использования рабочего стола, которая позволяет вручать движения клавиатуры и мыши с одного компьютера (ИИ) другому (среда обучения). При изменении окружающей среды, VNC отправляет обновленные скриншоты обратно ИИ, а позволяет ему выполнять следующий шаг. VNC выступает (как) будто глаза и руки ИИ.
Как происходит обучение?
Все ИИ, фигли подключены к Universe, обучаются при помощи так называемого обучения с подкреплением, мощного метода, тот или другой привел к успеху AlphaGo. Под этим термином скрывается, впрочем, так, как мы, люди, тренируем дельфинов, собак и ажно детей. Это обучение методом проб и ошибок: выберите маневр, и если вас за него вознаградили, продолжайте в волюм же духе. Если нет, попробуйте что-нибудь еще.
Вместо того в надежде начинать с совершенно пустого ИИ, исследователи иногда дают им импульс, позволяя им «смотреть», по образу люди решают задачу. Это позволяет ИИ сформировать суп впечатление и иметь более полное представление о том, что оптимизировать свои решения.
Обучение с подкреплением уже используется во многих приложениях ИИ. Внутри Universe, впрочем, Силаша этой технологии раскрывается на полную. Поскольку ИИ может перекидываться между играми и приложениями, он может взять изученное в одном приложении и без проблем использовать его, чтобы разобраться в другом — это назвали «трансферное обучение» или «обучение с переносом». Таковой навык непросто освоить, но он необходимо в дороге к разумным машинам.
По данным OpenAI, наш брат медленно туда движемся: некоторые из их агентов еще показывают признаки переноса обучения от одной игры с вождением в другую.
С игр к миру битов
Как и многие другие разработчики ИИ, OpenAI использует игры, дабы подтолкнуть Universe, не просто так: их несложно оценить с позиции успеха. Поскольку игры измеряются различными статистиками и оценками, прием может запросто использовать эти цифры, чтобы поставить прогресс ИИ и вознаградить его соответствующим образом. Сие крайне важно для обучения с подкреплением.
Поскольку Universe приличествует на пиксели и клавиатуры, люди тоже могут играть в игры получай платформе. Эти сеансы записываются и обеспечивают базовый ординар для оценки выступлений ИИ (неплохая работенка, согласитесь).
Однако игры — это лишь малая часть нашего взаимодействия с цифровым коллективно, и Universe уже выходит за свои ограничения с проектом Mini World of Bits («Мини-мiровая битов»). Биты — это собрание различных взаимодействий с браузерами, с которыми автор этих строк сталкиваемся, бороздя пучины Интернета: когда вводим документ или выбирает опции из выпадающих меню, нажимая «отправить».
Сии задачи, хоть и простые, формируют фундамент того, во вкусе мы подключаемся к сокровищнице под названием Сеть. OpenAI хочет, дай тебе ИИ свободно перемещался по Интернету — например, был в состоянии заказать билет на самолет. В одной из сред Universe исследователи ранее дают ИИ желаемое расписание букинга и учат его искать рейсы получи и распишись различных авиалиниях.
И это только начало.
Universe не более чем растет и ширится. Платформа Malmo от Microsoft, которая использует Minecraft во (избежание обучения ИИ, должна интегрироваться с Universe. Популярная игра со складыванием векша fold.it, приложения для Android, игры на HTML5 и многое другое стоят в очереди.
Призрак в машине
Итак, в данное время мы можем учить ИИ играть в различные игры и просматривать веб. Великое обязанности, подумаешь. Приведет ли это нас к интеллекту общего уровня?
Возможно, и перепутье будет долгой.
Но ИИ, который знает, во вкусе выиграть в любую игру, которую вы ему подбросите, умеет исключительно думать логически и в несколько шагов добиваться победы. ИИ, что может передвигаться по хаотическому миру GTA V, уже принуждён понимать основы физики реального мира, жестокости и ответных мер. ИИ, какой может работать в Интернете, уже знает, как аппарат обычно общаются друг с другом и может использовать сии знания, чтобы получить информацию, создать свою собственную веб-идентичность или инда заглянуть в вашу.
Каждый день мы учимся, играем, работаем и растем в цифровом царстве. Чтобы многих мир нулей и единичек так же реален, по образу и тот, в котором мы родились. Теперь, когда ИИ имеет подступ к этому цифровому миру, пришла его очередь подниматься. Давайте посмотрим, как далеко он сможет зайти.