Новые процессоры ARM готовы к приложениям ИИ
Бритaнскaя кoрпoрaция ARM усoвeршeнствoвaлa гeтeрoгeнную вычислитeльную aрxитeктуру ARM big.LITTLE, нa кoтoрoй oснoвaны всe вeдущиe микрoпрoцeссoры ARM нaчинaя с Cortex-A7 (2011 гoд) — и вчeрa прeдстaвилa нoвую гeтeрoгeнную aрxитeктуру DynamIQ big.LITTLE. Нa микрoсxeмax выделено (место)положение для специальных аппаратных ускорителей приложений машинного обучения. Возможно, в будущем аппаратная помочь нейросетей станет новым трендом среди разработчиков микропроцессоров и неотъемлемым качеством новых смартфонов.
Исключение архитектуры ARM big.LITTLE состоит в наличии процессорных ядер двух типов: относительно медленных, энергоэффективных (LITTLE) и условно мощных и прожорливых (big). Обычно система активирует только один из двух типов ядер: токмо большие или только маленькие. Понятно, что фоновые задачи на смартфоне или другом устройстве уместно решать с маленькими ядрами, которые потребляют очень мало энергии. В случае необходимости вычислитель активирует мощные прожорливые ядра, которые в многопоточном режиме, работая сообща, демонстрируют особенно высокую выработка. Ant. неэффективность. В принципе, у всех ядер есть доступ к общей памяти, так что задачи дозволено ставить для выполнения на обоих типах ядер одновременно. То снедать большие и маленькие будут переключаться на лету.
Подобная гетерогенная архитектура и переход задач на лету с одного типа ядер на другой задуманы угоду кому) создания динамического изменения мощности и энергопотребления процессора. Сама ARM заявляла, что в некоторых задачах та зодчество экономит до 75% энергии.
DynamIQ big.LITTLE — это эволюционный шаг вперёд. Новая застывшая музыка позволяет задействовать разнообразные сочетания больших и малых ядер, которые раньше безвыгодный были возможны. Например, 1+3, 2+4 или 1+7, или даже 2+4+2 (ядра трёх разных мощностей). Характерный смартфон будущего может иметь восьмиядерную систему на кристалле с двумя мощными ядрами, четырьмя средними и двумя низкопроизводительными ядрами про фонового режима.
С аппаратной поддержкой машинного обучения и ИИ разработчикам станут доступны новые специальные процессорные инструкции (вот хоть, вычисления с ограниченной точностью). ARM обещает, что в следующие три-пять лет процессоры Cortex-A для новой архитектуре обеспечат до 50-кратной прибавки производительности в приложениях ИИ, в сравнении с нынешними системами в базе Cortex-A73 и ещё дополнительную прибавку за счёт встроенных ускорителей для микросхеме. Специальный порт доступа с низкой задержкой между ЦП и акселераторами имеет 10-кратную коэффициент полезного действия.
Это означает, что на смартфонах будут гораздо лучше работать обученные нейросети, в волюм числе которые обсчитывают графику и видео, приложения компьютерного зрения и другие системы, которые обрабатывают взрослые потоки данных.
В каждом кластере может располагаться до восьми ядер разных характеристик. Сие тоже можно использовать для ускорения приложений ИИ, по сравнению с нынешними системами. К тому но, переработанная подсистема памяти обеспечит более быстрый доступ к данным и улучшит энергоэффективность. К лицу, в кластеры ядер необязательно вообще включать ядра LITTLE со слабой производительностью, которые обычно используются в мобильных устройствах про сбережения заряда аккумулятора. Если вам нужна очень высокая производительность необусловленно от энергопотребления — никто не мешает делать кластеры из восьми больших ядер, и объединять их в больше всего мощные компьютерные системы. ARM считает, что это позволит расширить сферу применения процессоров ARM вслед за пределы смартфонов.
Кластеры DynamIQ практически неограниченного масштаба с общей памятью — сие предложение создавать мощнейшие вычислительные системы самого разного назначения.
Дополнительную жесткость в динамической подстройке мощности/энергопотребления даст функция индивидуального изменения тактовой частоты отдельных процессоров в кластере из множества процессоров ARM. Разработчики из Кембриджа считают, яко это особенно важно в шлемах виртуальной реальности, которые длительные периоды времени находятся в состоянии низкого энергопотребления. Переходы процессора в одно из трёх энергетических состояний (ON, OFF, SLEEP) осуществляются несравнимо быстрее, автоматически на аппаратном уровне.
В конце концов, продвинутая архитектура DynamIQ позволяет строить паче надёжные системы с дублированием функций, что повышает уровень безопасности в автономных системах, которым нужно отзываться на сбои. Например, это системы компьютерного зрения в беспилотных автомобилях — Advanced Driver Assistance Systems (ADAS). В некоторых случаях один кластер ядер выходит из строя или ускоритель сбоит — супротивный кластер автоматически берёт его функции на себя.
Процессорную архитектуру ARM применяют числом лицензии в своих чипах многие производители, в том числе Samsung, Qualcomm, Nvidia, Intel и Apple (iPhone, iPad). Посередине 2013 и 2017 годами в мире было продано более 50 млрд микрочипов бери архитектуре ARM, и английские разработчики надеются, что в ближайшие четыре года это пять удвоится до более 100 млрд.
Большинство устройств на процессорах ARM безвыгодный нуждаются в активном охлаждении. Компания уверена, что с увеличением мощности этих систем и переходе получи и распишись архитектуру DynamIQ всё останется по-прежнему.