Eсли вaм дoвoдилoсь испoльзoвaть прилoжeниe Snapchat, вы знaeтe, кaк прoстo прeврaтить вo чтo-нибудь курьeзнoe свoю фoтoгрaфию или фoтoгрaфию другoгo чeлoвeкa. Бог знает что подобное, только с совершенно иной целью, создала группа исследователей из Имперского колледжа в Лондоне (Imperial College London, ICL). Сии исследователи создали самую точную на сегодняшний день цифровую модель «среднего» человеческого лица, которая может браться использована для создания трехмерных моделей человеческих лиц на компьютере, создания персонифицированных персонажей в компьютерных играх, исполнение) систем безопасности, технологий распознавания лиц и т.п.
Когда компьютер обрабатывает изображение человеческого лица, возлюбленный в большинстве случаев использует метод трехмерной морфологической модели (3D morphable model, 3DMM). В качестве опорной точки в этом методе используется что-то вроде модели среднестатистического человеческого лица, а модель реального лица представляет собой мебель параметров, характеризующих величину отклонения ключевых точек на реальном лице с ключевых точек «среднего» лица. Помимо отклонений, в описание реального лица может жить(-быть включена дополнительная информация о возрасте, половой принадлежности и других признаков, но все воссоздание лица обычно умещается всего в пару-тройку сотен числовых значений.
Пользу кого того, чтобы метод 3DMM работал должным образом, ему в качестве опорной точки нужна универсальная средняя схема человеческого лица, подходящая для работы с лицами людей различных национальностей, пола и возрастов. Спор создания такой модели является кропотливым занятием, для этого необходимо взять снимки множества людей и тщательно промаркировать получай них все ключевые точки. Самые лучшие средние модели основаны для данных, полученных со снимков максимум двух сотен людей, преимущественно взрослых, словно снижает уровень их универсальности.
Исследователи из Имперского колледжа в Лондоне разработали отсадка полной автоматизации процесса составления 3DMM-моделей, что позволяет включить в них причина, полученные от достаточно большого количества людей. Созданный алгоритм автоматически может ставить метку все ключевые точки, такие, как кончик носа, мочки ушей и т.п. Во-вторых, алгоритм автоматически выстраивает снимки лица одного человека согласно их пространственной ориентации и составляет нате их базе трехмерную модель. И, в-третьих, алгоритм способен самостоятельно детектировать сделанные им но ошибки и удалить их из конечных результатов.
Созданному исследователями алгоритму был «скормлен» безмерный объем данных изображений лиц людей различного возраста, национальности и пола, полученных из разных источников, в часть числе с камер наблюдения, установленных в Лондонском музее науки и техники. В результате обработки сих данных была составлена новая модель среднего человеческого лица (large scale facial model, LSFM), которая, в качестве кого оказалось позже, является практически идеальной моделью.
Используя данные новой LSFM-модели, исследователи получи основе фотоснимков сгенерировали модели лиц детей разного возраста. И в данном случае все лица детей были похожи именно нате детские лица, в отличие от лиц, построенных по более примитивным 3DMM-моделям, которые пре всего напоминают взрослых людей, остановившихся на детском уровне развития. Больше того, программное обеспечение, использующее новую LSFM-модель, смогло более верно установить возраст, пол и даже национальную принадлежность человека по его фотоснимку.
Помимо всего вышеперечисленного, новая LSFM-модель была использована для генерации 100 тысяч изображений, использованных пользу кого обучения системы искусственного интеллекта на базе нейронной сети. После такого обучения нейронная яруча стала способна преобразовывать случайные двухмерные снимки лиц людей в достаточно точные трехмерные модели. В среднем же этот метод может быть использован для того, что бы посмотреть, (как) будто будет выглядеть тот или иной человек через 20 лет или что он выглядел лет 20 назад.
Следующим шагом, которые намерены натворить исследователи, станет введение во все новые алгоритмы понятия выражения лица. Сие позволит составлять еще более точные LSFM и 3DMM-модели и проводить распознавание по мнению снимкам, на которых человек улыбается, плачет, испытывает другие эмоции или общедоступно гримасничает.