Почему 500 миллионов человек в Китае разговаривают с этим ИИ
Кoгдa Гaнг Сюй, 46-лeтний житeль Пeкинa, дoлжeн связaться сo свoим кaнaдским aрeндaтoрoм oб aрeндныx плaтeжax или счeтax зa элeктрoэнeргию, oн oткрывaeт прилoжeниe пoд нaзвaниeм iFlytek Input в свoём смaртфoнe и нажимает ударение, похожий на микрофон, а затем начинает говорить. Программное обеспечение превращает его китайские фр в текстовые сообщения на английском языке и отправляет их канадскому арендатору. Оно в свой черед переводит английские текстовые сообщения арендатора на китайские, позволяя прозрачное общение.
В Китае побольше 500 миллионов человек используют iFlytek Input для преодоления препятствий в общении. Есть такие используют его для отправки текстовых сообщений с помощью голосовых команд во время вождения или на общения с носителем другого китайского диалекта. Приложение было разработано iFlytek, китайской ИИ компанией, которая применяет глубокое обучение в таких областях, равно распознавание речи, обработка на естественном языке, машинный перевод и интеллектуальный разбирание данных (см. «50 Smartest Companies 2017»).
Судебные системы используют их технологию распознавания голоса, дай вам расшифровать длительные судебные разбирательства; бизнес-центры обработки вызовов используют технологию синтеза голоса для того генерации автоматизированных ответов; и Didi, популярное китайское приложение для перевозчиков, вдобавок использует технологию iFlytek для передачи заказов водителям.
Но, хотя часть впечатляющие успехи в распознавании голоса и мгновенном переводе позволили Сюй говорить со своим канадским арендатором, соображение языка и перевод остаются для машин невероятно сложной задачей (см. «AI’s Language Problem»).
Сюй вспоминает концы с концами не сходятся, когда он пытался спросить своего арендатора, когда он придёт с работы, с тем подписать продление аренды. Но текстовое сообщение, отправленное приложением, было «Когда вы идёте в работу сегодня?» Оглядываясь назад, он полагает, что, вероятно, из-из-за формулировки его вопроса: до какого времени вы будете работать нынче? «Иногда, в зависимости от контекста, я не могу передать смысл, – говорит Сюй, которому приложение всё до сего времени нужно для общения.
История Сюй подчёркивает, почему так важно, дай тебе такая компания, как iFlytek, собирала как можно больше данных из реальных взаимодействий. Бесплатное приложение собирает сии данные с момента его запуска в 2010 году.
Платформа разработчика iFlytek, называемая iFlytek Open Platform, предоставляет голосовые ИИ технологии сильнее чем 400 000 разработчиков в различных отраслях, таких как интеллектуальный прирученный и мобильный Интернет. Компания оценивается в 80 млрд. юаней ($12 млрд.) и имеет международные амбиции, в томик числе дочернее предприятие в США, и планы по расширению на другие языки. Промежду тем компания меняет то, как многие отрасли, такие как вождение, здравоохранение и образование, взаимодействуют со своими пользователями в Китае.
В августе iFlytek запустил голосовой сподручный для водителей под названием Xiaofeiyu (летучая рыбка). Для обеспечения безопасного вождения у него ни духу экрана и никаких кнопок. После подключения к Интернету и смартфону водителя он может ставить на квартиру вызовы, играть музыку, искать маршруты и рестораны через голосовые команды. В награда от голосовых ассистентов, предназначенных для дома, Xiaofeiyu был разработан, дабы распознавать голоса в шумной обстановке.
Мин Чу, вице-президент AISpeech, единаче одной китайской компании, работающей над голосовыми технологиями взаимодействия человека и компьютера, говорит, чисто голосовые помощники для водителей в некотором смысле более перспективны, чем умные динамики и виртуальные помощники, встроенные в смартфоны. Рано или поздно глаза и руки водителя заняты, имеет смысл полагаться на голосовые команды. Сверх того того, как только водители привыкнут к тому, чтобы делать что-в таком случае, используя свой голос, помощник может также стать поставщиком контента, рекомендуя варианты развлечений вместо пассивного выполнения запросов. Таким образом, закругляйтесь развиваться новая бизнес-модель.
Хотя искусственный интеллект имеет потенциал на снижения издержек и улучшения результатов лечения пациентов в сфере здравоохранения, многие больницы с тяжелым сердцем идут на решительные шаги, опасаясь разрушить загруженную систему, в которой (раз-два врачей и много пациентов.
В Провинциальной больнице Аньхой, которая проводит испытание ИИ, голосовые технологии трансформируют многие аспекты обслуживания. Чирик речевых помощников в форме девушки-робота используют технологию iFlytek, чтобы приветствовать посетителей в прогулочный зал амбулаторного отделения и предлагать помощь для перегруженных регистраторов. Пациенты могут отметить голосовому помощнику, каковы их симптомы, а затем выяснить, какой отдел может помочь.
Основываясь сверху данных, собранных больницей с июня, помощник направил пациентов в правильное отделение в 84% случаев.
Врачи в больнице вдобавок используют iFlytek, чтобы диктовать жизненные показатели пациента, принимаемые лекарства и иную информацию в мобильное приложение, которое там превращает их в записи. Приложение использует технологию голосовой печати как систему подписи, которая безлюдный (=малолюдный) может быть сфальсифицирована. Приложение собирает данные, которые со временем улучшат его алгоритмы.
Я признать себя виновным не могу голосовые методы ИИ становятся более полезными в разных сценариях, остаётся одна фундаментальная проблема: аппаратура не понимают ответы, которые они генерируют, говорит Сяоюн Ван, гелертер Пекинского университета, который занимается исследованиями в сфере обработки на естественном языке. ИИ отвечает сверху голосовые запросы, ища соответствующий ответ в огромном количестве данных, но дьявол не имеет реального понимания того, что он говорит.
Другими словами, методика обработки на естественном языке, которая управляет современными голосовыми помощниками, основана нате наборе жёстких правил, в результате чего возникает недоразумение, которое произошло c Сюй.
Изменение способа обработки языка машиной поможет компаниям создавать голосовые ИИ устройства, которые станут неотъемлемой в известной мере нашей повседневной жизни.
«Тот, кто сделает прорыв в обработке на естественном языке, достаточно иметь преимущество на рынке», – говорит Чу.