Голосовые технологии — ценный бизнес-инструмент

Голосовые технологии — ценный бизнес-инструмент

Когда мы впервые познакомились с голосовыми помощниками, такими как Siri в 2011 году, никто не ожидал, что они станут движущей силой для технологических инноваций. Сейчас подсчитано, что каждый четвертый американец владеет «умным» динамиком (Amazon Echo, Google Home), в то время как eMarketer прогнозировал, что к концу 2020 года около 100 миллионов пользователей смартфонов будут использовать голосовых помощников.

Но поскольку крупные бренды, такие как Google и Amazon, продолжают подпитывать эту тенденцию и конкурировать за долю на рынке, технология голосовых интерфейсов развивается очень быстрыми темпами. От банковского дела до здравоохранения — компании стремятся создать свои собственные голосовые технологии, чтобы не отставать от потребительского спроса.

Несмотря на то, что люди обращаются к голосовым технологиям, чтобы облегчить себе жизнь, они также являются ценным бизнес-инструментом, который может помочь сохранить конкурентоспособность и актуальность брендов на много лет вперед.

Ставка на голос

Ключевым фактором перехода к голосовой связи является спрос пользователей. Потребители демонстрируют высокий уровень комфорта и общей осведомленности, поскольку мы живем в постоянно развивающемся цифровом мире, где удобство, эффективность и скорость ежедневно улучшаются.

Еще один фактор — искусственный интеллект, внедренный в нашу повседневную жизнь. Количество устройств интернета вещей, таких как интеллектуальные приборы, термостаты и динамики, растет в геометрической прогрессии, что дает голосовым помощникам больше полезности в нашей повседневной жизни.

Интеллектуальные колонки могут быть средством номер один для использования голоса, но отраслевые эксперты прогнозируют, что почти все приложения будут использовать голосовые технологии в ближайшие пять лет.

На выставке CES 2020 Amazon заявила, что сегодня в мире существуют сотни миллионов устройств с поддержкой голоса. И в основе этого прорыва лежит инновационная голосовая аналитика и вычисления.

Как работает технология распознавания речи

Смарт-устройство слушает команду и отвечает нам — это похоже на имитацию взаимодействия человека с человеком. Но процесс совсем не похож на человеческий. Устройства голосового помощника работают на основе обработки естественного языка (NLP) с глубоким обучением — технологии, которая помогает компьютерам понимать, как люди общаются.

Устройства голосового управления выполняют следующие шаги для обработки и анализа больших объемов данных на естественном языке:

1. Пользователь разговаривает с устройством голосового помощника с помощью пробуждающего слова;

2. Устройство получает ответ в виде звука и преобразует его в текст, используя технологию преобразования речи в текст;

3. Устройство обрабатывает данные с помощью технологии NLP;

4. Устройство преобразует обработанные текстовые данные в аудио, используя технологию преобразования текста в речь;

5. Устройство воспроизводит аудиоданные для пользователя.

Может показаться, что эту технологию легко реализовать, но все совсем не так. Человеческий язык очень сложен для понимания ИИ. Таким образом, конвейер NLP должен помогать ИИ распознавать намерения фраз, которые они обнаруживают посредством морфологического, синтаксического, семантического и прагматического анализа человеческого языка.

Как речевые ассистенты помогают в бизнесе

Развитие искусственного интеллекта и речи позволяет виртуальным помощникам работать. Хотя эта разработка находится на начальном этапе, цифровые помощники обещают повысить производительность труда и совместную работу. Основное применение распознавания речи в офисе, по крайней мере на первых порах, будет вращаться вокруг повышения производительности труда сотрудников и автоматизации рабочих процессов.

Для бизнеса существует четыре основных способа применения речевых технологий:

·   Преобразование речи в текст можно использовать для таких целей, как диктовка электронной почты, и оно становится тем точнее, чем больше оно используется;

·   Преобразование текста в речь имеет преимущества в мобильных настройках, например, возможность создавать личные подкасты для просмотра рабочих документов или заметок во время поездки на работу;

·   Распознавание речи также позволяет разговаривать через виртуальных помощников, выдавая такие команды, как поиск документов или создание записей календаря;

·   И, наконец, речевая аналитика позволяет проводить «анализ настроений» на предприятии, что может быть полезно при собеседовании или обучении.

Совсем недавно Amazon представил Alexa for Business. Это не единственная компания, которая нацелена на виртуальных помощников, разработанных специально для бизнеса: Cisco Spark Assistant , Microsoft Cortana , Voicera Eva, Nuance Dragon и IBM Watson Assistant теперь также используются в бизнесе.

Сможет ли «Алиса» заговорить на казахском языке

Казахстанские ученые из Назарбаев Университета недавно собрали огромную базу аудиоданных на казахском языке, чтобы сделать возможным автоматическое распознавание казахского языка. На основе получившейся базы ученые обучили искусственный интеллект распознаванию языка, смысловым связкам, особенностям произношения и разным значениям слов. Протестировать технологию можно здесь.

Как утверждают казахстанские ученые, система по распознаванию казахской речи может быть интересна разработчикам виртуальных помощников, таких как Siri, Alexa, «Алиса» и Cortana.  Она позволит понимать команды на казахском в различных технологиях умного дома и в автомобилях. Но области применения технологии почти бесконечны, поэтому ученые NU решили бесплатно поделиться своей разработкой со всеми, кто пожелает внедрять казахскую речь в своих приложениях. Доступ уже получили KaspiBank, Beeline, BTS Digital, Yandex, система распознавания речи Silero Speech, а также несколько университетов, включая частный гуманитарный Суортмор-колледж в США, Казахстанско-Британский технический университет, Алматинский университет энергетики и связи, Технический университет имени Сатпаева в Алматы.

Кстати, еще в 2018 году Yandex уже сообщал о планах научить «Алису» казахскому, но компания пока не представила обновление своего голосового помощника. Возможно, работа ученых NU ускорит этот процесс.

Достижения в области голосовых технологий помогают цифровым голосовым помощникам стать более полезными. Голосовая связь теперь не только зарекомендовала себя как лучший мобильный опыт, но и благодаря этому появилась масса возможностей для более глубокого взаимодействия с клиентами. Вопрос только в том, готовы ли бренды воспользоваться этой возможностью и получить конкурентное преимущество.

Подписывайтесь на наш Telegram-канал и читайте новости первыми!