Yandex Cloud научила ИИ расставлять знаки препинания

Сервис для синтеза и распознавания речи на базе машинного обучения от Yandex Cloud обновился. Теперь Yandex SpeechKit при переводе голоса в текст автоматически расставляет необходимые знаки препинания.

Это улучшит опыт пользователей в сценариях, где с речевыми технологиями напрямую взаимодействует человек. Например, общение с голосовым помощником, автоматическое транскрибирование или формирование субтитров. Распознанный нейросетью текст максимально приближен к литературному и проще воспринимается читателем.

Казахстанским компаниям также доступен сервис Yandex SpeechKit, который можно использовать для автоматического транскрибирования, разработки голосовых помощников и др.

Новая функция Yandex SpeechKit называется "Пунктуатор" и работает как при распознавании в реальном времени для сценариев с голосовыми помощниками, так и при распознавании предзаписанных аудиофайлов.

Пунктуатор разработан с помощью двух последовательно работающих моделей машинного обучения. Первая — переводит голос в текст, вторая — расставляет знаки препинания в соответствии с нормами русского языка. Сейчас модель расставляет все основные знаки пунктуации русского языка. "Пунктуатор" доступен для всех пользователей Yandex SpeechKit и настраивается стандартными средствами в API.

Ранее мы рассказывали, что "Яндекс" опубликовал исходный код системы управления базами данных YDB.