В Казахстане разработана крупнейшая модель ИИ для распознавания тюркских языков
Казахстанский стартап Cybernet AI представил крупнейшую модель автоматического распознавания речи (ASR) для тюркских языков. Это первая разработка такого масштаба, созданная в Центральной Азии, и первый пример полноценной ИИ-модели, изначально спроектированной под специфику тюркской языковой группы, а не адаптированной из англоязычных решений.
Проект реализован при стратегической поддержке Astana Hub, Министерства искусственного интеллекта и цифрового развития РК на GPU-инфраструктуре Microsoft*.
Модель создана на базе казахского, турецкого, узбекского, кыргызского, азербайджанского и татарского языков, а также корректно распознаёт смешанную тюркско-русскую речь – формат, широко распространённый в реальных диалогах клиентов с бизнесом и при получении государственных услуг.
До настоящего времени Казахстан, как и другие страны региона Центральной Азии, были вынуждены использовать международные ASR-модели, ориентированные прежде всего на английский язык. Такие решения слабо учитывают тюркскую фонетику, акценты и смешанную речь, что ограничивало качество голосовых AI-сервисов.
Cybernet AI пошёл по другому пути: компания создала собственную модель внутри региона и для региона, заложив в неё лингвистические особенности современных тюркских языков.
Новая ASR-модель ориентирована на бизнес, который работает с большими объёмами голосовых коммуникаций: банки и финансовые организации, телеком-операторы, контакт-центры различного уровня, логистические и сервисные компании, государственные структуры, оказывающие услуги населению.
Разработчики модели считают, что она поможет снизить расходы в каналах поддержки клиентов, обеспечив круглосуточную доступность клиентского сервиса в наиболее востребованном голосовом формате.
Модель устойчива к шумам, акцентам и переключению языков в одном предложении и демонстрирует одинаково высокую точность в различных сферах применения — от финтеха до госуслуг.