В Казахстане разработана крупнейшая модель ИИ для распознавания тюркских языков


Казахстанский стартап Cybernet AI представил крупнейшую модель автоматического распознавания речи (ASR) для тюркских языков. Это первая разработка такого масштаба, созданная в Центральной Азии, и первый пример полноценной ИИ-модели, изначально спроектированной под специфику тюркской языковой группы, а не адаптированной из англоязычных решений. 

Проект реализован при стратегической поддержке Astana Hub, Министерства искусственного интеллекта и цифрового развития РК на GPU-инфраструктуре Microsoft*. 

«Разработка Cybernet AI открывает для стран тюркской языковой группы возможность масштабировать цифровые сервисы и клиентское обслуживание на родных языках с применением искусственного интеллекта без потери качества и по доступной стоимости. Для Казахстана это означает переход от роли потребителя глобальных ИИ-решений к роли разработчика собственных технологий, конкурентоспособных на международном уровне», – прокомментировал Танат Ускембаев, управляющий директор Astana Hub. 

Модель создана на базе казахского, турецкого, узбекского, кыргызского, азербайджанского и татарского языков, а также корректно распознаёт смешанную тюркско-русскую речь – формат, широко распространённый в реальных диалогах клиентов с бизнесом и при получении государственных услуг.

До настоящего времени Казахстан, как и другие страны региона Центральной Азии, были вынуждены использовать международные ASR-модели, ориентированные прежде всего на английский язык. Такие решения слабо учитывают тюркскую фонетику, акценты и смешанную речь, что ограничивало качество голосовых AI-сервисов.

Cybernet AI пошёл по другому пути: компания создала собственную модель внутри региона и для региона, заложив в неё лингвистические особенности современных тюркских языков.  

«Мы сознательно отказались от адаптации англоязычных моделей и создали ASR-модель, которая изначально понимает живые, смешанные формы разговорного языка. Это делает разработку не просто очередным технологическим продуктом, а вкладом в формирование локальной экосистемы искусственного интеллекта и технологического суверенитета Казахстана», – отметил Рашид Исмаилов, CTO компании Cybernet AI.

Новая ASR-модель ориентирована на бизнес, который работает с большими объёмами голосовых коммуникаций: банки и финансовые организации, телеком-операторы, контакт-центры различного уровня, логистические и сервисные компании, государственные структуры, оказывающие услуги населению.  

Разработчики модели считают, что она поможет снизить расходы в каналах поддержки клиентов, обеспечив круглосуточную доступность клиентского сервиса в наиболее востребованном голосовом формате.  

Модель устойчива к шумам, акцентам и переключению языков в одном предложении и демонстрирует одинаково высокую точность в различных сферах применения — от финтеха до госуслуг.