ASPEX запускает модель распознавания речи для рынка Казахстана


Компания ASPEX, резидент Astana Hub, представляет уникальную языковую ИИ модель “TilTap” по распознаванию русско-казахской речи с функциями диартизации (разделение на спикеров) и анализа эмоций по трём основным векторам. Эта разработка создана для решения ключевых бизнес-задач и повышения качества коммуникации с клиентами. Она открывает новые возможности для компаний в Казахстане, предлагая точность, безопасность и адаптацию к локальным языковым особенностям речи. 

В компании отмечают, что в казахском языке слово «тап» происходит от глагола «табу», что переводится как «находить» или «обнаруживать». Таким образом, название «ТильТап» можно интерпретировать как «Язык Найди» или «Понимание речи».

Современные технологии распознавания речи становятся ключевыми инструментами в оптимизации бизнес-процессов. Использование ИИ модели “TilTap” позволит:   

  • Снизить время и затраты на обработку звонков в call-центрах.   
  • Выявлять эмоциональные маркеры для улучшения взаимодействия с клиентами.   
  • Предотвращать мошенничество по телефону 
  • Повышать соблюдение стандартов обслуживания.   

ASPEX выводит на рынок решение, которое полностью соответствует требованиям локального бизнеса и международным стандартам. 

Преимущества модели

  • Поддержка многоязычной среды 

Модель способна распознавать русский, казахский и их гибридные варианты речи, включая ненормативную лексику. Это делает её незаменимым инструментом для бизнеса, работающего в многоязычной среде. ИИ модель “TilTap” учитывает языковые особенности региона, создавая технологии, которые говорят на одном языке с клиентами.

  • Современная точность и эффективность 

ИИ модель “TilTap” достигает уровня ошибок распознавания слов (WER) 11%, что существенно превосходит аналогичные решения с WER 23%. Мы приближаемся к лучшим доступным моноязычным моделям, которые демонстрируют WER 8%. Это открывает возможности для использования технологии в самых требовательных сценариях — от call-центров до медицины, где важна каждая деталь. 

  • Обработка в реальном времени и асинхронный режим 

Вы можете быстро и недорого конвертировать архивные записи в текст, чтобы искать в них важные данные, или в реальном времени отслеживать проблемные звонки.

  • Независимость от вендоров 

Полностью автономная разработка без использования сторонних технологий обеспечивает безопасность данных и защиту от внешних ограничений. Это технологическая независимость, которая становится ключевым преимуществом в эпоху глобальных изменений. 

  • Развитие и инновации 

ASPEX уже работает над следующей версией модели, обученной на 1,5 млн часов аудио. Она будет способна работать на уровне лучших моноязычных решениях, достигнув WER 8%.

  • Готовность к коммерческому использованию 

ИИ модель “TilTap” доступна в формате подписки или локальной лицензии с высоко конкурентной ценой, начиная от 1 тенге за минуту. Это делает технологию доступной для компаний любого масштаба, от стартапов до крупных предприятий. 

Где попробовать? 

Для демонстрации возможностей модели ASPEX предлагает протестировать её работу на примере Telegram-бота: @aspex_asr_ru_kz_bot

«Мы гордимся тем, чего достигли за 2024 год. За три года мы создали множество решений на основе искусственного интеллекта для наших заказчиков. Сегодня мы готовы представить нашу уникальную модель распознавания речи, специально разработанную для Казахстана. Эта модель – не просто продукт, а часть нашей экосистемы, объединяющей различные технологии на собственной RPA-платформе. Благодаря этим решениям один из наших клиентов заработал более 1 миллиарда тенге за год. Мы также готовим запуск zero-shot TTS, который будет озвучивать текст голосом человека всего через 3–5 секунд примера. Это настоящий прорыв в технологии текст-в-голос. Сейчас мы активно обучаем модель ASR на новом датасете, который в 10 раз больше текущего. Рынок развивается, конкуренция растет, и мы гордимся тем, что такие проекты становятся реальностью в Казахстане», — отметил директор по продукту ASPEX, Вадим Тигин.