ASPEX Қазақстан нарығы үшін сөйлеуді тану моделін іске қосты

ASPEX Қазақстан нарығы үшін сөйлеуді тану моделін іске қосты

Astana Hub резиденті ASPEX компаниясы қазақ-орыс тіліндегі сөйлеуді тануға арналған ерекше «TilTap» жасанды интеллект моделін ұсынды. Бұл модель диаризация (спикерлерді ажырату) және эмоцияларды үш негізгі вектор бойынша талдау функцияларымен жабдықталған. Бұл шешім бизнес міндеттерін шешуге және клиенттермен қарым-қатынас сапасын арттыруға арналған. ASPEX компаниясы жергілікті тілдік ерекшеліктерді ескере отырып, дәлдік, қауіпсіздік және бейімделу мүмкіндіктерін ұсынатын жаңа технологияны нарыққа шығарады.

Компанияның айтуынша, қазақ тілінде «тап» сөзі «табу», «анықтау» дегенді білдіреді. Сондықтан «ТильТап» атауы «Тілді тап» немесе «Сөйлеуді түсіну» деп түсіндірілуі мүмкін.

Сөйлеуді тану технологиялары бизнес-процестерді оңтайландырудың негізгі құралдарына айналуда. TilTap моделін пайдалану арқылы:

• Колл-орталықтардағы қоңырауларды өңдеу уақытын және шығындарын азайтуға;

• Клиенттермен өзара әрекеттесуді жақсарту үшін эмоциялық маркерлерді анықтауға;

• Телефон арқылы алаяқтықты болдырмауға;

• Қызмет көрсету стандарттарын сақтау деңгейін арттыруға болады.

ASPEX ұсынған бұл шешім жергілікті бизнес талаптарына және халықаралық стандарттарға толық сәйкес келеді.

Модельдің артықшылықтары

• Көптілді ортаны қолдау

Модель орыс, қазақ және олардың гибридті нұсқаларын, соның ішінде нормативті емес лексиканы да тани алады. Бұл оны көптілді ортада жұмыс істейтін бизнес үшін таптырмас құралға айналдырады. TilTap аймақтық тілдік ерекшеліктерді ескеріп, клиенттердің тілімен сөйлесетін технологияларды жасайды.

• Заманауи дәлдік пен тиімділік

TilTap моделінің сөздерді танудағы қате деңгейі (WER) 11% құрайды, бұл ұқсас шешімдердегі 23%-дан едәуір төмен. Біз ең үздік монотілдік шешімдерге (8% WER) жақындап келеміз. Бұл технологияны колл-орталықтардан бастап медицинаға дейін әрбір деталь маңызды болатын ең талапшыл сценарийлерде қолдануға мүмкіндік береді.

• Нақты уақыттағы өңдеу және асинхронды режим

Архивтік жазбаларды мәтінге жылдам әрі арзан түрде түрлендіріп, маңызды деректерді іздеуге немесе нақты уақытта проблемалық қоңырауларды бақылауға мүмкіндік береді.

• Вендорлардан тәуелсіздік

Үшінші тарап технологияларын қолданбай, деректер қауіпсіздігін және сыртқы шектеулерден қорғауды қамтамасыз ететін толық автономды шешім. Бұл жаһандық өзгерістер дәуірінде негізгі артықшылыққа айналады.

• Даму және инновациялар

ASPEX келесі нұсқасын әзірлеуде, ол 1,5 миллион сағаттық аудиода оқытылған. Ол WER деңгейін 8%-ға жеткізіп, үздік монотілдік шешімдер деңгейінде жұмыс істейтін болады.

• Коммерциялық қолдануға дайындық

TilTap моделі жазылу немесе локалды лицензия форматы арқылы қолжетімді. Оның бағасы 1 теңгеден басталады, бұл технологияны кез келген ауқымдағы компанияларға — стартаптардан бастап ірі кәсіпорындарға дейін қолжетімді етеді.

Қайда сынап көруге болады?

ASPEX Telegram-бот мысалында модельдің мүмкіндіктерін сынап көруді ұсынады: @aspex_asr_ru_kz_bot

«2024 жылы қол жеткізген жетістіктерімізбен мақтанамыз. Соңғы үш жылда біз тапсырыс берушілеріміз үшін жасанды интеллектке негізделген көптеген шешімдер жасадық. Бүгін біз Қазақстанға арнайы әзірленген сөйлеуді тану моделін ұсынып отырмыз. Бұл модель – жай ғана өнім емес, біздің экожүйеміздің бір бөлігі, ол әртүрлі технологияларды бірыңғай RPA платформасында біріктіреді. Осы шешімдер арқылы біздің клиентіміздің бірі жылына 1 миллиард теңгеден астам табыс тапты. Біз сонымен қатар тек 3–5 секундтық үлгі арқылы адам дауысы ретінде мәтінді дыбыстайтын zero-shot TTS моделін іске қосуға дайындалып жатырмыз. Бұл – мәтінді дауыстау технологиясындағы үлкен серпіліс. Қазіргі уақытта біз ASR моделін 10 есе үлкен жаңа деректер жиынында оқытудамыз. Нарық дамып келеді, бәсекелестік артып жатыр, және осындай жобалардың Қазақстанда жүзеге асырылып жатқаны біз үшін үлкен мақтаныш», – деп атап өтті ASPEX-тің өнім жөніндегі директоры Вадим Тигин.

TSARKA қолдауымен