Қазақ тілін үйренуге жасанды интеллект көмектеседі
Қазақстан Республикасы Ғылым және жоғары білім министрлігі Тіл саясаты комитетінің «Тіл-Қазына» ұлттық ғылыми-тәжірибелік орталығы жасанды интеллект негізінде қазақ тілін үйренуге арналған инновациялық «Tilqazyna» моделін ұсынды.
Модель мәтін генерациялау, перифраз жасау, мәтін контекстімен жұмыс істеу, мәтінді қысқарту, грамматикалық және тыныс белгілеріндегі қателерді түзету, фразеологизмдердің мағынасын ашу және терминдерді аудару сияқты кең ауқымды тапсырмаларды орындай алады.
Бұл бірегей салалық LLM (Large Language Model) қазірдің өзінде Hugging Face платформасы арқылы қолжетімді. Модель қазақ тілінде заманауи IT-өнімдерді жасауға мүмкіндік береді және Қазақстан Президенті Қасым-Жомарт Тоқаевтың жасанды интеллект пен цифрлық технологияларды дамыту жөніндегі бастамасын жүзеге асыруға үлес қосады.
Жобаның ерекшеліктері:
• Сөздерді тексеру үшін 684 876 лексикалық бірлік пайдаланылды.
• Тұрақты тіркестермен жұмыс істеуді жақсарту үшін 20 212 нұсқа тексерілді.
• Тыныс белгілерін түзету үшін 5 558 мәтін талданды.
• Құрылымды түзету үшін 3 000 дұрыс және қате мәтіндер дайындалды.
• Мәтінді қысқарту функциясына арналған 6 000 толық және қысқартылған сөйлемдер жұбы құрастырылды.
• Перифраз жасау үшін 14 790 синонимдік қатарлар жиналды.
• Қазақ тілінің жалпы өңделген корпусының көлемі 35 ГБ құрады.
Жобаның болашағы
Биыл модельге дауыстық қарым-қатынас және ыңғайлы пайдаланушылық интерфейс енгізіледі. Сондай-ақ, A1, A2 және B1 деңгейлерінде қазақ тілін үйрету жоспарланып отыр, ал 2026 жылға қарай B2 және C1 деңгейлері іске қосылады.
Жобаның түпкі мақсаты — пайдаланушының тілді меңгеру деңгейіне қарай оқыту бағдарламасын жеке бейімдейтін дауыстық көмекші құру. Бұл көмекші iOS және Android платформаларына арналған мобильді қосымша түрінде қолжетімді болады.