Қазақстанда жасанды интеллект пен цифрлық технологиялар негізінде Ұлттық сөздік қоры құрылмақ

Қазақстанда жасанды интеллект пен цифрлық технологиялар негізінде Ұлттық сөздік қоры құрылмақ

Қазақстанда қазақ тілінің Ұлттық сөздік қоры әзірленеді. Бұл қор жасанды интеллект пен цифрлық технологияларды пайдалана отырып, мәліметтерді өңдеу және жүйелеу үшін қолданылады. Жоба сөздік ресурстарына қолжетімділік беретін бірыңғай мемлекеттік ақпараттық жүйені құруды және тілді талдау құралдарын әзірлеуді көздейді.

Жобаның негізгі міндеттері:

● Қазақ тілінің лексикалық құрамын цифрландыру және автоматтандыру.

● Тілді жасанды интеллект пен заманауи технологияларға бейімдеу.

● Тілдік зерттеулер мен терминологияны дамыту үшін орталықтандырылған тіл корпустарын жасау.

● Іздеу функциялары мен деректерді экспорттау мүмкіндігі бар интерактивті пайдаланушылық интерфейс құру.

Қор қалай қалыптасады?

Ұлттық сөздік қоры академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, сондай-ақ терминологиялық база негізінде жасалады. Барлық деректер цифрлық форматта жиналып, өңделіп, сақталады, ал пайдаланушылар функционалды және аналитикалық сервистерге қол жеткізе алады.

Жүйенің негізгі функциялары:

● Сөздердің жалпы қолданысын модельдеу.

● Деректерді жинау және жүйелеу бойынша техникалық талаптарды әзірлеу.

● Ашық платформалар мен халықаралық стандарттармен интеграция.

● Тілді цифрландыру бойынша модераторлар мен сарапшылар тобының жұмысын қамтамасыз ету.

Жоба “Ашық НҚА” порталында жарияланып, 2025 жылдың 19 наурызына дейін көпшілік талқылауына ұсынылған.

TSARKA қолдауымен