Қазақстан ЖИ саласында азиялық жоғары оқу орындарымен ынтымақтастықты күшейтуде

Қазақстан ЖИ саласында азиялық жоғары оқу орындарымен ынтымақтастықты күшейтуде

Азиялық зерттеу университеттері жасанды интеллектті (ЖИ) дамытудағы жарысқа белсенді түрде қосылды. Бұл міндет аймақ үшін соншалықты маңызды, сондықтан Қытай, Оңтүстік Корея және Сингапур сияқты басты ойыншылар жетекші университеттерді жасанды интеллектті қолданатын кең ауқымды зерттеулер мен бизнес-пен бірлескен ғылыми-зерттеу және тәжірибелік-конструкторлық жұмыстар (R&D) үшін қаржыландыруда.

Бұрын зерттеулерде батыс ғылыми орталықтарымен және университеттерімен ынтымақтастыққа үлкен мән берілсе, қазір фокус азиялық университеттерге — жаһандық ғылымдағы қуатты ойыншыларға — ауысып отыр. Ғалымдардың зерттеулері барған сайын ықпалды болуда және олар стратегиялық маңызды бағыттарда елеулі жетістіктер көрсетіп келеді.

Азиялық университеттер материалтану мен нанотехнологияларға (жаңа материалдар, сенсорлар, графен, икемді электроника), робототехника мен автоматтандыруға, мехатроникаға белсенді түрде инвестиция салуда.

Жақында өткен Times Higher Education Asia Universities Summit саммитінде Азияның ғылым, технология және инновацияға әсері талқыланды. Қазақстанның генеративті жасанды интеллект саласындағы жетістіктері үлкен қызығушылық тудырды.

Азиялық жетекші сарапшыларға Назарбаев Университетіндегі Ақылды жүйелер және жасанды интеллект институты (ISSAI) әзірлеген қазақ тіліндегі үлкен тілдік модель — ISSAI KAZ-LLM таныстырылды. Жобаны профессор Атақан Варол, ISSAI бас директоры ұсынды.

KAZ-LLM — қазақ тілі мен мәдени контекстіне арнайы бейімделген егеменді жасанды интеллект моделі. Профессор Варол университеттің деректер тапшылығы мен лингвистикалық бейтараптық мәселелерін алдыңғы қатарлы зерттеулерді жергілікті тәжірибемен үйлестіру арқылы қалай еңсергенін бөлісті. KAZ-LLM негізінде жоғары дәлдіктегі Soyle аударма жүйесі және тілдік аудиовизуалды модель — Oylan2 әзірленді.

2021 жылы ISSAI мен Ташкент ақпараттық технологиялар университетінің компьютерлік жүйелер кафедрасындағы бейне және сөйлеуді өңдеу зертханасы бірлесіп Өзбек сөйлеу корпусы (USC) жобасын әзірледі. Бұл корпус 958 түрлі диктордан тұратын және жалпы ұзақтығы 105 сағатқа жуық транскрипцияланған аудиожазбаларды қамтиды. USC сөйлеуді автоматты тануға арналған, сондай-ақ сөйлеу синтезі және аудармасы сияқты басқа да сөйлеумен байланысты тапсырмаларды шешуге қолданылады.

Ал 2023–2024 жылдары Татарстан Ғылым академиясының Қолданбалы семиотика институтымен (Қазан қ.) бірлесіп, TatarTTS: татар тілі үшін ашық дереккөзді мәтіннен сөйлеуге түрлендіру деректер жиыны жобасы әзірленді. Бұл жинақта кәсіби дикторлардың қатысуымен шамамен 70 сағаттық транскрипцияланған аудиожазбалар бар.

Сонымен қатар, ISSAI жыл сайын Жазғы зерттеу бағдарламасын өткізеді, онда қазақстандық және шетелдік студенттер жасанды интеллект саласында тәжірибе мен білім алу үшін бірге жұмыс істейді. Бұл бағдарламаға KAIST пен Yonsei сияқты корей университеттерінің, БАӘ университеттерінің және Жаңа Өзбекстан университетінің студенттері қатысады.

TSARKA қолдауымен