Казахстан усиливает сотрудничество с азиатскими вузами в сфере ИИ

Азиатские исследовательские вузы активно включились в гонку в развитии искусственного интеллекта. Задача настолько важная для региона, что главные игроки — Китай, Южная Корея и Сингапур — финансируют ведущие университеты для широкого спектра исследований с использованием ИИ и создания R&D совместно с бизнесом.

На фоне заинтересованности сотрудничества с западными исследовательскими центрами и университетами, сейчас фокус смещается в сторону азиатских вузов — мощных игроков в глобальной науке. Исследования ученых становятся всё более влиятельными, и они демонстрируют заметные успехи в ряде стратегически важных направлений.

Азиатские вузы активно инвестируют в материаловедение и нанотехнологии (новые материалы, сенсоры, графен, гибкие электроники), робототехнику и автоматизацию, мехатронику.

На недавнем саммите Times Higher Education Asia Universities Summit обсуждалась роль Азии и ее влияние на науку, технологии и инновации. Презентованные достижения Казахстана в области генеративного ИИ вызвал большой интерес.

Ведущим азиатским экспертам представили ISSAI KAZ-LLM — казахскую большую языковую модель, разработанную Институтом умных систем и искуственного интелелекта при Nazarbayev University. Проект презентовал профессор Атакан Варол, генеральный директор ISSAI.

KAZ-LLM — суверенная модель ИИ, специально разработанной для казахского языка и культурного контекста. Профессор Варол поделился, как университет преодолел такие проблемы, как нехватка данных и лингвистическая предвзятость, благодаря инновационным подходам, сочетающим передовые исследования с местным опытом. На основе KAZ-LLM разработаны высокоточный переводчик Soyle и модель языкового аудиовидения Oylan2. 

В 2021 году в сотрудничестве между ISSAI и лабораторией обработки изображений и речи кафедры компьютерных систем Ташкентского университета информационных технологий был разработан корпус узбекской речи (USC), куда входят 958 различных дикторов с общим количеством транскрибированных аудиозаписей 105 часов. USC в первую очередь предназначен для автоматического распознавания речи, однако он также может быть использован для решения других задач, связанных с речью, таких как синтез речи и перевод речи.

А в 2023-2024 годах совместно с Институтом прикладной семиотики Академии наук Татарстана (Казань) был разработан проект TatarTTS: An Open-Source Text-to-Speech Synthesis Dataset for the Tatar Language. Набор данных включает в себя около 70 часов транскрибированных аудиозаписей с участием профессиональных дикторов.

Также ежегодно ISSAI проводит Летнюю исследовательскую программу, в которой студенты из казахстанских вузов и иностранные студенты совместно работают, чтобы получить больше опыта и знаний в области ИИ. Так, в этой программе участвуют студенты из корейских вузов KAIST и Yonsei, университетов ОАЭ, а также New Uzbekistan University.

Казахстанский NU на азиатском саммите объявил об инициативе «Генеративный ИИ во благо», основанной на принципе создания преобразующего, но социально ответственного ИИ. Инициатива направлена на совместную разработку высокопроизводительных моделей ИИ с учетом этических норм, культурных особенностей и языковых особенностей. NU пригласил азиатские университеты присоединиться к этой инициативе, подчеркивая важность совместного использования знаний и инклюзивных исследований для обеспечения пользы ИИ.