NU ISSAI изучает DeepSeek и создает свою мультимодальную ИИ-модель
Представленные китайской компанией DeepSeek новые модели ИИ — DeepSeek-V3 и DeepSeek-R1— названы прорывом в мире искусственного интеллекта. Технологии, по некоторым возможностям превосходящие OpenAI, выложены в открытый доступ, став вызовом для других разработчиков. Команда ISSAI при NU также изучает платформы, чтобы создать собственные ИИ продукты, адаптированные для потребностей Казахстана.
Как сообщил Генеральный директор Института умных систем искусственного интеллекта при NU (ISSAI) доктор Атакан Варол, для адаптации последней нашумевшей модели под определенную задачу, например, чтобы она лучше понимала казахский язык или работала в узкоспециализированных областях — нужно дообучать ее самостоятельно. Дело в том, что китайская компания не раскрыла методику тонкой настройки модели.
Недавно институт представил в пилотном режиме модель языкового зрения Oylan, которая в отличие от KAZ-LLM, обрабатывающей текстовые запросы, работает с изображением и текстом. Накопленный командой опыт поможет в создании мультимодальной универсальной модели.
Однако, недостаточно создавать новые модели, нужны также дополнительные вычислительные мощности для управления ими и предоставления доступа широкому кругу людей. К примеру, пилотная версия Oylan работает только на одном сервере NVIDIA A100, ограничивая одновременное использование лишь до 20 человек.
Создание KAZLLM исследователями ISSAI позволило Казахстану войти в число примерно 20 стран, разработавших крупные языковые модели, адаптированные к своим языковым и культурным особенностям. С недавним запуском Oylan Казахстан присоединился к числу стран, обладающих техническими компетенциями и интеллектуальным потенциалом для разработки передовых языково-визуальных моделей ИИ. Ожидается, что уже в этом году появятся разреженные мультимодальные модели ИИ, способные легко обрабатывать изображения, текст и аудио. Если Казахстан станет одной из стран с такой технологией, то у нее есть все шансы сохранить цифровой суверенитет и повысить конкурентоспособность в глобальном цифровом пространстве.