Нейросеть «Сбера» умеет генерировать тексты на казахском

Нейросеть «Сбера» умеет генерировать тексты на казахском

SberDevices представила многоязычную версию нейросети GPT-3. Модель под названием mGPT может генерировать тексты на 61 языке мира, включая казахский.

mGPT — это первая в мире генеративная модель, которая поддерживает такое количество языков. Она доступна в двух версиях: базовой, опубликованной в открытом доступе в облачном хранилище СберДиск, и расширенной, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.

Нейросеть может использоваться как просто для генерации текста, так и для решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Например, она уже показывает выдающиеся результаты на многих задачах few-shot и zero-shot learning: достаточно сформулировать задачу текстом и привести несколько примеров, после чего mGPT научится ее выполнять.

Это может использоваться для того, чтобы научить автоматизированную систему отвечать на вопросы, определять эмоциональную окраску текста, извлекать из текста имена, фамилии, названия компаний и т. п. Модель может также использоваться как компонент различных речевых технологий — например, для улучшения качества распознавания речи, генерации сценариев диалоговых систем и т. д.

"В 2020 году мы представили русскоязычную версию нейросети GPT-3, именно она используется в двух виртуальных ассистентах семейства Салют от Сбера — Джой и Афине. Мы продолжили развивать наши NLP-технологии и представили модель mGPT, поддерживающую более 60 языков, при этом для многих из них ранее генеративных моделей просто не существовало", — добавил Денис Филиппов, CEO SberDevices, вице-президент по новым цифровым поверхностям Салют Сбербанка.

Русскоязычная версия GPT-3, разработанная "Сбером", доступна на платформе SmartMarket.

Напомним, что ранее "Сбер" сообщали, что окажут поддержку дочерним банкам в Беларуси и Казахстане.