Регуляторные риски AI: о чем следует помнить, когда вы запускаете AI-продукт

Регуляторные риски AI: о чем следует помнить, когда вы запускаете AI-продукт

Если ваша компания работает с AI — разрабатывает его, покупает готовое решение, дообучает модель или интегрирует AI-компонент в свой продукт – вопрос регуляторного соответствия уже актуален. Даже если бизнес зарегистрирован в Казахстане и ваши клиенты пока локальные, стандарты, которые формирует европейское регулирование, постепенно становятся глобальным ориентиром. 

Инна Семенова, старший юрист REVERA Law Group.

Три явления, о которых стоит знать: EU AI ActGDPR и правовые вопросы вокруг Training Data. Разберём каждое из них по сути.

EU AI Act: первый в мире закон об ИИ

EU AI Act — это общеевропейский регламент, принятый в 2024 году и постепенно вступающий в силу в отдельных частях. Европейские регламенты действуют напрямую во всех странах ЕС, а это значит, что для того, чтобы их нормы работали в той или иной стране, не нужно принимать какие-то дополнительные законы. Ключевой момент — регламент работает по экстерриториальному принципу.

То есть, если ваш AI-продукт используется на территории ЕС — независимо от того, кто конечный пользователь — требования распространяются на вас независимо от страны регистрации. При этом в B2B-цепочке ответственность распределяется между всеми участниками: если казахстанская компания поставляет AI-компонент европейскому партнёру, который затем предоставляет его своим клиентам, обязательства возникают у обеих сторон — в разном объёме. 

Ваш AI-чатбот, который обрабатывает запросы из Германии, уже находится в поле зрения европейского регулятора.

EU AI Act делит все систмы ИИ на четыре категории риска

Запрещённые системы (Unacceptable Risk) — полный стоп. К таким системам относятся те, которые выстраивают социальный рейтинг граждан, осуществляют биометрическую идентификацию в публичных местах в реальном времени (например, системы распознавания лиц), управляют поведением пользователя через подпороговые техники. Если в продукте есть подобные функции, их нужно выявить, тщательно оценить и, как правило, полностью устранить до выхода на европейский рынок.

Высокорисковые системы (High Risk). К таким относятся системы, влияющие на важные решения о людях, включая: системы подбора и оценки персонала, кредитный скоринг, медицинские диагностические инструменты на базе AI, системы верификации личности и AI-решения в образовании. Требования: человеческий надзор, техническая документация, регистрация в EU Database (обязательно для провайдеров по ряду категорий), регулярные аудиты.

Ограниченный риск (Limited Risk). Данная категория ориентирована на чат-боты и инструменты генерации контента. Основное требование здесь – прозрачность. Пользователь должен понимать, что общается с AI-системой, а не с человеком.

Минимальный риск (Minimal Risk). Сюда попадает подавляющее большинство ИИ-систем, с которыми мы сталкиваемся ежедневно: фильтры спама, рекомендации контента, инструменты оптимизации. Никаких обязательных требований к ним нет – регулятор не установил специальных обязательных требований. Но не стоит забывать – общие нормы права – GDPR, национальное законодательство – по-прежнему применяются. 

Хотя категории риска определяют предмет регулирования, не менее важен вопрос распределения ответственности. EU AI Act разделяет участников на поставщиков (Providers), операторов (Deployers), импортёров и дистрибьюторов, связывая объём их обязанностей с категорией риска конкретной ИИ-системы. Так, оператор High-Risk системы обязан обеспечить человеческий надзор (human oversight) и провести оценку воздействия на основные права (Fundamental Rights Impact Assessment, FRIA), тогда как при минимальном риске никаких принудительных требований к нему не возникает.

Штрафы за запрещённые системы: до €35 млн или 7% от глобального оборота; за нарушения в категории High Risk – до €15 млн или 3%; за предоставление недостоверной информации регулятору – до €7,5 млн или 1,5%. Для компании среднего масштаба это уже не абстрактные цифры.

GDPR и AI: новые сложности на стыке 

Общеевропейский регламент по защите данных – GDPR действует с 2018 года, и его базовые требования многим уже знакомы. Появление AI-функций в продуктах добавляет к привычным обязательствам несколько новых нюансов.

Автоматизированные решения (Статья 22). Если AI принимает полностью автоматизированные решения, влияющие на людей (одобряет кредит, отбирает кандидатов на вакансию, рассчитывает тариф) – пользователь вправе оспорить это решение и потребовать объяснений. Ответ «модель так решила» юридически несостоятелен. Нужно предусматривать правила и процедуры, в рамках которых клиенту нужно будет объяснить логику принятия решения и обеспечить его пересмотр при необходимости. При этом, хотя норма формально не применяется при наличии human-in-the-loop, регуляторы трактуют это исключение всё строже – номинальное участие человека без реального контроля защитой не считается. 

Целевое ограничение (Purpose Limitation). Данные, собранные для одной цели, нельзя использовать для другой. Согласие на обработку данных «для улучшения сервиса» не даёт автоматического права использовать их для обучения AI-модели. Это одна из самых распространённых ошибок при внедрении AI-функций.

Минимизация данных. GDPR требует собирать и обрабатывать только те данные, которые действительно необходимы для заявленной цели. AI-модели, как правило, показывают лучшие результаты на больших объёмах данных, поэтому закономерно возникает стремление собирать как можно больше пользовательских данных. Это противоречие можно разрешать на уровне архитектурных решений – через анонимизацию или использование синтетических данных. Важно учитывать, что анонимизация по стандартам GDPR предполагает необратимую деидентификацию данных – псевдонимизация этому требованию не отвечает.

Быстрая проверка перед запуском AI-функции: 1) какие персональные данные обрабатывает система, 2) на каком правовом основании, 3) может ли пользователь оспорить принятое решение. Если хотя бы на один вопрос нет ответа – это сигнал к доработке.

Training Data: на чём обучена ваша модель

Происхождение обучающих данных остаётся одной из наиболее недооценённых зон риска. Большинство компаний покупают готовые модели или берут open-source решения, не задаваясь вопросом о правовой чистоте данных, на которых они обучены.

Авторские права. В 2023 году Getty Images подала иск против Stability AI на $1,8 млрд за обучение модели на защищённых изображениях без лицензий (дело рассматривается в Великобритании; аналогичные иски против OpenAI и других AI-компаний активно подаются и в судах ЕС – в частности, немецкими и французскими издательствами). Аналогичные дела инициируют авторы, музыканты, издательства. Если ваша модель обучена на данных, собранных без правового основания, этот риск косвенно касается и вас.

Персональные данные в датасетах. Если в Training Data попали персональные данные граждан стран-ЕС без надлежащего основания – это нарушение GDPR на уровне архитектуры продукта. Дополнительный риск возникает, если AI-модели способны «запоминать» и воспроизводить фрагменты обучающих данных (memorization).

Права на AI-контент. Если продукт генерирует тексты, изображения или код, право интеллектуальной собственности на полученные результаты не во всех юрисдикциях прямо определено законом. Суды ЕС и США отказывают в авторских правах на полностью AI-generated контент: в ЕС это следует из требования об авторстве человека (Directive 2001/29/EC), в США - из позиции USPTO и судебной практики. В B2B это создаёт прямой риск: заказчик может оспорить право на генерируемые материалы. Обычно это решается через включение соответствующих условий в пользовательские соглашения. Такие соглашения ни в коем случае не стоит бездумно копировать у других сервисов. Условия другого сервиса отражают его конкретную архитектуру и правовое положение - слепое копирование не обеспечивает реальной защиты.

Что сделать сейчас: запросите у AI-поставщиков документацию по Training Data. А также обратите внимание, на каких данных обучена модель, есть ли лицензии, как обрабатывались персональные данные в процессе обучения. Отсутствие внятных ответов – серьёзный критерий при выборе партнёра и повод крайне внимательно писать условия договоров с такими контрагентами.

Казахстанский контекст: кого это касается

Три сценария, в которых требования EU AI Act и GDPR становятся практически значимыми уже сегодня:

  • Компания продаёт продукт или SaaS европейским клиентам – напрямую или через партнёров.
  • Компания выступает подрядчиком для EU-заказчика и разрабатывает AI-компонент для его продукта.
  • Компания привлекает европейские инвестиции: регуляторное соответствие AI всё чаще проверяется в рамках due diligence.

Финтех, healthtech и HR-tech – направления, наиболее активно развивающиеся в Казахстане, – находятся под наиболее плотным регуляторным покрытием. Помимо EU AI Act, на них распространяются отраслевые регуляторы ЕС: EBA (банковский сектор), EMA (медицина), EIOPA (страхование) – каждый из которых формирует собственные AI-специфические требования поверх общего регламента. 

5 вопросов вашей команде

1.    На каком правовом основании мы обрабатываем персональные данные в AI-функциях?

2.    Можем ли мы объяснить пользователю, почему AI принял конкретное решение о нём?

3.    Есть ли у нас документация о том, на каких данных обучены используемые AI-модели?

4.    Если завтра EU-регулятор или инвестор запросит аудит нашего AI-продукта – что мы покажем?

5.    Закрепляют ли контракты с AI-поставщиками их ответственность за регуляторное соответствие?

Если на часть этих вопросов пока нет готового ответа, это вполне рабочая ситуация – важно, что она поддаётся решению. Регуляторная готовность в сфере AI складывается постепенно. Лучше выстраивать этот процесс сейчас, пока стандарты ещё формируются, чем догонять их в условиях дедлайнов или при появлении конкретных претензий. 

AI открывает возможности – и одновременно требует ответственного подхода.

Компании, которые понимают правила игры заранее, получают конкурентное преимущество.


Автор: Инна Семенова, старший юрист REVERA Law Group.