Что машинное обучение может дать управлению кредитными рисками?
Сегодняшние стратегии управления кредитным риском основаны на использовании традиционных методов. Поскольку кредитные рынки продолжают развиваться, машинное обучение может помочь улучшить эти процессы.
Финансовые организации могут воспользоваться преимуществами продуктов, использующих машинное обучение — программное обеспечение, которое позволяет более эффективно прогнозировать риски. Но должны ли они пересмотреть свои процессы управления кредитным риском и использовать эти новые решения? В этом мы попытаемся разобраться вместе с региональным управляющим SunFinance Group Виталием Нижегородцевым.
ИИ и машинное обучение для управления кредитными рисками
По данным McKinsey, технологии искусственного интеллекта и машинного обучения могут ежегодно приносить глобальным финансовым услугам до 1 триллиона долларов дополнительной ценности.
"Финансовые учреждения используют машинное обучение для более точного и последовательного принятия кредитных решений при одновременном снижении рисков, мошенничества и затрат. С другой стороны, более сложные и тонкие приложения этих технологий до сих пор оставались в основном в академической сфере. Однако в настоящее время специалисты по количественному анализу и риск-менеджеры внедряют эти технологии в реальные приложения, прокладывая путь к облегчению своей повседневной работы", — отмечает Виталий Нижегородцев.
Модель искусственной нейронной сети
Искусственные нейронные сети — эффективный инструмент для моделирования и анализа сложных систем. Они широко используются во многих научных областях, таких как распознавание образов, обработка сигналов, прогнозирование и управление системами.
В последние годы модель искусственной нейронной сети для кредитного риска привлекает все больше и больше внимания исследователей из-за преимуществ, предоставляемых ее нелинейностью, параллельными вычислениями, высокой отказоустойчивостью и хорошей производительностью обобщения.
Как работает модель искусственной нейронной сети?
Для обучения классификатора искусственной нейронной сети требуется, чтобы была известна метка категории выборочных данных. Для этого необходимо определить фактический кредитный рейтинг каждой компании в данном году.
"Новым решением этой проблемы является метод кластерного анализа, при котором все предприятия группируются в несколько категорий. Считая, что кредитный риск всех предприятий распределяется нормально, размерность уменьшается с помощью метода факторного анализа и получается общий факторный балл каждого предприятия", — говорит Нижегородцев.
По его мнению, фактический уровень кредитного риска каждой категории может быть определен в соответствии со степенью отклонения общего среднего балла каждой категории факторов от общего среднего балла всего фактора. После этого широко используемые традиционные модели прогнозирования кредитного риска проверяются на точность. В конечном итоге эффект предсказания сравнивается с моделью, созданной моделью искусственной нейронной сети.
"Благодаря значительному повышению точности прогнозирования проблемных кредитов коммерческие организации могут использовать модель нейронной сети для прогнозирования рисков и оценки кредитного риска, достигая хороших результатов", — отмечает специалист.
Генераторы рынка машинного обучения
Поскольку исторические данные до пандемии больше не точно отражают текущие уровни риска, способность генераторов рынка измерять риск на основе более коротких временных рядов бесценна. Модели риска калибруются по историческим данным. Чем длиннее временной горизонт модели, тем длиннее временной ряд, необходимый для калибровки модели.
По словам Виталия Нижегородцева, при использовании традиционных моделей риска короткая длина временных рядов данных эпохи пандемии не позволяет провести точную калибровку модели. Временные ряды для любой данной валюты, акции или кредитного имени слишком короткие, чтобы получить какую-либо статистическую достоверность оценки.
Поскольку стандартные рыночные модели кредитного риска, лимитов, страховых резервов и макроинвестиций измеряют риск на годы вперед, для них требуются длинные временные ряды, охватывающие данные до пандемии, которые больше не отражают текущий уровень риска.
"Генераторы рынка — это алгоритмы машинного обучения для создания дополнительных выборок рыночных данных, когда исторические временные ряды имеют недостаточную длину, без опоры на какие-либо предвзятые представления о данных. Они могут генерировать данные для временных горизонтов от 1 до 30 лет, которые требуются для моделей риска, что делает возможным точное измерение кредитного риска в эпоху пандемии, лимитов, страховых резервов (генерация экономических сценариев) и эффективности макростратегии", — отмечает региональный управляющий SunFinance Group.
По его мнению, используя неконтролируемое машинное обучение, генераторы рынка тщательно агрегируют статистические данные по нескольким валютам, акциям или кредитным именам, а затем генерируют выборки данных для каждого имени. Это позволяет уменьшить присущую коротким временным рядам статистическую неопределенность при сохранении различий между именами и включении их в модель. Эта уникальная способность модели была подтверждена путем сравнения ее с данными вне выборки — золотым стандартом проверки модели.
Устранение рисков, связанных с искусственным интеллектом и машинным обучением
Несмотря на то, что искусственный интеллект и расширенная аналитика открывают перед финансовыми организациями значительные возможности, они должны осуществляться таким образом, чтобы управление рисками также занимало центральное место в умах людей. Как и в статистическом моделировании, при проверке модели машинного обучения важно сосредоточиться на следующих шести областях:
- Интерпретируемость;
- Предвзятость;
- Разработка функций;
- Настройка гиперпараметров;
- Производственная готовность;
- Калибровка динамической модели.
По словам Виталия Нижегородцева, риск того, что модели машинного обучения будут предвзятыми, реален, потому что модели могут превосходить данные, если они не обрабатываются должным образом.
Переобучение — это когда модель очень хорошо соответствует данным, потому что она настроена таким образом, чтобы очень эффективно воспроизвести данные. На самом деле она не выдержит испытания временем, когда модель поступит в производство и будет подвергаться воздействию ситуаций, в которых она раньше не сталкивалась. Будет видно значительное ухудшение производительности.
"В искусственном интеллекте процесс немного другой. Разработчик передает большой объем данных в алгоритм ИИ, и модель изучает функции, описывающие эти данные. Проблема при этом заключается в том, что модель может изучать функции, которые совершенно нелогичны, а в некоторых случаях модель может переобучать данные. В этом случае валидатор модели должен иметь возможность тщательно изучить типы прогностических переменных, которые появляются в модели ИИ, и убедиться, что они согласуются с интуицией и действительно предсказывают выходные данные. В конечном счете, я считаю, что машинное обучение будет продолжать играть важную роль в выявлении моделей и тенденций, которые могут помочь финансовым учреждениям", — заключает региональный управляющий SunFinance GroupВиталий Нижегородцев.