Тенденции, влияющие на аналитику данных, ИИ и облачные технологии в 2023 году
В 2023 году мир аналитики, искусственного интеллекта и облачных вычислений вступает в захватывающую новую фазу с широким спектром инноваций и разработок, призванных изменить ландшафт. Давайте рассмотрим некоторые тенденции, которые будут иметь наибольшее влияние в наступившем году.
Тенденция 1: Оптимизация затрат на облако становится все более важной
В 2023 году, когда глобальная экономическая неопределенность сохранится, предприятиям, работающим с большими объемами данных в облаке, необходимо будет пересмотреть свои облачные стратегии, уделив больше внимания оптимизации затрат. Расходы на облачные технологии будут тщательно анализироваться на основе рентабельности инвестиций и совокупной стоимости владения существующих проектов или новых инвестиций.
Одной из областей, где оптимизация затрат будет особенно важна в предстоящем году, являются затраты на передачу данных, которые могут составлять значительную часть расходов организации на облачные вычисления. Мы увидим, как все больше компаний оптимизируют свою архитектуру, чтобы избежать шока от непредвиденных затрат на выход. Кроме того, все больше предприятий стремятся к "свободе" мультиоблачной среды, которая позволяет им использовать любые облачные службы, не ограничиваясь ими. Переносимость приложений будет основой этой "свободы". Это позволит им выбрать лучший вариант для своих конкретных требований и бюджета.
Тенденция 2. Большие модели демонстрируют трансформационный потенциал, стимулируя инновации в специализированной инфраструктуре.
Большие модели, такие как ChatGPT от OpenAI для диалога, модель генерации изображений DALL-E 2 и агент разговора LaMDA от Google, продемонстрировали преобразующий потенциал в 2022 году. Ожидается, что в этом году они будут способствовать развитию специализированной инфраструктуры и решений для ИИ.
Для обучения больших моделей с использованием миллиардов параметров требуется специализированная инфраструктура и решения для выполнения вычислительных требований. В результате мы ожидаем дальнейшего развития инфраструктуры ИИ, способной справиться с масштабом и сложностью этих моделей.
Кроме того, поскольку возможности больших моделей продолжают улучшаться, исследователям и разработчикам необходимо будет найти новые способы применения этих моделей в реальных сценариях. Появятся новые инструменты и платформы, облегчающие разработчикам работу с большими моделями и применение их к более широкому кругу задач.
Тенденция 3. Совместное использование данных, обмен данными и рынок данных будут более распространены
В то время как внедрение остается на ранних этапах, экосистема, основанная на обмене данными, включая инфраструктуру, транзакционные возможности и услуги как для потребителей данных, так и для поставщиков данных, продолжит развиваться в 2023 году.
Внутренний обмен данными внутри организаций будет обусловлен реализацией междоменной ценности данных, направленной на обмен данными и устранение разрозненности. Случаи использования внешнего обмена данными и истории успеха множатся по мере того, как все больше организаций используют возможности для монетизации своих активов данных. Например, в академических и исследовательских организациях изучают способы обмена исследовательскими данными через платформы для обмена данными, чтобы ускорить свои исследования.
Эта тенденция окажет значительное влияние на инфраструктуру данных, поскольку организациям потребуется адаптировать и развивать свои системы для поддержки обмена данными между регионами, организациями, облаками и платформами. Также будет уделяться повышенное внимание управлению данными и безопасности, поскольку организации стремятся обеспечить управление своими данными и доступ к ним безопасным образом.
Тенденция 4. Конвергенция хранилищ данных и ускоренное внедрение форматов открытых таблиц.
Конвергенция хранилищ данных — это растущая тенденция в современном стеке данных. Эта тенденция обусловлена растущей сложностью и разнообразием данных, а также потребностью организаций в гибких и масштабируемых системах, которые могут поддерживать широкий спектр вариантов использования в области науки о данных и аналитики. В результате хранилища данных становятся все более интегрированными.
Свою роль в этой тенденции сыграло появление форматов открытых столов, таких как Apache Iceberg, Hudi и Delta Lake. Эти форматы действуют как слой для эффективного хранения и управления большими объемами структурированных и неструктурированных данных в единой системе, позволяя организациям быстрее и с меньшими затратами извлекать пользу из своих данных. В 2023 году больше корпоративных данных будет храниться в форматах открытых таблиц, поскольку эти решения быстро внедряются.
Тенденция 5. Локальность данных будет решаться в Kubernetes
Разделение вычислений и хранения в Kubernetes долгое время было проблемой, когда дело доходит до локализации данных. В то время как Kubernetes упростил гибкое развертывание и масштабирование приложений, интенсивно использующих данные, доступ к ним из облачных источников (таких как AWS S3 или удаленные хранилища данных) становится более сложным. Мы ожидаем, что проблемы локализации данных будут решены уже в этом году.
Возможность принимать решения независимо от местоположения данных становится все более важной для планировщиков Kubernetes. Эта возможность будет иметь решающее значение для интерфейса Kubernetes, чтобы помочь приложениям и планировщикам работать более эффективно. Мы ожидаем, что появится больше решений, которые устранят разрыв между вычислениями и хранением и облегчат организациям управление и оптимизацию хранения и обработки данных в Kubernetes.
Заключение
В целом, следующий год обещает стать захватывающим временем для мира больших данных, искусственного интеллекта и облачных вычислений, когда будет представлен широкий спектр разработок и инноваций, которые определят будущее этих областей. Многие технологические парадигмы объединяются, чтобы сформировать экосистему вокруг данных. Будет интересно наблюдать, как эти технологии продолжают развиваться и влиять на мир вокруг нас.