VK Tech стала первой российской компанией, которая запустила корпоративный Data Lakehouse в облаке. Новый сервис Cloud Trino, интегрированный в VK Cloud, позволяет бизнесу эффективно работать с большими данными, совмещая преимущества Data Lake и Data Warehouse.

Как работает Data Lakehouse в VK Cloud

Облачный Data Lakehouse от VK Tech предлагает новый подход к управлению данными, который объединяет гибкость «озёр данных» (Data Lake) и структуру традиционных хранилищ (Data Warehouse). Этот подход позволяет:

  • Сократить нагрузку на системы хранения и обработки данных.
  • Оптимизировать затраты на хранение неструктурированных данных.
  • Эффективно анализировать данные благодаря разделению вычислительных мощностей и хранилищ.

В основе Data Lakehouse лежит S3-совместимое объектное хранилище собственной разработки, а также мощный SQL-движок Cloud Trino, работающий на базе Kubernetes. Использование модифицированных open-source компонентов делает решение доступным и масштабируемым — компании платят только за фактически потребленные ресурсы, без необходимости приобретать дорогостоящие лицензии.

Cloud Trino: ускоренная аналитика и снижение затрат

Сервис Cloud Trino в составе VK Cloud открывает новые возможности для обработки данных:

  • Подключение к нескольким источникам — ускоряет ETL-процессы и анализ больших массивов данных.
  • Облачное хранилище Cloud Storage (S3) — снижает стоимость хранения 1 ГБ до 3 рублей, что в 10 раз дешевле, чем в традиционных Data Warehouse (35 рублей за 1 ГБ).
  • Гибкая масштабируемость — Kubernetes в основе Cloud Trino позволяет быстро наращивать вычислительные мощности без необходимости закладывать ресурсы под пиковые нагрузки.

VK Tech делает работу с данными доступнее

Объем создаваемых данных в мире стремительно растет. В 2024 году ежедневно генерировалось около 402,89 млн терабайт, а к 2025 году ожидается увеличение до 181 зеттабайта в год.

Директор по продукту VK Cloud Дмитрий Лазаренко подчеркнул важность эффективных решений для бизнеса:

«Данные растут в геометрической прогрессии, и скорость работы с ними становится ключевым конкурентным преимуществом. Мы создаем инструменты, которые позволяют компаниям анализировать данные быстрее и дешевле. Новый сервис Cloud Trino дополняет наш стек технологий, позволяя строить Data Lakehouse по модели as a service. Наша цель — сделать его максимально быстрым и доступным».

Где можно развернуть Data Lakehouse VK Tech

VK Tech предлагает развертывание Data Lakehouse как в облаке VK Cloud, так и на частной инфраструктуре (Private Cloud и VK Data Platform). При этом платформа VK Cloud сертифицирована в соответствии с требованиями 152-ФЗ (УЗ-1), что делает её подходящей для работы с чувствительными данными.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии