
VK Tech стала первой российской компанией, которая запустила корпоративный Data Lakehouse в облаке. Новый сервис Cloud Trino, интегрированный в VK Cloud, позволяет бизнесу эффективно работать с большими данными, совмещая преимущества Data Lake и Data Warehouse.
Содержание
Как работает Data Lakehouse в VK Cloud
Облачный Data Lakehouse от VK Tech предлагает новый подход к управлению данными, который объединяет гибкость «озёр данных» (Data Lake) и структуру традиционных хранилищ (Data Warehouse). Этот подход позволяет:
- Сократить нагрузку на системы хранения и обработки данных.
- Оптимизировать затраты на хранение неструктурированных данных.
- Эффективно анализировать данные благодаря разделению вычислительных мощностей и хранилищ.
В основе Data Lakehouse лежит S3-совместимое объектное хранилище собственной разработки, а также мощный SQL-движок Cloud Trino, работающий на базе Kubernetes. Использование модифицированных open-source компонентов делает решение доступным и масштабируемым — компании платят только за фактически потребленные ресурсы, без необходимости приобретать дорогостоящие лицензии.

Cloud Trino: ускоренная аналитика и снижение затрат
Сервис Cloud Trino в составе VK Cloud открывает новые возможности для обработки данных:
- Подключение к нескольким источникам — ускоряет ETL-процессы и анализ больших массивов данных.
- Облачное хранилище Cloud Storage (S3) — снижает стоимость хранения 1 ГБ до 3 рублей, что в 10 раз дешевле, чем в традиционных Data Warehouse (35 рублей за 1 ГБ).
- Гибкая масштабируемость — Kubernetes в основе Cloud Trino позволяет быстро наращивать вычислительные мощности без необходимости закладывать ресурсы под пиковые нагрузки.
VK Tech делает работу с данными доступнее
Объем создаваемых данных в мире стремительно растет. В 2024 году ежедневно генерировалось около 402,89 млн терабайт, а к 2025 году ожидается увеличение до 181 зеттабайта в год.
Директор по продукту VK Cloud Дмитрий Лазаренко подчеркнул важность эффективных решений для бизнеса:
«Данные растут в геометрической прогрессии, и скорость работы с ними становится ключевым конкурентным преимуществом. Мы создаем инструменты, которые позволяют компаниям анализировать данные быстрее и дешевле. Новый сервис Cloud Trino дополняет наш стек технологий, позволяя строить Data Lakehouse по модели as a service. Наша цель — сделать его максимально быстрым и доступным».
Где можно развернуть Data Lakehouse VK Tech
VK Tech предлагает развертывание Data Lakehouse как в облаке VK Cloud, так и на частной инфраструктуре (Private Cloud и VK Data Platform). При этом платформа VK Cloud сертифицирована в соответствии с требованиями 152-ФЗ (УЗ-1), что делает её подходящей для работы с чувствительными данными.