
VK Tech стала первой российской компанией, которая запустила корпоративный Data Lakehouse в облаке. Новый сервис Cloud Trino, интегрированный в VK Cloud, позволяет бизнесу эффективно работать с большими данными, совмещая преимущества Data Lake и Data Warehouse.
Облачный Data Lakehouse от VK Tech предлагает новый подход к управлению данными, который объединяет гибкость «озёр данных» (Data Lake) и структуру традиционных хранилищ (Data Warehouse). Этот подход позволяет:
В основе Data Lakehouse лежит S3-совместимое объектное хранилище собственной разработки, а также мощный SQL-движок Cloud Trino, работающий на базе Kubernetes. Использование модифицированных open-source компонентов делает решение доступным и масштабируемым — компании платят только за фактически потребленные ресурсы, без необходимости приобретать дорогостоящие лицензии.
Сервис Cloud Trino в составе VK Cloud открывает новые возможности для обработки данных:
Объем создаваемых данных в мире стремительно растет. В 2024 году ежедневно генерировалось около 402,89 млн терабайт, а к 2025 году ожидается увеличение до 181 зеттабайта в год.
Директор по продукту VK Cloud Дмитрий Лазаренко подчеркнул важность эффективных решений для бизнеса:
«Данные растут в геометрической прогрессии, и скорость работы с ними становится ключевым конкурентным преимуществом. Мы создаем инструменты, которые позволяют компаниям анализировать данные быстрее и дешевле. Новый сервис Cloud Trino дополняет наш стек технологий, позволяя строить Data Lakehouse по модели as a service. Наша цель — сделать его максимально быстрым и доступным».
VK Tech предлагает развертывание Data Lakehouse как в облаке VK Cloud, так и на частной инфраструктуре (Private Cloud и VK Data Platform). При этом платформа VK Cloud сертифицирована в соответствии с требованиями 152-ФЗ (УЗ-1), что делает её подходящей для работы с чувствительными данными.