架构
我们正在寻求用前沿技术构建更好、更快、更经济的云数据仓库。
开源
-
计算和存储分离
服务
Meta 服务 / 计算 / 存储
云服务 / 计算 / 存储
支持的云服务商
AWS ( Google Cloud & Azure 计划中)
AWS / Google Cloud / Azure
技术
向量化查询执行
基于拉和推的 Pipeline
成本驱动和工作负载感知技术
Unknown
ARM 架构支持
使用 ARM 的成本效率特性节省了 50% 的折扣 (与 x86 处理器相比)
-
表格文件格式
Parquet - 开放数据格式
下游应用程序可访问
传统的微分区
下游应用程序不可访问
半结构化数据支持
企业级加密
最终解决
数仓 + 数据湖
数仓
可扩展性
无限的资源。无限弹性。低成本。
调度
Kubernetes pod-based
Virtual machines-based
弹性
Compute unit
Warehouse size
花费
技术强,成本低
AWS EC2 Instance Type
ARM Spot Instance
x86 EC2 Instance
云基础设施
基于 Kubernetes pod
基于 virtual machines
透明的价格
-
Warehouse 自动停止
秒级
分钟级
花费
经济的
每秒计费
以秒为单位发放计算资源
昂贵的
每分计费
以分钟为单位发放计算资源