博客

云上数据变革:Databend Cloud 正式发布

avatarDatabend4月 20, 2023
云上数据变革:Databend Cloud 正式发布

2023 年 4 月 20 日,Databend Cloud 经历了近两年的打磨终于发布了!🎉

此次发布会由北京数变科技有限公司【Databend Labs】联合阿里云共同举办。Databend Cloud 借助于云原生数仓 Databend 实现了云简单易用的大数据分析场景。

以下内容来自 Databend 联合创始人 - 王吟、Databend Cloud 平台负责人 - 李亚舟以及阿里云智能资深产品运营专家 - 蔡亮伟,在本次发布会上的分享总结。

🙋 本次发布会分为三个部分:

第一部分:王吟,李亚舟分享:「 云上数据变革,Databend Cloud 发布」

第二部分:蔡亮伟分享:「阿里云对象存储 OSS, 构建企业级数据湖底座」

第三部分:在阿里云平台上如何开通 Databend Cloud

databend-cloud-release-wy-clw.jpeg (上图: 王吟(左)蔡亮伟(右)共同见证 Databend Cloud 获得阿里云生态认证)

云上数据变革,Databend Cloud 发布

🙋 这部分的主题大纲

1. Databend Cloud 主要功能介绍

2. Databend Cloud 和传统数仓的区别,为什么要选择 Databend Cloud

3. Databend 登顶 ClickBench 测试介绍

4. Databend Cloud 未来定位

Databend Cloud 主要功能介绍

Databend 是一款使用 Rust 研发,完全面向云架构,基于对象存储构建的云原生数仓。

1.png

Databend Cloud 是基于 Databend 打造的弹性云数仓,由 3 层组成,底层基于对象存储,如阿里云 OSS,上层计算节点采用不同的规格,好比个人选购衣服,有小号,中号,大号等,同理计算节点也有小号 1x、中号 2x,大号 8x,根据自己计算的需求,选择不同的型号。最上层就是我们元数据和管理集群,实现多租户的隔离,保证用户的数据安全。

Databend Cloud 架构如下:

2.png

在 Databend Cloud 可以为用户提供:

  • 一站式数据分析和管理平台
  • 丰富的租户及组织管理能力
  • 按资源使用情况计费,零管理零运维
  • 多云解决方案
  • Databend 核心团队提供支撑

Databend 性能如何呢?

ClickBench 是 ClickHouse 发起的分析型数据库性能测试排行榜,收录了 Snowflake、ClickHouse 等 50 多个主流分析型数据库的测试结果,它采用一个公开的标准来衡量数据库的性能,我们的导入性能在三个机型下均为第一名,在 hot run 查询下,我们有一个机型是第一名,其他两个机型分别是第二第三名。

3.png

Databend Cloud 和自己搭建数仓的区别,为什么要选择 Databend Cloud

目前,很多用户在公有云中利用云主机自己部署数仓集群,通常采用传统数仓的存算一体架构,底层存储利用硬盘来构建。

Databend Cloud 底层采用对象存储使用多少用多少无需考虑空间容量,成本是云硬盘的 1/3 到 1/8 甚至更少,使用的计算资源也跟业务需求相关,如果是跑批类业务,只需要在指定时间使用。整体而言可以为企业节省 80% 以上成本。

4.png

Databend Cloud 和使用公有云数仓的区别

公有云中数仓主要还是存算一体架构,底层也是基于云硬盘来构建,相比于场景一,公有云厂商通常提供 PaaS 服务,一键可以安装整个集群到用户 VPC 中,但还需要用户时刻关注集群状态。

成本上,集群长期占用,费用甚至比第一种场景用户自己搭建还要高。所以整体而言,相对于 Databend Cloud 需要一定的运维成本,整体费用高出 4-10 倍以上。

5.png

相对公有云中数仓服务 Databend Cloud 是一家更加开放的公司,可以给你提供多云无锁定服务,同时 Databend Cloud 也是基于 Databend 研发,Databend 也可以在现在市场上所有的公有云上实现私有化部署, 可以让用户实现零担心被云锁定问题。

Databend Cloud 适用于以下业务场景

Databend Cloud 主要定位在云上大数据存储及分析,从现在实际用户使用场景来看 Databend Cloud 给用户提供了:

  • 基于存算分离,可以实现计算层的独立扩容及收缩
  • 基于对象存储,帮助用户实现结构化和半结构化的高压缩存储
  • 提多云上服务体验统一
  • 计算分析能力强,用户数据不只存储,同时拥有灵活的计算能力
  • 基于 AI 实现的问答应用,智能客服等

6.jpeg

部分用户

7.png

阿里云对象存储如何帮助云原生数仓构建统一数据底座

阿里云对象存储已经为上万家客户提供了云上数据湖和数仓分析业务的支持,在此过程中,对象存储不断提升和演进数据湖存储能力,从 1.0 到 3.0 版本,其最终愿景是为上层分析的生态应用提供统一的、多协议接入的存储底座。

在过去的一年中,阿里云存储团队与云原生数仓 Databend Cloud 团队展开了深度合作,通过对象存储 OSS 支持 Databend 实现存算分离,一起迈向 Serverless 架构的未来。

8.png

在此过程中,双方在数据存储方面为客户带来了如下价值:

  • 稳定可靠: 采用多种高可靠技术,如校验,多可用区,跨 Region 复制实现数据不丢不错,保证数据的持续访问。
  • 安全可信: 通过多种数据加密技术,配合完善的权限管控能力,实现全链路的访问安全和存储安全。
  • 弹性伸缩: 以服务化的方式,按量付费,提供从零到上万亿对象和 EB 级存储空间的扩展性。
  • 极致性能: 可为客户提供 Tbps 级别吞吐带宽,优化海量小文件读写,单命名空间支持 50 亿文件。

在阿里云平台如何开通 Databend Cloud

Databend Cloud 现在已经上架阿里云市场,现在阿里云用户开通 Databend 也比较方便,开通的方法可以看 B 站视频👇

另外也可以通过阿里云 OSS 控制台中开通:

9.png

关于 Databend Cloud

Databend Cloud 是基于 Databend 实现上的云原生数仓 SAAS 产品,提供的一站式 SaaS 云数据平台,它具备:免安装、免运维,注册账号即可使用,按你的 SQL 查询按需按量付费,真正做到使用才付费,不查询不使用不付费的特点。它为用户提供了:

  • 存算分离,或是进一步算算分离: 资源弹性,按量付费
  • 同一份数据支持多个计算节点共同访问
  • 基于应用层做好数据加密
  • 多级存储,对用户透明
  • 支持数据 time travel ,可以让用户非常方便地访问数据任意时间点
  • 多云无锁定,统一用户体的大数据解决方案

Databend Cloud 正是基于以上的条件为用户定制一个多云,无锁定,高弹性,高性能,低成本的云上大数据解决方案。

👨‍💻‍ 海外官网: https://www.databend.com

💻 国内官网: https://www.databend.cn

📖 开源社区网站: https://docs.databend.cn

Github: https://github.com/databendlabs/databend

🎬 B 站: 搜 Databend,技术分享视频

分享本篇文章

订阅我们的新闻简报

及时了解功能发布、产品规划、支持服务和云服务的最新信息!