博客

Databend 开源周报第 148 期

Databend Labs6月 10, 2024

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持 ORC 文件加载

ORC(Optimized Row Columnar)格式是一种高效的列存储格式,广泛应用于数据分析领域。

Databend 现已支持对 ORC 文件进行查询、加载和转换,帮助用户获得更快的查询性能和更高的压缩率。

下面的示例展示了如何查询位于 Stage 中的 ORC 格式文件:

-- Create a ORC file format
CREATE OR REPLACE FILE FORMAT orc_ff TYPE = 'ORC';


SELECT *
FROM @orc_data_stage (
FILE_FORMAT => 'orc_ff',
PATTERN => '.*[.]orc'
) t
LIMIT 10;

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Beyond the Code

一起来探索 Databend 社区和周边生态中的新鲜事。

Toco 使用 Databend Cloud 应对大数据挑战

随着 Toco 业务在欧洲的扩展,面临的数据处理需求急剧增加。Toco 希望数据库解决方案能够访问 S3 Buckets 处理数据文件,并具备计算与存储分离架构,以提供灵活和可靠的数据分析方案。

Databend Cloud 以其卓越的计算与存储分离架构和全面的对象存储服务支持(超过 20 种)被 Toco 选中。此外,Databend Cloud 的 STAGE 支持使得用户可以轻松地加载和导出数据,进行查询,无需复杂的表创建或数据导入过程。

目前 Databend Cloud 为 Toco 提供从数据获取与处理到数据访问与展示的全面支持。

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

Blog | Customer Success Story: Toco Chooses Databend Cloud to Tackle Big Data Challenges

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持
    task_history
    函数。
  • 为 show indexes 增加倒排索引相关信息。
  • 新增 databend-metaverifier 实用程序。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

RFC:使用
error-stack
增强错误处理

当前流行的错误处理主要是通过枚举类型树和

From
trait 实现,这导致难以追踪源自同一错误源的不同错误,缺乏错误跟踪信息,并且错误类型通常局限于单个 crate 的层面。

我们计划用

error-stack
替换现有的错误处理实践。这个 crate 能够详细追踪错误所有细节,并且能够在多线程或异步环境中跟踪错误,无需
async-backtrace

下面是

error-stack
的错误消息示例:

Error: a fatal error has occurred in the main loop
├╴at src/main.rs:11:51

├─▶ failed to read index file: index.txt
│ ╰╴at src/main.rs:29:35

╰─▶ No such file or directory (os error 2)
╰╴at src/main.rs:29:3

Issue #15741 | RFC: Enhancing Error Handling in Rust with

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!

New Contributors

一起认识社区中的新伙伴,Databend 因你们而变得更加美好。

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:https://github.com/datafuselabs/databend/releases

分享本篇文章

订阅我们的新闻简报

及时了解功能发布、产品规划、支持服务和云服务的最新信息!