博客
Databend 开源周报第 99 期
Databend Labs6月 26, 2023
英文版移步:https://www.databend.com/blog/2023-06-25-databend-weekly
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。
What's On In Databend
探索 Databend 本周新进展,遇到更贴近你心意的 Databend。
Flink CDC
Apache Flink CDC(Change Data Capture)是指 Apache Flink 使用基于 SQL 的查询从各种来源捕获和处理实时数据更改的能力。CDC 允许监视和捕获数据库或流系统中发生的数据修改(插入、更新和删除),并对这些更改进行实时响应。
Databend 现在提供 Flink SQL Connector,可以将 Flink 的流处理能力与 Databend 集成。通过对连接器进行配置,可以以流的形式从各种数据库中捕获数据更改,并将其载入到 Databend 中以进行实时处理和分析。
如果你想要了解更多信息,请查看下面列出的资源。
Code Corner
一起来探索 Databend 和周边生态中的代码片段或项目。
Databend 的 Python 绑定支持注册外部表
Databend 的 Python 绑定 现在支持注册外部表。你可以使用以下函数在 Python 绑定中注册外部表:
register_parquet
register_ndjson
register_csv
register_tsv
下面的例子展示了如何使用
register_parquet
ontime
from databend import SessionContext
ctx = SessionContext()
ctx.register_parquet("ontime", "./ontime/", pattern = ".*.parquet")
df = ctx.sql("select * from ontime limit 10").collect()
print(df)
这段代码将位于
./ontime/