…ark: Into the CSV Abyss – DuckDB](https://duckdb.org/2025/04/16/duckdb-csv-pollock-benchmark.html) DuckDB 尽可能的以兼容方式来读取 CSV 的方法: sql FROM readcsv('cafes.csv', strictmode = false,…
[[ Duckdb ]]
4 篇文章提到了此关键词
…ud-services-31538a356db2) 来自 @tison1096 的文章,如果经常在推上看到各种数据库的相关信息,可以看到大家都在基于 Cloud 提供的基础设施来构建,比如之前提到 DuckDB 可以直接从 S3 读取数据。这篇文章对我来说是一个很好的 101。Shared Nothing , Shared Disk,随着 Cloud native 发展 Shared Nothing 面临的…
…tions/python) 处理 Excel 方式对比,Calamine 最快,但是只读不能写,pandas/Tablib 相对慢一些,但是支持多种格式。感觉之后如果简单的数据分析需求,还是应该考虑 DuckDB。 --- [X 上的 Jake Ward:“We pulled off an SEO heist that stole 3.6M total traffic from a competitor.…
…lysis/) 作者有一个较大的 json 文件,使用 jq 配合 parallel 来处理,后来选择了 Dask 来处理,处理之后可以使用 Python 来进行数据操作。也许应该考虑 DuckDB 来操作,看过的例子都是不错。 --- [The Ruff Formatter: An extremely fast, Black-compatible Python formatter](htt…