DuckDB ist das SQLite fuer Analytik – eine eingebettete spaltenorientierte Datenbank ohne Server. Gigabytes an Daten mit einer Geschwindigkeit, die mit Spark konkurriert.
DuckDB – Analytik ohne Infrastruktur¶
In-Process OLAP ohne Server – laeuft in Ihrer Anwendung.
import duckdb
result = duckdb.sql("""
SELECT region, COUNT(*) AS orders, SUM(total_czk) AS revenue
FROM 'data/orders/*.parquet'
WHERE order_date >= '2026-01-01'
GROUP BY region ORDER BY revenue DESC
""").fetchdf()
# Verschiedene Formate ohne Import
duckdb.sql("SELECT * FROM 'data.csv' LIMIT 10")
duckdb.sql("SELECT * FROM 's3://bucket/*.parquet'")
Wann DuckDB verwenden¶
- Lokale Analyse – Ad-hoc-Abfragen
- Prototyping – SQL-Tests
- CI/CD – dbt lokal testen
- Data Science – SQL in Jupyter
Zusammenfassung¶
DuckDB ist revolutionaer fuer lokale Analytik. Zero Setup, SQL ueber Dateien, Integration mit pandas.
duckdbolapembeddedanalytics