DataHub zentralisiert Metadaten aus dem gesamten Data Stack — automatisches Lineage, Suche, Tagging und Governance.
DataHub — Zentraler Hub für Metadaten¶
Löst das Problem — wo Daten zu finden sind und wie man ihnen vertrauen kann.
Funktionen¶
- Automatische Ingestion — 50+ Konnektoren
- Lineage — automatische Abhängigkeitszuordnung
- Suche — Volltextsuche
- Ownership — Eigentümer zuweisen
# datahub-ingestion.yml
source:
type: postgres
config:
host_port: "warehouse:5432"
database: analytics
profiling:
enabled: true
sink:
type: datahub-rest
config:
server: "http://datahub:8080"
Zusammenfassung¶
DataHub ist der führende Open-Source-Katalog mit automatischem Lineage und umfangreichen Integrationen.
datahubdata catalogmetadatalineage