Zum Inhalt springen
_CORE
KI & Agentensysteme Unternehmensinformationssysteme Cloud & Platform Engineering Datenplattform & Integration Sicherheit & Compliance QA, Testing & Observability IoT, Automatisierung & Robotik Mobile & Digitale Produkte Banken & Finanzen Versicherungen Öffentliche Verwaltung Verteidigung & Sicherheit Gesundheitswesen Energie & Versorgung Telko & Medien Industrie & Fertigung Logistik & E-Commerce Retail & Treueprogramme
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Debezium — Change Data Capture für Echtzeit-Replikation

20. 09. 2023 1 Min. Lesezeit intermediate

Debezium erfasst Datenbankänderungen in Echtzeit. Jedes INSERT, UPDATE und DELETE wird ohne Belastung der Quelldatenbank an Kafka übertragen.

Change Data Capture

CDC liest das Transaktionslog (WAL, Binlog) — belastet die Quelldatenbank nicht.

{
  "name": "postgres-cdc",
  "config": {
    "connector.class": "io.debezium.connector.postgresql.PostgresConnector",
    "database.hostname": "postgres",
    "database.dbname": "app",
    "topic.prefix": "cdc",
    "table.include.list": "public.orders",
    "plugin.name": "pgoutput",
    "transforms": "unwrap",
    "transforms.unwrap.type": "io.debezium.transforms.ExtractNewRecordState"
  }
}

CDC → Data Lake

  • Debezium → Kafka
  • Flink/Spark → Verarbeitung
  • Delta/Iceberg/Hudi → Upsert

Zusammenfassung

Debezium ist der Standard für CDC im Kafka-Ökosystem. Nahezu Echtzeit-Replikation ohne Belastung der Quelldatenbank.

debeziumcdcReplikationkafka connect
Teilen:

CORE SYSTEMS Team

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.