Zum Inhalt springen
_CORE
KI & Agentensysteme Unternehmensinformationssysteme Cloud & Platform Engineering Datenplattform & Integration Sicherheit & Compliance QA, Testing & Observability IoT, Automatisierung & Robotik Mobile & Digitale Produkte Banken & Finanzen Versicherungen Öffentliche Verwaltung Verteidigung & Sicherheit Gesundheitswesen Energie & Versorgung Telko & Medien Industrie & Fertigung Logistik & E-Commerce Retail & Treueprogramme
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Great Expectations — automatizovaná validace kvality dat

08. 08. 2025 1 Min. Lesezeit intermediate

Great Expectations ermoeglicht es, Erwartungen an Ihre Daten zu definieren, zu testen und zu dokumentieren. Es generiert automatisch Dokumentation und integriert sich mit Airflow, Spark und pandas.

Warum Datenqualitaet validieren

Great Expectations definiert Regeln und ueberprueft sie automatisch bei jedem Pipeline-Lauf.

import great_expectations as gx

context = gx.get_context()
validator = context.get_validator(batch_request=batch_request)
validator.expect_column_values_to_be_unique("order_id")
validator.expect_column_values_to_not_be_null("customer_id")
validator.expect_column_values_to_be_between(
    "total_czk", min_value=0, max_value=10_000_000
)
validator.save_expectation_suite()

Integration mit Airflow

def validate_data():
    context = gx.get_context()
    result = context.run_checkpoint("daily_orders")
    if not result.success:
        raise ValueError("Datenqualitaetspruefung fehlgeschlagen!")

extract >> validate_task >> transform

Zusammenfassung

Great Expectations ist der Standard fuer automatisierte Datenvalidierung in Python-Pipelines.

great expectationsdata qualityvalidacetesting
Teilen:

CORE SYSTEMS Team

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.