Zum Inhalt springen
_CORE
KI & Agentensysteme Unternehmensinformationssysteme Cloud & Platform Engineering Datenplattform & Integration Sicherheit & Compliance QA, Testing & Observability IoT, Automatisierung & Robotik Mobile & Digitale Produkte Banken & Finanzen Versicherungen Öffentliche Verwaltung Verteidigung & Sicherheit Gesundheitswesen Energie & Versorgung Telko & Medien Industrie & Fertigung Logistik & E-Commerce Retail & Treueprogramme
Referenzen Technologien Blog Know-how Tools
Über uns Zusammenarbeit Karriere
CS EN DE
Lassen Sie uns sprechen

Hadoop ekosystém — HDFS, YARN a moderní alternativy

05. 04. 2025 1 Min. Lesezeit intermediate

Hadoop hat die Aera von Big Data eingeleitet. MapReduce wurde durch Spark ersetzt, HDFS durch Cloud Storage, aber die Prinzipien bleiben bestehen.

Hadoop – von der Revolution zur Evolution

HDFS

  • Block Storage – Bloecke mit 128 MB
  • Replikation – 3 Kopien
  • Data Locality – Compute bei den Daten

Von Hadoop zur Cloud

  • HDFS -> S3/GCS – elastischer Storage
  • MapReduce -> Spark – 100x schneller
  • YARN -> Kubernetes
  • Hive -> Trino – interaktives SQL
CREATE EXTERNAL TABLE orders (
    order_id STRING,
    total_czk DECIMAL(12,2)
) STORED AS PARQUET
LOCATION 'hdfs:///data/orders/';

SELECT YEAR(order_date) AS jahr,
       SUM(total_czk) AS umsatz
FROM orders GROUP BY YEAR(order_date);

Zusammenfassung

Hadoop hat die Grundlagen von Big Data gelegt. Moderne Architektur ersetzt seine Komponenten durch Cloud-Dienste.

hadoophdfsyarnbig data
Teilen:

CORE SYSTEMS Team

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.