Was ist etcd?

etcd ist ein verteilter Open-Source-Schlüssel-Werte-Speicher, der zum Speichern und Verwalten der entscheidenden Informationen verwendet wird, die verteilte Systeme benötigen. Vor allem verwaltet es die Konfigurationsdaten, Zustandsdaten und Metadaten für Kubernetes, die beliebte Container-Orchestrierungsplattform.

Wie alle verteilten Workloads haben auch containerisierte Workloads komplexe Verwaltungsanforderungen, die mit zunehmender Skalierung der Workload komplexer werden. Kubernetes vereinfacht den Prozess der Verwaltung dieser Workloads, indem Aufgaben wie Konfiguration, Bereitstellung, Serviceerkennung, Lastausgleich, Auftragsplanung und Zustandsüberwachung über alle Cluster hinweg koordiniert werden, die auf mehreren Maschinen an mehreren Standorten ausgeführt werden können.

Um diese Koordination zu erreichen, benötigt Kubernetes jedoch einen Datenspeicher, der zu jedem beliebigen Zeitpunkt eine einzige, konsistente Quelle mit Informationen über den Status des Systems (aller seiner Cluster und Pod und der darin enthaltenen Anwendungsinstanzen) bietet. etcd ist der Datenspeicher, der zum Erstellen und Verwalten dieser Version der Wahrheit verwendet wird.

etcd erfüllt eine ähnliche Rolle für Cloud Foundry – die Open-Source-Multicloud-Platform-as-a-Service (PaaS) – und ist eine praktikable Option für die Koordinierung entscheidender System- und Metadaten über Cluster jeder verteilten Anwendung hinweg. Der Name „etcd“ stammt von einer Namenskonvention innerhalb der Linux-Verzeichnisstruktur: In UNIX sind alle Systemkonfigurationsdateien für ein einzelnes System in einem Ordner namens „/etc“ enthalten; „d“ steht für „distributed“.

Die neuesten Tech-News – von Experten bestätigt

Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und mehr auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.

Warum etcd?

Es ist keine leichte Aufgabe, als Daten-Rückgrat zu dienen, das eine verteilte Workload am Laufen hält. Aber etcd ist für diese Aufgabe konzipiert und von Grund auf mit den folgenden Eigenschaften ausgestattet:

Vollständig repliziert: Jeder Knoten in einem etcd-Cluster hat Zugriff auf den gesamten Datenspeicher.
Hohe Verfügbarkeit: etcd ist so konzipiert, dass es keinen Single Point of Failure es toleriert Hardwareausfälle und Netzwerkpartitionen problemlos.
Zuverlässig konsistent: Jedes „Lesen“ von Daten gibt den letzten Datenschreibvorgang über alle Cluster zurück.
Schnell: etcd wurde mit 10.000 Schreibvorgängen pro Sekunde Benchmark.
Sicher: etcd unterstützt die automatische Authentifizierung von Transport Layer Security (TLS) und optional Secure Socket Layer (SSL) Client-Zertifikatsauthentifizierung. Da etcd wichtige und hochsensible Konfigurationsdaten speichert, sollten Administratoren rollenbasierte Zugriffskontrollen innerhalb der Bereitstellung implementieren und sicherstellen, dass Teammitglieder, die mit etcd interagieren, auf die am wenigsten privilegierte Zugriffsebene beschränkt sind, die für ihre Arbeit erforderlich ist.
Unkompliziert: Jede Anwendung, von einfachen Web-Apps bis hin zu hochkomplexen Container-Orchestrierungs-Engines wie Kubernetes, kann mit Standard-HTTP/JSON-Tools Daten in etcd lesen und schreiben.

Beachten Sie, dass die Leistung von etcd stark von der Geschwindigkeit der Speicherfestplatte abhängt und die Verwendung von SSDs in etcd-Umgebungen dringend empfohlen wird.

AI Academy

Ist Datenverwaltung das Geheimnis generativer KI?

Erfahren Sie, warum qualitativ hochwertige Daten für den erfolgreichen Einsatz generativer KI unerlässlich sind.

Zur Episode wechseln

Der Konsensalgorithmus Raft

etcd basiert auf dem Konsensalgorithmus Raf, um die Konsistenz der Datenspeicher auf allen Knoten in einem Cluster sicherzustellen – Tabellen-Stakes für ein fehlertolerantes verteiltes System.

Raft erreicht diese Konsistenz über einen gewählten Leader-Knoten, der die Replikation für die anderen Knoten im Cluster, die sogenannten Followers, verwaltet. Der Leader nimmt Anfragen von den Clients an, die er dann an die Follower-Knoten weiterleitet. Sobald der Leiter festgestellt hat, dass die Mehrheit der Follower-Knoten jede neue Anfrage als Log-Einträge gespeichert hat, wendet er den Eintrag auf seinen lokalen Zustandsmaschinen an und gibt das Ergebnis dieser Ausführung – einen Schreibvorgang – an den Client zurück. Wenn die Follower abstürzen oder Netzwerkpakete verloren gehen, versucht der Leader es erneut, bis alle Follower alle Log-Einträge einheitlich gespeichert haben.

Wenn ein Follower-Knoten innerhalb eines angegebenen Zeitintervalls keine Nachricht vom Leader empfängt, wird eine Wahl abgehalten, um einen neuen Leader zu wählen. Der Follower erklärt sich selbst zum Kandidaten, und die anderen Follower stimmen für ihn oder einen anderen Knoten, je nach Verfügbarkeit. Sobald der neue Leader gewählt ist, beginnt er mit der Verwaltung der Replikation, und der Prozess wiederholt sich. Dieser Prozess ermöglicht es allen etcd-Knoten, hochverfügbare, konsistent replizierte Kopien des Datenspeichers aufrechtzuerhalten.

etcd und Kubernetes

etcd gehört zu den Kern-Komponenten von Kubernetes und dient als primärer Schlüssel-Werte-Speicher für die Erstellung eines funktionierenden, fehlertoleranten Kubernetes-Clusters. Der Kubernetes-API-Server speichert die Zustandsdaten jedes Clusters in etcd. Kubernetes verwendet die „Watch“-Funktion von etcd, um diese Daten zu überwachen und sich bei Änderungen neu zu konfigurieren. Die Funktion „Watch“ speichert Werte, die den tatsächlichen und den idealen Zustand des Clusters repräsentieren, und kann eine Reaktion einleiten, wenn diese abweichen.

Einen Überblick über die Verwaltung von Clustern, Services und Worker-Knoten durch Kubernetes finden Sie in unserem Video „Kubernetes Explained“.

CoreOS und die Geschichte und Wartung von etcd

etcd wurde von demselben Team entwickelt, das für die Entwicklung von CoreOS Container Linux verantwortlich war, einem weit verbreiteten Container-Betriebssystem, das in großem Umfang effizient ausgeführt und verwaltet werden kann. Ursprünglich wurde etcd auf Raft aufgebaut, um mehrere Kopien von Container Linux gleichzeitig zu koordinieren und so einen ununterbrochenen Anwendungsbetrieb mit hoher Betriebszeit zu gewährleisten.

Im Dezember 2018 spendete das Team etcd an die Cloud Native Computing Foundation (CNCF), eine neutrale gemeinnützige Organisation, die den Quellcode, die Domänen, die gehosteten Dienste, die Cloud-Infrastruktur und anderes projektbezogenes Eigentum von etcd als Open Source Ressourcen für die Entwicklercommunity der containerbasierten Cloud betreut. CoreOS hat mit Red Hat fusioniert.

etcd vs. ZooKeeper vs. Consul

Andere Datenbanken wurden entwickelt, um koordinierte Informationen zwischen verteilten Anwendungsclustern zu verwalten. Die beiden am häufigsten mit etcd verglichenen sind ZooKeeper und Consul.

ZooKeeper

ZooKeeper wurde ursprünglich entwickelt, um Konfigurationsdaten und Metadaten in Apache Hadoop-Clustern zu koordinieren. (Apache Hadoop ist ein Open-Source-Framework bzw. eine Sammlung von Anwendungen zum Speichern und Verarbeiten großer Datenmengen auf Clustern handelsüblicher Hardware.) ZooKeeper ist älter als etcd und die Erkenntnisse aus der Arbeit mit ZooKeeper haben das Design von etcd beeinflusst.

Als Ergebnis verfügt etcd über einige wichtige Funktionen, die ZooKeeper nicht bietet. Im Gegensatz zu ZooKeeper kann etcd beispielsweise Folgendes:

Eine dynamische Rekonfiguration der Cluster-Mitgliedschaft erlauben.
Bleibt bei der Ausführung von Lese-/Schreibvorgängen unter hoher Last stabil.
Verwaltet ein Datenmodell zur Kontrolle des gemeinsamen Zugriffs auf mehreren Versionen.
Bietet eine zuverlässige Schlüsselüberwachung, bei der Ereignisse niemals ohne Benachrichtigung gelöscht werden.
Verwendet Parallelitätsprimitive, die Verbindungen von Sitzungen entkoppeln.
Unterstützt eine breite Palette an Sprachen und Frameworks (ZooKeeper verfügt über ein eigenes benutzerdefiniertes Jute RPC-Protokoll, das begrenzte Sprachbindungen unterstützt).

Consul

Consul ist eine Service-Networking-Lösung für verteilte Systeme, deren Funktionen irgendwo zwischen denen von etcd und dem Service-Mesh von Istio für Kubernetes liegen. Wie etcd umfasst Consul einen verteilten Schlüssel-Werte-Speicher, der auf dem Algorithmus Raft basiert und HTTP/JSON-Anwendungsprogrammierschnittstellen (APIs) unterstützt. Beide bieten eine dynamische Konfiguration der Cluster-Mitgliedschaft, aber Consul kontrolliert nicht so stark mehrere gleichzeitige Versionen von Konfigurationsdaten, und die maximale Datenbankgröße, mit der es zuverlässig funktioniert, ist kleiner.

etcd vs. Redis

Wie etcd ist auch Redis ein Open-Source-Tool, aber die grundlegenden Funktionen sind unterschiedlich.

Redis ist ein In-Memory-Datenspeicher und kann als Datenbank, Cache oder Nachrichtenbroker fungieren. Redis unterstützt eine größere Vielfalt an Datentypen und -strukturen als etcd und hat eine viel schnellere Lese-/Schreibleistung.

Aber etcd verfügt über eine höhere Fehlertoleranz, stärkere Failover- und kontinuierliche Datenverfügbarkeits-Funktionen und, was am wichtigsten ist, etcd speichert alle gespeicherten Daten auf einen Datenträger und opfert im Wesentlichen Geschwindigkeit zugunsten einer höheren Zuverlässigkeit und garantierten Konsistenz. Aus diesen Gründen eignet sich Redis besser als verteiltes Speicher-Caching-System als zum Speichern und Verteilen von Systemkonfigurationsinformationen.

3D-Rendering einer Spirale aus mehreren nebeneinander angeordneten Symbolen, darunter eine Kamera, ein Lautstärkeregler und ein Klemmbrett

Lesen Sie den Leitfaden für Data Leader, um zu erfahren, wie Sie die Daten Ihres Unternehmens KI-fähig machen können.

Ressourcen

3D-Rendering mehrerer nebeneinander angeordneter Symbole, darunter ein Mikrofon und eine Kamera

KI-Agenten arbeiten mit Daten – sind Ihre bereit dafür?

Ihre Daten sind Ihr Wettbewerbsvorteil. Erfahren Sie in diesem kurzen Webinar, wie Sie die KI sicher nutzen und einen messbaren ROI erzielen können.

Infos zu Datenverwaltung

Techsplainers von IBM erklärt die Grundlagen von Daten für KI, von Schlüsselkonzepten bis hin zu realen Anwendungsfällen. Klare, kurze Folgen helfen Ihnen, die Grundlagen schnell zu erlernen.

3D-Rendering von mehreren aneinandergereihten Symbolen wie einem Lautstärkeregler und einem Klemmbrett

Daten zur Skalierung Ihrer KI vereinheitlichen und zugänglich machen

Erfahren Sie, warum der Weg zu KI-fähigen Daten oft mit dem effektiven Zugriff auf strukturierte und unstrukturierte Daten beginnt und welche Herausforderungen Datenverantwortlichen im Wege stehen können.

Juristischer Aufwand wird zu strategischer Erkenntnis

Erfahren Sie, wie ein KI-gestützter Rechtsagent die Entscheidungsfindung beschleunigt, manuelle Arbeit reduziert und die Compliance verbessert.

Zwei Männer, die in einem Podcast miteinander sprechen

AI Akademy: Aufbau einer Datenstrategie für Unternehmens-KI

In dieser Folge erklärt Cathy Reese, dass Unternehmen heute eine Datenstrategie benötigen, die für fortschrittliche KI bereit ist, was bedeutet, dass sie ihre qualitativ hochwertigsten Datenressourcen nutzen müssen.

3D-Darstellung mehrerer nebeneinander angeordneter Symbole, wie z. B. einer Kamera und Papierfliegern

Das hybride, offene Data Lakehouse für KI

Vereinfachen Sie den Datenzugriff und automatisieren Sie die Data Governance. Entdecken Sie die Vorteile einer Data-Lakehouse-Strategie für Ihre Datenarchitektur, einschließlich der Kostenoptimierung Ihrer Workloads und der Skalierung von KI und Analysen, mit all Ihren Daten, überall.

Cost of a Data Breach Report 2025

Die Kosten für Datenschutzverletzungen haben einen neuen Höchststand erreicht. Erhalten Sie aktuelle Erkenntnisse hinsichtlich Cybersicherheit und deren finanziellen Auswirkungen auf Unternehmen.

3D-Rendering von zwei Reihen mit verschiedenen Symbolen, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage

Der Leitfaden für Data Leader zu KI-fähigen Daten

Erfahren Sie, welche umsetzbaren Schritte Datenverantwortliche unternehmen können, um Datenherausforderungen zu überwinden, die Grundlage für eine vertrauenswürdige Datenbasis zu schaffen und die Daten ihres Unternehmens auf die KI vorzubereiten.

3D-Rendering mehrerer nebeneinander angeordneter Symbole, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage

How the C-suite is turning information into impact

Erkunden Sie in diesem branchenübergreifenden Bericht für Datenverantwortliche die Erkenntnisse von 1.700 CDOs.

Weiterführende Lösungen

IBM® StreamSets

Erstellen und verwalten Sie intelligente Streaming-Datenpipelines über eine intuitive grafische Benutzeroberfläche, die eine nahtlose Datenintegration in Hybrid- und Multicloud-Umgebungen ermöglicht.

StreamSets erkunden

IBM watsonx.data

Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.

IBM watsonx.data entdecken

Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting® und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Analyse-Services entdecken

Machen Sie den nächsten Schritt

Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.

Was ist etcd?

Was ist etcd?

Die neuesten Tech-News – von Experten bestätigt

Vielen Dank! Sie haben sich angemeldet.

Warum etcd?

Ist Datenverwaltung das Geheimnis generativer KI?

Der Konsensalgorithmus Raft

etcd und Kubernetes

CoreOS und die Geschichte und Wartung von etcd

etcd vs. ZooKeeper vs. Consul

ZooKeeper

Consul

etcd vs. Redis

Ressourcen