OpenSearch ist eine Open Source-Such- und Analytics Engine, die zum Indizieren, Abfragen und Analysieren von Daten aus einer Vielzahl von Datenquellen verwendet wird.
Basierend auf Apache Lucene und ursprünglich abgeleitet von Elasticsearch– einer weiteren Such- und Analytics Engine – bietet OpenSearch eine skalierbare und verteilte Architektur für Echtzeitsuche, Observability, Analyse und Sicherheitsanalyse-Anwendungsfälle.
OpenSearch umfasst OpenSearch-Dashboards zur Datenvisualisierung und Anwendungsüberwachung. Es verfügt außerdem über ein breites Ökosystem von Plugins, Programmierschnittstellen (APIs) und Clients, die Workflows in modernen Datenumgebungen für die Analyse unterstützen.
Da OpenSearch als Open Source-Projekt mit einer von der Community gesteuerten Roadmap entwickelt wird, können Unternehmen OpenSearch ohne Lizenzbeschränkungen oder Anbieterbindung nutzen. Die Kompatibilität mit früheren Versionen von Elasticsearch – zusammen mit dem erweiterbaren Framework – ermöglicht es Teams, OpenSearch als flexible Analytics-Engine für operative Workloads, maschinelles Lernen und Anwendungen zu nutzen.
Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und mehr auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.
Heutige Unternehmen erzeugen erhebliche Datenmengen, die von unschätzbarem Wert sein können, aber nur, wenn die Daten indexiert, durchsuchbar und in Echtzeit verfügbar sind. OpenSearch bietet diese Funktionalität über eine Open-Source-Sucharchitektur, die auf Skalierbarkeit, Kosteneffizienz und Interoperabilität ausgelegt ist.
In der Praxis bietet OpenSearch Folgendes:
Unternehmen erhalten vollen Einblick in die Codebasis und Roadmap von OpenSearch, sodass sie die Plattform an interne Anforderungen anpassen können.
OpenSearch pflegt die Kompatibilität der API- und Abfragesyntax mit Open-Source-Elasticsearch, was bedeutet, dass Unternehmen Workloads ohne umfangreiche Neuschreibvorgänge übernehmen oder modernisieren können.
Seine Clusterarchitektur unterstützt hohe Verfügbarkeit über Knoten, Replikate und Shards und ermöglicht so eine Suche mit geringer Latenz über große Datensätze (weitere Details siehe Wie OpenSearch funktioniert).
OpenSearch kann Logdateien, Metriken und Traces in großem Maßstab aufnehmen und so die operativen Dashboards für die Fehlersuche und Analyse bereitstellen.
Mit integrierter Authentifizierung und Zugriffskontrolle können Teams Suchfunktionen über Sicherheits-Workloads hinweg anwenden.
Als Open-Source-Software kann OpenSearch lokal, über Cloud-Provider oder durch Managed-Service-Angebote bereitgestellt werden.
OpenSearch entstand als Reaktion der Community auf die Lizenzänderungen bei Elasticsearch und Kibana, einer beliebten Visualisierungsschicht. Frühere Versionen von Elasticsearch wurden unter der Apache 2.0-Lizenz veröffentlicht, spätere Versionen verwendeten jedoch die Server Side Public License (SSPL) und die Elastic License. Diese Lizenzen schränkten die Wiederverwendung von Open Source ein und stellten Unternehmen, die sich auf frei einsetzbare und weiterverteilbare Such-Software verließen, vor Herausforderungen.
Um ein offenes Suchökosystem zu erhalten, hat Amazon Web Services (AWS) die letzten Apache 2.0-Versionen von Elasticsearch und Kibana geforkt (d. h. eine unabhängige Kopie davon erstellt) und damit das OpenSearch-Projekt ins Leben gerufen. Das Projekt führte neue Funktionen und Verbesserungen im Rahmen eines offenen Governance-Modells ein und erweiterte die Kompatibilität mit Elasticsearch-APIs und Clientbibliotheken, um die Migration zu vereinfachen.
Seitdem hat sich das OpenSearch-Projekt unabhängig weiterentwickelt. Es zeichnet sich durch eine gemeinschaftlich entwickelte Roadmap, Beiträge von verschiedenen Anbietern und ein wachsendes Ökosystem von Plugins aus, die auf GitHub gehostet werden. OpenSearch ist zwar weiterhin mit vielen Elasticsearch-Mustern kompatibel, hat aber seinen Funktionsumfang durch Plugins für die Vektorsuche, die Erkennung von Anomalien und fortgeschrittene Observability-Tools erweitert.
Obwohl beide Projekte einen gemeinsamen Ursprung haben, trennen sich ihre Wege. Elasticsearch wird unter SSPL und Elastic License mit einer proprietären Feature-Entwicklungsstrategie fortgeführt. OpenSearch hingegen bleibt Apache 2.0-lizenziert und legt Wert auf Offenheit, Erweiterbarkeit und operative Sichtbarkeit. Als Ergebnis bewerten Unternehmen, die zwischen den beiden Modellen wählen, nun nicht nur die Funktionen, sondern auch die Governance-Modelle, die Lizenzbedingungen und die langfristige Ausrichtung des Ökosystems.
Kompatibilität bleibt eine wichtige Brücke zwischen den Projekten: OpenSearch unterstützt weiterhin viele Elasticsearch-APIs, Abfragemuster und Client-Bibliotheken aus früheren Versionen und hilft Teams bei der Migration mit minimaler Refaktorisierung. Außerdem werden ähnliche Repository-Strukturen und Indexformate beibehalten, so dass Benutzer, die von Elasticsearch umsteigen, mit dem System vertraut bleiben.
OpenSearch basiert auf einer verteilten Architektur, die auf Skalierbarkeit und Leistung ausgelegt ist. Zu den Kernkomponenten gehören Cluster, Knoten, Indizes, Shards und Dokumente – alle arbeiten zusammen, um Daten effizient zu speichern und abzurufen.
Knoten sind Server oder containerisierte Instanzen, die Indizierungs-, Abfrage- und Speicheroperationen durchführen. Zu den gängigen Knotentypen gehören:
Ein Cluster ist eine Sammlung von einem oder mehreren Knoten, die zusammenarbeiten, um Daten zu verwalten und Abfragen auszuführen. Cluster bieten Redundanz und Lastenausgleich, sodass Knotenausfälle die Gesamtleistung nicht beeinträchtigen. Jeder Cluster verwaltet Metadaten zu Indizes, Shards und Routing-Informationen.
Ein Index ist ein logischer Namensraum, der einer relationalen Datenbanktabelle ähnelt. Er enthält Zuordnungen, die die Struktur von JSON-Dokumenten definieren, sowie Verweise auf die Shards, die diese Dokumente speichern. Der Begriff „Index“ wird auch als Verb verwendet, um den Vorgang des Füllens eines Index mit Daten zu beschreiben.
Dokumente sind JSON-Objekte, die einzelne Datensätze repräsentieren. Einfach ausgedrückt, es sind die Daten, die gespeichert und gesucht werden. Beim Indexieren werden Felder in jedem Dokument analysiert, tokenisiert und in invertierten Indizes gespeichert.
Shards sind die grundlegenden Speichereinheiten in OpenSearch, in denen Dokumente abgelegt werden. Jeder Index besteht aus primären Shards und optionalen Replika-Shards.
Da jeder Shard eine eigenständige Lucene-Instanz (eine eigenständige Suchmaschinenbibliothek) ist, verteilt OpenSearch Shards über Knoten hinweg, um Suchoperationen zu parallelisieren und die Leistung zu skalieren.
Und wie passt das alles zusammen? Wenn ein Dokument indexiert wird, analysiert OpenSearch den Inhalt und verwendet Textanalysatoren und Tokenizer. Nach der Verarbeitung werden die Terme in den entsprechenden Shard geschrieben.
Die Indexierung erfolgt durch Datenknoten und kann für Geschwindigkeit und Zuverlässigkeit über den gesamten Cluster verteilt werden. Abfragen werden dann an einen koordinierenden Knoten gesendet, der die Shards mit relevanten Daten identifiziert, die Abfrage an diese weiterleitet und die Ergebnisse aggregiert.
Denken Sie daran als eine Restaurantküche mit verschiedenen Stationen. Die Indexierung ist wie das Vorbereiten von Zutaten und das Versenden dieser an die richtige Station, damit alles bereit ist, wenn die Bestellung eingeht. Wenn eine Anfrage eingeht, fungiert der Knoten als Vermittler – er ruft die benötigten Informationen auf, sammelt die Beiträge der einzelnen Stationen und liefert ein fertiges Gericht.
OpenSearch bietet integrierte Funktionen für Suche, Analyse und Observability. Plugins und Erweiterungen erweitern den Funktionsumfang, sodass Teams die Plattform an spezielle Workloads anpassen können.
Obwohl nicht vollständig, ermöglichen diese beliebten Erweiterungen Analyse, maschinelles Lernen (ML) und Observability-Szenarien:
Unternehmen, die eine verwaltete Erfahrung bevorzugen, können auch den Amazon OpenSearch Service nutzen, der Skalierung, Backups, Knotenaustausch und Wartung für OpenSearch-Cluster auf AWS automatisiert.
OpenSearch Dashboards ist die Visualisierungs- und Analyseoberfläche für OpenSearch. Es bietet eine interaktive Umgebung zum Erkunden von indexierten Daten, zum Erstellen von Visualisierungen und zur Erstellung von operativen Dashboards, die in Observability, Sicherheitsanalyse und Anwendungs-Workflows verwendet werden. So können Teams beispielsweise Dashboards nutzen, um Trends in Metriken zu visualisieren und Anomalien nahezu in Echtzeit zu untersuchen.
OpenSearch Dashboards unterstützt die Erstellung von Diagrammen, Tabellen, Karten, Notizbüchern und benutzerdefinierten Panels. Es enthält auch Funktionen zur Optimierung der Analyse. Notizbücher ermöglichen es den Nutzern, Visualisierungen und Text zu einer einzigen Erzählung zu kombinieren, während operative Panels Observability-Visualisierungen, die mit der Piped Processing Language erstellt wurden, in eine einheitliche Darstellung organisieren.
Da OpenSearch Dashboards die gleiche Benutzeroberfläche (UI) wie Kibana besitzt, empfinden viele Datenteams den Workflow als vertraut. Es wurde jedoch im Rahmen seiner eigenen Roadmap entwickelt und beinhaltet Funktionen, die den breiteren OpenSearch-Funktionsumfang widerspiegeln.
OpenSearch unterstützt eine Vielzahl von Anwendungsfällen in verschiedenen Branchen, darunter:
Teams indizieren Protokolle von Anwendungen, Infrastruktur und Cloud-Services, um Leistungsprobleme zu analysieren und Ausfälle zu beheben. OpenSearch unterstützt die Aufnahme großer Datenmengen und Echtzeitanalysen, wodurch es sich für verteilte Produktionssysteme wie beispielsweise multinationale E-Commerce-Websites eignet.
Mit Unterstützung für Metriken, Protokolle und Traces bietet OpenSearch eine integrierte Observability-Plattform. Trace Analytics visualisiert Service-Interaktionen, während Anwendungsanalysen Telemetrie korrelieren, um Systemverhalten zu verstehen und Latenz oder Ausfälle genau zu bestimmen. Dashboards und PPL-Abfragen ermöglichen es Teams, Probleme schnell zu untersuchen und wiederverwendbare operative Ansichten zu erstellen.
Die Erkennung von Anomalien und die ML-Algorithmen von OpenSearch ermöglichen Unternehmen, Such- und Analyse-Techniken in allen Sicherheitsabläufen anzuwenden. Teams nutzen es, um ungewöhnliche Muster in Authentifizierungsprotokollen oder Anwendungsverhalten zu erkennen sowie Benachrichtigungen auszulösen, wenn Bedingungen oder Schwellenwerte erfüllt sind.
Organisationen nutzen OpenSearch als Suchmaschine hinter Websites, Produktkatalogen und Unternehmensinhaltssystemen. Volltextsuche, Autovervollständigung, Phrasenabgleichen und Vektorsuche unterstützen eine Vielzahl von Anwendungsfällen für Nutzererfahrung und Empfehlungen.
OpenSearch Dashboards bietet interaktive Visualisierungen, Berichte und Notizbücher, die Teams dabei helfen, Daten zu erkunden, Trends zu überwachen, KPIs zu verfolgen und Erkenntnisse mit Stakeholdern zu teilen.
Mit ML Commons können Teams modellgesteuerte Operationen innerhalb von OpenSearch ausführen, wie Cluster, Klassifikation und Forecasting. Diese Funktionen unterstützen Anwendungsfälle wie Betrugserkennung, Nachfragevorhersage, Kundensegmentierung und Anreicherung von nachgelagerten Datenpipelines.
Erhalten Sie zuverlässige Antworten mit kontextbezogenen KI-Agenten, die auf kontrollierten und vernetzten Daten basieren – ohne Umstellung auf eine neue Plattform oder Bindung an einen Anbieter.
Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.
Erfolgreiches Skalieren von KI mit der richtigen Strategie, Datensicherheit und Governance.