Cloudbasierte Datenspeicher für Geschäftsdaten – insbesondere Big Data – steht heute ganz oben auf der Agenda, unabhängig davon, ob Sie sich darauf verlassen, um Routinegeschäfte zu erledigen oder um bestimmte Aufgaben zu erfüllen.
Daten steuern viele Geschäftsfunktionen – von der Erstellung gezielter Programme für Kunden und Interessenten über die Optimierung von Herstellungs- und Betriebsprozessen bis hin zur Entwicklung, Prüfung, Verteilung und Verfolgung von Virentests und Impfungen. Moderne Unternehmen verlassen sich auf die Verfügbarkeit der benötigten Daten, wenn sie sie benötigen. Es ist jedoch keine leichte Aufgabe, die beste Option für Ihre Bedürfnisse zu finden und kann mehrere verschiedene Arten von Repositorys für verschiedene Kategorien umfassen.
Beginnen wir mit den Grundlagen und gehen wir dann auf einige Beispiele dafür ein, wie ein Datenspeicher oder viele Arten von Datenspeichern für die Bedürfnisse Ihres Unternehmens erforderlich sein können.
Heutzutage gibt es drei verschiedene Arten von Cloud-Speicher-Repositorys, die jeweils einem anderen Zweck dienen, um eine bestimmte Adresse zu decken:
Ein Data Lake ist ein großes Repository mit Rohdaten, entweder unstrukturiert oder halbstrukturiert. Diese Daten werden aus verschiedenen Quellen aggregiert und einfach gespeichert. Sie werden nicht so verändert, dass sie einem bestimmten Zweck entsprechen oder in ein bestimmtes Format passen. Die Vorbereitung dieser Daten für die Analyse ist mit einer zeitaufwändigen Aufbereitung, Bereinigung und Neuformatierung der Daten verbunden, um sie zu vereinheitlichen. Data Lakes sind großartige Ressourcen für Kommunen oder andere Unternehmen, die Informationen zu Betriebsunterbrechungen, Datenverkehr, Kriminalität oder demografischen Daten speichern. Die Daten könnten zu einem späteren Zeitpunkt verwendet werden, um die Budgets und Ressourcen des DPW oder der Notfalldienste zu aktualisieren.
Ein Data Warehouse ist eine Aggregation von Daten aus vielen Quellen in einem einzigen, zentralen Repository, das die Datenqualitäten und das Format vereinheitlicht und es für Data Scientists bei Data Mining, künstlicherIntelligenz (KI), maschinellem Lernen und letztendlich in der Geschäftswelt nützlich macht Analysen und Business Intelligence. Eine Großstadt könnte Data Warehousing nutzen, um elektronische Transaktionen verschiedener Abteilungen zusammenzufassen, darunter Strafzettel für zu schnelle Fahrten, Hundeführerscheine, Verbrauchsteuerzahlungen und andere Transaktionen. Diese strukturierten Daten würden von der Stadt analysiert, um Folgerechnungen zu stellen und die Umfragedaten und die Polizeiprotokolle zu aktualisieren. Es könnte auch von einem Entwickler genutzt werden, um Terabytes an Daten zu sammeln, die von Sensoren an Autos generiert werden, um die Entscheidungsfindung für eine Lösung für autonomes Fahren zu unterstützen.
Ein Data Mart ist ein Teilbereich eines Data Warehouse, der einer bestimmten Gruppe von Benutzern innerhalb eines Unternehmens oder einer Geschäftseinheit zugute kommt. Ein Data Mart könnte von der Marketingabteilung eines Produktionsunternehmens verwendet werden, um die ideale demografische oder Persona-Zielgruppe zu bestimmen und so die Entwicklung von Marketingplänen zu unterstützen. Er könnte auch von einer Fertigungsabteilung genutzt werden, um Leistung und Fehlerraten zu analysieren und so kontinuierliche Verbesserungen zu ermöglichen. Datensätze innerhalb eines Data Mart werden oft in Echtzeit genutzt, um aktuelle Analysen und umsetzbare Ergebnisse zu erzielen.
Obwohl alle drei Arten von Cloud-Datenspeichern Daten enthalten, bestehen sehr deutliche Unterschiede zwischen ihnen. Ein Data Warehouse und ein Data Lake sind beispielsweise beides große Datenansammlungen, aber ein Data Lake ist in der Regel kostengünstiger zu implementieren und zu warten, da er weitgehend unstrukturiert ist.
Die Data-Lake-Architektur hat sich in den letzten Jahren weiterentwickelt, um größere Datenmengen und Cloud-Computing zu unterstützen. Große Datenmengen werden von mehreren Datenquellen an einem zentralen Ort empfangen.
Ein Data Warehouse kann auf drei Arten strukturiert sein:
Daten in einem Data Warehouse können für verschiedene Zwecke einfacher genutzt werden als Daten in einem Data Lake. Der Grund dafür ist, dass ein Data Warehouse strukturiert ist und leichter extrahiert oder analysiert werden kann.
Ein Data Mart hingegen enthält eine geringere Datenmenge als ein Data Lake und ein Data Warehouse, und die Daten sind für einen bestimmten Verwendungszweck oder nach einer bestimmten Bevölkerungsgruppe oder Geschäftsbereich kategorisiert. Ein Data Mart kann in vielen verschiedenen Formaten (Stern, Schneeflocke oder Vault) existieren, die durch die logische Struktur der Daten definiert sind, wobei eine Vault-Struktur flexibler, skalierbarer und agiler ist als die anderen Formate.
Es gibt drei Arten von Data Mart:
Für welche Art von Datenspeicher Sie sich entscheiden und wie er aufgebaut ist, hängt vor allem von den Bedürfnissen und Anforderungen Ihres Unternehmens ab. Wenn es für Ihr Unternehmen sinnvoll ist, profitieren Sie von den Vorteilen der auf Hybrid Clouds basierenden Speicherung für mehr Flexibilität, Skalierbarkeit und einen breiteren, fundierten Ansatz zur Problemlösung und Entscheidungsfindung.
Ein großes multinationales Fertigungsunternehmen generiert große Datenmengen für verschiedene Zwecke. Einige der Daten sind wichtig, während andere Daten in Zukunft möglicherweise einen Zweck haben oder nicht. Das Unternehmen nutzt ein cloudbasiertes Data Warehouse für die Speicherung von Massendaten, was günstiger ist als andere Datenspeicheroptionen. Das Unternehmen verfügt jedoch auch über abhängige Data Marts für bestimmte Geschäftsbereiche, die Wert für Geschäftsanwender in Abteilungen wie Finanzen, Fertigung und Marketing bieten. Jeder dieser Marts enthält Daten, die für einen bestimmten Verwendungszweck bestimmt und so formatiert sind, dass sie leicht analysiert werden können. Einige Beispiele:
Eine große Gemeinde benötigt eine erschwingliche Lösung, die Daten auf erschwingliche und einigermaßen nutzbare Weise bereitstellt. Die Stadtverwaltung nutzt einen Data Lake in der Cloud, um Verkehrsdaten zu verwalten. Das Unternehmen kann es sich im Moment nicht leisten, diese Daten zu analysieren und Maßnahmen zu ergreifen, wird aber bereit sein, wenn die Finanzierung erfolgt. Außerdem wird ein lokales Software-Data-Warehouse verwendet, um den Status von Steuerrechnungen zu verfolgen. Darüber hinaus nutzt die Stadtverwaltung einen hybriden Data Mart, um die Ausbreitung eines Virus unter den Einwohnern zu verfolgen. Daten aus verschiedenen Krankenhäusern und kommunalen Gesundheitsdiensten werden in einem einzigen Repository zusammengefasst, damit sie vom Gesundheitsministerium analysiert und genutzt werden können.
Es gibt viele Missverständnisse bezüglich cloudbasierter Datenspeicher. Zu den häufigsten Missverständnissen gehören die folgenden:
Ihr Unternehmen ist einzigartig und verfügt über spezifische Ressourcen, Ziele und Herausforderungen. Prüfen Sie Ihre Optionen sorgfältig, um festzustellen, welche Lösung Ihren Anforderungen am besten entspricht. Beachten Sie Folgendes:
Diese Überlegungen helfen Ihnen zu bestimmen, welche Lösung oder Kombination von Lösungen Ihnen hilft, Ihre Ziele zu erreichen.
IBM bietet verschiedene Lösungen, die Sie bei Ihren Anforderungen in den Bereichen Cloud-Speicher und Data Science unterstützen.