Cloud

Cloud macht aus Daten-Suchern echte Data Scientists

Noch vor einem Jahrzehnt gab es das Berufsbild des Data Scientist nicht. Mittlerweile zählt er zu den begehrtesten Jobs in der IT, gemessen an Gehalt, Arbeitszufriedenheit und Anzahl der Stellenangebote. Das Problem dabei ist, dass es einfach nicht genügend Data Scientists gibt, die den aktuellen, geschweige denn den zukünftigen Bedarf decken können. Laut einer IBM Studie  wird es weltweit im Jahr 2020 rund 700.000 offene Stellen für Data Scientists, Data Developer und Data Engineers geben.

Grund für die hohe Nachfrage an Datenanalyse-Experten ist das enorme Datenvolumen, mit dem Unternehmen heutzutage umgehen müssen. Jüngste Umfragedaten weisen darauf hin, dass Daten in Bereichen wie künstlicher Intelligenz, Analytik oder dem Internet der Dinge stark anwachsen. Etwa 20 Prozent dieser Daten sind strukturiert. Der Löwenanteil sind unstrukturierte Daten in Form von E-Mails, Social-Media-Inhalten, Bildern oder Videos. Diese sind erheblich schwieriger zu verwalten, zu sammeln und zu analysieren.

Schluss mit der 80:20-Regel
Wir leben in einer Datenökonomie – und um der Datenflut Herr zu werden, setzen immer mehr Unternehmen und Branchen weltweit auf die Cloud. Für die Datenauswertung stellen viele Unternehmen Data Scientists ein, die meist der 80:20-Regel folgen. Sie verbringen 80 Prozent ihrer Zeit damit, Daten zu finden, aufzubereiten und zu organisieren, und nur in den verbleibenden 20 Prozent kommen sie dazu, Daten tatsächlich zu analysieren.

Gut aufbereitete Daten in der Cloud sind für Data Scientists also entscheidend, um effizient zu arbeiten. Denn je weniger Zeit sie mit dem Suchen der Datenmassen verbringen, desto mehr Zeit bleibt ihnen, mit den Daten zu forschen. Data Scientists benötigen eine zentrale und zugängliche Plattform über alle Teams hinweg, bereitgestellt von ihren Unternehmen durch neue Cloud-Dienste und -Technologien. Dann verfügen sie bereits über die notwendigen Möglichkeiten, um die durch die Cloud-Technologie wachsenden Datenmengen zu analysieren und aus Informationen Einsichten für den Wandel von Unternehmen und Industrien abzuleiten. Denn im Gegensatz zum Suchen und Aufbereiten der Daten sind es gerade die Analyse und Bearbeitung der steigenden Menge an Datensätzen von Sensoren, Geräten oder Nutzern, die zur wichtigsten Aufgabe der Data Scientists gehören.

Data Scientists entlasten
Um das Verhältnis innerhalb der 80:20-Regel zugunsten der 20 Prozent Analyse zu verschieben, gibt es unterschiedliche Möglichkeiten. Beispielsweise können bestimmte Tools die Datenermittlung automatisieren und vereinfachen und ermöglichen eine langfristige Datenpflege (Datenkuration) und Daten-Governance. Intelligente Suchfunktionen erleichtern es den Data Scientists zusätzlich, die benötigten Daten zu finden. Metadaten, wie Tags, Kommentare oder numerische Angaben zur Datenqualität, können ihnen helfen, schneller zu entscheiden, ob ein Datensatz nützlich ist oder nicht. Eine integrierte Daten-Governance gibt den Data Scientists die Gewissheit, dass die Daten aus fundierten Quellen stammen und seine Modelle und Resultate auf einem soliden Datenfundament gebaut sind.

Ziel dieser Tools ist es, den Data Scientists auf Knopfdruck den benötigten Datensatz zuverlässig über die Cloud zur Verfügung zu stellen. Dadurch hat er wieder mehr Zeit für seine Forschung und kann mit seinen Daten noch mehr experimentieren. So kann er eine Vielzahl an Modellen aufstellen, anstatt sich aus Zeitgründen auf ein Modell fokussieren zu müssen, dass sich später womöglich als Sackgasse erweist.

Die Cloud gibt dem Data Scientist nicht nur mehr Spielraum, um die Daten zu testen und mit ihnen zu forschen, sondern unterstützt den Wissenschaftler auch, Modelle auf einfache Weise zu speichern. Er kann zentral auf sie zugreifen und sie beliebig erweitern, so dass Vorhandenes als Vorlage für neue Projekte genutzt werden kann und er das Rad nicht immer wieder neu erfinden muss.

Die Cloud eröffnet Data Scientists die Chance, sich viel von der Zeit zurückzuerobern, die sie bislang auf die Datensuche und Datenbereinigung aufgewendet haben. So können sie stattdessen Innovationen erarbeiten, die Unternehmen einen Wettbewerbsvorteil verschaffen und ihnen dabei helfen, sich und ihre Branche zu transformieren.

Add Comment
No Comments

Leave a Reply

Your email address will not be published.Required fields are marked *

More Cloud Stories

Vom Smart Home zum Haus mit Köpfchen – Intelligenz in den eigenen vier „Glas-Wänden“

Smarte Anwendungen und Produkte erobern zunehmend den privaten Wohnbereich. Die Idee dabei ist so simpel wie vielversprechend: Alarmanlagen, Zutrittssysteme oder elektrische Haushaltsgeräte lassen sich im Smart Home bequem über eine App steuern. Der technikaffine Hausbewohner kann die Einstellungen entweder über sein Smartphone unterwegs oder im WLAN zuhause steuern und findet sein Wohnzimmer nach einem langen […]

Sicherer EU-Wohnsitz für Daten

Data Residency, der Wohnsitz für Daten, soll 2018 sicherer werden. Dieses Ziel hat sich die Europäische Union auf ihre blaue Fahne mit den gelben Sternchen geschrieben. Stichtag ist der 25. Mai 2018, ab diesem Tag gilt in der EU die sogenannte Datenschutz-Grundverordnung (DSGVO/GDPR). Und die hat es in sich, denn sie schreibt vor, dass sensible […]

Wenn Offenheit und Flexibilität zählen: OpenStack erobert die Cloud!

Mit Cloud-Services erreichen Unternehmen mehr Flexibilität und Skalierbarkeit für ihre Applikationen und verkürzen ihre Time-to-Market. So weit – so gut. Dabei haben zahlreiche Anwender jedoch die Befürchtungen, von einem Anbieter abhängig zu werden – der gefürchtete Vendor-Lockin. So haben sich vor allem die Open-Source-Communities auf die Fahne geschrieben, Standards zu schaffen, die genau dies verhindern. […]