Cloud

Cloud macht aus Daten-Suchern echte Data Scientists

Noch vor einem Jahrzehnt gab es das Berufsbild des Data Scientist nicht. Mittlerweile zählt er zu den begehrtesten Jobs in der IT, gemessen an Gehalt, Arbeitszufriedenheit und Anzahl der Stellenangebote. Das Problem dabei ist, dass es einfach nicht genügend Data Scientists gibt, die den aktuellen, geschweige denn den zukünftigen Bedarf decken können. Laut einer IBM Studie  wird es weltweit im Jahr 2020 rund 700.000 offene Stellen für Data Scientists, Data Developer und Data Engineers geben.

Grund für die hohe Nachfrage an Datenanalyse-Experten ist das enorme Datenvolumen, mit dem Unternehmen heutzutage umgehen müssen. Jüngste Umfragedaten weisen darauf hin, dass Daten in Bereichen wie künstlicher Intelligenz, Analytik oder dem Internet der Dinge stark anwachsen. Etwa 20 Prozent dieser Daten sind strukturiert. Der Löwenanteil sind unstrukturierte Daten in Form von E-Mails, Social-Media-Inhalten, Bildern oder Videos. Diese sind erheblich schwieriger zu verwalten, zu sammeln und zu analysieren.

Schluss mit der 80:20-Regel
Wir leben in einer Datenökonomie – und um der Datenflut Herr zu werden, setzen immer mehr Unternehmen und Branchen weltweit auf die Cloud. Für die Datenauswertung stellen viele Unternehmen Data Scientists ein, die meist der 80:20-Regel folgen. Sie verbringen 80 Prozent ihrer Zeit damit, Daten zu finden, aufzubereiten und zu organisieren, und nur in den verbleibenden 20 Prozent kommen sie dazu, Daten tatsächlich zu analysieren.

Gut aufbereitete Daten in der Cloud sind für Data Scientists also entscheidend, um effizient zu arbeiten. Denn je weniger Zeit sie mit dem Suchen der Datenmassen verbringen, desto mehr Zeit bleibt ihnen, mit den Daten zu forschen. Data Scientists benötigen eine zentrale und zugängliche Plattform über alle Teams hinweg, bereitgestellt von ihren Unternehmen durch neue Cloud-Dienste und -Technologien. Dann verfügen sie bereits über die notwendigen Möglichkeiten, um die durch die Cloud-Technologie wachsenden Datenmengen zu analysieren und aus Informationen Einsichten für den Wandel von Unternehmen und Industrien abzuleiten. Denn im Gegensatz zum Suchen und Aufbereiten der Daten sind es gerade die Analyse und Bearbeitung der steigenden Menge an Datensätzen von Sensoren, Geräten oder Nutzern, die zur wichtigsten Aufgabe der Data Scientists gehören.

Data Scientists entlasten
Um das Verhältnis innerhalb der 80:20-Regel zugunsten der 20 Prozent Analyse zu verschieben, gibt es unterschiedliche Möglichkeiten. Beispielsweise können bestimmte Tools die Datenermittlung automatisieren und vereinfachen und ermöglichen eine langfristige Datenpflege (Datenkuration) und Daten-Governance. Intelligente Suchfunktionen erleichtern es den Data Scientists zusätzlich, die benötigten Daten zu finden. Metadaten, wie Tags, Kommentare oder numerische Angaben zur Datenqualität, können ihnen helfen, schneller zu entscheiden, ob ein Datensatz nützlich ist oder nicht. Eine integrierte Daten-Governance gibt den Data Scientists die Gewissheit, dass die Daten aus fundierten Quellen stammen und seine Modelle und Resultate auf einem soliden Datenfundament gebaut sind.

Ziel dieser Tools ist es, den Data Scientists auf Knopfdruck den benötigten Datensatz zuverlässig über die Cloud zur Verfügung zu stellen. Dadurch hat er wieder mehr Zeit für seine Forschung und kann mit seinen Daten noch mehr experimentieren. So kann er eine Vielzahl an Modellen aufstellen, anstatt sich aus Zeitgründen auf ein Modell fokussieren zu müssen, dass sich später womöglich als Sackgasse erweist.

Die Cloud gibt dem Data Scientist nicht nur mehr Spielraum, um die Daten zu testen und mit ihnen zu forschen, sondern unterstützt den Wissenschaftler auch, Modelle auf einfache Weise zu speichern. Er kann zentral auf sie zugreifen und sie beliebig erweitern, so dass Vorhandenes als Vorlage für neue Projekte genutzt werden kann und er das Rad nicht immer wieder neu erfinden muss.

Die Cloud eröffnet Data Scientists die Chance, sich viel von der Zeit zurückzuerobern, die sie bislang auf die Datensuche und Datenbereinigung aufgewendet haben. So können sie stattdessen Innovationen erarbeiten, die Unternehmen einen Wettbewerbsvorteil verschaffen und ihnen dabei helfen, sich und ihre Branche zu transformieren.

Add Comment
No Comments

Leave a Reply

Your email address will not be published.Required fields are marked *

More Cloud Stories

Building-Blocks: mit agilen Methoden in die Pole-Position – wie der Mittelstand gewinnen kann

Es existieren keine definierten Roadmaps, keine Standards oder Rezeptbücher, wie Unternehmen am besten von Industrie 4.0 beziehungsweise dem Internet of Things (IoT) profitieren können. Entsprechend gibt es bisher auch einen sehr unterschiedlichen Umgang und unterschiedliche  Erfahrungen mit dem Thema: Während sich einige Betriebe durchaus erfolgreich und vorbehaltlos auf den Weg zu Industrie 4.0 gemacht haben, […]

Update – Cloud Computing: In der Garage angekommen

Wie angekündigt haben wir am 18. April die 12te IBM Cloud Garage weltweit in München eröffnet – Sebastian Krause, GM Cloud Europe, erklärt das Konzept nochmal im Video: Die Cloud Garage in München hat sowohl als Ort als auch als eine Methode zur Entwicklung neuer Softwareprojekte überzeugt: Zuerst wird in einer Erhebungsphase das Problem analysiert. […]

Ausfall der IT-Systeme und Disaster Recovery – wie gut sind Sie auf den Ernstfall vorbereitet ?

Seit jeher gibt es in der Wirtschaft das Bestreben, mit weniger mehr zu erreichen. Dieser Trend macht auch vor der IT nicht Halt und fordert produktivere Nutzungsmodelle. Mit dem Aufkommen der Cloud-Systeme erwarten Nutzer einen Rundum-Service und möchten nur für das bezahlen, was sie verbrauchen – ähnlich dem Wasser- oder Stromverbrauch von Versorgungseinrichtungen. Da IT-Systeme […]