Worin besteht der Unterschied? Data Engineer vs Data Scientist vs Analytics Engineer?

Weibliche freiberufliche Entwicklerin programmiert

 

Das moderne Datenteam ist, nun ja, kompliziert.

Selbst wenn Sie zum Datenteam gehören, kann es verwirrend sein, den Überblick über all die verschiedenen Rollen und ihre Nuancen zu behalten – ganz zu schweigen davon, wenn Sie eine nichttechnische Führungskraft sind, die das Team unterstützt oder mit ihm zusammenarbeitet.

Einer der größten Verwirrung ist das Verständnis der Unterschiede zwischen den Rollen Data Engineer, Data Scientist und Analytics Engineer.

 

Die neuesten Tech-News – von Experten bestätigt

Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und darüber hinaus auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Was ist ein Data Engineer?

Data Engineers entwickeln und pflegen Datenarchitekturen und -pipelines. Im Wesentlichen erstellen sie die Programme, die Daten generieren, und zielen darauf ab, dies so zu tun, dass die Ausgabe für den Betrieb und die Analyse sinnvoll ist.

Zu ihren wichtigsten Aufgaben gehören:

  • Verwaltung  der Pipeline-Orchestrierung
  • Aufbau und Wartung einer Datenplattform
  • Leitung aller benutzerdefinierten Datenintegrationsbemühungen
  • Optimieren der Leistung des Data Warehouse
  • Entwicklung von Prozessen zur Datenmodellierung und Datengenerierung
  • Standardisierung von Datenmanagementpraktiken

Zu den wichtigen Fähigkeiten für Data Engineers gehören:

  • Fachkenntnisse in SQL
  • Die Fähigkeit, mit strukturierten und unstrukturierten Daten zu arbeiten
  • Fundierte Kenntnisse in Programmierung und Algorithmen
  • Erfahrung mit Engineering- und Testtools
  • Starkes kreatives Denken und Problemlösungsfähigkeiten
Mixture of Experts | 28. August, Folge 70

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Was ist ein Analytics Engineer?

Analytics Engineers stellen Datenquellen so zusammen, dass konsolidierte Erkenntnisse gewonnen werden können. Sie übernehmen die Aufgabe, Systeme zu entwickeln, die Daten auf saubere, klare Weise wiederholt modellieren können, damit jeder diese Systeme zur kontinuierlichen Beantwortung von Fragen verwenden kann. Wie ein Analytics Engineer bei dbt Labs es ausdrückte (Link befindet sich außerhalb von ibm.com), besteht ein wichtiger Teil des Analytics Engineerings darin, dass „es Ihnen ermöglicht,  schwierige Probleme einmal zu lösen und dann von dieser Lösung unendliche Vorteile zu haben.“

Zu ihren wichtigsten Aufgaben gehören:

  • Geschäftsanforderungen verstehen und erfolgreiche Analyseergebnisse definieren
  • Bereinigen, Transformieren, Testen und Bereitstellen von Daten, um für die Analyse bereit zu sein
  • Einführung in Definitionen und Dokumentation für wichtige Daten und Datenprozesse
  • Softwareentwicklungstechniken wie kontinuierliche Integration in den Analysecode einbringen
  • Schulung anderer Personen zur Verwendung der Enddaten für die Analyse
  • Beratung mit Data Scientists und Analytikern in Bereichen zur Verbesserung von Skripten und Abfragen

Zu den wichtigen Fähigkeiten für Analytics Engineers (Link befindet sich außerhalb von ibm.com) gehören:

  • Fachkenntnisse in SQL
  • Eingehendes Verständnis der Best Practices der Softwareentwicklung
  • Erfahrung mit Data Warehouse und Datenvisualisierung
  • Starke Kenntnisse zur Aufrechterhaltung multifunktionaler Beziehungen
  • Hintergrund im Bereich Datenanalyse oder Data Engineering

Was ist dann ein Data Scientist?

Data Scientists untersuchen große Datensätze mithilfe fortgeschrittener statistischer Analysen und Algorithmen für maschinelles Lernen. Dabei identifizieren sie Muster in Daten, um kritische Erkenntnisse zu gewinnen, und verwenden diese Muster dann typischerweise, um Lösungen für maschinelles Lernen zu entwickeln, die effizientere und genauere Erkenntnisse im großen Maßstab ermöglichen. Entscheidend ist, dass sie diese Statistikerfahrung mit Erfahrung in der Softwareentwicklung kombinieren.

Zu ihren wichtigsten Aufgaben gehören:

  • Umwandlung und Bereinigung großer Datensätze in ein verwendbares Format
  • Anwendung von Techniken wie Cluster, neuronalen Netzen und Entscheidungsbäumen, um Erkenntnisse aus Daten zu gewinnen
  • Analyse von Daten, um Muster und Trends zu erkennen, die sich auf das Geschäft auswirken können
  • Entwicklung von Algorithmen für maschinelles Lernen (Link befindet sich außerhalb von ibm.com) zur Auswertung von Daten
  • Erstellen von Datenmodellen zur Vorhersage von Ergebnissen

Zu den wichtigen Fähigkeiten für einen Data Scientist gehören:

  • Expertise in SAS, R und Python
  • Langjährige Erfahrung in den Bereichen maschinelles Lernen, Datenaufbereitung und fortgeschrittene Mathematik
  • Erfahrung im Umgang mit Big-Data-Tools
  • Verständnis für API-Entwicklung und -Abläufe
  • Hintergrund in Datenoptimierung und Data Mining
  • Starke kreative Kompetenzen in der Denk- und Entscheidungsfindung

Wie wirkt all das zusammen?

Selbst wenn Sie die Beschreibungen eines Data Engineers, eines Data Scientists und eines Analytics Engineers nebeneinander sehen, kann es zu Verwirrung führen, da es sicherlich Überschneidungen bei den Fähigkeiten und Schwerpunktbereichen dieser einzelnen Rollen gibt. Wie passt das alles zusammen?

Ein Data Engineer erstellt Programme, die Daten generieren, und obwohl sie darauf abzielen, dass diese Daten aussagekräftig sind, müssen sie dennoch mit anderen Quellen kombiniert werden. Ein Analytics Engineer führt diese Datenquellen zusammen, um Systeme zu entwickeln, die Benutzern den Zugriff auf konsolidierte Erkenntnisse auf leicht zugängliche und wiederholbare Weise ermöglichen. Ein Data Scientist schließlich entwickelt Tools, um all diese Daten in großem Maßstab zu analysieren und Muster und Trends schneller und besser zu erkennen, als es ein Mensch könnte.

Entscheidend ist, dass eine enge Beziehung zwischen diesen Rollen besteht. Aber allzu oft stellt sich heraus, dass diese nicht mehr funktioniert. Jeff Magnuson, Vice President, Data Platform bei Stich Fix, schrieb vor einigen Jahren über dieses Thema in einem Artikel mit dem Titel Engineers Should Write ETL (Link befindet sich außerhalb von ibm.com).Die Kernaussage seines Artikels war, dass Teams keine getrennten „Denker“ und „Macher“ haben sollten. Vielmehr benötigen hochfunktionale Datenteams eine durchgängige Verantwortung für die von ihnen produzierte Arbeit, was bedeutet, dass es zwischen diesen Rollen keine Mentalität geben sollte, Aufgaben an andere weiterzugeben.

Das Ergebnis ist ein hoher Bedarf an Data Scientists, die einen technischen Hintergrund haben und sich mit Dingen wie dem Aufbau wiederholbarer Prozesse und der Bedeutung von Betriebszeit und SLAs auskennen. Dieser Ansatz hat wiederum Auswirkungen auf die Rolle der Dateningenieure, die dann auf ganz andere Weise Seite an Seite mit Data Scientists arbeiten können. Und das übertragen sich natürlich auch auf die Analytics Engineers.

Den Unterschied zwischen Data Engineer, Data Scientist und Analytics Engineers ein für alle Mal verstehen – vorerst

Tatsache bleibt, dass viele Unternehmen jede dieser Rollen anders definieren. Es ist schwierig, eine klare Grenze zwischen dem Ende und dem Anfang zu ziehen, da sie alle bis zu einem gewissen Grad ähnliche Aufgaben haben. Josh Laurito fasst zusammen: „Jeder schreibt SQL. Jeder kümmert sich um die Qualität. Jeder wertet verschiedene Tabellen aus und schreibt irgendwo Daten, und alle beschweren sich über Zeitzonen. Alle machen viele der gleichen Dinge. Wir teilen die Dinge also so auf, dass die Menschen in Bezug auf unsere primären Analysedaten stehen, die wir speichern.“

Bei Squarespace bedeutet dies, dass die Data Engineers für die gesamte Arbeit zum Aufbau und der Wartung dieser speichern verantwortlich sind, dass die Analytics Engineers in die Funktionsteams eingebettet sind, um die Entscheidungsfindung zu unterstützen, Berichte über die Daten zusammenzustellen und diese zu nutzen, um Maßnahmen und Entscheidungen voranzutreiben, und Data Scientists sitzen in der Mitte und schaffen Anreizstrukturen und Metriken, um Entscheidungen zu treffen und die Menschen zu leiten.

Natürlich sieht es bei jedem Unternehmen etwas anders aus. Und so unscharf die Grenzen jetzt auch sind, jede dieser Rollen wird sich weiterentwickeln und die Dynamik zwischen ihnen weiter verschieben. Aber ich hoffe, dass dieser Überblick dazu beiträgt, die Frage zu klären, was der Unterschied zwischen einem Data Engineer, einem Data Scientist und einem Analytics Engineer ist – vorerst.

Erfahren Sie mehr über die Daten-Observability-Plattform von IBM Databand und wie sie hilft, Datenvorfälle früher zu erkennen, sie schneller zu lösen und dem Unternehmen vertrauenswürdigere Daten bereitzustellen. Wenn Sie bereit sind, einen genaueren Blick darauf zu werfen, buchen Sie noch heute eine Demo.

Weiterführende Lösungen
Analysetools und -lösungen

Um erfolgreich zu sein, müssen Unternehmen Daten nutzen, um die Kundenbindung zu stärken, Geschäftsprozesse zu automatisieren und mit KI-gestützten Lösungen Innovationen zu schaffen.

Analyselösungen entdecken
Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Analyse-Services entdecken
IBM Cognos Analytics

Wir stellen vor: Cognos Analytics 12.0, KI-gestützte Erkenntnisse für eine bessere Entscheidungsfindung.

Cognos Analytics erkunden
Machen Sie den nächsten Schritt

Um erfolgreich zu sein, müssen Unternehmen Daten nutzen, um die Kundenbindung zu stärken, Geschäftsprozesse zu automatisieren und mit KI-gestützten Lösungen Innovationen zu schaffen.

Analyselösungen entdecken Analyse-Services entdecken