¿Cuál es la diferencia? ¿Ingeniero de datos vs. científico de datos vs. ingeniero de analytics?

Desarrolladora independiente trabaja en programación

 

El equipo de datos moderno es, bueno, complicado.

Incluso si está en el equipo de datos, hacer un seguimiento de todos los diferentes roles y sus matices se vuelve confuso, y mucho menos si es un ejecutivo no técnico que apoya o trabaja con el equipo.

Una de las mayores áreas de confusión es comprender las diferencias entre los roles de ingeniero de datos, científico de datos y ingeniero de analytics.

 

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

¿Qué es un ingeniero de datos?

Un ingeniero de datos desarrolla y mantiene la arquitectura de datos y los pipelines. Esencialmente, construyen los programas que generan datos y pretenden hacerlo de una manera que garantice que el resultado sea significativo para las operaciones y el análisis.

Algunas de sus responsabilidades clave incluyen:

  • Gestión de la orquestación de pipelines
  • Creación y mantenimiento de una plataforma de datos
  • Liderar cualquier esfuerzo de integración de datos personalizado
  • Optimización del rendimiento del almacén de datos
  • Desarrollo de procesos para el modelado y la generación de datos
  • Estandarización de las prácticas de gestión de datos

Las habilidades importantes para los ingenieros de datos incluyen:

  • Experiencia en SQL
  • Capacidad para trabajar con datos estructurados y no estructurados
  • Conocimiento profundo en programación y algoritmos
  • Experiencia con herramientas de ingeniería y pruebas
  • Fuertes habilidades de pensamiento creativo y resolución de problemas
Mixture of Experts | 28 de agosto, episodio 70

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

¿Qué hay de un ingeniero de analytics?

Un ingeniero de analytics reúne fuentes de datos de una manera que permite generar insights consolidados. Hacen el trabajo de construir sistemas que puedan modelar datos de manera limpia y clara repetidamente para que todos puedan usar esos sistemas para responder preguntas de forma continua. Como lo expresó un ingeniero de analytics de dbt Labs (enlace externo a ibm.com), una parte clave de la ingeniería de analytics es que “le permite resolver problemas difíciles una vez, y luego obtener beneficios de esa solución infinitamente.

Algunas de sus responsabilidades clave incluyen:

  • Comprender los requisitos del negocio y definir resultados de analytics exitosos
  • Limpiar, transformar, probar y desplegar datos para que estén listos para el análisis
  • Introducir definiciones y documentación para datos clave y procesos de datos
  • Incorporar técnicas de ingeniería de software, como la integración continua al código de analytics
  • Capacitar a otros para que utilicen los datos finales para el análisis
  • Consultar con científicos de datos y analistas sobre áreas para mejorar scripts y consultas

Las habilidades importantes para los ingenieros de analytics (enlace externo a ibm.com) incluyen:

  • Experiencia en SQL
  • Comprensión profunda de las mejores prácticas de ingeniería de software
  • Experiencia con almacén de datos y herramientas de visualización de datos
  • Sólidas capacidades en torno al mantenimiento de relaciones multifuncionales
  • Experiencia en análisis de datos o ingeniería de datos

Entonces, ¿qué es un científico de datos?

Un científico de datos estudia grandes conjuntos de datos mediante análisis estadístico avanzado y algoritmos de machine learning. Al hacerlo,identifica patrones en los datos para generar insights críticos empresariales y, a continuación, suele utilizar esos patrones para desarrollar soluciones de machine learning para obtener insights más eficientes y precisos a escala. Fundamentalmente, combina esta experiencia estadística con la experiencia en ingeniería de software.

Algunas de sus responsabilidades clave incluyen:

  • Transformar y limpiar grandes conjuntos de datos en un formato utilizable
  • Aplicar técnicas como agrupación en clústeres, redes neuronales y árboles de decisión para obtener insights de los datos
  • Analizar datos para identificar patrones y detectar tendencias que puedan afectar al negocio
  • Desarrollo de algoritmos de machine learning (enlace externo a ibm.com) para evaluar datos
  • Crear modelos de datos para pronosticar resultados

Las habilidades importantes para un científico de datos incluyen:

  • Experiencia en SAS, R y Python
  • Amplia experiencia en machine learning, acondicionamiento de datos y matemáticas avanzadas
  • Experiencia en el uso de herramientas de big data
  • Comprensión de desarrollo de API y operaciones
  • Experiencia en optimización y minería de datos
  • Fuertes habilidades de pensamiento creativo y toma de decisiones

¿Cómo funciona todo en conjunto?

Incluso ver las descripciones de ingeniero de datos, científico de datos e ingeniero de analytics una al lado de la otra puede causar confusión, ya que ciertamente hay superposiciones en las habilidades y áreas de enfoque en cada uno de estos roles. Entonces, ¿cómo funciona todo en conjunto?

Un ingeniero de datos crea programas que generan datos y, si bien su objetivo es que esos datos sean significativos, aún deberán combinarse con otras fuentes. Un ingeniero de analytics reúne esas fuentes de datos para crear sistemas que permitan a los usuarios acceder a insights consolidados de una manera repetible y de fácil acceso. Finalmente, un científico de datos desarrolla herramientas para analizar todos esos datos a escala e identificar patrones y tendencias más rápido y mejor que cualquier humano.

Es fundamental que exista una relación sólida entre estos roles. Pero con demasiada frecuencia, termina siendo disfuncional. Jeff Magnuson, vicepresidente de Plataforma de datos en Stitch Fix, escribió sobre este tema hace varios años en un artículo titulado Los ingenieros no deben escribir ETL (enlace externo a ibm.com).La idea central de su artículo era que los equipos no deberían tener “pensadores” y “ejecutores” separados. Por el contrario, los equipos de datos de alto rendimiento necesitan tener la responsabilidad total del trabajo que producen, lo que significa que no debería existir una mentalidad de “pasarlo por alto” entre estos roles.

El resultado es una gran demanda de científicos de datos que tengan experiencia en ingeniería y comprendan cosas como cómo crear procesos repetibles y la importancia del tiempo de actividad y los SLA. A su vez, este enfoque tiene un impacto en el papel de los ingenieros de datos, quienes pueden trabajar codo a codo con los científicos de datos de una manera completamente diferente. Y, por supuesto, eso también afecta a los ingenieros de analytics.

Comprender la diferencia entre ingeniero de datos, científico de datos e ingeniero de analytics de una vez por todas, por ahora

La verdad es que muchas organizaciones definen cada uno de estos roles de manera diferente. Es difícil trazar una línea firme entre dónde termina uno y dónde comienza porque todos tienen tareas similares hasta cierto punto. Como concluye Josh Laurito: “Todo el mundo escribe SQL. A todos les importa la calidad. Todos evalúan diferentes tablas y escriben datos en algún lugar, y todos se quejan de las zonas horarias. Todo el mundo hace muchas de las mismas cosas. Así que realmente la forma en que dividimos las cosas es dónde están las personas en relación con nuestros principales almacenes de datos”.

En Squarespace, esto significa que los ingenieros de datos son responsables de todo el trabajo realizado para crear y mantener esos almacenes, los ingenieros de analytics están integrados en los equipos funcionales para respaldar la toma de decisiones, elaborar narrativas en torno a los datos y utilizarlos para impulsar acciones y decisiones, y, finalmente, los científicos de datos se sientan en medio, configurando las estructuras de incentivos y las métricas para tomar decisiones y guiar a las personas.

Por supuesto, será ligeramente diferente para cada organización. Y por muy borrosas que sean las líneas ahora, cada uno de estos roles solo continuará evolucionando y cambiando aún más la dinámica en cada uno de ellos. Pero con suerte, esta descripción general ayudará a resolver la pregunta de cuál es la diferencia entre ingeniero de datos, científico de datos y ingeniero de analytics, por ahora.

Aprenda más sobre la plataforma de observabilidad de los datos continua de IBM®  Databand y cómo ayuda a detectar incidentes de datos antes, resolverlos más rápido y entregar datos más confiables a la empresa. Si está listo para profundizar, agende una demostración hoy mismo.

Soluciones relacionadas
Herramientas y soluciones de analytics

Con el fin de prosperar, las empresas deben utilizar los datos para fidelizar a sus clientes, automatizar los procesos empresariales e innovar con soluciones impulsadas por IA.

Explorar las soluciones de analytics
Servicios de consultoría en datos y analytics

Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por insights que ofrezca ventajas empresariales.

Descubra los servicios de analytics
IBM Cognos Analytics

Presentamos Cognos Analytics 12.0: insights impulsados por IA para una mejor toma de decisiones.

Explorar Cognos Analytics
Dé el siguiente paso

Con el fin de prosperar, las empresas deben utilizar los datos para fidelizar a sus clientes, automatizar los procesos empresariales e innovar con soluciones impulsadas por IA.

Explorar las soluciones de analytics Descubra los servicios de analytics