Etiquetas

Casos de uso de Apache Kafka: impulsar la innovación en diversos sectores

Autor

Staff Writer

IBM Think

Apache Kafka es una plataforma de transmisión distribuida y de código abierto que permite a los desarrolladores crear aplicaciones en tiempo real y orientadas a eventos. Con Apache Kafka, los desarrolladores pueden crear aplicaciones que utilicen continuamente registros de datos de transmisión y ofrezcan experiencias en tiempo real a los usuarios.

Ya sea para consultar el saldo de una cuenta, ver Netflix o navegar por LinkedIn, los usuarios de hoy en día esperan que las aplicaciones les ofrezcan experiencias casi en tiempo real. La arquitectura basada en eventos de Apache Kafka se diseñó para almacenar datos y transmitir eventos en tiempo real, lo que la convierte en un intermediario de mensajes y una unidad de almacenamiento que permite experiencias de usuario en tiempo real en muchos tipos diferentes de aplicaciones.

Apache Kafka es uno de los sistemas de procesamiento de datos de código abierto más populares disponibles, con casi 50 000 empresas que lo utilizan y una cuota de mercado del 26,7 %.

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA  

Descubra ideas y noticias de expertos sobre IA, nube y mucho más en el boletín semanal Think.

¿Cómo funciona Apache Kafka?

Kafka es un sistema distribuido, lo que significa que es una colección de diferentes programas de software que comparten recursos computacionales en varios nodos (ordenadores) para lograr un único objetivo. Esta arquitectura hace que Kafka sea más tolerante a fallos que otros sistemas, ya que puede hacer frente a la pérdida de un solo nodo o máquina del sistema y seguir funcionando.

Entre los sistemas distribuidos, Apache se ha distinguido como una de las mejores herramientas para construir arquitecturas de microservicios, un enfoque nativo de la nube en el que una única aplicación se compone de muchos componentes o servicios más pequeños y conectados. Además de los entornos nativos de la nube, los desarrolladores también utilizan Apache Kafka en Kubernetes, una plataforma de orquestación de contenedores de código abierto, para desarrollar aplicaciones utilizando marcos sin servidor.

Para los desarrolladores, gran parte del atractivo de Apache es su arquitectura única. Apache utiliza un sistema de mensajería de publicación-suscripción, un sistema que tiene lo que se conoce como comunicación asíncrona, lo que facilita a los desarrolladores la creación de aplicaciones avanzadas y arquitectónicamente complejas. La arquitectura de Apache se compone de tres categorías: eventos, productores y consumidores, y depende en gran medida de interfaz de programación de aplicaciones (API) para funcionar.

Conceptos importantes de Kafka

Apache Kafka se basa en cuatro conceptos subyacentes: eventos, transmisión, productores y consumidores. A continuación, se ofrece una breve descripción de cómo cada uno de estos modelos funciona conjuntamente para dotar a Apache Kafka de sus capacidades básicas.

Eventos y transmisión

Cuando un usuario interactúa con un sitio web, para registrarse en un servicio o realizar un pedido, por ejemplo, se describe como un "evento". En la arquitectura Apache, un evento es cualquier mensaje que contiene información que describe lo que ha hecho un usuario. Por ejemplo, si un usuario se ha registrado en un sitio web, un registro de eventos contendría su nombre y dirección de correo electrónico.

Quizás ninguna otra capacidad distinga a Apache Kafka de otras arquitecturas de almacenamiento de datos más que su capacidad para transmitir eventos, una capacidad conocida como "transmisión de eventos" o simplemente "transmisión" (y específicamente, en el caso de Apache Kafka, como transmisiones de Kafka). La transmisión de eventos es cuando los datos generados por cientos o incluso miles de productores se envían simultáneamente a través de una plataforma a los consumidores.

Productores y consumidores

Un "productor", en la arquitectura Apache Kafka, es cualquier cosa que pueda crear datos, por ejemplo, un servidor web, una aplicación o un componente de aplicación, un dispositivo de Internet de las cosas (IoT), y muchos otros. Un "consumidor" es cualquier componente que necesita los datos creados por el productor para funcionar. Por ejemplo, en una aplicación IoT, los datos podrían ser información de sensores conectados a Internet, como un indicador de temperatura o un sensor en un vehículo autónomo que detecta que un semáforo ha cambiado.

La arquitectura de Kafka está diseñada de tal manera que puede manejar una afluencia constante de datos de eventos generados por los productores, mantener registros precisos de cada evento y publicar constantemente un flujo de estos registros a los consumidores.

IBM® Kafka

¿Qué es Kafka?

Whitney Lee, de IBM® Cloud, explica cómo Apache Kafka, una plataforma de streaming distribuido de código abierto, permite a los desarrolladores crear aplicaciones que utilizan event streams para crear aplicaciones de alto rendimiento.

Descubra IBM® Event Streams

Casos de uso de Apache Kafka

La capacidad central de Apache Kafka de proceso de datos en tiempo real ha abierto las compuertas en términos de lo que las aplicaciones pueden hacer en muchos sectores. Con Kafka, las empresas están explorando nuevas formas de aprovechar los datos en transmisión para aumentar los ingresos, impulsar la transformación digital y crear experiencias agradables para sus clientes. Estos son algunos de los ejemplos más llamativos.

Internet de las cosas (IoT)

El Internet de las cosas (IoT), una red de dispositivos integrados con sensores que les permiten recopilar y compartir datos a través de Internet, depende en gran medida de la arquitectura Apache Kafka. Por ejemplo, los sensores conectados a un molino de viento utilizan capacidades de IoT para transmitir datos sobre cosas como la velocidad del viento, la temperatura y la humedad a través de Internet. En esta arquitectura, cada sensor es un productor, que genera datos cada segundo que envía a un servidor backend o base de datos, el consumidor, para su procesamiento.

La arquitectura Kafka facilita esta transmisión y recepción de datos de ida y vuelta, así como su procesamiento, en tiempo real, lo que permite a los científicos e ingenieros rastrear las condiciones meteorológicas a cientos o miles de kilómetros de distancia. Las capacidades de mantenimiento de registros y colas de mensajes de Apache garantizan la calidad y precisión de los datos que se recopilan.

Servicios financieros

Del mismo modo que Apache permite recopilar datos a través de dispositivos IoT que pueden transmitirse a los consumidores en tiempo real, también permite recopilar y analizar información del mercado bursátil.

Apache se ha utilizado para muchas cargas de trabajo críticas que son esenciales para negociar acciones y supervisar los mercados financieros. Algunos de los bancos e instituciones financieras más grandes del mundo, como PayPal, Ing y JP Morgan Chase, lo utilizan para el análisis de datos en tiempo real, la detección del fraude, la gestión de riesgos en operaciones, el cumplimiento normativo, el análisis de mercado y mucho más.

Venta minorista

Los minoristas en línea y los sitios de comercio electrónico deben procesar miles de pedidos desde su aplicación o sitio web todos los días, y Kafka desempeña un papel central para que esto suceda para muchas empresas. El tiempo de respuesta y la gestión de la relación con el cliente (CRM) son claves para el éxito en el comercio minorista, por lo que es importante que los pedidos se procesen con rapidez y precisión.

Kafka ayuda a simplificar la comunicación entre clientes y empresas, utilizando su pipeline de datos para registrar eventos con precisión y mantener registros de pedidos y cancelaciones, alertando a todas las partes relevantes en tiempo real. Además de procesar pedidos, Kafka genera datos precisos que pueden analizarse para evaluar el rendimiento empresarial y descubrir conocimientos valiosos.

Sanidad

El sector de la salud confía en Kafka para conectar los hospitales con historiales electrónicos de salud (EHR) críticos e información confidencial de los pacientes. Kafka facilita la comunicación bidireccional que impulsa aplicaciones que dependen de datos generados en tiempo real por varias fuentes diferentes. Las capacidades de Kafka también permiten compartir conocimientos en tiempo real; por ejemplo, la alergia de un paciente a un determinado medicamento que puede salvar vidas.

Además de ayudar a los médicos a obtener datos en tiempo real que les permiten decidir cómo tratar a los pacientes, Kafka también es crítico para la comunidad de investigación médica. Sus capacidades de almacenamiento de datos y análisis ayudan a los investigadores a buscar en los datos médicos conocimiento sobre enfermedades y atención al paciente, lo que acelera los avances médicos.

Telecomunicaciones

Las empresas de telecomunicaciones utilizan Apache para una variedad de servicios. Principalmente, su procesamiento de flujos de datos en tiempo real se utiliza para monitorizar las redes que alimentan millones de dispositivos inalámbricos en todo el mundo. Apache recopila datos sobre las operaciones de la red que transmite en tiempo real a servidores que los analizan constantemente en busca de cualquier problema. Los registros que Apache mantiene para las empresas de telecomunicaciones incluyen llamadas, mensajes de texto, datos de clientes, uso, llamadas perdidas y más.

Juegos

Las plataformas de juego más avanzadas de la actualidad se basan en la comunicación en tiempo real entre jugadores separados por cientos e incluso miles de kilómetros. Si hay algún retraso en un juego en el que el tiempo de reacción de los jugadores es clave para su éxito, el rendimiento se verá afectado. Además, la industria del juego ha estado en auge últimamente, creciendo con una tasa de crecimiento anual compuesta (CAGR) del 13,4 % y aumentando el escrutinio de sus principales métricas operativas.

Apache potencia la rapidísima comunicación e interacción entre jugadores que hace tan populares a los ecosistemas de juego hiperrealistas. Los nuevos juegos dependen de las capacidades de transmisión en tiempo real de Apache, así como de sus funciones de análisis en tiempo real y almacenamiento de datos. Además, el pipeline de transmisión de Apache ayuda a los jugadores a seguir el control en tiempo real asegurando que los movimientos se transmitan a otros jugadores de forma instantánea.

Beneficios de Apache Kafka

Los desarrolladores e ingenieros de algunas de las empresas más grandes y modernas del mundo utilizan Apache para crear muchas aplicaciones empresariales en tiempo real. Apache Kafka está detrás de las aplicaciones que sirven a los sectores financieros, a los gigantes de las compras en línea, a las plataformas de transmisión de música y vídeo, a los innovadores de los videojuegos y más. Desarrollar con Kafka tiene muchas ventajas sobre otras plataformas. Estos son algunos de sus beneficios más populares.

Velocidad

El sistema de proceso de datos de Kafka utiliza API de una manera única que le ayuda a optimizar la Integración de datos en muchos otros diseños de almacenamiento de bases de datos, como las populares arquitecturas SQL y NoSQL, utilizadas para el análisis de big data.

Escalabilidad

Kafka se creó para abordar los problemas de alta latencia en el procesamiento de colas por lotes en algunos de los sitios web más transitados del mundo. Tiene lo que se conoce como escalabilidad elástica, multiclúster, lo que permite aprovisionar flujos de trabajo en varios clústeres de Kafka, en lugar de solo uno, lo que permite una mayor escalabilidad, un alto rendimiento y una baja latencia.

Conectividad

Apache Connect, una herramienta de transmisión de datos, viene con 120 conectores prediseñados que permiten a Apache integrarse con todas las soluciones de almacenamiento de datos de backend más populares, incluidas Amazon S3 de AWS, MongoDB, Google BigQuery, ElasticSearch, Azure, DataDog y más. Los desarrolladores que utilizan Apache pueden acelerar el desarrollo de aplicaciones con soporte para cualquier requisito que tenga su organización.

Almacenamiento y seguimiento

Dado que algunos de los sitios web más grandes y exigentes del mundo utilizan Apache, éste debe ser capaz de registrar la actividad de los usuarios con rapidez y precisión para evitar interrupciones. Apache registra eventos frecuentes como el registro de usuarios, las visitas a la página, las compras y otra información relacionada con el seguimiento de la actividad del sitio web en tiempo real. A continuación, agrupa los datos por temas y los almacena en una red distribuida para un acceso rápido y sencillo.

Mensajería

Apache recibe y mantiene los mensajes en una cola, un contenedor utilizado para almacenar y transmitir mensajes. El contenedor conecta los mensajes con las aplicaciones de consumo y con el usuario. Apache está diseñado de forma similar a otros intermediarios de mensajes populares, como RabbitMQ; pero a diferencia de Rabbit y estos otros intermediarios, divide sus mensajes en temas de Kafka utilizando una clave de mensaje que se puede utilizar para filtrar los mensajes por relevancia.

Procesamiento de datos

Uno de los atributos más atractivos de Apache es su capacidad para capturar y almacenar datos de eventos en tiempo real. Otros pipelines de datos populares en tiempo real deben ejecutarse en lo que se denomina un lote programado, un lote de datos que solo se puede procesar a una hora preprogramada. El diseño de Apache permite que los datos se procesen en tiempo real, lo que permite que funcionen tecnologías como IoT, análisis y otras que dependen del proceso de datos en tiempo real.

Más información

Apache Kafka se creó para almacenar datos y transmitir eventos en tiempo real, ofreciendo experiencias de usuario dinámicas en un conjunto diverso de aplicaciones. IBM® Event Streams ayuda a las empresas a optimizar Kafka con una plataforma de código abierto que se puede implementar como un servicio totalmente gestionado en IBM Cloud u on-premises como parte de Event Automation.

Fortalezca los flujos de trabajo de Kafka con la gestión de API escalable

Explore cómo una la gestión de API robusta mejora su ecosistema Kafka. Este documento revela estrategias clave para escalar de forma segura las API junto con las arquitecturas de flujo de datos, lo que permite una mejor gobernanza, integración y observabilidad a través de sistemas impulsados por eventos en tiempo real.

Imagen desde arriba de un hombre sentado en un banco

Conocimientos que no debe perderse. Suscríbase a nuestros boletines.

Vaya más allá de las expectativas con noticias de expertos sobre inteligencia artificial, computación cuántica, nube, seguridad y mucho más.

Suscríbase hoy

Recursos

Servicio totalmente gestionado con experiencia nativa de Kafka

Event Streams ofrece un servicio Apache Kafka totalmente gestionado, que garantiza durabilidad, alta disponibilidad, seguridad y cumplimiento para que pueda centrarse en tareas de valor añadido, como la creación de aplicaciones.

Kafka simplificado

Trabaje con todas las API y clientes estándar de Kafka en una instancia de Event Streams para disfrutar de una experiencia Kafka nativa.

Alta disponibilidad y recuperación en caso de siniestro

Event Streams está distribuido en 3 zonas y se implementa en 10 regiones multizona, lo que le confiere una alta disponibilidad. Puede habilitar la recuperación ante desastres con funciones avanzadas de seguridad y georreplicación.

IBM Event Streams e IBM Event Automation

Únase a este grupo en línea para comunicarse entre usuarios de productos IBM y expertos, compartiendo consejos y buenas prácticas con sus compañeros.

La eliminación de errores con IA ayuda a permitir una logística impecable

"Event Streams en IBM Cloud es fundamental en todo lo que desarrollamos". Viktor Nilsson, director de tecnología (CTO), SiB Solutions

Mejorar la experiencia de juego con la tecnología de transmisión de eventos

"Event Streams es realmente fiable e IBM siempre ha estado ahí para ayudarnos". Jan Harald Fonås, ingeniero de sistemas de middleware, Norsk Tipping AS

Soluciones relacionadas

IBM Event Streams

IBM® Event Streams es un software de transmisión de eventos basado en Apache Kafka de código abierto. Está disponible como servicio totalmente gestionado en IBM® Cloud o para autoalojamiento.

Explore Event Streams

Software y soluciones de integración

Desbloquee el potencial empresarial con las soluciones de integración de IBM, conectando aplicaciones y sistemas para acceder a datos críticos de forma rápida y segura.

Explore las soluciones de integración

Servicios de consultoría en la nube

Desbloquee nuevas capacidades e impulse la agilidad empresarial con los servicios de consultoría de IBM Cloud.

Explore los servicios de consultoría en la nube

Dé el siguiente paso

IBM® Event Streams es un software de transmisión de eventos basado en Apache Kafka de código abierto. Está disponible como servicio totalmente gestionado en IBM® Cloud o para autoalojamiento.

Explore Event Streams

Más información