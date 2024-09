Diferentemente do processamento em lote, os pipelines de dados de streaming, também conhecidos como arquiteturas orientadas por eventos, processam continuamente os eventos gerados por várias fontes, como sensores ou interações do usuário em um aplicativo. Os eventos são processados e analisados e, em seguida, armazenados em bancos de dados ou enviados para uma análise mais aprofundada.

Os dados de streaming são aproveitados quando é necessário que os dados sejam atualizados continuamente. Por exemplo, as aplicações ou sistemas de ponto de venda precisam de dados em tempo real para atualizar o inventário e o histórico de vendas dos seus produtos; dessa forma, os vendedores podem informar aos consumidores se um produto está em estoque ou não. Uma única ação, como a venda de um produto, é considerada um "evento", e os eventos relacionados, como a adição de um item ao carrinho, geralmente são agrupados como um "tópico" ou "fluxo". Esses eventos são então transportados por meio de sistemas de mensagens ou intermediadores de mensagens, como a oferta de código aberto Apache Kafka.

Como os eventos de dados são processados logo após a ocorrência, os sistemas de processamento de streaming têm latência menor do que os sistemas em lote, mas não são considerados tão confiáveis quanto os sistemas de processamento em lote, pois as mensagens podem ser descartadas involuntariamente ou passar muito tempo na fila. Os intermediadores de mensagens ajudam a lidar com essa preocupação por meio de confirmações, em que um consumidor confirma o processamento da mensagem ao intermediador para removê-la da fila.

