O Apache Spark é o maior projeto de processamento de dados de software livre, proporcionando uma ferramenta de processamento de dados rápida para big data e analítica profunda. O monitoramento do Apache Spark da Instana inclui a capacidade de monitorar o Spark implantado por meio do AWS EMR, mas também pode monitorar o gerenciador do cluster independente do Spark. O monitoramento do desempenho do Spark gira em torno do monitoramento da instância do driver do Spark. O sensor de monitoramento do Spark da Instana é compatível com ambos os métodos de implantação do driver.
Dependendo do tipo de aplicativo que foi implantado (EMR, independente), outros dados são coletados e utilizados para monitoramento.
Para instâncias do Spark em execução no AWS EMR, instale o agente Instana nas instâncias do Amazon EC2 dentro do cluster EMR. Se você quiser a implantação automatizada do sensor de monitoramento do Spark, o agente Instana deverá ser colocado em todos os nós no cluster EMR.
O monitoramento do Spark da Instana contém um painel de resumo criado automaticamente que se concentra nos KPIs do aplicativo, incluindo tempo de resposta e carga. O painel também contém as principais métricas de desempenho e configuração da infraestrutura, bem como métricas específicas de dados de processamento do Spark. O painel permite que DevOps e IT Ops vejam todos os dados relevantes do Spark em uma tela, facilitando a compreensão do estado de suas instâncias do Spark.
O monitoramento da integridade e do desempenho das instâncias do Apache Spark exige o conhecimento sobre o próprio Spark, bem como a capacidade de ver as interações e dependências entre as instâncias do Spark em cluster e as interações com outros microsserviços (tanto no envio quanto no recebimento de dados). O sensor de monitoramento do Spark da Instana identifica e colhe automaticamente essas métricas relevantes.
Aplicações em lote
Aplicativos de streaming
Configuração
Métrica