O que é observabilidade?
A observabilidade fornece visibilidade aprofundada sobre aplicativos modernos distribuídos para identificação e resolução de problemas mais rápidas e automatizadas
Assine a newsletter da IBM Inscreva-se para receber o guia de observabilidade
Fundo em preto e azul
O que é observabilidade?

Em geral, a observabilidade é a medida em que é possível entender o estado interno ou a condição de um sistema complexo, baseado apenas no conhecimento de suas saídas externas. Quanto mais observável um sistema for, de forma mais rápida e precisa é possível navegar de um problema de desempenho identificado até sua causa raiz, sem teste ou programação adicional.

Em TI e computação em cloud, a observabilidade também se refere a ferramentas e práticas de software para agregar, correlacionar e analisar um fluxo constante de dados de desempenho de um aplicativo distribuído com o hardware e a rede nos quais ele é executado. Isso é executado para monitorar, depurar e solucionar problemas do aplicativo e da rede de forma mais eficaz para atender às expectativas de experiência do cliente, aos acordos de nível de serviço (SLAs) e a outros requisitos de negócios.

A observabilidade, um assunto que ganhando terreno em TI, é muitas vezes descaracterizada como um termo da moda ou novo nome para monitoramento de sistemas, monitoramento de desempenho de aplicativos (APM)gerenciamento de desempenho da rede (NPM). Na verdade, a observabilidade é uma evolução natural do APM  e dos métodos de coleta de dados do NPM que melhor abordam a natureza cada vez mais rápida, distribuída e dinâmica das implementações de aplicativos nativos de cloud. A observabilidade não substitui o monitoramento; ela possibilita um melhor monitoramento e melhores APM e NPM.

O termo "observabilidade" tem origem na teoria de controle, uma área da engenharia preocupada em automatizar o controle de um sistema dinâmico, por exemplo, o fluxo de água através de um cano, ou a velocidade de um automóvel em subidas e descidas, com base no feedback obtido do sistema.

Por que precisamos da observabilidade?

Nos últimos 20 anos, as equipes de TI contavam principalmente com o APM para monitorar e solucionar problemas de aplicativos. O APM amostra e agrega periodicamente dados do aplicativo e do sistema, o que é chamado de telemetria, conhecido por estarem relacionados a problemas de desempenho de aplicativos. Ele analisa a telemetria relativa aos principais indicadores de desempenho (KPIs) e reúne os resultados em um painel para alertar as equipes de operações e de suporte a respeito de condições anormais que devem ser abordadas a fim de evitar ou resolver problemas.

O APM é eficaz o suficiente para o monitoramento e a resolução de problemas de aplicativos monolíticos ou aplicativos distribuídos tradicionais, em que um novo código é lançado periodicamente e fluxos de trabalho e dependências entre componentes, servidores e recursos relacionados do aplicativo são bem conhecidos ou fáceis de rastrear.

Mas hoje as organizações estão adotando rapidamente práticas modernas de desenvolvimento: desenvolvimento ágil, integração contínua e implementação contínua (CI/CD), DevOps, várias linguagens de programação e tecnologias nativas de cloud, como microsserviços, contêineres do Docker, Kubernetes e funções serverless. Como resultado, elas estão lançando serviços no mercado mais rápido do que nunca. Mas no processo, elas estão implementados novos componentes de aplicativos com tanta frequência, em tantos lugares, em tantas linguagens diferentes e por períodos tão diversos (por segundo ou frações de segundo, no caso de funções serverless) que a amostragem de dados de uma vez por minuto do APM não consegue acompanhar o ritmo.

O que é necessário é uma telemetria de maior qualidade (e em grande quantidade) que possa ser usada para criar um registro de alta fidelidade, repleto de contexto e totalmente correlacionado a cada solicitação ou transação feita pelo usuário do aplicativo. Entra em cena a observabilidade.

Como funciona a observabilidade?

As plataformas de observabilidade descobrem e coletam telemetria de desempenho de forma contínua ao integrar-se à instrumentação existente nos componentes do aplicativo e da infraestrutura, além de fornecer ferramentas para incluir instrumentação nesses componentes. A observabilidade concentra-se em quatro tipos principais de telemetria:

  • Logs. Logs são registros granulares, com registro de data e hora e imutáveis sobre eventos do aplicativo. Entre outras coisas, os logs podem ser usados para criar um registro de alta fidelidade, milissegundo a milissegundo, de cada evento, completo com contexto circundante, que os desenvolvedores podem "reproduzir" para fins de resolução de problemas e depuração.
  • Métricas. Métricas (às vezes chamadas de métricas de série temporal) são medidas fundamentais sobre o funcionamento do aplicativo e do sistema ao longo de um determinado período de tempo, como quanta memória ou capacidade de CPU um aplicativo utiliza ao longo de cinco minutos, ou quanta latência um aplicativo experimenta durante um pico de uso.
  • Rastreios. Rastreios registram a "jornada" de ponta a ponta de cada solicitação do usuário, da interface com o usuário ou aplicativo móvel através de toda a arquitetura distribuída e de volta ao usuário.
  • Dependências (também chamadas de mapas de dependências) revelam como cada componente de aplicativo é dependente de outros componentes, aplicativos e recursos de TI.

Após reunir essa telemetria, a plataforma a correlaciona em tempo real para fornecer às equipes de DevOps, às equipes de engenharia de confiabilidade de site (SREs) e à equipe de TI informações completas e contextuais: o quê, onde e por que de qualquer evento que possa indicar, causar ou ser usado para abordar um problema de desempenho do aplicativo. 

Muitas plataformas de observabilidade descobrem automaticamente novas fontes de telemetria, como aquelas que podem surgir de dentro do sistema (como uma nova chamada de API para outro aplicativo de software). E por lidarem com muitos mais dados do que uma solução APM padrão, muitas plataformas incluem recursos de AIOps (inteligência artificial para operações) que separam os sinais, as indicações de problemas reais, do ruído (dados não relacionados a problemas).

 

Benefícios da observabilidade

O benefício dominante da observabilidade é que, com todas as outras coisas sendo iguais, um sistema mais visível é mais fácil de entender (em geral e em maior detalhe), mais fácil de monitorar, mais fácil e seguro de atualizar com nova programação, e mais fácil de reparar do que um sistema menos visível. Mais especificamente, a observabilidade suporta diretamente os objetivos de Agile/DevOps/SRE de fornecer software de alta qualidade mais rapidamente, ao permitir que uma organização:

  • Descubra e aborde os "desconhecidos", aqueles problemas que você não sabe que existem. Um principal limitação das ferramentas de monitoramento é que elas monitoram apenas os "desconhecidos conhecidos", aquelas condições excepcionais as quais você já sabe que deve monitorar. A observabilidade descobre condições que você talvez nunca conheça ou considere procurar e, em seguida, rastreia seu relacionamento com problemas específicos de desempenho para fornecer o contexto para identificar as causas raízes e acelerar a resolução.
  • Detecte e resolva problemas no início do desenvolvimento. A observabilidade integra o monitoramento às fases iniciais do processo de desenvolvimento de software. As equipes de DevOps podem identificar e corrigir problemas no novo código antes que impactem a experiência do cliente ou os SLAs.
  • Ajuste a escala da observabilidade automaticamente. Por exemplo, é possível especificar a instrumentação e a agregação de dados como parte de uma configuração de cluster de Kubernetes e começar a coletar telemetria desde sua criação até sua destruição.
  • Permite a correção automatizada e a infraestrutura com capacidade de recuperação automática do aplicativo. Combine a observabilidade com os recursos de aprendizado de máquina e de automação do AIOps para prever problemas com base nas saídas do sistema e resolvê-las sem a intervenção da gestão.
Soluções relacionadas
Automação impulsionada por IA

A automação impulsionada por IA pode ajudar sua empresa, dos fluxos de trabalho de negócios às operações de TI.

Conheça a automação impulsionada por IA
Observability with IBM Instana™

Descubra a plataforma de observabilidade corporativa líder para nuvens híbridas.

Conheça o Observability with Instana
IBM Cloud Pak® for Watson AIOps

O IBM Cloud Pak® for Watson AIOps é uma solução de gerenciamento de operações de TI que permite aos operadores de TI colocar a IA no centro de sua cadeia de ferramentas ITOps.

Conheça o IBM Cloud Pak® for Watson AIOps
Recursos Observabilidade x monitoramento: qual é a diferença?

Monitoramento e observabilidade são duas formas de identificar a causa subjacente de problemas: em que eles se assemelham e diferem?

Observabilidade Por que e Como?

Aprenda o por que e o como da observabilidade com um explicador IBM.

O que os desenvolvedores precisam saber sobre a observabilidade

Este e-book é um exame do novo mundo. Nós vamos deixar todos os sentimentos ruins sobre o monitoramento para trás e dar os nossos primeiros passos no mundo da observabilidade e sua importância cada vez maior para os desenvolvedores.

Soluções de observabilidade e operações de IA da IBM: como elas se encaixam para resolver incidentes

As três soluções sinérgicas da BM no domínio AIOps: IBM Observability by Instana APM, Turbonomic Application Resource Management for IBM Cloud Paks e IBM Cloud Pak® for Watson AIOps.

Dê o próximo passo

Com a aquisição do Instana, a IBM oferece recursos de automação impulsionados por IA líderes do setor para gerenciar a complexidade de aplicativos modernos que abrangem cenários de cloud híbrida, especialmente à medida que a demanda por melhores experiências do cliente e mais aplicativos impactam os negócios e as operações de TI.Uma mudança em direção a uma maior automação nos negócios e na TI deve começar com projetos pequenos e mensuráveis de sucesso, que você pode ajustar a escala e otimizar para outros processos e em outras partes da sua organização.

Teste o IBM Instana™ Observability