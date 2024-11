Os SLAs contêm termos que variam de acordo com o fornecedor, tipo de serviço, requisitos do cliente, padrões de conformidade, entre outros, e as métricas variam conforme o setor e a aplicação. No entanto, métricas como disponibilidade, tempo médio de recuperação, tempo de resposta, taxas de erro e medições de segurança e conformidade são comumente usadas em diversos serviços e setores. Essas métricas definem uma linha de base para as operações e a qualidade dos serviços prestados.

Definir claramente quais métricas e KPIs serão usados para medir o desempenho e como essa informação será comunicada ajuda as equipes de gerenciamento de serviços de TI (ITSM) a identificar quais dados coletar e monitorar. Com os dados certos, as equipes podem manter os SLAs de forma mais eficiente e garantir que os clientes saibam exatamente o que esperar.



Idealmente, as equipes de ITSM participam do processo de criação dos SLAs e monitoram as métricas relacionadas ao seu cumprimento. Incluir as equipes de ITSM desde o início ajuda a garantir que as equipes de negócios não firmem acordos com clientes que não sejam possíveis para as equipes de TI.

Métricas de SLA importantes para líderes de TI e ITSM monitorarem incluem:

1. Disponibilidade

Interrupções de serviço, ou períodos de inatividade, são custosos, podem prejudicar a credibilidade da empresa e levar a problemas de conformidade. O SLA entre uma organização e um cliente estabelece o nível esperado de disponibilidade ou tempo de operação do serviço, sendo um indicador de funcionalidade do sistema.

A disponibilidade é frequentemente medida em "noves no caminho para 100%": 90%, 99%, 99,9% e assim por diante. Muitos provedores de nuvem e SaaS buscam um padrão do setor de "cinco noves" ou 99,999% de tempo de atividade.

Para determinados negócios, até mesmo uma hora de downtime pode gerar perdas significativas. Se um site de comércio eletrônico sofrer uma interrupção durante um período de tráfego intenso, como a Black Friday ou uma grande promoção, isso pode prejudicar a reputação da empresa e sua receita anual. As interrupções de serviço também impactam negativamente a experiência do cliente. Serviços que não estão disponíveis de forma consistente muitas vezes levam os usuários a buscar alternativas. As necessidades empresariais variam, mas a necessidade de fornecer produtos e serviços rápidos e eficientes é universal.

Geralmente, o tempo de atividade máximo é preferido. No entanto, provedores em alguns setores podem considerar mais eficaz em termos de custo oferecer uma taxa de disponibilidade ligeiramente menor, desde que ainda atenda às necessidades dos clientes.

2. Tempo médio de recuperação

O tempo médio de recuperação mede a quantidade média de tempo necessária para recuperar um produto durante uma falha ou interrupção. Nenhum sistema ou serviço é imune a falhas ocasionais, mas empresas que conseguem se recuperar rapidamente têm maior probabilidade de manter a lucratividade, atender às necessidades dos clientes e cumprir os SLAs.

3. Tempo de resposta e tempo de resolução

SLAs frequentemente estipulam o tempo necessário para que um provedor de serviço responda após a sinalização ou registro de um problema. Quando um problema é registrado ou uma solicitação de serviço é feita, o tempo de resposta indica quanto tempo leva para o provedor responder e começar a lidar com o problema. O tempo de resolução refere-se a quanto tempo leva para que o problema seja resolvido. Minimizar esses tempos é fundamental para manter o desempenho do serviço.



As organizações devem buscar resolver problemas antes que eles se tornem falhas de sistema generalizadas e causem problemas de segurança ou conformidade. Soluções de software que oferecem observabilidade de ponta a ponta nas funções empresariais podem desempenhar um papel importante na manutenção de sistemas otimizados e no desempenho do serviço. Muitas dessas plataformas utilizam ferramentas de automação e aprendizado de máquina (ML) para automatizar o processo de remediação ou identificar problemas antes que eles surjam.

Por exemplo, sistemas de detecção de intrusão (IDS) baseados em IA monitoram constantemente o tráfego de rede em busca de atividades maliciosas, violações de protocolos de segurança ou dados anômalos. Esses sistemas utilizam algoritmos de aprendizado de máquina para monitorar grandes conjuntos de dados e identificar dados anômalos. Anomalias e intrusões geram alertas que notificam as equipes de TI. Sem IA e aprendizado de máquina, monitorar manualmente esses grandes conjuntos de dados seria inviável.

4. Taxas de erros

As taxas de erro medem as falhas de serviço e o número de vezes que o desempenho do serviço fica abaixo dos padrões definidos. Dependendo da empresa, as taxas de erro podem estar relacionadas a uma série de questões ligadas às funções de negócios.

Por exemplo, na manufatura, as taxas de erro estão correlacionadas ao número de defeitos ou problemas de qualidade em uma linha de produtos específica, ou ao número total de erros encontrados durante um intervalo de tempo definido. Essas taxas de erro, ou taxas de defeito, ajudam as organizações a identificar a causa raiz de um erro e se ele está relacionado aos materiais usados ou a um problema mais amplo.



Há um subconjunto de métricas baseadas em clientes que monitora as interações de atendimento ao cliente, também relacionadas às taxas de erro.

Taxa de resolução no primeiro contato: no atendimento ao cliente, questões relacionadas a interações com o help desk podem influenciar as taxas de erro. O sucesso nas interações de atendimento ao cliente pode ser difícil de avaliar. Nem todos os clientes preenchem uma pesquisa ou registram uma reclamação se um problema não for resolvido, alguns simplesmente buscam outro serviço. Uma métrica que ajuda a medir as interações de atendimento ao cliente é a taxa de resolução no primeiro contato. Essa taxa reflete se o problema do usuário foi resolvido na primeira interação com um help desk, chatbot ou representante. Cada escalonamento de uma consulta de atendimento ao cliente além do contato inicial implica em custos extras de recursos. Também pode impactar a experiência do cliente.

no atendimento ao cliente, questões relacionadas a interações com o help desk podem influenciar as taxas de erro. O sucesso nas interações de atendimento ao cliente pode ser difícil de avaliar. Nem todos os clientes preenchem uma pesquisa ou registram uma reclamação se um problema não for resolvido, alguns simplesmente buscam outro serviço. Uma métrica que ajuda a medir as interações de atendimento ao cliente é a taxa de resolução no primeiro contato. Essa taxa reflete se o problema do usuário foi resolvido na primeira interação com um help desk, chatbot ou representante. Cada escalonamento de uma consulta de atendimento ao cliente além do contato inicial implica em custos extras de recursos. Também pode impactar a experiência do cliente. Taxa de abandono: essa taxa reflete a frequência com que um cliente abandona sua consulta antes de encontrar uma resolução. A taxa de abandono pode também contribuir para a taxa geral de erro e ajuda a medir a eficácia de um service desk, chatbot ou equipe humana.

5. Segurança e conformidade

Altos volumes de dados e o uso de servidores locais, servidores em nuvem e um número crescente de aplicações aumentam o risco de violações de dados e ameaças à segurança. Se não forem monitoradas adequadamente, as falhas de segurança e vulnerabilidades podem expor os provedores de serviço a repercussões legais e financeiras.

Por exemplo, o setor de saúde possui requisitos específicos sobre como armazenar, transferir e descartar dados médicos dos pacientes. O não cumprimento desses padrões de conformidade pode resultar em multas e compensações por perdas sofridas pelos clientes.

Embora existam inúmeras métricas específicas de setor definidas pelos diferentes serviços oferecidos, muitas delas se enquadram em categorias mais amplas. Para alcançar o sucesso, é importante que as equipes de negócios e as equipes de gerenciamento de serviços de TI trabalhem juntas para melhorar a entrega de serviços e atender às expectativas dos clientes.