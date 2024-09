Um engenheiro de confiabilidade de sites é um desenvolvedor de software com experiência em operações de TI — alguém que sabe programar e que entende como “manter as luzes acesas” em um ambiente de TI de grande escala.

Os engenheiros de confiabilidade do local gastam metade de seu tempo executando operações manuais de TI e tarefas de administração do sistema — analisando logs, ajuste de desempenho, aplicando patches, testando ambientes de produção, respondendo a incidentes, realizando post-mortems. No resto do tempo, eles desenvolvem código que automatiza essas tarefas. O objetivo deles é passar menos tempo no primeiro e mais tempo no segundo.

Em um nível superior, a equipe de SRE serve como uma ponte entre as equipes de desenvolvimento e as equipes de operações, permitindo que a equipe de desenvolvimento traga novos softwares ou novos recursos para a produção o mais rápido possível. Eles fazem isso ao mesmo tempo em que garantem um nível aceitável acordado de desempenho de operações de TI e risco de erro, de acordo com os acordos de nível de serviço (SLAs) que a organização tem em vigor com seus clientes. Com base em sua experiência e uma riqueza de dados operacionais, a equipe de SRE ajuda as equipes de desenvolvimento e operações a estabelecer