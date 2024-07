Ein Site Reliability Engineer ist ein Softwareentwickler mit Erfahrung im IT-Betrieb – jemand, der weiß, wie man programmiert und wie man in einer ausgedehnten IT-Umgebung die Systeme am Laufen hält.

Site Reliability Engineers verbringen die Hälfte ihrer Zeit mit manuellen IT-Operationen und Aufgaben der Systemadministration – der Analyse von Protokollen, der Leistungsoptimierung, der Anwendung von Patches, dem Testen von Produktionsumgebungen, der Reaktion auf Vorfälle und der Durchführung von Post-Mortem-Analysen. Den Rest ihrer Zeit entwickeln sie Code, der diese Aufgaben automatisiert. Ihr Ziel ist es, weniger Zeit mit dem Ersteren und mehr Zeit mit dem Letzteren zu verbringen.

Auf einer höheren Ebene dient das SRE-Team als Brücke zwischen den Entwicklungsteams und den Betriebsteams und ermöglicht es dem Entwicklungsteam, neue Software oder neue Funktionen so schnell wie möglich in Produktion zu bringen. Sie tun dies, während sie gleichzeitig ein vereinbartes akzeptables Niveau der IT-Betriebsleistung und des Fehlerrisikos in Übereinstimmung mit den Service Level Agreements (SLAs) sicherstellen, welche das Unternehmen mit seinen Kunden abgeschlossen hat. Auf der Grundlage seiner Erfahrung und einer Fülle von Betriebsdaten hilft das SRE-Team den Entwicklungs- und Betriebsteams bei der Erstellung von