Die IBM® Software Site Reliability Engineering (SRE) Organization ist für die Zuverlässigkeit und Sicherheit der IBM Software-as-a-Service- (SaaS) und Managed Services-Plattform verantwortlich. Sie umfasst mehrere Cloud-Plattformen, darunter IBM Cloud®, AWS, Microsoft® Azure und Google Cloud Platform. Das Software SRE-Team liefert eine Vielzahl von SaaS-Lösungen an Hunderte von Unternehmen in verschiedenen Branchen weltweit.



Da die Plattform sehr umfangreich und komplex ist, sind möglicherweise viele allgemeine Schwachstellen und Gefährdungen (CVE) vorhanden, die es zu beseitigen gilt. Darüber hinaus müssen Tausende von Anwendungszertifikaten ordnungsgemäß gewartet werden, um die Betriebszeit einhalten zu können.



Das Software-SRE-Team muss genau bestimmen, welche CVEs abgemildert und welche Zertifikate erneuert oder ersetzt werden müssen, um die Leistung und Sicherheit von IBM SaaS-Lösungen zu unterstützen. Bis vor kurzem war dies mit viel manueller Arbeit verbunden. „Wir mussten uns um 1.000 bis 2.000 CVEs pro Nacht kümmern“, sagt Marc Velasco, Site Reliability Engineer für die IBM SaaS-Plattform. „Es ist wie die Suche nach der Nadel im Heuhaufen. Und unsere Herausforderung besteht darin, wie finden wir die Nadeln, sprich: die CVEs, die wir wirklich patchen müssen?“



Bisher ging das Software-SRE-Team die CVE-Herausforderung wie viele andere SRE-Teams in der Branche an. Sie verwendeten die Twistlock-Software, die Teil der Palo Alto Prisma Cloud ist, um potenziell relevante CVEs zu melden. Und separate Teams, die jeweils für einen bestimmten Aspekt der Plattform verantwortlich waren, analysierten die CVEs manuell, um Prioritäten und Maßnahmen für ihren Bereich festzulegen. Die Teams mussten außerdem manuell nach Zertifikaten suchen und diese entschärfen, die nicht vom automatisierten Zertifikatsverwaltungssystem des Unternehmens erfasst wurden.



Diese Arbeit nahm viel Zeit in Anspruch. Angesichts der begrenzten Ressourcen suchte das Team immer nach Möglichkeiten, effizienter zu arbeiten. „Es gibt nur eine begrenzte Anzahl von SREs, die wir dafür einsetzen können“, sagt Velasco. „Wie können wir also all diese Informationen in etwas umwandeln, das handlungsfähig ist und Prioritäten setzt?“



Hier kommt IBM Concert® ins Spiel.