L'organizzazione IBM Software Site Reliability Engineering (SRE) è responsabile dell'affidabilità e della sicurezza della piattaforma software as a service (SaaS) e di servizi gestiti IBM, che si estende su più piattaforme cloud, tra cui IBM Cloud, AWS, Microsoft Azure e Google Cloud Platform. Il team Software SRE fornisce una vasta gamma di soluzioni SaaS a centinaia di aziende, in tutti i settori, in tutto il mondo.



A causa dell'ampiezza e della complessità della piattaforma, molte vulnerabilità ed esposizioni comuni (CVE) sono potenzialmente rilevanti e potrebbero dover essere mitigate. Inoltre, migliaia di certificati applicativi devono essere mantenuti correttamente per proteggere il tempo di attività.



È compito del team Software SRE determinare esattamente quali CVE devono essere mitigate e quali certificati devono essere rinnovati o sostituiti per supportare le prestazioni e la sicurezza delle soluzioni IBM SaaS. Fino a poco tempo fa, questo significava molto lavoro manuale. "Avevamo un cumulo di 1.000-2.000 CVE a notte", afferma Marc Velasco, Site Reliability Engineer per la piattaforma IBM SaaS. "È come un pagliaio di informazioni. E la nostra sfida è: come possiamo trovare gli aghi, le CVE che dobbiamo davvero correggere?"



In precedenza, il team Software SRE affrontava la sfida delle CVE come molti altri team SRE del settore. Utilizzavano il software Twistlock, parte di Palo Alto Prisma Cloud, per segnalare CVE potenzialmente rilevanti. E team separati, ciascuno responsabile di un aspetto specifico della piattaforma, analizzavano manualmente le CVE per determinare le priorità e le azioni per la loro area. I team dovevano anche cercare manualmente e mitigare eventuali certificati non coperti dal sistema di gestione automatizzata dei certificati dell'organizzazione.



Questo lavoro richiedeva una notevole quantità di tempo. Con risorse limitate, il team ha sempre cercato modi per essere più efficiente. "C'è un limite alla progettazione dell'affidabilità del sito che possiamo attuare", afferma Velasco. "Quindi, come possiamo trasformare tutte queste informazioni in qualcosa di attuabile e prioritario?"



Entra in scena IBM Concert.