미국 최대 5G 네트워크의 AI 기반 자동화
T-Mobile이 효율성과 신뢰성을 최대화하기 위해 AIOps를 사용하는 방법

2020년 4월, T-Mobile은 미국 통신 시장을 변화시키는 경쟁적 도약을 이루었습니다. 이 회사는 Sprint를 인수하여 미국 최대 규모의 5G 네트워크를 구축하는 합병을 시작했습니다.

물론 이러한 확장에는 상당한 위험도 수반되었습니다. 치열한 경쟁이 벌어지는 통신 시장에서 고객은 합병 후에도 숨 쉴 틈을 주지 않았습니다. T-Mobile은 뛰어난 서비스 신뢰성과 품질을 계속 유지함과 동시에 양대 네트워크를 통합해야 했습니다.

이를 실현하는 것은 네트워크 관리에 달려 있습니다. T-Mobile은 IBM Cloud Pak® for Watson AIOps 툴을 사용하여 관리를 통합하고, 두 개의 방대한 네트워크를 하나로 전환하며, AI 기반 자동화를 사용하여 안정성과 효율성을 모두 극대화합니다.

엄청난 수의 결함

 

T-Mobile이 Sprint를 인수했을 때, 하루에 약 3백만 건의 추가적인 결함을 처리해야 했습니다.

처리 시간 단축

 

IBM Cloud Pak for Watson AIOps의 평균 장애 처리 시간은 5분에서 19초로 단축되었습니다.

"대상 지정 프로덕션 시스템을 1/10로 스케일링하여 전체 경보의 90%를 처리했습니다." 네트워크에 존재하는 다른 관리 시스템에서는 동일한 볼륨에 대해 10개의 SNMP 게이트웨이가 필요했고 여러 번의 장애 및/또는 처리 지연이 발생한 반면, 모든 SNMP 경보는 지연이나 실패 없이 단일 SNMP 프로브를 통해 수신되었습니다. Tom Higdon Principal Event Management Architect T-Mobile
두 배의 복잡성을 극복한 품질 극대화

"네트워크 관리는 T-Mobile 네트워크를 사용하는 사람과 기업에 제공하는 서비스 품질의 주요 구성 요소입니다."라고 T-Mobile의 수석 이벤트 관리 아키텍트인 Tom Higdon은 말합니다. “네트워크 관리란 보유한 모든 훌륭한 서비스를 고객이 실제로 이용할 수 있도록 보장하고 고객이 원하는 방식으로 수행하도록 하는 방법입니다.”

그리고 세계 최대 규모의 통신 네트워크 중 하나를 운영하는 경우 네트워크 관리도 매우 복잡합니다. "무선 네트워크는 데이터 센터와 IP 기반 장비 및 애플리케이션과 서비스, 셀 사이트와 스위치 사이트, 관련된 모든 장비 등 다른 지원 네트워크와 인프라에 의존하기 때문에 단순히 무선 네트워크만 있는 것은 아닙니다."라고 Higdon은 설명합니다.

T-Mobile이 Sprint를 인수하면서 기본적으로 범위와 복잡성이 두 배로 증가했습니다. "합병 첫날, 네트워크 관리 기능을 제공해야 하는 대상의 범위가 50만 대에 가까운 디바이스로 늘어났고, 이로 인해 하루에 약 300만 개의 새로운 결함이 발생했습니다."라고 Higdon은 말합니다.

또한, 두 네트워크에는 뚜렷하고 성숙한 관리 시스템이 있었습니다. "우리는 각각 10년 이상 존재해 온 시스템을 가지고 있었기 때문에 통합의 복잡성이 증가했다"고 Higdon은 설명합니다. 이 시스템에는 두 개의 별도 핵심 관리 플랫폼(하나는 IBM® Netcool® 솔루션 기반(현재 IBM Cloud Pak for Watson AIOps에 내장됨), 다른 하나는 타사 관리 솔루션 기반)과 핵심 플랫폼에 공급되는 멀티벤더 모니터링 도구가 포함되었습니다.

최고의 네트워크 성능을 제공하는 데 중점을 둔 T-Mobile은 매일 발생하는 수백만 건의 장애 중에서 조치 가능한 항목을 식별할 수 있는 최선의 방법을 모색했습니다. 이 회사는 또한 더 많은 자동화를 구축하여 네트워크 관리를 더욱 효율적으로 만들고 네트워크 자체의 신뢰성을 더욱 높일 계획입니다.

네트워크 관리의 유연성 및 효율성

"히그던은 "합병 후 거의 즉시 IBM이 자사 제품군에 투자하고 있다는 사실을 알게 되었고, IBM이 우리와 진정한 파트너십을 맺어 서로 발전하고 성공하기를 원한다는 사실을 알게 되었습니다."라고 말합니다. 따라서 일부 기술적인 차별화 요소와 비기술적인 차별화 요소가 나타나기 시작했습니다. 그래서 우리는 Watson AIOps 솔루션을 사용하기로 결정했습니다.”

즉각적인 우선순위는 서로 다른 결함 관리 플랫폼을 통합하는 것이었습니다. 빠르게 완료해야 하는 어려운 작업이었습니다. 다행히도 Higdon과 그의 동료들은 IBM 솔루션이 다른 관리 및 모니터링 도구의 데이터를 통합할 수 있을 만큼 유연하다는 것을 알게 되었습니다. "빠르게 성공적으로 통합했습니다. 이는 우리가 새로운 비즈니스로서 가장 먼저 한 일 중 하나입니다."라고 Higdon은 말합니다. “IBM 제품군의 커넥터와 어댑터를 최소한의 사용자 지정으로 신속하게 배포 및 구성하여 해당 데이터를 얻고 장애 및 이벤트 정보를 보강할 수 있었습니다. 덕분에 네트워크 운영 팀을 통합할 수 있었습니다."

T-Mobile은 양산 출시를 위해 통합 네트워크 관리 플랫폼을 준비하면서 효율성이 크게 향상되었습니다. "대상 지정 프로덕션 시스템을 1/10로 스케일링하여 전체 경보의 90%를 처리했습니다. 네트워크에 존재하는 다른 관리 시스템에서는 동일한 볼륨에 대해 10개의 SNMP 게이트웨이가 필요했고 여러 번의 장애 및/또는 처리 지연이 발생한 반면, 모든 SNMP 경보는 지연이나 실패 없이 단일 SNMP 프로브를 통해 수신되었습니다."

 

실행 가능한 인사이트의 획기적인 가속화

인수한 플랫폼과 기존 플랫폼 간의 운영이 통합됨에 따라 Higdon과 그의 팀은 이제 관리를 더욱 간소화하고, 일반적인 네트워크 운영의 '노이즈'를 줄이며, 문제를 감지 및 해결하거나 이상적으로는 예방할 수 있는 가장 빠른 경로를 만드는 데 집중하고 있습니다. Higdon은 “우리는 다양한 유형의 문제를 해결하고 적절한 결과를 얻는 데 도움이 되는 본질적으로 일반적인 프레임워크라고 부르는 것을 만들고 구현합니다.”라고 말합니다. 예를 들어 Higdon은 최근 구현된 무선 코어 경보 상관관계 프레임워크를 설명합니다. "상관관계 분석은 거의 즉각적으로 수행할 수 있습니다. 이것이 바로 차별화 요소입니다. 다시 돌아가서 매분 수천 개의 결함을 스캔할 필요가 없다는 얘기입니다. 순식간에 이루어집니다."

그리고 이러한 프레임워크를 만드는 것은 비교적 쉽다고 Higdon은 말합니다. “Watson AIOps의 도구는 유연하며 이러한 프레임워크를 만드는 데 도움이 되는 어댑터가 포함되어 있습니다. 이것이 가장 큰 강점 중 하나입니다. 복잡한 코딩이 필요하지 않습니다. 약간의 조정이 필요하지만 매우 간단한 경향이 있습니다. 이 솔루션은 다양한 대상과 일반적으로 대화할 수 있는 방법을 제공합니다. 이는 우리의 요구 사항에 맞게 쉽게 조정할 수 있는 내부 기능을 제공합니다.”

Higdon과 그의 팀은 이미 사용자에게 실행 가능한 인사이트를 제공하는 데 있어 극적인 가속화를 경험하고 있습니다. "우리는 모든 수준에서 완전한 로컬 및 지리적 이중화를 제공하도록 Watson AIOps 배포를 설계했습니다. 또한, 지연을 최소화하면서 필요한 오류 볼륨을 처리할 수 있도록 대상 시스템을 확장했습니다. 최소한의 AIOps 구성 요소를 사용하여 전체 장애 볼륨의 90%를 처리할 때, 모든 강화, 상관관계 및/또는 억제 기능을 갖춘 시스템을 통해 장애 발생부터 사용자 디스플레이까지 평균 19초가 걸리는 것으로 나타났습니다. 레거시 시스템은 5분에 가까웠습니다."

다음 단계: AI를 통한 폐쇄 루프 자동화

현재 T-Mobile은 IBM Watson AIOps의 AI 및 머신 러닝 기능이 어떻게 반응성을 더욱 높이고 네트워크 안정성을 더욱 강화하는 데 도움이 되는지 테스트하고 있습니다.

"우리는 AI가 우리에게 다시 인텔리전스를 제공할 수 있기를 바랍니다. 상관관계 수에 대한 임계값은 얼마인지, 아니면 우리가 알 수 없는 관계가 있는지와 같은 형태의 인텔리전스일 수 있습니다. 인간으로서 많은 시간과 에너지를 들이지 않으면 파악하지 못할 수도 있는 것들입니다."

네트워크 관리의 목표는 사후 대응에서 사전 예방적 관리로, 궁극적으로는 예측 관리로 전환하는 것입니다. Higdon은 한 단계 더 나아가 폐쇄 루프 자동화를 달성하기 위해 AIOps를 사용하려고 합니다. "이것이 우리가 궁극적으로 가고자 하는 곳입니다. 도구를 통해 대량의 데이터를 가져오고, 해당 데이터를 이해하고, 권장 사항을 제시하고, 인텐트 기반 오케스트레이션 또는 자동화까지 구현할 수 있습니다.”

이는 경쟁이 치열한 업계에서 이러한 규모의 네트워크를 사용하면 귀중한 이점이 될 것입니다. "용량을 늘려야 합니다. 변화에 영향을 미칠 지능형 자동화 플랫폼에 해당 정보를 전달하는 도구가 있습니다. 이 모든 것이 사람의 개입 없이 이루어집니다. 이것이 우리의 계획이며, 폐쇄형 루프이며, 지금 이 순간에도 우리가 계속 전진하고 있는 곳입니다."

T-Mobile 로고
T-Mobile 소개

T-Mobile (링크는 ibm.com 외부에 있음)은 세계에서 가장 빠르게 성장하고 있는 선도적인 모바일 통신 사업자 중 하나입니다. 독일 본에 본사를 둔 Deutsche Telekom AG의 자회사인 T-Mobile은 유럽, 미국, 카리브해의 소비자 및 기업 고객에게 서비스를 제공합니다. 2020년에는 550만 명의 순 고객을 추가하고 미화 684억 달러의 매출을 달성했습니다.

다음 단계 안내

이 사례에 소개된 IBM 솔루션에 대해 자세히 알아보려면 IBM 담당자 또는 IBM 비즈니스 파트너에게 문의하세요.

PDF 읽기 더 많은 사례 보기 급성장하는 경제의 엔진 구축

급성장하는 경제의 엔진 구축

사례 연구 읽기
법률

© Copyright IBM Corporation 2021. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

2021년 11월 미국에서 제작

IBM, IBM 로고, ibm.com, IBM Cloud 및 Netcool은 전 세계 여러 국가에 등록된 International Business Machines Corp.의 상표입니다. 기타 제품 및 서비스 이름은 IBM 또는 다른 회사의 상표일 수 있습니다. IBM 상표의 최신 목록은 웹( ibm.com/trademark)에서 확인할 수 있습니다.

이 문서는 최초 발행일 기준 최신 문서로, IBM은 언제든지 해당 내용을 변경할 수 있습니다. IBM이 현재 영업 중인 모든 국가에서 모든 제품이 제공되는 것은 아닙니다.

명시된 성능 데이터 및 고객 사례는 오직 정보 목적으로 제공됩니다. 실제 성능 결과는 특정 구성 및 작동 조건에 따라 다를 수 있습니다. 본 문서의 정보는 상품성, 특정 목적에의 적합성, 비침해성 보증 또는 조건을 포함하여 명시적 또는 묵시적 보증 없이 '있는 그대로' 제공됩니다. 제품 제공 시의 계약 조건에 따라 해당 IBM 제품을 보증합니다.