상호 연결된 컴퓨팅 리소스가 원활하게 통신하고 일상적인 네트워크 관리 작업을 자동화하며 최적화된 AI 모델 학습 및 추론을 용이하게 하는 최신 컴퓨터 네트워킹의 중요한 구성 요소입니다. AI 기반 전략은 개발 팀이 오늘날 IT 환경의 규모, 복잡성 및 정교함에 비해 충분하지 않은 기존 네트워킹 관행의 한계를 극복하는 데 도움이 될 수 있습니다.
기존 네트워크는 수동 프로세스, 정적 구성 및 예약된 유지 관리에 의존하므로 간단한 장치 상호 작용이 있는 소규모 네트워크에서는 문제가 되지 않습니다. 그러나 최신 네트워크는 단순하거나 규모가 작지 않습니다. 이는 다양하고 역동적인 글로벌 환경과 수천 개의 상호 연결된 디바이스와 종속성이 있는 하이브리드 클라우드 인프라에 걸쳐 있습니다. 멀티 클라우드 환경은 서로 다른 12가지의 서비스와 플랫폼에 걸쳐 있습니다.
AI 및 ML 도구로 기존 네트워크 인프라를 보강하면 기업이 네트워크 관리 관행을 간소화하고 네트워크 인텔리전스를 개선하며 자동화 기능을 확장하는 데 도움이 될 수 있습니다. AI 네트워킹 솔루션은 다음을 지원합니다.
어떤 경우에는 AI 기반 네트워크가 자가 치료 메커니즘과 워크플로를 생성할 수도 있습니다.
AI 네트워킹은 대규모 AI 모델 배포와 고도로 자율적인 데이터 기반 엔터프라이즈 네트워크 구축에 필수적입니다. 이는 사람이 관리하는 정적인 네트워킹에서 현대 기술(5G, 사물인터넷(IoT), 엣지 컴퓨팅, AI 워크로드 및 클라우드 네이티브 서비스)의 엄청난 수요를 지원할 수 있는 동적 자율 구동 IT 인프라로 패러다임을 전환합니다.
그 결과 최종 사용자에게 원활한 경험을 제공하는 데 도움이 되는 더 스마트하고 빠르며 탄력적인 엔터프라이즈 네트워크가 탄생합니다.
AI 네트워킹은 원격 측정 수집을 통해 구동됩니다. 네트워크 전반의 모든 네트워킹 및 컴퓨팅 요소(라우터, 스위치, 애플리케이션 프로그래밍 인터페이스(API) 엔드포인트 포함)는 대규모 실시간 데이터 스트림(성과 지표, 트래픽 흐름 및 이상 신호)을 중앙 집중식 또는 분산형 데이터 레이크에 공급합니다.
클라우드 네이티브 AI 및 ML 모델은 지속적으로 데이터를 분석하고, 이벤트의 상관 관계를 지정하고, 정상 및 비정상적인 동작을 구성하는 요소를 학습하고, 데이터 기반 통찰력을 생성합니다. 비지도 학습(이상 탐지용), 지도 학습(예측 분석) 및 강화 학습을 사용하여 네트워크 프로세스와 상호 작용을 동적으로 최적화합니다. 그런 다음 AI 도구에서 얻은 인사이트는 자동화된 응답으로 변환됩니다.
AI 기반 네트워크 모니터링 툴이 정체 또는 장애를 감지하면 교정 워크플로를 트리거하여 트래픽 경로 변경, 워크로드 밸런싱, 네트워크 정책 업데이트 또는 보안 위협 격리를 수행하므로 IT 직원의 수동 개입이 필요하지 않습니다.
AI 네트워킹은 수평적으로 확장되도록 설계되었습니다. 네트워크 수요와 디바이스 에코시스템이 성장함에 따라 네트워크의 AI 시스템은 자동으로 더 많은 컴퓨팅 노드, 스위치 및 링크를 추가합니다. 또한 AI 네트워크는 다중 경로 연결과 신속한 장애 조치 메커니즘을 사용하여 중복성을 생성하고 높은 네트워크 가용성을 보장합니다.
업계 뉴스레터
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
AI 네트워크는 일련의 주요 구성 요소에 의존하여 작동합니다. 여기에는 다음이 포함됩니다.
AI 네트워크는 고급 하드웨어(예: 800G 및 400G 이더넷 또는 InfiniBand)와 컴퓨팅 노드, 데이터 스토리지 및 오케스트레이터 플랫폼 간의 초고속 저지연 데이터 교환을 위한 최적화된 컨트롤러를 사용합니다. 스위치에는 AI 트래픽의 급증을 수용하고 패킷 손실을 방지하기 위해 특수 패킷 프로세서와 딥 패킷 버퍼가 있는 경우가 많습니다.
라우터와 스위치는 소프트웨어 정의 네트워킹(SDN) 및 Network Functions Virtualization(NFV) 도구와 통합하여 네트워크 유연성과 확장성을 높일 수도 있습니다.
AI 네트워크는 대규모 무손실 고속 데이터 이동에 최적화된 구리 또는 광학 링크, 케이블링 및 트랜시버를 사용하여 그래픽 처리 장치(GPU) 및 데이터 처리 장치(DPU)를 비롯한 수천 개의 컴퓨팅 가속기를 연결합니다. 상호 연결은 디지털 커뮤니케이션의 중추를 형성하여 서로 다른 시스템, 데이터 및 서비스를 데이터 센터, 클라우드 및 경계 전반에서 연결합니다.
AI 네트워크는 상호 연결된 대규모 클러스터로 구성된 강력한 프로세서(DPU, GPU 및 기타 AI 전용 프로세서)를 사용하여 병렬 처리를 구현하고 AI 모델 학습 및 추론을 가속화합니다.
네트워크 패브릭은 종종 많은 수의 서버와 스위치 간 다중 경로 통신을 가능하게 하는 비차단 토폴로지 또는 네트워크를 응집력 있는 시스템을 형성하는 더 작고 독립적인(그러나 상호 연결된) 모듈로 나누는 분산된 모듈식 아키텍처로 설계됩니다.
AI 네트워크는 일반적으로 다계층 전략을 사용합니다. 예를 들어, 네트워크는 장기 보관을 위해 데이터 레이크와 웨어하우스를 사용하고, 비정형 데이터를 위한 오브젝트 스토리지를 사용하며, AI 워크로드에 대한 빠른 유사성 검색을 가능하게 하는 벡터 데이터베이스를 사용합니다.
자동화 및 AIOps 소프트웨어는 AI 네트워크가 리소스 배포, 확장, 지속적인 모니터링 및 CI/CD 파이프라인을 자동화하는 데 도움이 됩니다. 이러한 도구는 종종 머신 러닝 알고리즘을 사용하여 예측 분석을 실행하고 폐쇄 루프 네트워크 관리(네트워크 시스템이 실시간 동적 피드백 루프를 사용하여 수정 조치를 자동화하는 자체 수정 접근 방식)를 용이하게 합니다.
또한 소프트웨어 개발, 컨테이너화 및 버전 제어 프로세스를 간소화하는 데 도움이 되는 AI 지원 운영 체제와 가상 환경을 제공합니다.
AI 네트워크는 제로 트러스트 보안 구성, 역할 기반액세스 제어(RBAC), 암호화 프로토콜, 규정 준수 프레임워크 및 데이터 처리 규칙을 적용하여 네트워크 데이터와 AI 애플리케이션을 침해 및 사이버 공격으로부터 보호합니다.
AI 네트워킹은 AI 지원 자동화와 지능적이고 반응성이 뛰어난 인프라의 융합을 나타냅니다. 기업이 동적이고 안전하며 확장성이 뛰어난 네트워킹 환경을 구축하는 데 도움이 됩니다. AI 네트워크는 다음을 제공합니다.
ML 시스템은 일별, 주별, 계절별 패턴을 고려하여 시간에 따른 '정상적인' 네트워크 행동에 대한 동적 모델을 구축합니다. 이 접근 방식은 양성 변동이 경고를 트리거하는 것을 방지하고 시스템이 네트워크 기준선에서 크게 벗어나는 실제 이상 징후에 집중할 수 있도록 합니다.
AI 시스템은 여러 데이터 소스를 통합하고 정교한 알고리즘(비지도 학습 포함)을 사용하여 규칙 기반 시스템에서 간과할 수 있는 네트워크 성능 문제의 미묘한 지표를 상호 연관시킵니다. 예를 들어, AI 도구는 조직화된 다중 벡터 공격과 점진적으로 진행되는 저속 악성 트래픽을 탐지할 수 있습니다.
AI 네트워크는 ML 모델을 사용하여 네트워크 트래픽, 장치 로그 및 데이터 패턴을 지속적으로 모니터링하고 대량의 데이터를 실시간으로 분석합니다. 이러한 기능은 AI 도구가 보안 취약성, 비정상적인 동작(예: 급격한 트래픽 흐름), 무단 액세스 시도 및 사이버 공격의 초기 징후를 감지하는 데 도움이 됩니다.
기존의 정적 임계값 기반 이상 탐지 방법과 달리, AI 모델은 상황별 및 역사적 데이터를 사용하여 적응형 기준선을 구현하여 탐지를 보다 정확하게 만들고 IT 팀의 주의를 산만하게 할 수 있는 잘못된 경보를 줄입니다.
AI 도구는 네트워크 운영자가 사고를 더 빠르고 효과적으로 조사할 수 있도록 고급 분석, 자연어 쿼리, 데이터 시각화와 같은 기능을 제공합니다. 이러한 기능은 복잡한 네트워크 데이터에 대한 액세스를 민주화하여 데이터 처리 및 분석에 더 많은 리소스를 투입합니다. 또한 AI 네트워크가 협업 문제 해결을 지원하고 근본 원인 분석을 가속화하는 데 도움이 됩니다.
이상 징후를 감지하면 AI 네트워크는 자동화된 워크플로를 트리거하여 문제를 즉시 해결합니다. 예를 들어 AI 네트워크는 혼잡한 지역 주변으로 트래픽을 다시 라우팅하고, 의심스러운 IP 주소를 차단하고, 추가 네트워크 용량을 프로비저닝할 수 있습니다.
AI 도구는 현재의 이상 현상을 감지할 뿐만 아니라 원격 측정 데이터의 추세와 신호를 분석하여 향후 장애 또는 정체 지점을 예측하는 데 도움을 줄 수 있습니다. 예측 기능을 사용하면 네트워크 엔지니어와 관리자가 네트워크 관리에 대한 사전 예방적 접근 방식을 취하여 다운타임과 중단이 발생하기 전에 방지할 수 있습니다.
AI 네트워킹은 기존 네트워크 아키텍처와 근본적으로 다릅니다. AI 네트워킹은 실시간 데이터, ML 및 자동화를 활용하여 컴퓨팅 네트워크를 동적으로 개선하고 보호합니다.
기존 네트워크는 일반적으로 수동으로 구성된 정적 규칙, 사전 설정된 임계값 및 사후 관리 관행에 의존합니다. 기존 네트워킹은 또한 효율적인 데이터 전달을 위해 네트워킹 장치 계층을 생성하는 계층적 아키텍처를 사용합니다. 분산 제어는 예측 가능하고 안정적인 네트워크 환경을 생성하지만 확장성도 제한합니다(용량을 추가하려면 많은 경우 새로운 하드웨어 투자가 필요합니다).
기존 모델에서는 각 네트워크 장치가 자체 제어 및 데이터 플레인 기능을 독립적으로 수행합니다. 네트워크 운영자는 디바이스별로 라우팅 테이블, 스위칭 규칙 및 보안 정책을 수동으로 구성하여 데이터 트래픽을 관리합니다. 모니터링은 기본 지표로 제한되고, 경고는 고정된 조건(네트워크 문제가 발생한 후)에 의해 트리거되는 경우가 많으며, 문제 해결은 개별 장치로 격리되는 경향이 있어 인시던트 대응 네트워크 적응 속도가 느려집니다.
반면 AI 네트워크는 하이브리드 클라우드와 다중 클라우드 환경에 걸쳐 있으며, 많은 경우 온프레미스 데이터 센터, 다중 클라우드 환경 및 엣지 서버를 포합니다. 네트워크 전체에서 원격 측정 데이터를 지속적으로 수집하고 AI 알고리즘을 사용하여 실시간 데이터 세트를 분석하고 복잡한 트래픽 흐름을 이해하며 사용자 행동을 해석합니다.
AI 네트워크는 또한 더 나은 최적화 도구를 지원하고 네트워크 확장성을 높일 수 있습니다. 정적 구성에 의존하는 대신 AI 기반 네트워크는 실시간 사용 패턴에 따라 대역폭 할당 및 라우팅을 동적으로 조정하여 수요 급증에 맞게 리소스를 자동으로 확장합니다.
또한 AI 기반 네트워크는 더욱 안정적이고 포괄적인 보안을 제공합니다. 기존 네트워크는 일반적으로 멀웨어 또는 악의적인 활동과 관련된 고유한 패턴 또는 "서명"을 식별하여 알려진 위협을 탐지하고 방지하는 서명 기반 보안 모델을 사용합니다. AI 네트워킹은 포괄적인 행동 분석을 사용하여 정교한 공격을 식별하고 사이버 위협이 네트워크 보안을 손상시키 기 전에 해결하는 AI 기반 위협 탐지로 서명 기반 보안 모델을 강화(또는 대체)합니다.
AI 네트워크의 구축, 관리 및 보안 방식을 결정하는 몇 가지 주요 추세가 있습니다.
이더넷은 AI 워크로드를 위한 네트워크 패브릭으로 사용되는 경우가 증가하고 있습니다. 이 제품은 속도가 이미 400G 및 800G(및 곧 출시될 1.6T 이더넷)에 도달할 정도로 유연하고 비용 효율적이며 지연 시간이 짧은 네트워킹 솔루션을 제공합니다.
이더넷 기반 AI 네트워크에는 AI 모델 교육, 실시간 추론 및 대규모 AI 데이터 데이터 처리에 필요한 엄청난 데이터 처리량을 처리할 수 있는 막대한 대역폭이 있습니다. 또한 이더넷은 더욱 간단한 배포 프로세스와 온프레미스와 클라우드 AI 리소스 간의 무손실 통신을 지원하는 기능을 제공하므로, 다양한 분산형 AI 인프라를 연결하기 위한 훌륭한 옵션입니다.
생성형 AI(gen AI)의 발전으로 AI 네트워크 운영은 더욱 스마트해지고 자동화되고 있습니다. 생성형 AI는 이상적인 네트워크 토폴로지 및 장치 설정을 시뮬레이션하고 생성하여 네트워크 엔지니어의 네트워크 설계를 지원합니다.
생성형 AI 도구는 AI 네트워킹 및 용량 계획을 위한 예측 모델을 생성할 수 있습니다. 대규모 역사적 및 실시간 데이터 세트를 사용하여 향후 네트워크 부하를 예측하는 모델을 구축합니다. 이러한 모델을 통해 네트워크 운영자는 향후 수요 급증을 예측하고 인프라를 선제적으로 조정하여 병목 현상이나 서비스 중단을 방지할 수 있습니다.
또한 생성형 AI 기반 네트워킹 도구는 여러 무선 액세스 기술(예: Wi-Fi, Bluetooth, 4G LTE 및 5G)에서 로드 밸런싱을 지원하고 밀집된 네트워크 환경에서 데이터 간섭을 줄이는 데 도움이 됩니다.
에이전트 AI는 기업이 더욱 자율적이고 적응력이 뛰어난 AI 네트워크를 구축할 수 있도록 지원합니다. 에이전틱 AI는 "제한된 감독으로 특정 목표를 달성할 수 있는 AI 시스템"입니다. AI 에이전트는 대규모 언어 모델(LLM), 자연어 처리(NLP)와 머신 러닝(ML)을 사용하여 사용자와 여타 시스템 대신 워크플로를 자율적으로 설계하고 작업을 수행하며 프로세스를 실행합니다.
에이전틱 AI 네트워크는 기존의 정적 시스템과 달리 분산형 아키텍처를 사용하는데, 여기서 AI 에이전트는 여러 시스템과 엔드포인트를 이동하며 데이터를 빠르게 교환하여 의사 결정을 지원합니다. 에이전트는 환경을 인식하고, 네트워크 연결을 최적화하고, 보안 프로토콜을 강화하며 사용자 경험을 개선하기 위한 조치를 독립적으로 취할 수 있습니다.
예를 들어, 조건이 변경됨에 따라 네트워크 매개변수(예: 리소스 할당 및 데이터 라우팅)를 동적으로 조정할 수 있습니다. 또한 에이전트가 의심스러운 네트워크 활동을 감지하면 손상된 장치를 격리하고 실시간으로 대응 조치를 구현하여 사이버 공격을 차단할 수 있습니다.
네트워킹 분야의 AI가 발전함에 따라 AI 워크로드에 특별히 최적화된 스위치, GPU 및 고대역폭, 저지연 패브릭 등 AI 지원 인프라를 구축하는 데 상당한 관심이 집중되고 있습니다.
서비스형 AI 네트워크 인프라(NIaaS)가 그러한 발전 중 하나입니다. AI NIaaS는 온디맨드 방식으로 AI 네트워크 인프라를 가상화하고 오케스트레이션하여 네트워크 관리를 단순화하고 배포 시간을 몇 개월에서 몇 분으로 단축합니다. 이는 기업이 물리적 하드웨어를 배포하거나 유지 관리할 필요 없이 가상 라우터, 방화벽, 로드 밸런서 및 AI 관리 구성 요소를 포함한 전체 네트워킹 및 보안 기능 제품군에 액세스할 수 있는 클라우드 기반 모델입니다.
AI NIaaS 서비스 제공업체는 특정 AI 프로젝트의 컴퓨팅 요구 사항에 따라 네트워크 리소스가 프로비저닝되는 클라우드와 유사한 유연한 소비 모델(예: 종량제 또는 구독 기반 가격 책정)을 제공합니다.
통합 AI 클러스터를 사용한 하이퍼스케일 네트워킹은 또 다른 AI 네트워킹 추세입니다. AI 클러스터 통합은 AI 컴퓨팅 리소스를 여러 AI '섬'으로 구성하고 통합하여 데이터 패브릭을 생성하는 프로세스입니다. 이 통합은 워크로드를 더 적은 수의 더 강력한 클러스터에 집중시켜 네트워크에서 활용도가 낮은 서버와 노드의 수를 줄입니다.
또한 하이퍼스케일 환경(대규모 워크로드를 처리하도록 설계된 초대형 컴퓨팅 환경)은 엔터프라이즈 네트워크 규모의 클러스터 통합을 지원하는 데 필요한 용량, 냉각 및 데이터 스토리지를 제공합니다. 클러스터 통합과 하이퍼스케일 네트워킹을 함께 사용하면 AI 모델 학습 및 배포를 간소화하여 더 빠르고 효율적인 AI 네트워크를 구현할 수 있습니다.
IBM 기업가치연구소(IBM IBV)에 따르면 "에이전트 AI가 주도하는 AI 기반 워크플로는 2024년 3%에서 2026년 25%로 8배 증가할 것으로 예상된다"고 합니다. AI 기반 네트워킹 접근 방식을 채택하면 기업은 다음과 같은 다양한 이점을 누릴 수 있습니다.
AI 도구는 상황 변화에 따라 네트워크 구성을 동적으로 조정하고 트래픽 흐름을 최적화하여 성능 병목 현상을 줄이고 기업이 고성능, 가동 중지 시간이 짧은 네트워크를 유지할 수 있도록 돕습니다.
AI 네트워크는 더 나은 리소스 관리를 가능하게 하고 분산 환경에서 효율적인 대역폭 사용을 보장하는 데 도움이 됩니다.
AI 기반 워크플로 자동화는 일상적인 작업을 처리할 수 있으므로 IT 직원이 더 높은 수준의 전략적 이니셔티브에 집중할 수 있습니다.
AI 도구는 네트워크 트래픽 패턴을 지속적으로 분석하여 비정상적인 동작과 불규칙한 네트워크 운영이 발생할 때 이를 식별합니다.
AI 네트워킹 도구는 사람의 개입 없이도 대량의 데이터를 빠르게 처리할 수 있습니다. 또한 네트워크의 규모와 복잡성이 증가함에 따라 AI 모델을 쉽게 확장할 수 있습니다.
AI 시스템은 네트워크 트래픽을 분석하여 잠재적인 문제와 사이버 위협이 심각한 사고로 확대되기 전에 실시간으로 식별합니다. 즉각적인 격리 조치(예: 손상된 디바이스 격리 또는 의심스러운 활동 차단)와 보안 업그레이드를 장려하고 종종 이를 시작하여 공격 체류 시간을 줄이고 사이버 공격으로 인한 피해를 완화하는 데 도움이 됩니다.