클라우드 시장의 30% 이상을 차지하는 AWS는 다른 어떤 클라우드 인프라 공급자보다 더 많은 인프라를 운영하고 있습니다.1 기업들은 웹 호스팅, 데이터 스토리지, 빅 데이터 분석, 모바일 앱 개발, 엔터프라이즈 IT 서비스 등을 위해 AWS를 사용합니다.
이러한 조직의 경우 AWS에서 워크로드를 모니터링하는 것이 중요합니다. 이를 통해 지표, 시스템 로그 및 이벤트를 추적하여 AWS 환경이 예상대로 작동하는지 확인할 수 있습니다.
AWS 모니터링이 없으면 성능 문제가 감지되지 않은 채 증가할 수 있고, 과도하게 프로비저닝된 리소스로 인해 비용이 급증할 수 있으며, 보안 취약성이 계속 노출될 수 있습니다. 예를 들어, 과도한 네트워크 트래픽은 중앙 처리 장치(CPU)를 과부하시키고 병목 현상을 일으킬 수 있습니다. 또는 잘못 구성된 클라우드 스토리지 컨테이너가 공용 액세스를 통해 민감한 데이터를 노출할 수 있습니다.
AWS 모니터링 툴은 이러한 문제를 식별하고 문제 해결을 위해 AWS Lambda 함수 호출과 같은 자동화된 응답을 트리거하거나 수동 문제 해결을 위해 팀에 알릴 수 있습니다. 이를 통해 조직은 최적의 성능을 유지하고, 비용을 절감하며, 보안 태세를 강화하고, 인프라에 대한 데이터 기반 의사 결정을 내릴 수 있습니다.
AWS 모니터링은 AWS 클라우드 리소스의 신뢰성, 가용성 및 성능을 보장하는 데 도움이 됩니다. AWS 인프라에 대한 가시성을 제공하므로 조직은 문제를 사전에 감지하고 해결하여 중단을 줄이고 가동 중지 시간을 최소화할 수 있습니다.
모니터링은 컴퓨팅 용량, 스토리지, 네트워크 인프라를 포함한 AWS 클라우드 기반 리소스의 상황을 파악하는 데 도움이 됩니다.
예를 들어 서버에 고객 트래픽으로 인한 부하가 많은 경우 모니터링은 자동 크기 조정을 트리거하여 더 많은 서버를 추가합니다. 이를 통해 애플리케이션 충돌을 방지하고 트래픽이 급증하는 동안에도 일관된 응답 시간을 보장하므로 최종 사용자가 애플리케이션에 계속 액세스할 수 있습니다.
모니터링은 AWS 클라우드 리소스에서 지표를 수집하여 구성을 최적화함으로써 속도와 효율성을 높이는 데 도움이 될 수 있습니다.
예를 들어, 아시아 사용자의 페이지 로드 속도가 느린 경우 모니터링 툴은 해당 위치에 더 가까운 싱가포르에 콘텐츠를 캐시할 수 있습니다. 이를 통해 대기 시간을 줄이고 페이지 로드 속도를 높여 보다 원활한 스트리밍을 보장하고 사용자 경험을 향상시킬 수 있습니다.
클라우드 비용은 종종 조직의 IT 예산에서 가장 큰 항목 중 하나입니다.
모니터링을 통해 활용도가 낮거나 불필요한 AWS 리소스를 식별하여 클라우드 비용을 최적화할 수 있습니다. 예를 들어 워크로드에 할당된 메모리의 10%만 사용하는 가상 서버는 메모리 비용의 90%를 낭비할 위험이 있습니다. AWS 모니터링은 사용량이 적은 시간에 인스턴스 크기를 자동으로 조정하고 유휴 리소스를 종료하는 데 도움이 될 수 있습니다.
모니터링은 무단 API 호출, 비정상적인 데이터 전송 및 구성 변경과 같은 보안 위협을 나타낼 수 있는 AWS 인프라의 의심스러운 활동 또는 비정상적인 변경을 탐지합니다.
예를 들어, 모니터링 툴이 반복적으로 실패한 로그인 시도를 감지하면 소스 IP 주소를 차단하고 보안 알림을 트리거할 수 있습니다.
모니터링을 통해 잠재적인 문제가 발생하고 최종 사용자에게 영향을 미치기 전에 이를 식별할 수 있습니다. 여기에는 용량 제한에 접근하고, 성능 추세를 저하시키고, SSL 인증서가 만료되는 것이 포함될 수 있습니다.
예를 들어, 저장 용량이 90%를 넘어서고 있는 데이터베이스를 모니터링하면 데이터베이스 장애가 발생하기 전에 개발자에게 공간을 추가하라는 알림이 트리거됩니다.
AWS 모니터링은 AWS 인프라에서 데이터를 지속적으로 수집하고 분석합니다.
데이터 모니터링에는 일반적으로 API 호출, 구성 변경, 네트워크 활동 및 보안 이벤트와 같은 시스템 로그와 함께 서버, 데이터베이스 및 애플리케이션의 성능 지표, 리소스 사용률 및 오류율이 포함됩니다.
툴은 이 데이터를 분석하여 추세를 파악하고, 이상 징후를 감지하고, 대시보드를 통해 실시간으로 성능을 시각화합니다.
AWS 모니터링 툴은 문제 해결 및 근본 원인 분석을 위해 팀에 잠재적인 문제에 대한 알림을 제공할 수 있습니다. 또한 리소스 추가 또는 AWS 서비스 재시작을 비롯한 일부 문제를 자동으로 해결할 수도 있습니다.
예를 들어, 고객이 결제 실패로 인해 온라인 장바구니를 포기하는 경우 AWS 모니터링은 결제 게이트웨이 오류를 식별하고 DevOps 팀에 알릴 수 있습니다. 그런 다음 오래된 시간 초과 설정을 조사하고 수정하여 수익 손실을 최소화할 수 있습니다.
AWS 모니터링 요금은 일반적으로 사용되는 서비스에 따라 사용자 지정 지표 수, 로그 수집 볼륨 및 분석 빈도에 따라 확장됩니다.
포괄적인 범위를 제공하기 위해 AWS 모니터링은 일반적으로 4개의 핵심 영역에서 지표를 추적합니다.
AWS 모니터링은 AWS 인프라 구성 요소 전반의 성능 및 리소스 소비를 자동으로 추적합니다.
이러한 지표를 통해 팀은 과도하게 프로비저닝된 리소스를 식별하고, 필요한 용량을 예측하고, 성능 저하가 사용자에게 영향을 미치기 전에 이를 감지할 수 있습니다.
AWS 모니터링의 기반인 Amazon CloudWatch는 이 데이터를 수집하기 위한 기본 툴입니다. 모든 AWS 서비스에서 지표를 자동으로 수집, 집계 및 분석합니다. X-Ray 및 CloudTrail과 같은 다른 AWS 툴은 CloudWatch와 통합되어 시스템 상태, 성능 및 보안에 대한 통합 보기를 제공합니다.
EC2는 클라우드에서 애플리케이션을 실행하는 가상 서버에 온디맨드 컴퓨팅 용량을 제공합니다.
주요 EC2 지표는 다음과 같습니다.
Amazon의 기본 컨테이너 서비스인 ECS 및 EKS는 컨테이너화된 애플리케이션을 대규모로 배포하고 오케스트레이션합니다.
주요 컨테이너 지표는 다음과 같습니다.
RDS는 AWS 클라우드 환경에서 관리형 데이터베이스를 제공합니다.
주요 RDS 지표는 다음과 같습니다.
Lambda는 이미지 크기 조정 또는 데이터베이스 업데이트와 같은 작업을 위한 서버리스 컴퓨팅을 제공합니다.
주요 Lambda 지표는 다음과 같습니다.
ELB는 들어오는 트래픽을 적절한 클라우드 리소스에 분산하여 높은 가용성을 유지하는 데 도움이 됩니다.
주요 ELB 지표는 다음과 같습니다.
AWS 성능 모니터링은 수동 구성 및 코드 계측을 통해서만 애플리케이션 동작을 추적할 수 있습니다.
애플리케이션은 고립된 상태로 존재하는 경우가 거의 없으며 외부 결제 프로세서, 타사 API 및 AWS가 아닌 데이터베이스에 연결됩니다.
이러한 상호 작용을 모니터링하면 성능 문제가 AWS 리소스에서 발생하는지 아니면 외부 종속성에서 발생하는지 알 수 있습니다. 또한 최종 사용자가 애플리케이션과 상호 작용하는 방식에 대한 인사이트를 제공합니다.
분산 추적 서비스인 AWS X-Ray는 이러한 지표를 수집하기 위한 기본 툴입니다. 코드가 SDK로 계측되면 X-Ray는 애플리케이션을 통해 이동하는 요청을 추적하여 AWS 서비스 전반의 지연 시간, 오류 및 병목 현상에 대한 가시성을 제공합니다.
주요 애플리케이션 성능 모니터링 지표는 다음과 같습니다.
AWS 모니터링은 AWS 계정 내의 활동 및 구성 변경 사항을 자동으로 추적합니다. 이러한 지표는 민감한 데이터에 액세스한 사람을 식별하고, 정책 위반을 감지하고, 규정 준수를 입증하는 데 도움이 됩니다.
AWS 보안 서비스마다 감사 추적, 구성 추적 및 위협 탐지와 같은 다양한 보안 이점을 제공합니다. CloudTrail과 같은 일부는 기본적으로 기본 활동을 기록하는 반면, GuardDuty 및 Config와 같은 다른 기능은 명시적 설정이 필요합니다.
주요 AWS 네이티브 보안 서비스는 다음과 같습니다.
주요 보안 지표는 다음과 같습니다.
AWS 모니터링은 비즈니스 메트릭을 추적할 수 있지만, 이를 위해서는 조직이 직접 메트릭을 정의하고 AWS 모니터링 툴에 사용자 지정 지표로 전송하는 사용자 구성이 필요합니다.
수익, 주문 이행 시간 또는 고객 만족도와 같은 이러한 지표는 기술 성능을 비즈니스 성과와 연결하고 클라우드 지출을 정당화하며 시스템 문제가 수익에 미치는 영향을 파악하는 데 도움이 될 수 있습니다.
주요 운영 및 비즈니스 지표는 다음과 같습니다.
모니터링은 무엇이 잘못되었는지에 대한 답을 찾는 데 도움이 되고, 관측 가능성은 왜 그런 일이 발생하는지 설명하는 데 도움이 됩니다.
AWS 모니터링 솔루션에는 일반적으로 AWS 관측 가능성 기능이 포함됩니다. 둘 다 함께 작동하여 문제를 해결하고 안정성을 유지합니다.
모니터링은 CPU 사용량 및 네트워크 지연 시간과 같은 사전 정의된 지표를 캡처하여 시스템 성능에 대한 스냅샷을 제공하지만 문제가 발생하는 이유에 대한 인사이트는 거의 제공하지 않습니다. 예를 들어 모니터링은 웹 서버에서 높은 CPU 사용률을 식별할 수 있지만 근본 원인은 식별하지 못할 수 있습니다.
관측 가능성은 지표, 이벤트, 로그 및 추적(MELT 데이터)과 같은 여러 원격 측정 데이터 유형을 상호 연관시켜 AWS 환경에 대한 실시간 보기를 제공합니다. 이는 클라우드 네이티브 아키텍처의 복잡성을 처리하기 위해 기존 모니터링으로부터 발전한 개념입니다.
