02: 관찰 가능성을 위한 3단계
관찰 가능성 여정을 시작하기 위한 3단계를 소개합니다.
1. 애플리케이션 관찰 가능성 성숙도 곡선의 어느 단계에 있는지 측정하기

2. 데이터 구축하기
관찰 가능성 플랫폼에서 수집하는 원격 측정 데이터는 여러 유형으로 나눌 수 있습니다.
메트릭 - 지정된 기간 동안 애플리케이션 성능, 리소스 활용도 및 전체 시스템 상태를 수치로 평가합니다.
트레이스 - 트랜잭션이 한 서비스에서 다른 서비스로 이동할 때 모든 사용자 요청에 대한 엔드 투 엔드 서비스 기록입니다.
종속성 - 각 애플리케이션 구성요소가 다른 구성요소, 애플리케이션 및 IT 리소스에 따라 어떻게 달라지는지 평가합니다.
상태 점검 - 특정 서비스를 정기적으로 폴링합니다. 상태 점검이 실패하면 문제가 됩니다.
경보 - 미리 정해진 특정 임계값을 초과하면 알림이 트리거됩니다.
대시보드 - 애플리케이션 시각에서 미리 정해진 특정 메트릭을 시각적 및 대화식으로 이해할 수 있게 표시합니다.
로그 - 시스템 내 애플리케이션 이벤트에 타임스탬프를 적용하여 누락 없이 상세하게 기록한 것으로, 변경할 수 없습니다.
이 정보가 수집되면 관찰 가능성 도구는 수집된 정보를 실시간으로 연관시켜 컨텍스트 정보, 즉 애플리케이션 성능 문제를 나타내거나, 유발하거나, 해결하는 데 사용될 수 있는 이벤트의 주체, 위치, 원인을 제공합니다.
또한 가장 발전된 관찰 가능성 플랫폼은 애플리케이션에서 얻을 수 있는 새로운 원격 측정 소스를 자동으로 검색합니다. 이러한 플랫폼은 표준 APM 솔루션보다 훨씬 더 많은 실시간 데이터를 처리하기 때문에 대부분 신호(실제 문제 표시)에서 노이즈(문제와 관련 없는 데이터)를 분리할 수 있는 ML(머신 러닝) 기능과 AIOps(운영을 위한 인공 지능)가 포함되어 있습니다.
3. 주요 관행과 원칙 적용하기
관찰 가능성이 제대로 작동하려면 데이터와 AI를 활용하여 자동화되고 실행 가능한 인사이트를 확보해야 합니다. 이러한 주요 구성요소를 사용하면 복잡한 환경에서 규모에 맞게 빠른 속도로 다양한 서비스와 시스템을 효과적으로 관리하고 관찰할 수 있습니다. 관찰 가능성 플랫폼이 목표를 달성하도록 하기 위해 적용해야 할 몇 가지 주요 관행과 원칙은 다음과 같습니다.
체계적인 최적화: 관찰 가능성은 전체 IT 환경을 최적화하기 위해 IT 아키텍처에 존재하는 모든 리소스 간의 상호작용을 맵핑하고 컨텍스트화합니다.
완전한 컨텍스트화: 모든 관찰 가능성 데이터는 완전한 컨텍스트와 함께 전달되어야 합니다. 모든 메트릭의 엔드 투 엔드 추적과 컨텍스트화가 필요합니다.
클라우드 네이티브 배포: 관찰 가능성 도구가 클라우드 네이티브 애플리케이션 환경에 원활하게 통합되도록 관찰 가능성 배포 및 계측 프로세스가 완전히 자동화됩니다.
데이터 수집에 대한 포괄적인 지원: 관찰 가능성은 표준 출력 및 기존 로그부터 OpenTracing과 같은 원격 측정에 이르기까지 현대식 애플리케이션 환경에 데이터가 노출되는 다양한 방법을 지원합니다.
파이프라인 전반의 관찰 가능성: 원점 회귀 관찰 가능성은 CI/CD 파이프라인을 최적화하고 문제를 찾아 프로덕션으로 릴리스되지 않도록 하기 위해 사전 프로덕션에서 관찰 가능성 플랫폼을 사용합니다.
03: 이점
조직이 얻는 관찰 가능성의 가치는 무엇일까요?