근본 원인 분석이란 무엇인가요?
근본 원인 분석을 수행하고 문제를 신속하게 해결하기 위한 다양한 툴과 방법론에 대해 알아보세요.
IBM 뉴스레터 구독하기
공장에서 일하는 사람들
근본 원인 분석이란 무엇인가요?

어떤 조직도 문제와 사고를 피할 수는 없습니다. 상황이 아주 좋을 때도 문제가 생길 수 있습니다. 윤리적이고 사전 예방적으로 행동하며 잘 운영되는 기업과 사후 대응적인 접근 방식을 사용하는 기업 모두 문제를 겪을 수 있지만, 전자는 근본 원인 분석에 우선순위를 두기 때문에 문제가 더 적게 발생하고 복구 속도도 빠릅니다.   

근본 원인 분석(또는 RCA)은 조직이 문제 또는 사건이 발생한 후 근본 원인을 검색하는 품질 관리 프로세스입니다. 문제가 현실화되었을 때 단순히 문제의 증상을 해결하고 싶을 수도 있지만, 증상을 해결하는 것은 일련의 문제가 반복적으로 악화되는 것을 피할 수 없는 반응형 프로세스일 뿐입니다.

근본 원인 분석은 조직이 문제의 근본 원인을 파악하고, 적절한 시정 조치를 찾고, 향후 발생을 방지하기 위한 계획을 개발하는 데 도움이 됩니다. 전반적으로 더 효율적인 운영을 위해 근본적인 문제에 대한 솔루션을 구현하는 것을 목표로 합니다.

IBM Maximo 둘러보기

IBM Maximo를 살펴보고 IoT 데이터, 분석 및 AI가 자산 운영을 간소화하는 데 어떻게 도움이 되는지 알아보세요.

관련 내용

IBM 뉴스레터 구독하기

근본 원인 분석은 언제 수행해야 하나요?

조직은 문제나 인시던트가 발생하면 근본 원인 분석을 수행하지만, RCA가 필요한 문제는 그 외에도 많습니다. 근본 원인 분석을 시작해야 하는 경우는 크게 세 가지로 구분할 수 있습니다.

물리적 원인

실제 재료 또는 장비에 어떤 방식으로든 장애가 발생한 경우(예: 데스크톱 컴퓨터가 작동을 멈추거나 타사 공급업체의 구성 요소의 성능이 표준 이하인 경우).

인적 원인(또는 인적 오류)

사람이 실수하거나 필요한 작업을 완료하지 못한 경우(예: 직원이 장비를 정기적으로 유지 관리하지 않아 장비가 고장 나는 경우).

조직적 원인

사람이 의사 결정을 내릴 때 사용하는 시스템, 프로세스 또는 정책에 결함이 있는 경우(예: 회사가 팀원들에게 사이버 보안 프로토콜에 대한 교육을 실시하지 않아 회사가 사이버 공격에 취약해지는 경우).

근본 원인 분석 수행 방법

조직에서는 일반적인 이메일 서비스 중단에서 치명적인 장비 장애에 이르기까지 다양한 범위 또는 원인에 대해 근본 원인 분석을 수행할 수 있습니다. 문제의 성격이나 범위와 관계없이 근본 원인 분석 수행에는 동일한 기본 단계가 포함되어야 합니다.

문제 파악

근본 원인 분석을 실시하기로 했다면, 해당 부서 또는 조직에서 어떤 종류의 심각한 문제를 겪고 있거나 적어도 특정 프로세스를 실질적으로 개선하고자 하는 것일 가능성이 높습니다. 그러므로 근본 원인 분석 프로세스의 첫 번째 단계는 해결하려는 문제를 파악하고 정의하는 것입니다. 문제가 정확하게 정의되지 않으면 근본 원인을 올바르게 파악하는 것이 불가능합니다.

부서에서 문제를 명확하게 파악했다면 이제 RCA에 도움을 줄 모든 사람을 위해 문제를 설명하는 문제 설명서를 작성할 차례입니다.

RCA 팀 구성

문제를 파악하고 모든 관련 당사자에게 명확하게 전달한 후에는, 경영진이 프로젝트 헌장을 작성하여 팀을 구성하고 분석을 완료해야 합니다. 팀에는 분석을 통해 팀을 이끌어나갈 진행자와 조사할 시스템, 프로세스 및 인시던트에 대한 개인적 및/또는 전문적 지식을 갖춘 팀원이 포함되어야 합니다.

관련 데이터 수집

데이터 수집은 문제 해결 프로세스의 근간입니다. 이 단계에서는 문제에 기여한 요인 및 궁극적으로는 문제의 근본 원인을 파악하는 데 도움이 되는 모든 정보를 찾는 것이 중요합니다. 사진 및 사건 보고서 수집, 영향을 받은 당사자와의 면담, 기존 정책 및 절차 검토 등이 여기에 포함될 수 있습니다. 데이터를 수집하는 동안 다음과 같은 질문을 하세요.

  • 문제는 언제 시작되었으며 얼마나 오래 지속되었는가?
  • 팀이 어떤 증상을 관찰했는가?
  • 문제의 존재 사실을 증명하기 위해 조직/부서에서 어떤 문서를 보유하고 있는가?
  • 이 문제가 직원 및 기타 이해 관계자에게 어떤 영향을 미치는가?
  • 이 문제의 존재로 인해 피해를 보거나 영향을 받은 사람은 누구인가?
가능한 근본 원인 파악

이는 RCA 프로세스에서 가장 중요한 단계입니다. 이 단계에서 팀은 필요한 모든 정보를 수집하고 원인 요인을 찾기 위한 브레인스토밍을 시작합니다. 근본 원인 분석을 효과적으로 실시하려면 문제의 모든 잠재적인 근본 원인에 대해 개방적인 태도를 취해야 하므로 RCA 팀원 모두가 열린 마음으로 브레인스토밍 단계에 참여해야 합니다. 모든 가능성을 확인하고 검증하기 전에 근본 원인을 결정하려고 해서는 안 됩니다. 선입견을 가지고 사고 조사 과정을 시작하면 결과가 편향되고 실제 근본 원인을 파악하기가 더 어려워질 수 있습니다.

근본 원인 파악

RCA 팀이 가능한 원인과 기여 요인을 모두 정리했다면 이제는 문제의 근본 원인을 파악해야 할 때입니다. 가능한 모든 원인을 분석하고 각 원인이 실제로 미치는 영향을 조사하여 어떤 가능성이 가장 문제가 되는지, 어떤 가능성이 유사한지, 어떤 가능성을 완전히 제거할 수 있는지 알아냅니다. 문제의 근본 원인이 여러 개일 가능성에도 대비해야 합니다.

가능한 원인을 목록으로 추린 후에는 영향과 문제의 근본 원인일 가능성을 기준으로 나머지 잠재적 근본 원인의 순위를 매깁니다. 경영진은 각 가능성을 조사 및 분석하고 RCA 팀과 협력하여 실제 근본 원인을 파악합니다.

솔루션 찾기 및 구현

팀은 근본 원인을 파악하고 문제의 모든 세부 사항을 식별한 후에 솔루션 브레인스토밍을 시작해야 합니다. 솔루션은 근본 원인을 직접적으로 해결해야 하며, 솔루션을 실행하는 과정에서 발생할 업무량과 팀이 직면할 수 있는 잠재적인 장애물을 고려해야 합니다. 이러한 요소는 팀이 현재 문제를 해결하고 재발을 방지하는 데 도움이 되는 실행 계획에 포함됩니다.

근본 원인 분석 방법론

모든 RCA에는 동일한 기본 단계가 포함되지만, 조직이 데이터를 효율적이고 효과적으로 수집하는 데 유용하게 활용할 수 있는 근본 원인 분석 방법은 무수히 많습니다. 일반적으로 기업은 방법을 선택하고, 분석 템플릿 및 소프트웨어와 같은 근본 원인 분석 도구를 사용하여 프로세스를 완료합니다.

'왜?'라고 5번 묻기

''왜?'라고 5번 묻기' 접근 방식은 '왜?'라는 질문을 다섯 번 던지면 모든 문제의 근본 원인을 파악할 수 있다는 생각에 뿌리를 두고 있습니다. ''왜?'라고 5번 묻기'는 문제를 해결하려는 사람이 섣불리 가정하지 않고 문제의 근본 원인을 파악할 때까지 계속해서 '왜'라고 묻도록 유도합니다. 공식화된 조직에서 근본 원인 분석을 실시하는 경우 팀은 근본 원인을 찾기 위해 '왜?'를 세 번만 물어보고 끝날 수도 있고, 50~60번 물어봐야 할 수도 있습니다. ''왜?'라고 5번 묻기'의 목적은 팀이 정답을 찾는 데 필요한 만큼 많은 질문을 하도록 유도하는 것입니다.

장애 모드 및 영향 분석(FMEA)

장애 모드 및 영향 분석은 근본 원인 분석에 대한 가장 엄격한 접근 방식 중 하나입니다. 위험 분석과 마찬가지로 FMEA는 시스템/프로세스 장애의 모든 가능성을 식별하고 각 가상 장애의 잠재적 영향을 조사합니다. 이를 통해 조직은 장애를 일으킬 수 있는 모든 근본 원인을 해결합니다.

파레토 차트

파레토 차트는 막대형 차트와 꺾은선형 차트의 특징을 결합하여 조직의 가장 일반적인 근본 원인에 대한 빈도를 보여줍니다. 가장 자주 발생하거나 가능성이 높은 것부터 시작하여 근본 원인을 빈도 내림차순으로 확인할 수 있습니다. 그러면 팀은 솔루션을 적용했을 때 조직이 가장 큰 이점을 확인할 수 있는 근본 원인을 해결합니다.

영향 분석

조직은 영향 분석을 통해 각 근본 원인의 긍정적인 영향과 부정적인 영향을 모두 평가할 수 있습니다.

 

변경 분석

변경 분석은 시스템 또는 프로세스의 성능이 크게 변경된 경우에 유용합니다. 이러한 유형의 RCA를 수행할 때, 부서는 문제 또는 인시던트를 둘러싼 상황이 시간이 지남에 따라 어떻게 변화했는지를 검토합니다. 개인, 정보, 인프라, 데이터 등의 변화를 조사하면 조직에서 어떤 요인이 성과 변화를 일으켰는지 파악하는 데 도움이 될 수 있습니다.

이벤트 분석

이벤트 분석은 일반적으로 기름 유출 또는 건물 붕괴와 같은 한 가지의 주요한 이벤트 문제의 원인을 파악하는 데 사용됩니다. 이벤트 분석은 인시던트를 초래한 일련의 이벤트를 재현하기 위해 신속하면서도 철저한 증거 수집 프로세스를 활용합니다. 타임라인을 확인하고 나면 조직이 원인과 기여 요인을 더 쉽게 식별할 수 있습니다.

인과 관계 트리 분석

인과 관계 분석이라고도 하는 인과 관계 트리 분석을 통해 조직은 특정 문제에 영향을 미친 모든 의사 결정, 이벤트 또는 행동을 기록하고 인과 관계 트리를 사용하여 시각적으로 표시할 수 있습니다.

이시카와 다이어그램

이시카와 다이어그램(또는 피시본 다이어그램)은 문제를 둘러싼 상황을 시각화하는 인과 관계 스타일의 다이어그램입니다. 물고기 골격과 비슷하게 생긴 이 다이어그램은 수많은 원인 목록을 관련 하위 카테고리로 그룹화합니다.

DMAIC

DMAIC는 정의(Define), 측정(Measure), 분석(Analyze), 개선(Improve), 제어(Control)의 약자입니다. 이 데이터 기반 프로세스 개선 방법론은 조직의 식스 시그마(Six Sigma)에 포함되어 사용됩니다.

케프너-트레고의 근본 원인 분석

이 RCA 방법론은 4단계 문제 해결 프로세스를 통해 문제의 근본 원인을 찾습니다. 이 프로세스는 상황 분석으로 시작하여 문제 분석 및 솔루션 분석으로 이어지며, 마지막 단계인 잠재적인 문제 분석으로 끝납니다.

결함 유형 분석(FTA)

조직은 FTA를 통해 잠재적인 인과 관계를 시각적으로 매핑하고 부울 논리를 사용하여 근본 원인을 식별할 수 있습니다.

방지벽 분석

방지벽 분석은 적절한 방지벽이 문제와 인시던트를 예방할 수 있다는 생각에 기초합니다. 위험 관리에 자주 사용되는 이러한 유형의 RCA는 적절한 방지벽이 없음으로 인해 인시던트가 발생하게 된 관계를 조사하고, 문제가 재발하지 않도록 도와 줄 방지벽을 제시합니다.

근본 원인 분석의 이점

RCA 프로세스를 사용하는 기업은 문제를 증상만 없애는 관행에서 벗어나려고 합니다. 대신 비즈니스 운영을 최적화하고, 위험을 줄이며, 더 나은 고객 경험을 제공하는 것을 목표로 합니다. 근본 원인 분석 프로세스에 투자하면 조직은 전반적인 의사 결정을 개선할 수 있는 프레임워크를 확보하고 다음과 같은 이점을 얻을 수 있습니다.

  • 지속적인 개선: 근본 원인 분석은 반복적인 프로세스입니다. 긴박한 문제를 해결하는 것뿐만 아니라 근본 원인을 다루는 것부터 시작하여 시간이 지남에 따라 전체 시스템을 개선하는 것을 추구합니다. 근본 원인 분석의 반복적인 특성 덕분에 조직은 지속적인 프로세스 개선을 우선시할 수 있습니다.

  • 생산성 향상: 조직 내에서 다운타임, 지연, 직원 감소 및 기타 생산 문제를 방지하면 직원들의 시간을 절약하고 다른 중요한 업무에 집중할 시간과 에너지를 확보할 수 있습니다.

  • 비용 절감: 장비가 고장 나거나 소프트웨어 버그로 인해 지연이 발생하면 조직은 비용 손실을 겪고, 직원은 사기가 저하됩니다. 근본 원인 분석은 반복되는 문제를 지속적으로 해결하는 데 드는 비용을 제거하여 전반적으로 재정적으로 더 효율적인 운영을 실현할 수 있게 도와줍니다.

  • 제품 결함 방지: 기업이 근본적인 문제를 해결하지 못하면 의도치 않게 최종 제품의 품질에도 영향을 미칠 수 있습니다. 지속적인 문제가 눈덩이처럼 불어나기 전에 해결하면 제품 결함으로 인한 매출 및 평판 저하로부터 조직을 보호할 수 있습니다.

  • 위험 감소: 비즈니스 프로세스와 시스템을 개선하면 장비가 안전하게 동작하고, 근로자는 작업장 내 안전 위험을 피할 수 있습니다.

 

 

 

근본 원인 분석 제품
자산 관리 IBM Maximo® Application Suite

지능형 자산 관리, 모니터링, 예측 유지보수 및 안정성이 단일 플랫폼에서 제공됩니다.

IBM Maximo Application Suite 자세히 보기 IBM Maximo 둘러보기

IBM AIOps Insights

AIOps Insights는 AI 기반 이벤트 및 인시던트 관리를 통해 중앙 IT 운영 팀이 엔터프라이즈 IT 리소스의 가용성을 관리할 때 직면하는 문제를 처리하고 해결하는 SaaS 솔루션입니다.

AIOps 인사이트 살펴보기

관측성 IBM Instana Observability

애플리케이션 성능 모니터링을 강화하여 인시던트를 더 빨리 해결하는 데 필요한 컨텍스트를 제공합니다.

IBM Instana Observability 더 알아보기 IBM Instana 체험

근본 원인 분석 리소스 Spark에 대한 로그 기반 비정상 작업 탐지 및 근본 원인 분석

IBM 연구에서는 Spark 로그 파일을 사용하여 이상을 감지하고 근본 원인을 분석하는 접근 방식을 제안합니다.

IBM Instana, Gartner Magic Quadrant™ 리더 기업으로 선정

IBM Instana가 정밀한 하이브리드 클라우드 관측 가능성, 메트릭, 추적, 로그를 제공하는 방식을 자세히 확인해 보세요.

철도 산업에서 예측 유지보수 활용

Downer와 IBM은 스마트 예방 유지보수를 사용하여 호주 경전철 및 중전철 시스템을 이용하는 승객이 안전하고, 안정적이며, 편안하게 친환경적인 서비스를 이용할 수 있습니다.

다음 단계 안내

Maximo Application Suite로 기업 자산의 가치를 극대화하세요. Maximo Application Suite는 AI, IoT 및 분석을 사용하여 성능을 최적화하고 자산 라이프사이클을 연장하며, 운영 다운타임 및 비용을 줄이는 단일 통합 클라우드 기반 플랫폼입니다.

IBM Maximo 자세히 보기