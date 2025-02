신뢰도 메트릭은 항목 세트에서 함께 발생하는 항목이나 항목 세트의 확률을 식별합니다. 예를 들어 트랜잭션에 2개 항목이 있는 경우, 한 항목의 존재가 다른 항목으로 이어지는 것으로 간주합니다. 첫 번째 항목 또는 항목 세트는 선행 항목, 두 번째 항목 세트는 결과 항목입니다. 따라서 신뢰도는 선행과 결과 항목을 모두 가진 트랜잭션의 수, 그리고 선행 항목만 가진 트랜잭션의 수의 비율로 정의됩니다. 이 상황을 표현하면 다음과 같습니다.

C ( A , B ) = O c c ( A ∩ B ) O c c ( A )

여기서 A는 선행 항목, B는 결과 항목, C(A,B)는 A가 B로 이어질 확률을 나타냅니다.

앞의 예를 확장하여 사과와 바나나를 함께 구매한 거래가 150건 있다고 가정해 보겠습니다. 신뢰도는 다음과 같이 계산됩니다.

C ( A p p l e s , B a n a n a s ) = 150 250 = 0.6

이 결과는 사과 구매가 바나나 구매로 이어질 확률이 60%임을 나타냅니다. 마찬가지로, 바나나에 대한 총 500건의 거래가 있다고 가정하면 바나나 구매가 사과 구매로 이어질 확률은 다음과 같이 계산됩니다.

C ( B a n a n a s , A p p l e s ) = 150 500 = 0.3

여기서 바나나 구매가 사과 구매로 이어질 확률은 30%에 불과합니다.

신뢰도는 가능성을 측정하는 좋은 척도이지만, 항목 간의 명확한 연관성을 보장하는 것은 아닙니다. 다른 이유로 신뢰도의 값이 높을 수도 있습니다. 이러한 이유로, 연관성 규칙으로 마이닝할 때는 가능성이 낮은 연관성을 걸러내기 위해 최소 신뢰도 임계값이 적용됩니다.