予測モデルについて
モデルは、過去のデータに存在するパターンに基づいて、将来発生する可能性の高い事象を予測するために使用します。例えば、モデルを使用することで、解約する可能性が最も低い顧客や、特定のオファーに応じる可能性が最も高い顧客を、収入や年齢、加入している組織やメンバーシップなどの特性に基づいて予測できます。
モデルは、ルールと同様の方法で使用できますが、ルールが会社の方針やビジネス・ロジックなどの前提条件に基づくものであるのに対し、モデルは、過去の結果で実際に見られた事象に基づくものであり、他の方法では判明しない可能性のあるパターンを発見できます。ルールが、共通のビジネス・ロジックをアプリケーションに組み込むものであるのに対し、モデルは、洞察と予測能力を付加するものです。
モデルの作成およびスコアリングのためのデータ
モデル作成プロセスでは、以下の 2 つの異なるタイプのデータが使用されます。
- モデルを作成するために、予測対象に関する情報が必要です。例えば、解約を予測する場合は、過去に解約したことがある顧客に関する情報が必要です。これは、多くの場合、履歴データまたは分析データ呼ばれ、プロジェクト・データ・モデル内のフィールドの一部またはすべてと、予測対象の結果を記録する追加のフィールドが含まれている必要があります。この追加のフィールドは、モデル作成のターゲットとして使用されます。
- 将来の結果の予測でモデルを使用するために、対象となるグループまたは母集団に関するデータ (潜在的顧客や受け取ったクレームなど) が必要です。これは、多くの場合、 運用データ、またはスコアリング・データと呼ばれます。プロジェクト・データ・モデルは、通常、このデータに基づいています。
- ターゲット・フィールドがデータ・モデルに含まれている場合は、このフィールドの「運用中」列を選択しないようにする必要があります。これは、このフィールドをモデルのスコアリングに使用することはできないためです。モデルは履歴データに基づいて作成されているため、スコアリングの目的は、結果がまだわからない新規データにモデルを適用することです。