最も一般的なデータ・マイニングの種類は次のとおりです。

相関ルール：相関ルールは、データ・セット内の変数間の関係を見つけるためのif/thenルールベースの方法です。関係の長所は、サポートと信頼によって測定されます。信頼度は、ifステートメントまたはthenステートメントがどのくらいの頻度で当てはまるかに基づきます。サポート指標は、関連する要素がデータに表示される頻度です。

これらの手法はマーケット・バスケット分析によく使用され、企業は頻繁に一緒に購入される製品など、異なる製品間の関係をより深く理解できるようになります。顧客の習慣を理解することで、企業はより優れたクロスセル戦略と推奨エンジンを開発できるようになります。



分類：オブジェクトのクラスは、組織の必要に応じて、オブジェクトが共通に持つ特性の定義とともに事前定義されます。その結果、基になるデータをグループ化して分析が容易になります。

たとえば、消費財の会社は、将来の最適なキャンペーン戦略を見つけるために、販売データ、在庫統計、手持ちの消費者データとともに過去のクーポン引き換えを検討することで、クーポン戦略を検討するかもしれません。



クラスタリング：分類と密接に関連していて、類似点を報告しますが、相違点に基づいてさらにグループ化も行います。石鹸メーカーの事前設定された分類には、洗剤、漂白剤、洗濯柔軟剤、床クリーナー、床ワックスが含まれる場合があります。一方、クラスタリングでは、洗濯製品やフロア・ケアなどのグループが作成される可能性があります。



決定木：このデータ マイニング手法では、分類分析または回帰分析を使用して、一連の決定に基づいて潜在的な結果を分類または予測します。決定木の名前が示すように、ツリーのような視覚化を使用して潜在的な結果を表します。

k近傍法（KNN）：KNNアルゴリズムとしても知られるk近傍法はノンパラメトリック・アルゴリズムで、データ点をその近接性と他の利用可能なデータとの関連性に基づいて分類します。類似のデータポイントが互いに、近くに存在することを前提としています。その結果、通常はユークリッド距離を通じてデータ点間の距離を計算し、最も頻度の高いカテゴリまたは平均に基づいてカテゴリを割り当てます。

ニューラル・ネットワーク：主にディープラーニング・アルゴリズムに使用されるニューラル・ネットワークは、ノードの層を通じて人間の脳の相互接続性を模倣することで訓練データを処理します。各ノードは、入力、重み、バイアス（しきい値）と出力で構成されます。

出力値が特定のしきい値を超えると、ノードが「起動」またはアクティブ化され、ネットワーク内の次のレイヤーにデータが渡されます。ニューラル・ネットワークは教師あり学習を通じてこのマッピング関数を学習し、勾配降下プロセスを通じて損失関数に基づいて調整を行います。コスト関数がゼロまたはゼロに近い場合、組織はモデルの精度を信頼して正しい答えを導き出すことができます。

予測分析： データ・マイニングと統計モデリング・テクノロジーおよび機械学習を組み合わせることで、予測分析を使用して履歴データを分析し、パターンの特定、将来のイベントと結果の予測、リスクと機会の特定を目的としたグラフィカルまたは数学的モデルを作成できます。



回帰分析： この手法では、あらかじめ決められた変数に基づいて結果を予測することで、データ内の関係を発見します。これには、決定木、多変量回帰、線形回帰が含まれます。関係の近さによって結果に優先順位を付けることができ、どのデータが最も重要か、最も重要でないかを判断するのに役立ちます。たとえば、清涼飲料メーカーが、予想される暑い夏の到来前に、必要な飲料の在庫を見積もることが挙げられます。