モデル作成手法
モデル作成手法は、アルゴリズム、つまり特定の問題を解決する一連の指示に基づいています。特定のアルゴリズムを使用して、該当する種類のモデルを作成します。モデル作成手法には次の 3 つのクラスがあり、IBM® SPSS® Modeler ではそれぞれについて例をいくつか示します。
- 教師あり学習
- アソシエーション
- セグメント化 (「クラスタリング」とも呼ばれます)
教師あり学習モデルでは、1 つまたは複数の入力フィールドの値を使用し、1 つまたは複数の出力、または対象フィールドの値を予測します。これらの手法の例として、ディシジョン ツリー (C&R ツリー、QUEST、CHAID および C5.0 アルゴリズム)、回帰 (線型、ロジスティック、一般化線型、Cox 回帰アルゴリズム)、ニューラル・ネットワーク、サポート・ベクター・マシン、Bayesian ネットワークがあります。
アソシエーション・モデルでは、イベント、購入、属性など、1 つまたは複数のエンティティーが 1 つまたは複数のその他のエンティティーと関連するデータ内のパターンを検出します。モデルは、これらの関係性を定義するルール・セットを構築します。データ内のフィールドは、入力および対象のいずれのフィールドとしても機能します。これらのアソシエーションは手動で検出できますが、アソシエーション・ルール・アルゴリズムはより迅速に検出が可能で、より複雑なパターンも検証できます。Apriori および Carma モデルが、アソシエーション・アルゴリズムの使用例です。他にアソシエーション・モデルの 1 つとしてシーケンス検出モデルがあり、時間構造データのシーケンス・パターンを検索します。
セグメンテーション・モデルでは、データを入力フィールドの類似したパターンを持つレコードのセグメント、またはクラスターに分割します。入力フィールドにのみ関心があるため、セグメンテーション・モデルには出力フィールドまたは対象フィールドの概念はありません。セグメンテーション・モデルの例として、Kohonen ネットワーク、K-Means クラスタリング、TwoStep クラスタリングおよび異常値検査があります。