ビン分割カテゴリーの自動生成
「分割点の作成」ダイアログ・ボックスでは、選択した条件に基づいてビン分割カテゴリーを自動生成できます。
「分割点の作成」ダイアログ・ボックスを使用するには
- 「データ・エディター」ウィンドウのメニューから、次の項目を選択します。
- 新しいカテゴリー (ビン分割) 変数を作成する数値スケールおよび順序変数、またはそのいずれかを選択します。
- 「続行」をクリックしてください。
- 「スキャンされた変数のリスト」で変数を選択 (クリック) します。
- 「分割点の作成」をクリックします。
- ビン分割カテゴリーを定義する分割点を生成するための条件を選択します。
- 「適用」をクリックします。
注: 0 個のケースをスキャンした場合、「分割点の作成」ダイアログ・ボックスは使用できません。
等幅の区間。 次の 3 つの条件のうちの任意の 2 つに基づいて、等幅 (1 から 10、11 から 20、21 から 30 など) のビン分割カテゴリーを生成します。
- 最初の分割点の位置。 最小ビン分割カテゴリーの上限を定義する値 (例えば、値 10 は、10 までのすべての値を含む範囲を示します)。
- 分割点の数。 ビン分割カテゴリーの数は、分割点の数に 1 を加えた数 です。 例えば、分割点が 9 個の場合、10 個のビン分割カテゴリーが生成されます。
- 幅。 各区間の幅。 例えば、値 10 は、年齢 を 10 年の区間にビン分割します。
スキャンされたケースに基づく等しいパーセンタイル。 次のいずれかの条件に基づいて (パーセンタイルに AEMPIRICAL アルゴリズムを使用して)、各ビンに同じ数のケースが含まれるビン分割カテゴリーを生成します。
- 分割点の数。 ビン分割カテゴリーの数は、分割点の数に 1 を加えた数 です。 例えば、分割点が 3 つの場合、それぞれに 25 % のケースを含む 4 つのパーセンタイル・ビン (四分位) が生成されます。
- 幅 (%).間隔の幅を合計件数に対する割合で表示しています。 例えば、値が 33.3 の場合、それぞれにケースの 33.3% を含む 3 つのビン分割カテゴリー (2 つの分割点) が作成されます。
ソース変数に比較的少数の異なる値が含まれている場合、または同じ値のケースが多数含まれている場合は、要求した数よりも少ない数のビンが生成されることがあります。 分割点に同じ値が複数存在する場合、それらの値は同じ区間に含まれます。したがって、実際のパーセントは必ずしも完全に等しいとは限りません。
スキャンされたケースに基づく、平均値および選択された標準偏差の分割点。 平均の値および変数の分布の標準偏差の値に基づいて、ビン分割カテゴリーを生成します。
- 標準偏差区間を選択しない場合、2 つのビン分割カテゴリーが作成され、ビンを分割する分割点が平均となります。
- 1 つ、2 つ、または 3 つの標準偏差に基づいて、任意の組み合わせの標準偏差区間を選択できます。 例えば、3 つをすべて選択すると、8 つのビン分割カテゴリーが作成されます。つまり、1 標準偏差区間に 6 つのビンと、平均の上下で 3 つの標準偏差を上回るケースについて 2 つのビンが作成されます。
正規分布では、平均から 1 標準偏差以内にケースの 68%、2 標準偏差以内にケースの 95%、3 標準偏差以内にケースの 99% が含まれます。 ビン分割カテゴリーを標準偏差に基づいて作成すると、実際のデータ範囲の外や、可能なデータ値の範囲の外にビンが定義されることがあります (例えば、給与の範囲が負になることがあります)。
注: パーセンタイルと標準偏差の計算は、スキャンされたケースに基づきます。 スキャンされたケースの数を制限した場合、特にデータ・ファイルがソース変数でソートされているときは、作成されるビンに目的のケースの一部が含まれないことがあります。 例えば、1,000 個のケースを含むデータ・ファイルの最初の 100 個のケースのみスキャンし、データ・ファイルがそれぞれにケースの 25% を含む 4 つのパーセンタイル年齢ビンではなく、応答者の年齢の昇順でソートされている場合、最初の 3 つのビンのそれぞれにケースの約 3.3% しか含まれず、最後のビンにケースの 90% が含まれることがあります。