散点图“选项”选项卡
样式。选择点或线作为绘图样式。选择线将激活 X 模式控件。选择点将使用加号 (+) 作为缺省的点形状。创建图形后,可以更改点的形状并改变其大小。
X 模式。对于线散点图,必须选择“X 模式”以定义线散点图的样式。选择排序、重叠或如所读取。请参阅主题散点图节点以获取更多信息。 如选择重叠或如所读取,应该指定一个最大数据集大小,以用于对前 n 条记录进行抽样。否则,将使用缺省值 2000 条记录。
自动 X 范围。选择此选项将使用此轴上整个范围内的数据值。取消选择此项,则将使用由您指定的 最小值 和 最大值 限定的值的精确子集。您可以直接键入值或使用箭头。缺省情况下,将选择自动范围以快速构建图形。
自动 Y 范围。选择此选项将使用此轴上整个范围内的数据值。取消选择此项,则将使用由您指定的 最小值 和 最大值 限定的值的精确子集。您可以直接键入值或使用箭头。缺省情况下,将选择自动范围以快速构建图形。
自动 Z 范围。仅用于在“散点图”选项卡上指定三维图形的情况。选择此选项将使用此轴上整个范围内的数据值。取消选择此项,则将使用由您指定的 最小值 和 最大值 限定的值的精确子集。您可以直接键入值或使用箭头。缺省情况下,将选择自动范围以快速构建图形。
抖动。又称为颤动,在数据集中有许多重复值的情况下,“抖动”对于散点图很有用。为了更清楚地看清值的分布,您可利用“抖动”使点随机分布在实际值周围。
使用先前版本 IBM® SPSS® Modeler 的用户请注意:在 IBM SPSS Modeler 的本发行版中,散点图中使用的抖动值所采用的度量方式与以前不同。在先前版本中,该值是一个实际数字,但现在它是相对于框大小的比例。这就意味着,旧版本流中的颤动值在本版本中可能过大。在本版本中,任何非零颤动值都将被转换为值 0.2。
要绘制的最大记录数。指定用于绘制大型数据集的方法。可以指定最大数据集大小,或使用缺省值 2,000 条记录。如果选择分箱或抽样选项,那么处理大数据集时的性能将会提高。另外,您也可以选择使用所有数据来绘制所有数据点,但应该注意的是,这样可能会大幅降低软件的性能。
注:如果“X 模式”设置为重叠或如所读取,那么上述选项将处于禁用状态且仅使用前 n 条记录。
- 分箱。选择此选项以在数据集包含的记录数超过指定数量时启用分箱。分箱使图形在实际绘制前划分成较小的网格,并计算每个网格单元格中出现的点数。在最终图形中,将在每个单元格的分箱质心处绘制一个点(该点即代表分箱中所有点位置的平均值)。所绘制符号的大小表示此区域内的点数(除非您将大小用作重叠)。通过使用质心及大小表示点数,使分箱后的散点图成为表示大数据集的最佳方式,因为这样可以避免在密集区域过量绘制(点数量过多无法区分颜色),也减少了符号误导的问题(点的密度模式出现偏差)。当某些符号(特别是加号 [+])部分重叠时,其所产生的密集区域并不是原始数据的真实反映,这一现象称为符号误导。
- 样本。选择此选项将根据文本框中输入的记录数对数据进行随机抽样。缺省值为 2,000。