散点图选项选项卡

样式。 选择线作为绘制样式。 选择 线 将激活 X 模式 控件。 选择 将使用加号 (+) 作为缺省的点形状。 创建图形后,可以更改点的形状并改变其大小。

X 模式 如要绘制线散点图,您需要选择“X 模式”以定义图的样式。 选择 排序重叠读取 请参阅主题 散点图节点 以获取更多信息。 如选择 重叠 如所读取 ,则必须指定用来抽取前 n 个记录样本的数据集大小上限。 否则,将使用缺省的 2000 条。

自动 X 范围。 选择此选项将使用此轴上整个范围内的数据值。 取消选择此项,则将使用由您指定的 最小值 最大值 限定的值的精确子集。 您可以直接键入值或使用箭头。 缺省情况下,将选择自动范围以支持快速构建图形。

自动 Y 范围。 选择此选项将使用此轴上整个范围内的数据值。 取消选择此项,则将使用由您指定的 最小值 最大值 限定的值的精确子集。 您可以直接键入值或使用箭头。 缺省情况下,将选择自动范围以支持快速构建图形。

自动 Z 范围。 仅用于在“散点图”选项卡上指定 3-D 图形的情况。 选择此选项将使用此轴上整个范围内的数据值。 取消选择此项,则将使用由您指定的 最小值 最大值 限定的值的精确子集。 您可以直接键入值或使用箭头。 缺省情况下,将选择自动范围以支持快速构建图形。

抖动。 又称为颤动。在数据集中有许多重复值的情况下,“抖动”对于点图很有用处。 如要将值的分布观察地更加清楚,您可利用“抖动”使点随机分布在实际值周围。

对较早版本的 IBM® SPSS® Modeler 用户的注意: 图中使用的抖动值在此发行版的 IBM SPSS Modeler中使用不同的度量。 在早期版本中,该值是实际数字,但在本版本中,它是相对于框大小的比例。 这就意味着,使用早期版本生成的流所具有的颤动值在本版本中可能过大。 在本版本中,任何非零的颤动值都将被转换为 0.2。

要绘制的最大记录数。 为大型数据集指定一种绘制方法。 可以指定数据集大小上限,或使用缺省的 2000 条记录。 如果选择 分隔 抽样 选项,则处理大数据集的性能将显著提高。 另外,您也可以选择 使用所有数据 ,但必须要注意,这一选项可能大幅降低软件的执行效率。

注意:如果“X 模式”设置为重叠如所读取,那么上述选项将处于禁用状态且仅使用前 n 个记录。

  • 分级。 选择此选项可对所包含记录数超过指定数字的数据集进行分级。 “分级”使图形在实际绘制前被分散在较小的网格中,并计算在每个单元格中将出现的点的数目。 在最终图形中,每个网格中的分级矩心处将出现一个点(该点即代表分级中所有点位置的平均数)。 所绘制符号的大小表示在此区域内点的数目(除非您用大小作为重叠)。 使用矩心及尺寸代表点的数量使分级后的散点图成为表现大数据集的最佳方式。因为该方式杜绝了在密集区域过量绘制(点的颜色没有区别)的问题,也减少了符号误导的问题(即点的密度出现偏差)。 当某些符号(特别是加号 [+])部分重叠时,其所产生的密集区域并不是原始数据的真实反映,这一现象称为符号误导。
  • 样本。 选择此选项将随机抽取数量相当于文本框中所输入记录数的数据。 缺省值为 2,000。