数据审核节点属性

"数据审计" 节点图标数据审核节点提供了对数据的全面初步查看,包括每个字段的汇总统计、直方图和分布,以及关于异常值、缺失值和极端值的信息。 结果以易于阅读的矩阵形式显示,可以对其进行排序并生成全尺寸图形和数据准备节点。

示例

stream = modeler.script.stream()
sourcenode = stream.findByID("id46WRP1285C")
node = stream.createAt("dataaudit", "My node", 196, 100)
stream.link(sourcenode, node)
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("fields", ["Age", "Na", "K"])
node.setPropertyValue("display_graphs", True)
node.setPropertyValue("basic_stats", True)
node.setPropertyValue("advanced_stats", True)
node.setPropertyValue("median_stats", False)
node.setPropertyValue("calculate", ["Count", "Breakdown"])
node.setPropertyValue("outlier_detection_method", "std")
node.setPropertyValue("outlier_detection_std_outlier", 1.0)
node.setPropertyValue("outlier_detection_std_extreme", 3.0)
node.setPropertyValue("output_mode", "Screen")
表 1。 dataauditnode 属性
dataauditnode properties 数据类型 属性描述
custom_fields 标志  
fields [field1 … fieldN]  
overlay 字段  
display_graphs 旗帜 用于打开或关闭输出矩阵中的图形显示。
basic_stats 标志  
advanced_stats 标志  
median_stats 标志  
calculate Count Breakdown 用于计算缺失值。 请选择一种、两种或都不选择计算方法。
outlier_detection_method std iqr 用于指定异常值和极值的检测方法。
outlier_detection_std_outlier 如果 outlier_detection_methodstd ,则指定用于定义离群值的数字。
outlier_detection_std_extreme 如果 outlier_detection_methodstd ,则指定用于定义极值的数字。
outlier_detection_iqr_outlier 如果 outlier_detection_methodiqr ,则指定用于定义离群值的数字。
outlier_detection_iqr_extreme 如果 outlier_detection_methodiqr ,则指定用于定义极值的数字。
use_output_name 标志 指定是否使用自定义输出名称。
output_name 字符串 如果 use_output_name 为真,则指定要使用的名称。
output_mode Screen File 用于指定输出节点输出的目标位置。
output_format Formatted (. tab ) Delimited (. csv ) HTML (. html ) Output (. cou ) 用于指定输出类型。
paginate_output 标志 output_formatHTML 时,输出结果将分页显示。
lines_per_page 当与 paginate_output 一起使用时,指定每页输出的行数。
full_filename 字符串