数据审核节点属性
数据审核节点提供了对数据的全面初步查看,包括每个字段的汇总统计、直方图和分布,以及关于异常值、缺失值和极端值的信息。 结果以易于阅读的矩阵形式显示,可以对其进行排序并生成全尺寸图形和数据准备节点。
示例
stream = modeler.script.stream()
sourcenode = stream.findByID("id46WRP1285C")
node = stream.createAt("dataaudit", "My node", 196, 100)
stream.link(sourcenode, node)
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("fields", ["Age", "Na", "K"])
node.setPropertyValue("display_graphs", True)
node.setPropertyValue("basic_stats", True)
node.setPropertyValue("advanced_stats", True)
node.setPropertyValue("median_stats", False)
node.setPropertyValue("calculate", ["Count", "Breakdown"])
node.setPropertyValue("outlier_detection_method", "std")
node.setPropertyValue("outlier_detection_std_outlier", 1.0)
node.setPropertyValue("outlier_detection_std_extreme", 3.0)
node.setPropertyValue("output_mode", "Screen")
dataauditnode properties |
数据类型 | 属性描述 |
|---|---|---|
custom_fields |
标志 | |
fields |
[field1 … fieldN] | |
overlay |
字段 | |
display_graphs |
旗帜 | 用于打开或关闭输出矩阵中的图形显示。 |
basic_stats |
标志 | |
advanced_stats |
标志 | |
median_stats |
标志 | |
calculate |
Count Breakdown |
用于计算缺失值。 请选择一种、两种或都不选择计算方法。 |
outlier_detection_method |
std iqr |
用于指定异常值和极值的检测方法。 |
outlier_detection_std_outlier |
号 | 如果 outlier_detection_method 是 std ,则指定用于定义离群值的数字。 |
outlier_detection_std_extreme |
号 | 如果 outlier_detection_method 是 std ,则指定用于定义极值的数字。 |
outlier_detection_iqr_outlier |
号 | 如果 outlier_detection_method 是 iqr ,则指定用于定义离群值的数字。 |
outlier_detection_iqr_extreme |
号 | 如果 outlier_detection_method 是 iqr ,则指定用于定义极值的数字。 |
use_output_name |
标志 | 指定是否使用自定义输出名称。 |
output_name |
字符串 | 如果 use_output_name 为真,则指定要使用的名称。 |
output_mode |
Screen File |
用于指定输出节点输出的目标位置。 |
output_format |
Formatted (. tab ) Delimited (. csv ) HTML (. html ) Output (. cou ) |
用于指定输出类型。 |
paginate_output |
标志 | 当 output_format 为 HTML 时,输出结果将分页显示。 |
lines_per_page |
号 | 当与 paginate_output 一起使用时,指定每页输出的行数。 |
full_filename |
字符串 |