在 Data Refinery 中优化 Hadoop 集群上的数据
在 Hadoop 集群上优化数据时,充分利用 Hadoop 对大型数据集的支持。
如果使用 Hadoop 环境,可以使用以下 Hadoop 执行引擎连接来提炼数据:
- HDFS via Execution Engine for Hadoop 用于 Hadoop 分布式文件系统 ( HDFS ) 的文件
- Hive via Execution Engine for Hadoop 对于存储在 Hive 仓库表中的数据
- Impala via Execution Engine for Hadoop 针对存储在 Hadoop 集群中 Impala 数据库表中的数据
另请参阅 《 Hadoop 环境故障排除》。