IBM Cloud Data Engine es el servicio central de IBM Cloud para data lakes. La combinación de IBM Cloud Data Engine con datos en IBM Cloud Object Storage le permite crear un espacio de trabajo activo para una variedad de casos de uso de analytics de big data.
IBM Cloud Data Engine utiliza Apache Spark, un motor de procesamiento de datos in-memory, rápido, extensible y de código abierto, optimizado para el análisis de datos ad hoc y de baja latencia.
No se necesita ETL ni definición de esquemas para habilitar las consultas SQL. Analice los datos donde se encuentran en IBM Cloud Object Storage con nuestro editor de consultas y la API REST.
Ejecute tantas consultas como necesite; con el precio de pago por consulta, usted paga solo por el escaneo de datos. Comprima o particione los datos para aumentar el ahorro y el rendimiento.
IBM Cloud Data Engine tiene alta disponibilidad y ejecuta consultas mediante recursos informáticos en varias instalaciones.
Controle el acceso a sus datos con IBM Identity and Access Management e IBM Key Protect. Conceda a los usuarios un control granular de sus buckets de IBM Cloud Object Storage.
IBM Cloud Data Engine admite una variedad de formatos de datos, como CSV, JSON y Parquet, y permite ANSI SQL estándar.
Un servicio de almacenamiento de datos a escala web altamente seguro, rentable y resiliente, que garantiza un acceso continuo a sus datos.
Transfiera grandes conjuntos de datos hacia y desde IBM Cloud Object Storage de forma confiable y a la máxima velocidad.
Acelere el movimiento seguro de grandes cantidades de datos en IBM Cloud Object Storage, mediante dispositivos de almacenamiento portátil robustos y con una capacidad utilizable de 120 TB.
Para usar IBM Cloud Data Engine, necesitará una cuenta de IBM Cloud Object Store para almacenar los conjuntos de resultados de sus consultas.
Siga estos pasos para comenzar:
Ya puede enviar consultas contra nuestro conjunto de datos de muestra o el suyo.
Debe traer sus propias cuentas de IBM Cloud Object Storage y es responsable de todos los costos en los que incurra en su cuenta de IBM Cloud Object Storage, además de sus costos de IBM Cloud Data Engine.
1. IBM Cloud Data Engine analiza los datos en tus volúmenes de datos.
2. IBM Cloud Data Engine escribe los resultados en nuevos archivos en el bucket de IBM Cloud Object Storage especificado.
IBM Cloud Data Engine se basa en Apache Spark y utiliza Spark SQL para ejecutar sus consultas. Puede enviar sus consultas a través de la interfaz de usuario o la API REST.
En la actualidad, IBM Cloud Data Engine aún no está integrado con IBM Watson Knowledge Catalog. Sin embargo, esta integración ocupa un lugar destacado en nuestra lista de prioridades, por lo que los clientes pueden publicar consultas, metadatos y conjuntos de datos en el catálogo, así como activos de datos de referencia registrados en el catálogo.
IBM Cloud Data Engine está disponible en todo el mundo.
IBM Cloud Data Engine le da el control para acceder a sus datos mediante políticas de IBM Identity and Access Management.
IBM Cloud Data Engine está diseñado para ser tolerante a fallas y altamente disponible. Admite el SLA de IBM Cloud.
IBM Cloud Data Engine está disponible en IBM Cloud. Se le cobrará por consulta, según la cantidad de datos escaneados por mes. No habrá cargos por consultas fallidas, pero se le facturarán consultas canceladas en función de la cantidad de datos escaneados.
No.
Solo se le cobrará por los datos que ya se han escaneado en el momento en que canceló la consulta.
No hay cargos adicionales para IBM Cloud Data Engine. Tendrá cargos por los datos almacenados en IBM Cloud Object Storage. El uso de IBM Cloud Data Engine aumentará su uso de IBM Cloud Object Storage y su factura mensual.Usted es responsable de eliminar volúmenes que ya no desee conservar en IBM Cloud Object Storage.