Versiones compatibles de Spark y lenguajes de aplicación

Analytics Engine powered by Apache Spark Es compatible con diferentes versiones de Spark y lenguajes como Python, R y Scala con Spark.

Versiones compatibles de Spark

IBM Cloud Pak for Data Es compatible con las siguientes versiones del tiempo de ejecución de Spark para ejecutar cargas de trabajo de Spark.

Tabla 1. Versiones compatibles de Spark
Nombre Estado
Apache Spark 3.3.4 En desuso
Apache Spark 3.4.2 En desuso
Apache Spark 3.5 Soportado

Idiomas admitidos para la solicitud

Los siguientes ejemplos muestran cargas útiles de muestra para enviar trabajos Spark en diferentes lenguajes.

  • Carga útil para enviar un trabajo Spark con Python 3.10:

    {
      "application_details": {
        "application": "<your application_file_path>",
        "arguments": [
          "<your_application_arguments>"
        ],
        "conf": {
          "spark.app.name": "MyJob",
          "spark.eventLog.enabled": "true"
        },
        "env": {
          "RUNTIME_PYTHON_ENV": "python310"
        }
      }
    }
    
  • Carga útil para enviar un trabajo de Spark Scala :

    {
      "application_details": {
        "application": "/opt/ibm/spark/examples/jars/spark-examples*.jar",
        "arguments": [
          "1"
        ],
        "class": "org.apache.spark.examples.SparkPi",
        "conf": {
          "spark.app.name": "MyJob",
          "spark.eventLog.enabled": "true",
          "spark.driver.memory": "4G",
          "spark.driver.cores": 1,
          "spark.executor.memory": "4G",
          "spark.executor.cores": 1,
          "ae.spark.executor.count": 1
        },
        "env": {
          "SAMPLE_ENV_KEY": "SAMPLE_VALUE"
        }
      }
    }
    
  • Carga útil para enviar un trabajo R 4.2 Spark:

    {
      "application_details": {
        "application": "/opt/ibm/spark/examples/src/main/r/dataframe.R",
        "class": "org.apache.spark.examples.SparkPi",
        "conf": {
          "spark.app.name": "MyJob",
          "spark.eventLog.enabled": "true",
          "spark.driver.memory": "4G",
          "spark.driver.cores": 1,
          "spark.executor.memory": "4G",
          "spark.executor.cores": 1,
          "ae.spark.executor.count": 1
        },
        "env": {
          "SAMPLE_ENV_KEY": "SAMPLE_VALUE"
        }
      }
    }