Gestione delle configurazioni a livello di servizio e di istanza per l' Analytics Engine Powered by Apache Spark

Dopo aver installato il servizio Analytics Engine powered by Apache Spark, l'amministratore di IBM Cloud Pak for Data può configurare alcune impostazioni predefinite relative al livello di servizio modificando o aggiungendo le seguenti proprietà nella risorsa personalizzata Analytics Engine, ad esempio per aggiornare i valori massimi relativi ai core della CPU e alla memoria per il driver Spark e gli executor. L'amministratore può inoltre modificare il numero massimo di worker che possono essere richiesti da un'applicazione Spark.

Quando viene inviato un processo di un'applicazione Spark, viene avviato un runtime Spark e ogni worker Spark viene eseguito in un singolo executor. Pertanto, il numero di executor deve sempre corrispondere al numero di worker richiesto nel payload dell'applicazione Spark.

Per visualizzare le configurazioni attuali dei livelli di servizio, utilizzare il seguente comando:

kubectl get configmap spark-hb-resource-limit -o yaml -n ${PROJECT_CPD_INST_OPERANDS}

Output previsto:

apiVersion: v1
data:
  resource-limit-properties: |-
    max_driver_cpu_cores=5
    max_executor_cpu_cores=5
    max_driver_memory=40g
    max_executor_memory=40g
    max_num_workers=50
    default_instance_cpu_quota=20
    default_instance_memory_quota=80
kind: ConfigMap

Aggiornamento delle configurazioni dei livelli di servizio

Per modificare le impostazioni predefinite del livello di servizio:

  1. Accedi al sito Cloud Pak for Data.

  2. Aggiornare la proprietà corrispondente nel file YAML della risorsa personalizzata (CR) Analytics Engine utilizzato per configurare Analytics Engine powered by Apache Spark. Vedi le opzioni di installazione aggiuntive. Quindi applicare le modifiche a un CR già distribuito utilizzando il seguente comando:

    oc apply -f analyticsengine-cr.yaml -n ${PROJECT_CPD_INST_OPERANDS}
    
  3. Attendere che il CR dell' Analytics Engine sia nello Completed stato:

    oc get analyticsengine -n ${PROJECT_CPD_INST_OPERANDS}
    

Le modifiche alla configurazione avranno effetto entro pochi minuti. Tutte le applicazioni Spark inviate successivamente da un utente utilizzeranno i valori di configurazione modificati.

Aggiornamento delle configurazioni a livello di istanza del servizio

Quando un amministratore di progetto crea un'istanza di Analytics Engine powered by Apache Spark, a ciascuna istanza viene applicata la quota predefinita per l'utilizzo della CPU e della memoria.

Sebbene l'amministratore del progetto possa modificare la quota di risorse predefinita al momento della creazione dell'istanza, tale quota può essere modificata una sola volta a livello di istanza del servizio dall'amministratore di IBM Cloud Pak for Data e si applica a tutte le istanze create successivamente.

Per modificare default_instance_cpu_quota e default_instance_memory_quota a livello di istanza del servizio:

  1. Accedi al sito Cloud Pak for Data.

  2. Aggiornare le default_instance_cpu_quota proprietà default_instance_memory_quota e nel file YAML CR di Analytics Engine, utilizzato per configurare Analytics Engine powered by Apache Spark. Vedi le opzioni di installazione aggiuntive. Quindi applicare le modifiche a un CR già distribuito utilizzando il seguente comando:

    oc apply -f analyticsengine-cr.yaml -n ${PROJECT_CPD_INST_OPERANDS}
    
  3. Attendere che il CR dell' Analytics Engine sia nello Completed stato:

    oc get analyticsengine -n ${PROJECT_CPD_INST_OPERANDS}
    

    Le istanze di « Analytics Engine powered by Apache Spark » create successivamente dagli amministratori di progetto utilizzeranno i valori di configurazione modificati.