Gestione delle configurazioni a livello di servizio e di istanza per l' Analytics Engine Powered by Apache Spark
Dopo aver installato il servizio Analytics Engine powered by Apache Spark, l'amministratore di IBM Cloud Pak for Data può configurare alcune impostazioni predefinite relative al livello di servizio modificando o aggiungendo le seguenti proprietà nella risorsa personalizzata Analytics Engine, ad esempio per aggiornare i valori massimi relativi ai core della CPU e alla memoria per il driver Spark e gli executor. L'amministratore può inoltre modificare il numero massimo di worker che possono essere richiesti da un'applicazione Spark.
Quando viene inviato un processo di un'applicazione Spark, viene avviato un runtime Spark e ogni worker Spark viene eseguito in un singolo executor. Pertanto, il numero di executor deve sempre corrispondere al numero di worker richiesto nel payload dell'applicazione Spark.
Per visualizzare le configurazioni attuali dei livelli di servizio, utilizzare il seguente comando:
kubectl get configmap spark-hb-resource-limit -o yaml -n ${PROJECT_CPD_INST_OPERANDS}
Output previsto:
apiVersion: v1
data:
resource-limit-properties: |-
max_driver_cpu_cores=5
max_executor_cpu_cores=5
max_driver_memory=40g
max_executor_memory=40g
max_num_workers=50
default_instance_cpu_quota=20
default_instance_memory_quota=80
kind: ConfigMap
Aggiornamento delle configurazioni dei livelli di servizio
Per modificare le impostazioni predefinite del livello di servizio:
Accedi al sito Cloud Pak for Data.
Aggiornare la proprietà corrispondente nel file YAML della risorsa personalizzata (CR) Analytics Engine utilizzato per configurare Analytics Engine powered by Apache Spark. Vedi le opzioni di installazione aggiuntive. Quindi applicare le modifiche a un CR già distribuito utilizzando il seguente comando:
oc apply -f analyticsengine-cr.yaml -n ${PROJECT_CPD_INST_OPERANDS}Attendere che il CR dell' Analytics Engine sia nello
Completedstato:oc get analyticsengine -n ${PROJECT_CPD_INST_OPERANDS}
Le modifiche alla configurazione avranno effetto entro pochi minuti. Tutte le applicazioni Spark inviate successivamente da un utente utilizzeranno i valori di configurazione modificati.
Aggiornamento delle configurazioni a livello di istanza del servizio
Quando un amministratore di progetto crea un'istanza di Analytics Engine powered by Apache Spark, a ciascuna istanza viene applicata la quota predefinita per l'utilizzo della CPU e della memoria.
Sebbene l'amministratore del progetto possa modificare la quota di risorse predefinita al momento della creazione dell'istanza, tale quota può essere modificata una sola volta a livello di istanza del servizio dall'amministratore di IBM Cloud Pak for Data e si applica a tutte le istanze create successivamente.
Per modificare default_instance_cpu_quota e default_instance_memory_quota a livello di istanza del servizio:
Accedi al sito Cloud Pak for Data.
Aggiornare le
default_instance_cpu_quotaproprietàdefault_instance_memory_quotae nel file YAML CR di Analytics Engine, utilizzato per configurare Analytics Engine powered by Apache Spark. Vedi le opzioni di installazione aggiuntive. Quindi applicare le modifiche a un CR già distribuito utilizzando il seguente comando:oc apply -f analyticsengine-cr.yaml -n ${PROJECT_CPD_INST_OPERANDS}Attendere che il CR dell' Analytics Engine sia nello
Completedstato:oc get analyticsengine -n ${PROJECT_CPD_INST_OPERANDS}Le istanze di « Analytics Engine powered by Apache Spark » create successivamente dagli amministratori di progetto utilizzeranno i valori di configurazione modificati.