Hive via Execution Engine for Hadoop

È possibile creare un asset di connessione per Hive via Execution Engine for Hadoop.

Utilizzare la connessione Hive via Execution Engine for Hadoop per connettersi a tabelle in un magazzino Hive sul cluster Hadoop .

Prerequisiti

  • L'amministratore deve registrare il cluster Hadoop dal pannello Hadoop Execution Engine . Chiedete all'amministratore l'URL.
  • È necessario creare una definizione di runtime di ambiente per Hadoop nel proprio progetto.
  • SSL certificato associato alla connessione URL.
  • SSL certificato per il server Hive se il server Hive è abilitato per SSL.
  • Scaricare il file 'HiveJDBC41.jar dal file ' sito web Cloudera :
    1. Selezionare l'ultima versione del driver Hive JDBC .
    2. Fare clic su GET IT NOW, quindi scaricare ed estrarre il file hive_jdbc_#.#.#.####.zip .
    3. Estrarre il file ClouderaHiveJDBC41-#.#.#.####.zip . Il file HiveJDBC41.jar sarà nei contenuti estratti.
    4. Caricare il file su Cloud Pak for Data. Vedere Importazione dei driver di JDBC nella documentazione di IBM Software Hub per la procedura e i permessi necessari per caricare il file JAR su Cloud Pak for Data. Importante: per impostazione predefinita, il caricamento dei file dei driver JDBC è disabilitato e gli utenti non possono visualizzare l'elenco dei driver JDBC nel client Web. Un amministratore deve abilitare gli utenti a caricare o visualizzare i driver JDBC nella documentazione di IBM Software Hub.

Crittografia supportata

  • Certificato SSL
  • Questa connessione supporta la connessione a un ambiente Hadoop protetto da Kerberos.

Prerequisiti per l'autenticazione Kerberos

Se si intende utilizzare l'autenticazione Kerberos, completare i seguenti requisiti:

  • Configurare l'origine dati per l'autenticazione Kerberos. Opzionale: Questa connessione supporta Kerberos SSO con impersonificazione dell'utente, che richiede una configurazione aggiuntiva.
  • Confermare che il servizio che si intende utilizzare per la connessione supporta Kerberos. Per ulteriori informazioni, vedere Kerberos in Cloud Pak for Data.

Credenziali

Credenziali di accesso alla piattaforma

Creare una connessione Hive via Execution Engine for Hadoop al magazzino Hive sul cluster Hadoop

  1. Dal tuo progetto, su Risorse scheda, fare clic Nuova risorsa > Connetti a un'origine dati.

  2. Selezionare Hive via Execution Engine for Hadoop.

  3. Inserire un nome e una descrizione e le informazioni di connessione.

  4. Selezionare le credenziali di accesso alla piattaforma.

    Nota: per consentire agli altri utenti di utilizzare la connessione, è necessario fornire le proprie credenziali Cloud Pak for Data .
  5. Nell'elenco a discesa Jar uris , caricare il file HiveJDBC41.jar se non è già presente, quindi selezionarlo.

  6. Nel campo Certificato SSL, inserisci il certificato SSL per la connessione URL (l'URL contrassegnato come URL ) che si trova nei dettagli di registrazione in Amministrazione > Configurazione e impostazioni > Motore di esecuzione Hadoop. Se il server Hive è abilitato per SSL, inserire anche il certificato per il server.
    Esempio con due certificati:

    -----BEGIN CERTIFICATE-----
    certificate from the connection URL
    -----END CERTIFICATE-----
    -----BEGIN CERTIFICATE-----
     certificate from the Hive server
     -----END CERTIFICATE-----
    
  7. Inserire l'URL per accedere al servizio di integrazione Hadoop.

    Importante: l'URL del servizio di integrazione Hadoop deve essere uguale a quello indicato nei dettagli di registrazione di Hadoop. L'amministratore può confermare l'URL da Amministrazione > Configurazione e impostazioni > Hadoop Execution Engine.
  8. Fare clic su Crea.

Conformità FIPS (Federal Information Processing Standards)

Questa connessione non può essere creata in un ambiente FIPS.

Limitazioni

  • Questa funzione non è supportata su cluster Hortonworks 3.x .

  • Per SPSS Modelerè possibile utilizzare questa connessione solo per importare i dati. Non è possibile esportare i dati su questa connessione o su un asset di dati connesso Hive via Execution Engine for Hadoop .

Problemi noti

Ulteriori informazioni