Impala über Execution Engine for Hadoop-Verbindung
Sie können eine Verbindungsressource für erstellen Impala via Execution Engine for Hadoop.
Verwenden Sie die Impala via Execution Engine for Hadoop-Verbindung, um eine Verbindung zu Daten herzustellen, die in Tabellen in Impala auf dem Hadoop-Cluster gespeichert sind.
Voraussetzungen
- Ihr Administrator muss den Hadoop Cluster über das Hadoop Execution Engine-Fenster registrieren. Wenden Sie sich an Ihren Administrator, um die URL zu erfragen.
- LDAP muss im Rahmen der Impala-Authentifizierung aktiviert sein.
- Sie müssen eine Definition der Umgebungslaufzeit für Hadoop in Ihrem Projekt erstellen.
- Verwenden Sie optional ein SSL-Zertifikat für den Impala-Dämon, sofern der Dämon SSL-fähig ist.
- Laden Sie die
ImpalaJDBC41.jarDatei von der Cloudera Website herunter:- Wählen Sie die neueste Version von 'Impala JDBC Connector' aus.
- Klicken Sie auf GET IT NOW. Laden Sie anschießend die Datei
ClouderaImpala_JDBC-#.#.##.####.zipherunter und extrahieren Sie sie. - Extrahieren Sie die
ClouderaImpalaJDBC41-#.#.##.####.zip-Datei. Die DateiImpalaJDBC41.jarbefindet sich in dem extrahierten Inhalt.
Unterstützte Verschlüsselung
- SSL-Zertifikat (optional)
- Diese Verbindung unterstützt die Verbindung zu einer Hadoop-Umgebung, die durch Kerberos geschützt wird.
Voraussetzungen für Kerberos die Authentifizierung
Wenn Sie die Authentifizierung Kerberos verwenden möchten, erfüllen Sie die folgenden Anforderungen:
- Konfigurieren Sie die Datenquelle für Kerberos die Authentifizierung. Optional: Diese Verbindung unterstützt Kerberos SSO mit Benutzerimitation, was eine zusätzliche Konfiguration erfordert.
- Vergewissern Sie sich, dass der Dienst, für den Sie die Verbindung nutzen möchten, dies unterstützt Kerberos. Weitere Informationen finden Sie unter Kerberos Authentifizierung in Cloud Pak for Data.
Berechtigungsnachweise
Benutzername und Kennwort
Für Anmeldeinformationen und Zertifikate können Sie Geheimnisse verwenden, wenn für die Plattform ein Tresor konfiguriert ist und der Dienst Tresore unterstützt. Weitere Informationen finden Sie unter Verwenden von Geheimnissen aus Tresoren in Verbindungen.
Erstellen Sie eine Impala via Execution Engine for Hadoop Verbindung zum Cluster Hadoop
- Hostname oder IP-Adresse : Hostname oder IP-Adresse, unter der der Impala Daemon verfügbar ist.
- Port : Impala Daemon-Port aus Hadoop Cluster.
Zertifikate
- Der Port unterstützt „ SSL “: Aktivieren Sie diese Option, wenn der von Ihnen gewählte Port so konfiguriert ist, dass er „ SSL “-Verbindungen akzeptiert.
Wenn die Option „Port ist SSL -fähig“ aktiviert ist, füllen Sie die folgenden Felder aus:
- SSL Zertifikat : Geben Sie das Zertifikat „ SSL “ des vertrauenswürdigen Hosts ein
- Hostname im Zertifikat „ SSL “: Der Hostname unter SubjectAlternativeName oder der Teil „Common Name“ (CN) des Zertifikats „ SSL “
- SSL -Zertifikat überprüfen : Aktivieren Sie diese Option, um zu überprüfen, ob das vom Host zurückgegebenen SSL -Zertifikat vertrauenswürdig ist.
Einhaltung der Federal Information Processing Standards (FIPS)
Diese Verbindung kann in einer FIPS-Umgebung nicht hergestellt werden.
Einschränkungen
- Für Data Refinery können Sie diese Verbindung nur als Quelle verwenden. Sie können diese Verbindung nicht als Zielverbindung oder verbundenes Zieldatenasset verwenden.Eine Problemumgehung finden Sie unter „Verfeinern von in Tabellen gespeicherten Daten in Impala.“
- In SPSS Modeler können Sie diese Verbindung nur zum Importieren von Daten verwenden. Sie können keine Daten zu dieser Verbindung oder zu einem Impala via Execution Engine for Hadoop verbundenen Datenbestand exportieren.