Daten in ein Notebook laden und darauf zugreifen

Sie können Daten in Notebooks integrieren, indem Sie über eine lokale Datei, freie Datasets oder eine Datenquellenverbindung auf die Daten zugreifen. Sie laden diese Daten in eine Datenstruktur oder einen Container im Notebook, z. B. ein pandas.DataFrame, numpy.array, Spark RDD oder Spark DataFrame.

Zum Arbeiten mit Daten in einem Notebook können Sie zwischen den folgenden Optionen wählen:

Empfohlene Methoden zum Hinzufügen von Daten zu Ihrem Notebook
Option	Empfohlene Methode	Anforderungen	Details zu
Daten aus einer Datei auf dem lokalen System hinzufügen	Fügen Sie ein Code-Snippet hinzu, das Ihre Daten lädt.	Die Datei muss als Asset in Ihrem Projekt vorhanden sein.	Fügen Sie Ihrem lokalen System eine Datei zu Ihrem Projekt hinzu und verwenden Sie anschließend ein Code-Snippet zum Laden der Daten .
Daten aus einer Datenquellenverbindung laden	Fügen Sie ein Code-Snippet hinzu, das Ihre Daten lädt.	Die Verbindung muss als Asset in Ihrem Projekt vorhanden sein	Fügen Sie eine Verbindung zu Ihrem Projekt hinzu und fügen Sie anschließend ein Code-Snippet hinzu, das die Daten aus Ihrer Datenquellenverbindung lädt
Programmgesteuerter Zugriff auf Projektassets und Metadaten	`ibm-watson-studio-lib` -Bibliotheksfunktionen verwenden	Die Datenquelle muss als Projektasset vorhanden sein.	`ibm-watson-studio-lib` -Bibliothek für die Interaktion mit Datenassets verwenden
Eigenen Code zum Lesen oder Schreiben von Daten generieren	Verwenden Sie den Flight Service und das Apache Arrow Flight-Protokoll, um von Datenbeständen in einem Projekt zu lesen und in diese zu schreiben	Das Datenasset muss in Ihrem Projekt vorhanden sein,	Verwenden Sie den Flight service in Python Notebooks oder den Flight service in R-Notebooks , um auf Datenquellen zuzugreifen.
Feature-Store-Daten erstellen und verwenden	`assetframe-lib` -Bibliotheksfunktionen verwenden.	Das Datenasset muss in Ihrem Projekt vorhanden sein,	Verwenden Sie die `assetframe-lib` -Bibliothek für Python zum Erstellen und Verwenden von Feature-Store-Daten.
Mit einer API-Funktion oder einem Betriebssystembefehl auf Daten zugreifen	Verwenden Sie beispielsweise `wget`.	Nicht zutreffend	Mit einer API-Funktion oder einem Betriebssystembefehl auf Daten zugreifen

Wichtig: Stellen Sie sicher, dass die Umgebung, in der das Notebook gestartet wird, über genügend Speicher zum Speichern der Daten verfügt, die Sie in das Notebook laden. Die Umgebung muss deutlich mehr Speicher haben als die Gesamtgröße der Daten, die in das Notebook geladen werden. Einige Datenframeworks wie Pandas können mehrere Kopien der Daten im Speicher enthalten.

Datei aus dem lokalen System hinzufügen

Gehen Sie wie folgt vor, um Ihrem Projekt mithilfe des Jupyterlab Notebook-Editors eine Datei aus Ihrem lokalen System hinzuzufügen:

Öffnen Sie Ihr Notebook im Bearbeitungsmodus.
Klicken Sie in der Symbolleiste auf das Symbol " asset zum Projekt hochladen " ( und fügen Sie Ihre Datei hinzu.

Tipp: Sie können die Datei auch in die Seitenleiste Ihres Notebooks ziehen.

Daten aus Dateien laden

Voraussetzungen Die Datei muss als Asset in Ihrem Projekt vorhanden sein.

Gehen Sie wie folgt vor, um Daten aus einer Projektdatei in Ihr Notebook zu laden:

Öffnen Sie Ihr Notebook im Bearbeitungsmodus.
Klicken Sie auf das Symbol für die Codeschnipsel " , klicken Sie auf Daten lesen und wählen Sie dann die Datendatei aus Ihrem Projekt aus. Wenn Sie Ihre Auswahl ändern möchten, verwenden Sie das Symbol Bearbeiten .
Wählen Sie in der Dropdown-Liste Laden als die gewünschte Ladeoption aus.
Klicken Sie auf eine leere Codezelle in Ihrem Notebook und anschließend auf Code in Zelle einfügen , um den generierten Code einzufügen. Alternativ können Sie auf klicken, um den generierten Code in die Zwischenablage zu kopieren, und den Code anschließend in Ihr Notebook einfügen.

Der generierte Code dient als Schnelleinstieg für die Arbeit mit einem Dataset. Überprüfen Sie bei Produktionssystemen sorgfältig den eingefügten Code, um festzustellen, ob Sie eigenen Code schreiben müssen, der Ihren Anforderungen besser entspricht.

Informationen dazu, welche Datenstrukturen für welche Notebooksprache und welches Datenformat generiert werden, finden Sie unter Datenladeunterstützung.

Daten aus Datenquellenverbindungen laden

Voraussetzungen Bevor Sie Daten aus einem IBM -Datendienst oder einer externen Datenquelle laden können, müssen Sie eine Verbindung zu Ihrem Projekt erstellen oder hinzufügen.

So laden Sie Daten aus einer bestehenden Datenquellenverbindung in eine Datenstruktur in Ihrem Notebook:

Öffnen Sie Ihr Notebook im Bearbeitungsmodus.
Klicken Sie auf das Symbol „Code-Schnipsel“, klicken Sie auf „Daten lesen “ und wählen Sie dann die Datenquellenverbindung aus Ihrem Projekt aus.
Wählen Sie das Schema aus und wählen Sie eine Tabelle aus. Wenn Sie Ihre Auswahl ändern möchten, klicken Sie auf das Symbol Bearbeiten.
Wählen Sie die Ladeoption aus.
Klicken Sie in eine leere Codezelle in Ihrem Notebook und fügen Sie dann Code in die Zelle ein. Alternativ können Sie auf klicken, um den generierten Code in die Zwischenablage zu kopieren, und den Code anschließend in Ihr Notebook einfügen.
Geben Sie bei Bedarf Ihre persönlichen Anmeldedaten für gesperrte Datenverbindungen ein, die mit dem Sch lüsselsymbol gekennzeichnet sind. Dies ist ein einmaliger Vorgang, durch den die Verbindung dauerhaft für Sie freigeschaltet wird. Sobald Sie die Verbindung entsperrt haben, wird das Schlüsselsymbol nicht mehr angezeigt. Weitere Informationen finden Sie unter Hinzufügen von Verbindungen zu Projekten.

Der generierte Code dient als Schnelleinstieg für die Arbeit mit einer Verbindung. Überprüfen Sie bei Produktionssystemen sorgfältig den eingefügten Code, um festzustellen, ob Sie eigenen Code schreiben müssen, der Ihren Anforderungen besser entspricht.

Informationen dazu, welche Datenstrukturen für welche Notebooksprache und welches Datenformat generiert werden, finden Sie unter Datenladeunterstützung.

Verwenden Sie eine API-Funktion oder einen Betriebssystembefehl, um auf die Daten zuzugreifen

Sie können API-Funktionen oder Betriebssystembefehle in Ihrem Notebook verwenden, um auf Daten zuzugreifen, z. B. den Befehl " wget für den Zugriff auf Daten über die Protokolle HTTP, HTTPS oder FTP.

Referenzinformationen zur API finden Sie unter Daten und AI Common Core API.