Fehlerbehebung bei Data Refinery

Anhand dieser Informationen können Sie Fragen zur Verwendung von Data Refinerylösen.

Daten aus einem Excel-Datenasset können nicht optimiert werden
Der AblaufData Refinery schlägt mit der Nachricht "Das ausgewählte Dataset wurde nicht geladen" fehl
Data Refinery -Ablaufjob schlägt mit großem Datenasset fehl

Daten aus einem Excel-Datenasset können nicht optimiert werden

Der Data Refinery -Ablauf schlägt möglicherweise fehl, wenn er die Daten nicht lesen kann. Bestätigen Sie das Format der Excel-Datei. Standardmäßig wird die erste Zeile der Datei als Header behandelt. Sie können diese Einstellung in den Flow-Einstellungen ändern. Klicken Sie auf das Symbol Flow-Einstellungen Einstellungen für Ablauf . Wechseln Sie zur Registerkarte Quellendatasets , klicken Sie auf das Symbol Überlauf Überlaufmenü neben der Datenquelle und wählen Sie Format bearbeitenaus. Sie können auch die Eigenschaft für die erste Zeile angeben, die angibt, welche Zeile die erste Zeile im zu lesenden Dataset ist. Das Ändern dieser Eigenschaften wirkt sich darauf aus, wie die Daten in Data Refinery angezeigt werden, sowie auf die Ausgabe der Jobausführung und des Ablaufs von Data Refinery .

Data Refinery -Ablauf schlägt mit Nachricht "The selected data set wasn't loaded" fehl

Der Data Refinery-Ablauf kann fehlschlagen, wenn nicht genügend Ressourcen vorhanden sind. Der Administrator kann die Ressourcen überwachen und anschließend Ressourcen hinzufügen (durch Skalieren des Data Refinery-Service oder durch Hinzufügen von Knoten zum Cloud Pak for Data-Cluster).

Data Refinery -Ablaufjob schlägt mit einem großen Datenasset fehl

Wenn Ihr Data Refinery -Ablaufjob mit einem großen Datenasset fehlschlägt, versuchen Sie die folgenden Tipps zur Fehlerbehebung, um das Problem zu beheben:

Verwenden Sie anstelle eines Projektdatenassets als Ziel des Data Refinery -Ablaufs (Standardeinstellung) eines der folgenden Ziele:
- Cloud-Speicher. Zum Beispiel IBM Cloud Object Storage, Amazon S3 oder Google Cloud Storage
- Speicherdatenträger
Wählen Sie eine Spark & R -Umgebung für den Datenflussjob Data Refinery aus, oder erstellen Sie eine neue Spark & R -Umgebungsvorlage.