Fehlerbehebung bei Data Refinery
Anhand dieser Informationen können Sie Fragen zur Verwendung von Data Refinerylösen.
- Daten aus einem Excel-Datenasset können nicht optimiert werden
- Der AblaufData Refinery schlägt mit der Nachricht "Das ausgewählte Dataset wurde nicht geladen" fehl
- Data Refinery -Ablaufjob schlägt mit großem Datenasset fehl
Daten aus einem Excel-Datenasset können nicht optimiert werden
Der Data Refinery -Ablauf schlägt möglicherweise fehl, wenn er die Daten nicht lesen kann. Bestätigen Sie das Format der Excel-Datei. Standardmäßig wird die erste Zeile der Datei als Header behandelt. Sie können diese Einstellung in den Flow-Einstellungen ändern. Klicken Sie auf das Symbol Flow-Einstellungen
. Wechseln Sie zur Registerkarte Quellendatasets , klicken Sie auf das Symbol Überlauf
neben der Datenquelle und wählen Sie Format bearbeitenaus. Sie können auch die Eigenschaft für die erste Zeile angeben, die angibt, welche Zeile die erste Zeile im zu lesenden Dataset ist. Das Ändern dieser Eigenschaften wirkt sich darauf aus, wie die Daten in Data Refinery angezeigt werden, sowie auf die Ausgabe der Jobausführung und des Ablaufs von Data Refinery .
Data Refinery -Ablauf schlägt mit Nachricht "The selected data set wasn't loaded" fehl
Der Data Refinery-Ablauf kann fehlschlagen, wenn nicht genügend Ressourcen vorhanden sind. Der Administrator kann die Ressourcen überwachen und anschließend Ressourcen hinzufügen (durch Skalieren des Data Refinery-Service oder durch Hinzufügen von Knoten zum Cloud Pak for Data-Cluster).
Data Refinery -Ablaufjob schlägt mit einem großen Datenasset fehl
Wenn Ihr Data Refinery -Ablaufjob mit einem großen Datenasset fehlschlägt, versuchen Sie die folgenden Tipps zur Fehlerbehebung, um das Problem zu beheben:
Verwenden Sie anstelle eines Projektdatenassets als Ziel des Data Refinery -Ablaufs (Standardeinstellung) eines der folgenden Ziele:
- Cloud-Speicher. Zum Beispiel IBM Cloud Object Storage, Amazon S3 oder Google Cloud Storage
- Speicherdatenträger
Wählen Sie eine Spark & R -Umgebung für den Datenflussjob Data Refinery aus, oder erstellen Sie eine neue Spark & R -Umgebungsvorlage.