Details zur Batch-Bereitstellungseingabe für R-Skripte in Watson Machine Learning

Befolgen Sie diese Regeln, wenn Sie Eingabedetails für die Batch-Bereitstellung von R-Skripten angeben.

Übersichtstabelle der Datentypen:

Akzeptierte Datentypen und Dateiformate
Daten Beschreibung
Typ Datenreferenzen
Dateiformate Beliebig

Datenquellen

Eingabe- oder Ausgabedatenreferenzen:

  • Lokale oder verwaltete Vermögenswerte aus dem Weltraum
  • Verbundene (Remote-)Assets in Cloud-Speicher und Speichervolumes

Hinweise:

  • Für Cloud-Speicherverbindungen wie müssen Sie den Zugriffsschlüssel und Cloud Object Storage den geheimen Schlüssel konfigurieren, auch bekannt als HMAC-Anmeldedaten.

Wenn Sie Verweise auf Ein- und Ausgabedaten programmgesteuert festlegen:

  • Die Referenz der Datenquelle hängt type vom Asset-Typ ab. Siehe den Abschnitt „Referenztypen für Datenquellen“ unter „Hinzufügen von Daten-Assets zu einem Bereitstellungsbereich “.
  • Sie können die für die Ausführung des R-Skripts erforderlichen Umgebungsvariablen als 'key': 'value' Paare in angeben scoring.environment_variables. Das key muss der Name einer Umgebungsvariablen sein und das value muss der entsprechende Wert der Umgebungsvariablen sein.
  • Die Nutzlast des Bereitstellungsauftrags wird als JSON-Datei im Bereitstellungscontainer gespeichert, in dem Sie das R-Skript ausführen. Das R-Skript kann über die JOBS_PAYLOAD_FILE Umgebungsvariable auf den vollständigen Pfadnamen der JSON-Datei zugreifen.
  • Wenn Eingabedaten als lokale oder verwaltete Datenressource referenziert werden, lädt der Bereitstellungsdienst die Eingabedaten herunter und speichert sie in dem Bereitstellungscontainer, in dem das R-Skript ausgeführt wird. Sie können über die BATCH_INPUT_DIR Umgebungsvariable auf den Speicherort (Pfad) der heruntergeladenen Eingabedaten zugreifen.
  • Für Eingabedatenreferenzen (Daten-Asset oder Verbindungs-Asset) muss das Herunterladen der Daten über das R-Skript erfolgen. Wenn ein verbundenes Daten-Asset oder ein Verbindungs-Asset in der Nutzlast der Bereitstellungsaufträge vorhanden ist, können Sie darauf über die JOBS_PAYLOAD_FILE Umgebungsvariable zugreifen, die den vollständigen Pfad zur Nutzlast des Bereitstellungsauftrags enthält, der als JSON-Datei gespeichert ist.
  • Wenn Ausgabedaten als lokales oder verwaltetes Daten-Asset in einem Bereich gespeichert werden sollen, können Sie den Namen des zu erstellenden Assets angeben. scoring.output_data_reference.location.name Als Teil eines R-Skripts können Ausgabedaten in dem Pfad abgelegt werden, der durch die BATCH_OUTPUT_DIR Umgebungsvariable angegeben wird. Der Bereitstellungsdienst komprimiert die Daten in das ZIP-Format und lädt sie an den in BATCH_OUTPUT_DIR. angegebenen Speicherort hoch.
  • Wenn Ausgabedaten in einem Remote-Datenspeicher gespeichert werden müssen, müssen Sie die Referenz der Ausgabedatenreferenz (z. B. ein Datenasset oder ein verbundenes Datenasset) in angeben output_data_reference.location. Das R-Skript muss dafür sorgen, dass die Ausgabedaten in die Remote-Datenquelle hochgeladen werden. Wenn eine verbundene Datenressource oder eine Verbindungsressourcenreferenz in der Nutzlast der Bereitstellungsaufträge vorhanden ist, können Sie darauf über die JOBS_PAYLOAD_FILE Umgebungsvariable zugreifen, die den vollständigen Pfad zur Nutzlast des Bereitstellungsauftrags enthält, der als JSON-Datei gespeichert ist.
  • Wenn das R-Skript keine Eingabe- oder Ausgabedatenreferenzen erfordert, die in der Nutzlast des Bereitstellungsauftrags angegeben werden müssen, geben Sie die scoring.input_data_references Objekte scoring.output_data_references und nicht in der Nutzlast an.
  • Sie können R-Skripte nur mit der Standard-Softwarespezifikation bereitstellen. Die Angabe einer benutzerdefinierten Softwarespezifikation wird nicht unterstützt.
  • Die Bereitstellung eines Skripts zur Ausführung in einer Hadoop Umgebung wird nicht unterstützt.