Anleitung: Multivariates Zeitreihen-Experiment mit „ AutoAI “ und den zugehörigen Funktionen

Verwenden Sie Beispieldaten, um ein multivariates Zeitreihen-Experiment zu trainieren, das die Verschmutzungsrate und die Temperatur mithilfe von unterstützenden Merkmalen vorhersagt, die die Vorhersagefelder beeinflussen.

Wenn Sie das Experiment einrichten, laden Sie Beispieldaten hoch, die die Wetterbedingungen in Peking von 2010 bis 2014 erfassen. Das Experiment generiert eine Reihe von Pipelines, die mithilfe von Algorithmen die künftige Luftverschmutzung und Temperatur vorhersagen, wobei Faktoren wie Tau, Luftdruck, Schnee und Regen berücksichtigt werden. Nach der Erstellung der Pipelines vergleicht und testet „ AutoAI “ diese, wählt die leistungsstärksten aus und stellt sie in einer Rangliste zur Überprüfung bereit.

Übersicht über den Datensatz

Für dieses Tutorial verwenden Sie den Datensatz „Beijing PM 2.5 “ aus dem Resource Hub. Dieser Datensatz beschreibt die Wetterbedingungen in Peking von 2010 bis 2014, die in täglichen Schritten gemessen werden. Sie verwenden diesen Datensatz, um Ihr „ AutoAI “-Experiment zu konfigurieren und die unterstützenden Funktionen auszuwählen. Einzelheiten zum Datensatz finden Sie hier:

  • Jede Spalte – mit Ausnahme der Datumsspalte – steht für eine Wetterbedingung, die sich auf den Verschmutzungsindex auswirkt.
  • Der Eintrag im Ressourcen-Hub gibt Auskunft über die Herkunft der Daten. Sie können eine Vorschau der Datei anzeigen, bevor Sie sie herunterladen.
  • Die Beispieldaten sind in Zeilen und Spalten gegliedert und als CSV-Datei gespeichert.

Vorschau des Datensatzes

Aufgabenübersicht

In diesem Tutorial führen Sie die folgenden Schritte aus, um ein multivariates Zeitreihen-Experiment zu erstellen, das folgende Funktionen nutzt:

  1. Projekt erstellen
  2. Ein „ AutoAI “-Experiment erstellen
  3. Das Experiment konfigurieren
  4. Experimentergebnisse überprüfen
  5. Trainiertes Modell bereitstellen
  6. Das bereitgestellte Modell testen

Projekt erstellen

Befolgen Sie diese Schritte, um ein leeres Projekt zu erstellen und den Datensatz „Beijing PM 2.5 “ aus dem Ressourcen-Hub „ IBM “ ( watsonx ) herunterzuladen:

  1. Klicken Sie im Hauptnavigationsbereich auf „Projekte“ > „Alle Projekte “ und anschließend auf „Neues Projekt “.
    a. Klicken Sie auf „Leeres Projekt erstellen “.
    b. Geben Sie einen Namen und optional eine Beschreibung für Ihr Projekt ein.
    c. Klicken Sie auf Erstellen.
  2. Klicken Sie im Hauptnavigationsbereich auf „Ressourcenzentrum“ und laden Sie eine lokale Kopie des Datensatzes „PM- 2.5 en in Peking“ herunter.

Ein „ AutoAI “-Experiment erstellen

Befolgen Sie diese Schritte, um ein „ AutoAI “-Experiment zu erstellen und Beispieldaten zu Ihrem Experiment hinzuzufügen:

  1. Klicken Sie in Ihrem Projekt auf der Registerkarte „Assets“ auf „Neues Asset “ > „Maschinelle Lernmodelle automatisch erstellen“.

  2. Geben Sie einen Namen und optional eine Beschreibung für Ihr Experiment ein.

  3. Wählen Sie eine Systemkonfiguration mit 8 vCPU und 32 GB RAM.

  4. Klicken Sie auf Erstellen.

  5. Um Beispieldaten hinzuzufügen, wählen Sie eine der folgenden Methoden:

    • Wenn Sie die Datei lokal heruntergeladen haben, laden Sie die Trainingsdatendatei „ PM25.csv “ hoch, indem Sie auf „Durchsuchen“ klicken und anschließend den Anweisungen folgen.
    • Wenn Sie Ihre Datei bereits in Ihr Projekt hochgeladen haben, klicken Sie auf „Aus Projekt auswählen“, wechseln Sie dann zur Registerkarte „Datenressource“ und wählen Sie „Beijing PM 25.csv “ aus.

Das Experiment konfigurieren

Befolgen Sie diese Schritte, um Ihr multivariates Zeitreihen-Experiment zur „ AutoAI “ zu konfigurieren:

  1. Klicken Sie auf „Ja“, um eine Zeitreihenprognose zu erstellen.

  2. Wähle als Vorhersagespalten: pollution, temp.

  3. Wählen Sie als Datums-/Uhrzeitspalte: date.

    Konfigurieren der Versuchseinstellungen. Ja, für Zeitreihenprognosen, wobei „Verschmutzung“ und „Temperatur“ die Prognosespalten und „Datum“ die Datums-/Uhrzeitspalte sind.

  4. Klicken Sie auf „Experiment-Einstellungen“, um das Experiment zu konfigurieren:
    a. Übernehmen Sie auf der Seite „Vorhersage“ die Standardauswahl für die einzubeziehenden Algorithmen. Algorithmen, bei denen Sie Zusatzfunktionen nutzen können, sind in der Spalte „Zusatzfunktionen zulassen“ mit einem Häkchen gekennzeichnet. Konfigurieren der Versuchseinstellungen. Algorithmen, die die Nutzung von Zusatzfunktionen unterstützen

    b. Gehen Sie zur Seite „Datenquelle “. In diesem Tutorial geben Sie während des Tests die zukünftigen Werte der unterstützenden Merkmale ein. Zukunftswerte sind hilfreich, wenn die Werte der zugrunde liegenden Merkmale für den Prognosehorizont bekannt sind. Übernehmen Sie die Standardaktivierung, um die zukünftigen Vorteile der unterstützenden Funktionen nutzen zu können. Übernehmen Sie außerdem die Standardauswahl für die Spalten, die als Zusatzmerkmale verwendet werden sollen.
    Unterstützende Funktionen
    c. Klicken Sie auf „Abbrechen“, um die Experiment-Einstellungen zu verlassen.

  5. Klicken Sie auf „Experiment ausführen“, um das Training zu starten.

Experimentergebnisse überprüfen

Das Experiment dauert einige Minuten. Während das Experiment trainiert wird, zeigt die Beziehungskarte die Transformationen an, die zur Erstellung von Pipelines verwendet werden. Befolgen Sie diese Schritte, um die Versuchsergebnisse zu überprüfen und die Pipeline mit der besten Leistung zu speichern.

  1. Optional: Bewegen Sie den Mauszeiger über einen beliebigen Knoten in der Beziehungskarte, um Details zur Transformation einer bestimmten Pipeline anzuzeigen.

    Beziehungszuordnung

  2. Optional: Nachdem die Pipelines in der Rangliste aufgeführt sind, klicken Sie auf „Pipeline-Vergleich“, um zu sehen, wie sie sich voneinander unterscheiden. Zum Beispiel:

    Pipelinevergleich

  3. Nach Abschluss des Trainings werden die drei leistungsstärksten Pipelines in der Rangliste gespeichert. Klicken Sie auf einen beliebigen Pipeline-Namen, um die Details anzuzeigen.

    Hinweis: Pipelines, die unterstützende Funktionen nutzen, sind mit dem Vermerk **SUP** gekennzeichnet.

    Pipelinebestenliste

  4. Wählen Sie die Pipeline mit Rang 1 aus und klicken Sie auf „Speichern unter“, um Ihr Modell zu erstellen. Klicken Sie anschließend auf „Erstellen “. Durch diese Aktion wird die Pipeline im Abschnitt „Modelle“ auf der Registerkarte „Assets“ gespeichert.

Trainiertes Modell bereitstellen

Bevor Sie Ihr trainiertes Modell zur Vorhersage für neue Daten verwenden können, müssen Sie das Modell bereitstellen. Befolgen Sie diese Schritte, um Ihr trainiertes Modell in einen Bereitstellungsbereich zu übertragen:

  1. Sie können das Modell über die Seite mit den Modelldetails bereitstellen. Um die Seite mit den Modelldetails aufzurufen, wählen Sie eine der folgenden Optionen:
    • Klicken Sie auf den Namen des Modells in der Benachrichtigung, die beim Speichern des Modells angezeigt wird.
    • Öffnen Sie die Seite „Assets“ für das Projekt, das das Modell enthält, und klicken Sie im Abschnitt „ Machine Learning -Modell“ auf den Namen des Modells.
  2. Klicken Sie auf das Symbol „In alt="Symbol für die Übertragung in den Bereitstellungsbereich" Bereitstellungsbereich verschieben“ und wählen Sie anschließend einen Bereitstellungsbereich aus oder erstellen Sie einen neuen, in dem das Modell bereitgestellt werden soll.
    Optional : Befolgen Sie diese Schritte, um einen Bereitstellungsbereich zu erstellen:
    a. Wählen Sie in der Liste „Zielbereich“ die Option „Neuen Bereitstellungsbereich erstellen “ aus.
    b. Geben Sie einen Namen für Ihren Bereitstellungsbereich ein.
    c. Um eine Machine-Learning-Instanz zuzuordnen, gehen Sie zu „Machine-Learning-Dienst auswählen“ (optional) und wählen Sie eine Machine-Learning-Instanz aus der Liste aus.
    d. Klicken Sie auf Erstellen.
  3. Sobald du deinen Bereich ausgewählt oder erstellt hast, klicke auf „Bewerben “.
  4. Klicken Sie in der Benachrichtigung auf den Link zum Bereitstellungsbereich.
  5. Auf der Registerkarte „Assets“ des Bereitstellungsbereichs:
    a. Bewegen Sie den Mauszeiger über den Namen des Modells und klicken Sie auf das Bereit stellungssymbol alt="Symbol für Bereitstellung".
    b. Füllen Sie auf der sich öffnenden Seite die Felder aus:
    - Wählen Sie als Bereitstellungstyp „Online“ aus.
    - Geben Sie einen Namen für die Bereitstellung ein.
    - Klicken Sie auf „Erstellen “.

Nachdem die Bereitstellung abgeschlossen ist, klicken Sie auf die Registerkarte „Bereitstellungen“ und wählen Sie den Namen der Bereitstellung aus, um die Detailseite anzuzeigen.

Das bereitgestellte Modell testen

Befolgen Sie diese Schritte, um das bereitgestellte Modell auf der Seite mit den Bereitstellungsdetails zu testen:

  1. Gehen Sie auf der Registerkarte „Test“ der Seite mit den Bereitstellungsdetails zur Tabelle „Neue Beobachtungen (optional) “ und geben Sie die folgenden Werte ein:
    pollution (double): 80.417
    temp (double): -5.5
    dew (double): -7.083
    press (double): 1020.667
    wnd_spd (double): 9.518
    snow (double): 0
    rain (double): 0

    Neue Beobachtungen

  2. Um zukünftige Werte für unterstützende Merkmale hinzuzufügen, gehen Sie zur Tabelle „Zukünftige exogene Merkmale (optional) “ und geben Sie die folgenden Werte ein:
    Tau (Doppelwert): -12.667
    Luftdruck (Doppelwert): 1023.708
    Windgeschwindigkeit (Doppelwert): 9.518
    Schnee (Doppelwert): 0
    Regen (Doppelwert): 0.042

    Hinweis: Sie müssen für zukünftige exogene Merkmale dieselbe Anzahl an Werten angeben wie den Vorhersagehorizont, den Sie bei der Konfiguration des Experiments festgelegt haben.

    Zukünftige exogene Werte

  3. Klicken Sie auf „Vorhersagen “. Die daraus resultierende Vorhersage gibt Werte für die Luftverschmutzung und die Temperatur an.

    Hinweis: Die in der Ausgabe angezeigten Prognosewerte können beim Testen Ihrer Bereitstellung abweichen.

    Daraus resultierende Vorhersage