Erstellen eines Textanalyseexperiments

Nutzen Sie die Textanalysefunktion von „ AutoAI's “, um eine Textanalyse Ihrer Experimente durchzuführen. Führen Sie zum Beispiel eine grundlegende Stimmungsanalyse aus, um ein Ergebnis auf der Grundlage von Textkommentaren vorherzusagen.

Hinweis: Die Textanalyse steht nur für Klassifizierungs- und Regressionsversuche im Rahmen von „ AutoAI “ zur Verfügung. Diese Funktion ist für Zeitreihen-Experimente nicht verfügbar.

Übersicht über die Textanalyse

Wenn Sie ein Experiment erstellen, bei dem die Textanalysefunktion verwendet wird, wird der Text vom AutoAI-Prozess mithilfe des Algorithmus word2vec in Vektoren umgewandelt und danach ein Vergleich der Vektoren durchgeführt, um die Auswirkungen auf die Vorhersagespalte zu ermitteln.

Der Algorithmus word2vec verwendet einen Textkorpus als Eingabe und gibt eine Gruppe von Vektoren aus. Indem Text in eine numerische Darstellung verwandelt wird, kann er ähnliche Wörter erkennen und vergleichen. Wenn word2vec mit ausreichend Daten trainiert wird, kann der Algorithmus präzise Vorhersagen zur Bedeutung oder zur Beziehung eines Wortes zu anderen Wörtern machen. Die Vorhersagen können verwendet werden, um Texte zu analysieren und die Bedeutung in Anwendungen zur Stimmungsanalyse zu erraten.

Während der Feature-Engineering-Phase des Trainingsexperiments werden mithilfe des word2vec Algorithmus 20 Merkmale für die Textspalte generiert. Die automatische Erkennung von Textmerkmalen basiert auf der Analyse der Anzahl eindeutiger Werte in einer Spalte und der Anzahl der Tokens in einem Datensatz (Mindestanzahl = 3). Wenn die Anzahl eindeutiger Werte kleiner als die Anzahl aller Werte dividiert durch 5 ist, wird die Spalte nicht als Text behandelt.

Wenn das Experiment ausgeführt wurde, können Sie die Ergebnisse der Featureentwicklung auf der Seite mit den Details zur Pipeline überprüfen. Sie können eine Pipeline auch als Notebook speichern, in dem Sie die Transformationen und eine Visualisierung der Transformationen anzeigen können.

Hinweis: Wenn Sie beim Überprüfen des Experiments feststellen, dass eine Textspalte nicht erkannt und nicht von der automatischen Erkennung verarbeitet wurde, können Sie die Textspalte manuell in den Experimenteinstellungen angeben.

Beispiel: Analyse von Kundenkommentaren

In diesem Beispiel werden die Bewertungen einer fiktiven Autovermietung verwendet, um ein Modell zu trainieren, das bei der Eingabe einer neuen Bewertung eine Zufriedenheitsbewertung vorhersagt.

Sehen Sie sich folgende kurze Video mit dem Beispiel an und informieren Sie sich dann anhand der Abschnitte unterhalb des Videos über nähere Einzelheiten zur Textfunktion.

Dieses Video bietet eine anschauliche Möglichkeit, die Konzepte und Aufgaben in dieser Dokumentation kennenzulernen.

Ausgehend von einem Datensatz, der eine Spalte mit Bewertungskommentaren zur Vermietungserfahrung (Customer_service) sowie eine Spalte mit einer binären Zufriedenheitsbewertung (Satisfaction) enthält, wobei 0 für einen negativen Kommentar und 1 für einen positiven Kommentar steht, wird das Modell darauf trainiert, bei Eingabe neuer Rückmeldungen eine Zufriedenheitsbewertung vorherzusagen.

Training eines Texttransformationsexperiments

Nachdem Sie den Datensatz geladen und die Vorhersagespalte (Zufriedenheit) festgelegt haben, wird in den Experiment-Einstellungen die Option „Text-Feature-Engineering verwenden“ ausgewählt.

Einstellungen für die Datenquelle zur Verwendung bei der Text-Feature-Engineering

Beachten Sie einige der Details zur Optimierung Ihres Textanalyseexperiments:

  • Sie können die Standardauswahl akzeptieren, bei der die Textspalten automatisch ausgewählt werden, oder sich für eine stärkere Steuerung entscheiden, indem Sie die Spalten für die Textmerkmalsentwicklung manuell angeben.
  • Während der Durchführung des Experiments werden mithilfe des word2vec Algorithmus standardmäßig 20 Merkmale für die Textspalte generiert. Sie können diesen Wert bearbeiten, um die Anzahl der Merkmale zu erhöhen oder zu verringern. Je mehr Vektoren Sie generieren, desto genauer ist Ihr Modell, aber desto länger dauert das Training.
  • Die übrigen Optionen gelten für alle Arten von Experimenten, sodass Sie die Verarbeitung der endgültigen Trainingsdaten genau anpassen können.

Führen Sie das Experiment aus, um die jeweils bearbeiteten Transformationen anzuzeigen.

Pipeline-Rangliste des Algorithmus

Wählen Sie den Namen einer Pipeline aus und klicken Sie dann auf „Funktionsübersicht“, um die Textumwandlungen anzuzeigen.

Funktionsübersicht der einzelnen Pipeline

Sie können die Experimentpipeline auch als Notebook speichern und die Transformationen als Visualisierung überprüfen.

Bereitstellung und Scoring eines Texttransformationsmodells

Wenn Sie dieses Modell auswerten, geben Sie neue Kommentare ein, um eine Vorhersage mit einem Konfidenzwert darüber zu erhalten, ob der Kommentar zu einer positiven oder negativen Zufriedenheitsbewertung führt.

Die Eingabe des Kommentars 'Es hat fast drei Stunden gedauert, bis wir ein Auto hatten. „Das war absurd“ sagt eine Zufriedenheitsbewertung von 0 bei einem Konfidenzniveau von 95 % voraus.

Vorhersage eines Zufriedenheitswerts

Nächste Schritte

Ein Experiment zur Zeitreihenprognose erstellen