Tuning Studio

Stimmen Sie ein Fundamentmodell mit Tuning Studio ab, um es an Ihre Bedürfnisse anzupassen.

Erforderliche Berechtigungen

Um Tuning-Experimente durchzuführen, müssen Sie die Rolle Admin oder Editor in einem Projekt haben.

Datenformat

Tabellarisch: JSON, JSONL

Tabellendaten aus unterstützten Datenverbindungen. Weitere Informationen finden Sie unter Datenformate.

Hinweis: Sie können dieselben Trainingsdaten mit einem oder mehreren Optimierungsexperimenten verwenden.
Datenmenge

Beispielpaare mit 50 bis 10.000 Ein-und Ausgaben. Die maximale Dateigröße beträgt 200 MB.

Vorbereitende Schritte

  • Treffen Sie Entscheidungen über die folgenden Tuning-Optionen:

    Das Foundation-Modell, das Sie optimieren möchten, muss in Ihrem Cluster installiert sein. Weitere Informationen finden Sie unter Hinzufügen Foundation-Modelle.

  • Erstellen Sie eine Reihe von Beispiel-Prompts, die als Trainingsdaten für die Feinabstimmung des Foundation-Modell verwendet werden können. Siehe Datenformate.

Vorgehensweise

  1. Wechseln Sie innerhalb eines Projekts zur Registerkarte Vermögenswerte und klicken Sie dann auf Neues Asset > Ein Foundation-Modell mit beschrifteten Daten trainieren. Geben Sie dem Abstimmungsversuch einen Namen und klicken Sie auf „Erstellen “.

    Es können eine Beschreibung und Tags hinzugefügt werden, um den Zweck des optimierten Modells zu dokumentieren und später die zugehörigen Optimierungsressourcen zu filtern.

  2. Klicken Sie auf Fundamentmodell auswählen, um das Fundamentmodell auszuwählen, das Sie abstimmen möchten. Wählen Sie anschließend den Aufgabentyp „Generierung“ aus.

    Weitere Informationen zum Formatieren von Eingabeaufforderungen finden Sie unter „Verbalizer-Einstellungen “.

  3. Fügen Sie die Trainingsdaten hinzu, die zur Feinabstimmung des Modells verwendet werden sollen. Sie können eine Datei hochladen oder ein Asset aus Ihrem Projekt verwenden.

    Um Beispiele dafür zu sehen, wie Sie Ihre Datei formatieren können, oder um die Token-Größe der Beispiele zu ändern, die während des Trainings verwendet werden, klicken Sie auf „Wie sollten Ihre Daten aussehen? “. Klicken Sie auf „Vorschau der Vorlage“ oder passen Sie die Einstellungen nach Bedarf an.

    Optional : Klicken Sie auf „Parameter konfigurieren“, um die Parameter zu bearbeiten, die für das Tuning-Experiment verwendet werden. Nachdem Sie die Parameterwerte geändert haben, klicken Sie auf „Speichern “.

    Das Optimierungsexperiment verwendet Standardparameterwerte, die Sie nach Bedarf anpassen können. Weitere Informationen finden Sie unter „Parameter des Tuning-Experiments “.

  4. Geben Sie einen Speicherort für das optimierte Modell an, das nach Abschluss des Experiments erstellt wird.

  5. Klicken Sie auf „Tuning starten “.

    Das Abstimmungsexperiment beginnt. Je nach Größe Ihrer Trainingsdaten und der Verfügbarkeit von Rechenressourcen kann dies zwischen einer und mehreren Stunden dauern. Wenn das Experiment beendet ist, wird der Status als „abgeschlossen“ angezeigt.

  6. Bewerten Sie die Ergebnisse Ihres Tuning-Experiments nach Abschluss des Experiments. Ändern Sie gegebenenfalls die Trainingsdaten oder die Versuchsparameter und führen Sie weitere Versuche durch, bis Sie mit den Ergebnissen zufrieden sind. Siehe Auswertung des Tuning-Experiments.

Achtung: Jeder Feinabstimmungsvorgang verbraucht 300 Gi, auch wenn das resultierende Modell nicht bereitgestellt wird, da die Modellartefakte sehr groß sind. Um Ressourcen zu schonen, löschen Sie alle Feinabstimmungsaufträge, die von einem bereitgestellten Modell nicht verwendet werden.

Fehlerbehebung bei einem Feinabstimmungsexperiment

Wenn Ihr Feinabstimmungsexperiment nicht erfolgreich abgeschlossen werden kann und eine der folgenden Meldungen angezeigt wird, versuchen Sie diese Lösungen.

Speicher voll

Eine Meldung über einen Speicherengpass bedeutet, dass nicht genügend Ressourcen verfügbar sind, um das Tuning-Experiment abzuschließen. Um die in der folgenden Liste aufgeführten Konfigurationsparameter zu ändern, erstellen Sie ein neues Tuning-Experiment. Nachdem Sie den Aufgabentyp ausgewählt haben, klicken Sie auf „Parameter konfigurieren“, um Änderungen vorzunehmen. Speichern Sie anschließend Ihre Änderungen und beginnen Sie mit der Optimierung.

  • Reduzieren Sie die Chargengröße.

    Große Stapelgrößen können den Speicherbedarf erhöhen und zu schnelleren Trainingszeiten führen. Wenn jedoch wiederholt Speicherfehler auftreten, reduzieren Sie den Wert, indem Sie den Schieberegler „Batchgröße“ anpassen.

  • Reduzieren Sie die Anzahl der Gradientenakkumulationsschritte.

    Gradientenakkumulationsschritte können zur Gesamtbatchgröße beitragen. Versuchen Sie es mit einem niedrigeren Wert. Stellen Sie den Schieberegler „Schritte akkumulieren“ auf den gewünschten Wert ein.

  • Erhöhen Sie die Anzahl der GPUs.

    Die Feinabstimmung eines großen Modells verbraucht mehr Speicher und erfordert mehr GPUs. Um mehr GPUs für das Experiment zu verwenden, stellen Sie den Schieberegler „Anzahl der GPUs“ auf einen höheren Wert ein.

  • Reduzieren Sie die Sequenzlänge des Datensatzes auf den niedrigsten praktikablen Wert.

    Größere Sequenzlängen benötigen mehr Speicherplatz. Reduzieren Sie die Sequenzlänge nach Möglichkeit, insbesondere wenn sie 4.000 Token überschreitet. Beachten Sie, dass bei einer zu geringen Sequenzlänge die Ausgabebeispiele in den Trainingsdaten gekürzt und bei der Auswertung unvollständig verwendet werden. Um die Sequenzlänge zu ändern, verlassen Sie die Seite „Parameter konfigurieren “. Erweitern Sie im Bereich „Trainingsdaten hinzufügen “ den Abschnitt „Wie sollten Ihre Daten aussehen? “. Stellen Sie den Schieberegler „Maximale Sequenzlänge“ auf den gewünschten Wert ein.

RuntimeError: Die Größe des Tensors a muss mit der Größe des Tensors b übereinstimmen.

Diese Meldung wird gelegentlich angezeigt, wenn der Datensatz klein ist. Stellen Sie auf der Seite „Parameter konfigurieren“ des Tuning-Experiments den Schieberegler „Schritte akkumulieren“ auf 1 ein.

Der Antwortschlüssel konnte in der folgenden Instanz nicht gefunden werden.

Der Text, der im Antwort vorlagensegment des Verbalizers angegeben ist, kann in den Trainingsdatenbeispielen nicht gefunden werden. Einige Tokenizer tokenisieren Wörter am Anfang einer Sequenz anders als andere Teile einer Sequenz. Um diese Inkonsistenz zu vermeiden, fügen Sie am Anfang der Antwortvorlage im Verbalizer ein Zeilenumbruch-Trennzeichen ein.

Zum Beispiel:

verbalizer: "### Input: {{input}} \n\n### Response: {{output}}"
response_template: “\n### Response:”

Weitere Schritte

Ein abgestimmtes Modell-Asset wird erst erstellt, nachdem Sie eine Bereitstellung aus einem abgeschlossenen Abstimmungsversuch erstellt haben. Weitere Informationen finden Sie unter Bereitstellen optimierter Modelle.