Konfigurieren von Qualitätsbewertungen
Sie können Qualitätsbewertungen konfigurieren, um die Fähigkeit Ihres Modells zu messen, korrekte Ergebnisse zu liefern, basierend auf der Leistungsfähigkeit des Modells.
Qualitätsbewertungen messen, wie gut Ihr Modell genaue Ergebnisse vorhersagt, indem sie erkennen, wann die Modellqualität nachlässt, sodass Sie Ihr Modell entsprechend neu trainieren können. Um das Modell zu bewerten, stellen Sie Feedback-Daten bereit, bei denen es sich um gekennzeichnete Daten handelt, deren Ergebnis bekannt ist. Qualitätsbewertungen verwenden Metriken, um zu bewerten, wie gut das Modell Ergebnisse vorhersagt, die mit den tatsächlichen Ergebnissen im gekennzeichneten Datensatz übereinstimmen.
In den folgenden Abschnitten wird beschrieben, wie Sie Qualitätsbewertungen konfigurieren:
Konfigurieren von Qualitätsbewertungen für Modelle des maschinellen Lernens
Bevor Sie beginnen: Bereitstellung der Feedback-Daten
Die Feedback-Daten sind wie ein Antwortbogen mit tatsächlich beobachteten Ergebnissen. Der Monitor kann das Modell so ausführen, als ob die Antworten nicht bekannt wären, dann die vorhergesagten Ergebnisse mit den tatsächlichen Ergebnissen vergleichen und auf der Grundlage von Qualitätsmetriken Genauigkeitswerte bereitstellen.
Um die Feedback-Daten bereitzustellen, die Sie zur Bewertung des Modells verwenden möchten, klicken Sie auf die Seite „Endpunkte“ und führen Sie einen der folgenden Schritte aus:
- Klicken Sie auf „Feedbackdaten hochladen“ und laden Sie eine Datei mit gekennzeichneten Daten hoch.
- Klicken Sie auf die Registerkarte „Endpunkte“ und geben Sie einen Endpunkt an, der mit der Feedback-Datenquelle verbunden ist.
Weitere Informationen finden Sie unter Verwalten von Feedback-Daten.
Festlegen von Qualitätsschwellenwerten
Nachdem Ihre Feedback-Daten für die Auswertung verfügbar sind, konfigurieren Sie die Monitoreinstellungen. Sie legen Schwellenwerte für die akzeptable Leistung des Modells im Vergleich zu den bekannten Ergebnissen fest.
Um die Schwellenwerte festzulegen, klicken Sie auf der Registerkarte „Qualität“ auf das Symbol
„Bearbeiten“, um Werte für das Feld „Qualitätsschwelle“ einzugeben, und bearbeiten Sie dann die Werte für die Stichprobengröße.
Alertschwellenwert für Qualität
Wählen Sie einen Wert aus, der eine akzeptable Genauigkeitsstufe liefert. Beispielsweise ist im mit der automatischen Einrichtung bereitgestellten deutschen Kreditrisikomodell die Warnmeldung für die Kennzahl „Fläche unter ROC“ auf 95 % festgelegt. Wenn die gemessene Qualität für das Modell unter diesen Wert fällt, wird eine Warnmeldung ausgelöst. Ein typischer Wert für die Fläche unter der ROC-Kurve beträgt 80 %.
Mindest- und maximale Stichprobengröße
Durch das Festlegen einer Mindeststichprobengröße wird die Qualitätsmessung verhindert, bis eine Mindestanzahl Datensätze im Bewertungsdatenbestand verfügbar ist. Dadurch wird sichergestellt, dass die Ergebnisse nicht etwa durch einen zu kleinen Stichprobenumfang verfälscht werden. Bei jeder Durchführung der Qualitätsprüfung wird jeweils die Mindeststichprobengröße verwendet, um die Anzahl der Datensätze zu bestimmen, für die die Berechnung der Qualitätsmetriken ausgeführt wird.
Die maximale Stichprobengröße hilft dabei, den Zeit- und Ressourcenaufwand für die Auswertung des Datensatzes besser zu verwalten. Bei Überschreitung dieser Größe werden nur die neuesten Datensätze ausgewertet. Beispielsweise ist im deutschen Kreditrisikomodell die Mindeststichprobengröße auf 50 festgelegt, während keine Höchstgröße angegeben ist, da es sich um eine kleine Stichprobe handelt.
Konfigurieren von Qualitätsbewertungen für generative KI-Modelle
Wenn Sie Prompt-Vorlagen bewerten, können Sie eine Zusammenfassung der Qualitätsbewertungsergebnisse für den Aufgabentyp „Textklassifizierung“ einsehen.
Die Zusammenfassung zeigt die Punktzahlen und Verstöße für Metriken an, die mit den Standardeinstellungen berechnet werden.
Um Qualitätsbewertungen mit Ihren eigenen Einstellungen zu konfigurieren, können Sie eine Mindeststichprobengröße festlegen und Schwellenwerte für jede Metrik festlegen. Die Mindeststichprobengröße gibt die Mindestanzahl der Modelltransaktionsdatensätze an, die Sie auswerten möchten, und die Schwellenwerte lösen Warnmeldungen aus, wenn Ihre Metrikwerte Ihre Schwellenwerte überschreiten. Die Metrikwerte müssen über den Schwellenwerten liegen, um Verstöße zu vermeiden. Höhere Metrikwerte bedeuten bessere Ergebnisse.
Unterstützte Qualitätsmetriken
Wenn Sie Qualitätsbewertungen aktivieren, können Sie Metriken generieren, mit denen Sie feststellen können, wie gut Ihr Modell Ergebnisse vorhersagt. Die Werte, die als Schwellenwerte für Ihre Metriken festgelegt sind, bestimmen, wie Sie Ihre Metrik-Ergebnisse interpretieren können. Bei Metriken, die mit niedrigeren Schwellenwerten konfiguriert sind, bedeuten höhere Werte bessere Ergebnisse. Bei Metriken, für die obere Schwellenwerte konfiguriert sind, bedeuten niedrigere Werte bessere Ergebnisse.
Qualitätsbewertungen generieren die folgenden Kennzahlen:
Fläche unterhalb der ROC-Kurve
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung : Fläche unter der Recall- und Falsch-Positiv-Rate-Kurve zur Berechnung der Sensitivität gegenüber der Ausfallrate
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
Fläche unterhalb der PR-Kurve
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Die Fläche, die sich unterhalb der PR-Kurve (PR = Precision Recall) befindet.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Der Bereich unter „Präzision-Rückruf“ gibt die Summe für beide an Precision + Recall.
n
AveP = ∑ P(k)∆r(k)
k=1
Die Genauigkeit (P) ist definiert als die Anzahl der wahr-positiven Ergebnisse (Tp) im Verhältnis zur Anzahl der wahr-positiven Ergebnisse zuzüglich der Anzahl der falsch-positiven Ergebnisse (Fp).
number of true positives
Precision = ______________________________________________________
(number of true positives + number of false positives)
Die Trefferquote (R) ist definiert als die Anzahl der wahr-positiven Ergebnisse (Tp) im Verhältnis zur Anzahl der wahr-positiven Ergebnisse zuzüglich der Anzahl der falsch-negativen Ergebnisse (Fn).
number of true positives
Recall = ______________________________________________________
(number of true positives + number of false negatives)
Genauigkeit
- Unterstützte Modelle : Maschinelles Lernen und generative KI
- Beschreibung: Die Proportion der richtigen Vorhersagen.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtypen: Binäre Klassifizierung und Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Genauigkeit verstehen :
Genauigkeit kann je nach Art des Algorithmus unterschiedliche Bedeutungen habenMehrklassige Klassifizierung: Die Genauigkeit misst die Zahl der korrekten Vorhersagen einer beliebigen Klasse bei Normalisierung der Anzahl der Datenpunkte. Weitere Informationen finden Sie unter „Multiclass-Klassifizierung“ in der Dokumentation zu „ Apache Spark “.
Binäre Klassifizierung: Bei einem Algorithmus für die binäre Klassifizierung wird die Genauigkeit als die Fläche unter einer ROC-Kurve gemessen. Weitere Informationen finden Sie unter „Binäre Klassifizierung“ in der Dokumentation zu „ Apache Spark “.
Regression : Regressionsalgorithmen werden anhand des Bestimmtheitsmaßes ( R2 ) gemessen. Weitere Informationen finden Sie unter „Bewertung von Regressionsmodellen “ in der Dokumentation zu „ Apache Spark “.
Rate der echten Positivergebnisse
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Anteil der richtigen Vorhersagen innerhalb der Vorhersagen in der positiven Klasse.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die Wahr-positiv-Rate wird anhand der folgenden Formel berechnet:
number of true positives
TPR = _________________________________________________________
(number of true positives + number of false negatives)
Falsch-positiv-Rate
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Anteil der falschen Vorhersagen innerhalb der positiven Klasse.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die Falsch-Positiv-Rate ist der Quotient aus der Gesamtzahl der Falsch-Positiven, geteilt durch die Summe der Falsch-Positiven und der Echt-Negativen.
number of false positives
False positive rate = ______________________________________________________
(number of false positives + number of true negatives)
Brier-Score
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung : Misst die mittlere quadratische Abweichung zwischen der vorhergesagten Wahrscheinlichkeit und dem Zielwert. Höhere Werte deuten darauf hin, dass die vom Modell vorhergesagten Wahrscheinlichkeiten nicht mit dem Zielwert übereinstimmen.
- Standardschwellenwerte :
- Obergrenze = 80 %
- Problemtyp: Binäre Klassifizierung
- Rechnen Sie selbst:
Die Brier-Score-Metrik wird anhand der folgenden Formel berechnet:
BrierScore = 1/N * sum( (p - y)^2 )
Where y = actual outcome, and p = predicted probability
Gini-Koeffizient
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung : Der Gini-Koeffizient misst, wie gut Modelle zwischen zwei Klassen unterscheiden können. Sie wird berechnet als das Doppelte der Fläche zwischen der ROC-Kurve und der diagonalen Linie des Diagramms. Wenn der Gini-Koeffizient 0 beträgt, weist das Modell keine Unterscheidungsfähigkeit auf, während ein Wert von 1 eine perfekte Unterscheidungsfähigkeit anzeigt.
- Standardschwellenwerte :
- Untergrenze = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Der Gini-Koeffizient wird anhand der folgenden Formel berechnet:
Gini = 2 * Area under ROC - 1
Beschriftungsabweichung
- Unterstützte Modelle : Generative KI und maschinelles Lernen
- Beschreibung : Misst die Asymmetrie von Label-Verteilungen. Bei einer Schiefe von 0 ist der Datensatz perfekt ausbalanciert; ist sie kleiner als -1 oder größer als 1, ist die Verteilung stark schief; alle Werte dazwischen sind mäßig schief.
- Standardschwellenwerte :
- Untergrenze = -0.5
- Obergrenze = 0.5
- Problemtypen: Binäre Klassifizierung und Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
Matthews-Korrelationskoeffizient
- Unterstützte Modelle : Generative KI und maschinelles Lernen
- Beschreibung : Misst die Qualität von binären und mehrklassigen Klassifizierungen unter Berücksichtigung von echten und falschen Positiven und Negativen. Ausgewogene Maßnahme, die auch bei unterschiedlicher Klassengröße angewendet werden kann. Ein Korrelationskoeffizient zwischen - -1 und +1. Ein Koeffizient von +1 steht für eine perfekte Vorhersage, 0 für eine durchschnittliche zufällige Vorhersage und - -1 e und inverse Vorhersage.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtypen: Binäre Klassifizierung und Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare metrische Details : Verwechslungsmatrix
Mittlerer absoluter prozentualer Fehler
- Unterstützte Modelle : maschinelles Lernen
- Standardschwellenwerte : Obergrenze = 0.2
- Problemtyp: Regression
- Beschreibung : Misst die mittlere prozentuale Fehlerdifferenz zwischen den vorhergesagten und den tatsächlichen Werten
- Rechnen Sie selbst:
Der mittlere absolute prozentuale Fehler wird mit der folgenden Formel berechnet:
A ist der tatsächliche Wert und P ist der vorhergesagte Wert.
Symmetrischer mittlerer absoluter prozentualer Fehler
- Unterstützte Modelle : Maschinelles Lernen
- Standardschwellenwerte : Obergrenze = 0.2
- Problemtyp: Regression
- Beschreibung : Misst den symmetrischen Mittelwert des prozentualen Fehlers der Differenz zwischen den vorhergesagten und den tatsächlichen Werten
- Rechnen Sie selbst:
Der symmetrische mittlere absolute prozentuale Fehler wird mit der folgenden Formel berechnet:
A ist der tatsächliche Wert und P ist der vorhergesagte Wert.
Pearson-Korrelationskoeffizient
- Unterstützte Modelle : Maschinelles Lernen
- Standardschwelle : Untergrenze = 80 %
- Problemtyp: Regression
- Beschreibung : Der Pearson-Korrelationskoeffizient (Pearson) misst die lineare Beziehung zwischen Modellvorhersage und Zielwerten. Die Pearson-Metrik berechnet einen Korrelationskoeffizienten zwischen - -1 und +1. Ein Korrelationswert von -1 oder +1 zeigt an, dass eine exakte lineare Beziehung besteht, und ein Wert von 0 zeigt an, dass keine Korrelation besteht. Positive Korrelationen zeigen, dass Variablen gleichzeitig zunehmen, und negative Korrelationen zeigen, dass eine Variable zunimmt, während eine andere abnimmt. Hohe positive Werte zeigen an, dass das Modell Werte vorhersagt, die den Zielwerten ähnlich sind.
Spearman-Korrelationskoeffizient
- Unterstützte Modelle : Maschinelles Lernen
- Standardschwelle : Untergrenze = 80 %
- Problemtyp: Regression
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Beschreibung : Der Spearman-Rangkorrelationskoeffizient (Spearman) misst die Monotonie der Beziehung zwischen Modellvorhersagen und Zielwerten. Die Spearman-Metrik berechnet einen Korrelationskoeffizienten zwischen - -1 und +1. Ein Korrelationswert von -1 oder +1 zeigt an, dass eine exakte monotone Beziehung besteht, und ein Wert von 0 zeigt an, dass keine Korrelation besteht. Positive Korrelationen zeigen, dass Variablen gleichzeitig zunehmen, und negative Korrelationen zeigen, dass eine Variable zunimmt, während eine andere abnimmt.
Trefferquote
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Anteil der richtigen Vorhersagen innerhalb der positiven Klasse.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die Trefferquote (R) ist definiert als die Anzahl der wahr-positiven Ergebnisse (Tp) im Verhältnis zur Anzahl der wahr-positiven Ergebnisse zuzüglich der Anzahl der falsch-negativen Ergebnisse (Fn).
number of true positives
Recall = ______________________________________________________
(number of true positives + number of false negatives)
Genauigkeit
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Anteil der richtigen Vorhersagen innerhalb der Vorhersagen in der positiven Klasse.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die Genauigkeit (P) ist definiert als die Anzahl der wahr-positiven Ergebnisse (Tp) im Verhältnis zur Anzahl der wahr-positiven Ergebnisse zuzüglich der Anzahl der falsch-positiven Ergebnisse (Fp).
number of true positives
Precision = __________________________________________________________
(number of true positives + the number of false positives)
F1-Measure
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Harmonisches Mittel zwischen Genauigkeit und Trefferquote.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Binäre Klassifizierung
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Der „ F1-measure ” ist der gewichtete harmonische Mittelwert oder Durchschnitt aus Präzision und Recall.
(precision * recall)
F1 = 2 * ____________________
(precision + recall)
Logarithmischer Verlust
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Mittelwert der Zielklassenwahrscheinlichkeit (Konfidenz) der Logarithmen. Wird auch als erwartete Log-Likelihood bezeichnet.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtypen: Binäre Klassifizierung und Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Keine
- Rechnen Sie selbst:
Bei einem binären Modell wird der logarithmische Verlust anhand der folgenden Formel berechnet:
-(y log(p) + (1-y)log(1-p))
Dabei ist p die wahre Kennzeichnung und y die vorhergesagte Wahrscheinlichkeit.
Bei einem Modell mit mehreren Klassen wird der logarithmische Verlust anhand der folgenden Formel berechnet:
M
-SUM Yo,c log(Po,c)
c=1
Dabei ist M > 2, p die wahre Kennzeichnung und y die vorhergesagte Wahrscheinlichkeit.
Proportion der erklärten Varianz
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Die Proportion der erklärten Varianz stellt das Verhältnis der erklärten Varianz zur Zielvarianz dar. Die erklärte Varianz gibt die Differenz zwischen der Zielvarianz und der Varianz eines Vorhersagefehlers an.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Regression
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Keine
- Rechnen Sie selbst:
Die proportionale erklärte Varianz wird berechnet, indem man den Durchschnitt der Zahlen bildet, dann für jede Zahl den Mittelwert subtrahiert und die Ergebnisse quadriert. Dann berechnen Sie die Quadrate.
sum of squares between groups
Proportion explained variance = ________________________________
sum of squares total
Mittlerer absoluter Fehler
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Der Mittelwert der absoluten Differenz zwischen der Modellvorhersage und dem Zielwert.
- Standardschwellenwerte: Oberer Grenzwert = 80 %
- Problemtyp: Regression
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Keine
- Rechnen Sie selbst:
Der mittlere absolute Fehler wird berechnet, indem alle absoluten Fehler addiert und durch die Anzahl der Fehler dividiert werden.
SUM | Yi - Xi |
Mean absolute errors = ____________________
number of errors
Mittlerer quadratischer Fehler
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Der Mittelwert der quadrierten Differenz zwischen der Modellvorhersage und dem Zielwert.
- Standardschwellenwerte: Oberer Grenzwert = 80 %
- Problemtyp: Regression
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Keine
- Rechnen Sie selbst:
Der mittlere quadratische Fehler in seiner einfachsten Form wird durch die folgende Formel dargestellt.
SUM (Yi - ^Yi) * (Yi - ^Yi)
Mean squared errors = ____________________________
number of errors
R-Quadrat
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Das Verhältnis der Differenz zwischen der Zielvarianz und der Varianz für einen Vorhersagefehler in Bezug zur Zielvarianz.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Regression
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Keine
- Rechnen Sie selbst:
Die R-Quadrat-Metrik wird in der folgenden Formel definiert.
explained variation
R-squared = _____________________
total variation
Wurzel für mittleren quadratischen Fehler
- Unterstützte Modelle : Maschinelles Lernen
- Beschreibung: Quadratwurzel des Mittelwerts der quadrierten Differenz zwischen der Modellvorhersage und dem Zielwert.
- Standardschwellenwerte: Oberer Grenzwert = 80 %
- Problemtyp: Regression
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Keine
- Rechnen Sie selbst:
Die Wurzel des mittleren quadratischen Fehlers entspricht der Quadratwurzel des Mittelwerts von (Prognosen minus beobachtete Werte) zum Quadrat.
___________________________________________________________
RMSE = √(forecasts - observed values)*(forecasts - observed values)
Gewichtete Wahr-positiv-Rate
- Unterstützte Modelle : Maschinelles Lernen und generative KI
- Beschreibung: Gewichteter Mittelwert der Klasse TPR mit Gewichtungen, die gleich der Klassenwahrscheinlichkeit sind.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die Wahr-positiv-Rate wird anhand der folgenden Formel berechnet:
number of true positives
TPR = _________________________________________________________
number of true positives + number of false negatives
Gewichtete Falsch-positiv-Rate
- Unterstützte Modelle : Maschinelles Lernen und generative KI
- Beschreibung: Anteil der falschen Vorhersagen innerhalb der positiven Klasse.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die gewichtete Falsch-positiv-Rate ist die Anwendung der Falsch-positiv-Rate mit gewichteten Daten.
number of false positives
FPR = ______________________________________________________
(number of false positives + number of true negatives)
Gewichtete Trefferquote
- Unterstützte Modelle : Maschinelles Lernen und generative KI
- Beschreibung: Gewichteter Mittelwert der Trefferquote mit Gewichtungen, die gleich der Klassenwahrscheinlichkeit sind.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die gewichtete Trefferquote (wR) ist definiert als die Anzahl der wahr-positiven Ergebnisse (Tp) im Verhältnis zur Anzahl der wahr-positiven Ergebnisse zuzüglich der Anzahl der falsch-negativen Ergebnisse (Fn) mit gewichteten Daten.
number of true positives
Recall = ______________________________________________________
number of true positives + number of false negatives
Gewichtete Genauigkeit
- Unterstützte Modelle : Maschinelles Lernen und generative KI
- Beschreibung: Gewichteter Mittelwert der Genauigkeit mit Gewichtungen, die gleich der Klassenwahrscheinlichkeit sind.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Die Genauigkeit (P) ist definiert als die Anzahl der wahr-positiven Ergebnisse (Tp) im Verhältnis zur Anzahl der wahr-positiven Ergebnisse zuzüglich der Anzahl der falsch-positiven Ergebnisse (Fp).
number of true positives
Precision = ________________________________________________________
number of true positives + the number of false positives
Gewichtetes F1-Maß
- Unterstützte Modelle : Maschinelles Lernen und generative KI
- Beschreibung: Gewichteter Mittelwert des F1-Maßes mit Gewichtungen, die gleich der Klassenwahrscheinlichkeit sind.
- Standardschwellenwerte: Unterer Grenzwert = 80 %
- Problemtyp: Klassifizierung mit mehreren Klassen
- Diagrammwerte : Letzter Wert im Zeitrahmen
- Verfügbare Metrikdetails: Wahrheitsmatrix
- Rechnen Sie selbst:
Das gewichtete F1-Maß ist das Ergebnis der Verwendung gewichteter Daten.
precision * recall
F1 = 2 * ____________________
precision + recall
Konfigurieren von Qualitätsbewertungen mit historischen Daten
Sie können auch Qualitätsbewertungen konfigurieren, um Metriken mit historischen Bewertungsdaten aus früheren Zeitfenstern zu generieren. Mit dem SDK „ Python “ können Sie Parameter festlegen, um eine der folgenden Optionen zur Konfiguration von Qualitätsbewertungen mit historischen Bewertungsdaten zu verwenden:
- Berechnen Sie die Metriken in einem einzigen Zeitfenster mit Start- und Enddatum.
parameters = {
"start_date": "2024-08-05T11:00:18.0000Z",
"end_date": "2024-08-05T14:00:18.0000Z"
}
run_details = wos_client.monitor_instances.run(monitor_instance_id=quality_monitor_instance_id, parameters = run_parameters, background_mode=False).result
- Teilen Sie das angegebene Zeitfenster durch die Anzahl der im Parameter
compute_windowsangegebenen Auswertungen und berechnen Sie die Metriken für jedes Zeitfenster.
parameters = {
"start_date": "2024-08-05T11:00:18.0000Z",
"end_date": "2024-08-05T14:00:18.0000Z",
"compute_windows":3
}
run_details = wos_client.monitor_instances.run(monitor_instance_id=quality_monitor_instance_id, parameters = run_parameters, background_mode=False).result
- Teilen Sie das angegebene Zeitfenster basierend auf der im Abonnement konfigurierten Zeitplanfrequenz auf und berechnen Sie die Metriken für jedes Zeitfenster.
parameters = {
"start_date": "2024-08-05T11:00:18.0000Z",
"end_date": "2024-08-05T14:00:18.0000Z",
"evalute_using_schedule":True
}
run_details = wos_client.monitor_instances.run(monitor_instance_id=quality_monitor_instance_id, parameters = run_parameters, background_mode=False).result
Weitere Informationen
Überprüfung der Qualitätsergebnisse für Modelle des maschinellen Lernens