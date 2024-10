Lineare Regression und logistische Regression sind beides Vorhersagemodelle, die dem maschinellen Lernen zugrundeliegen. Die lineare Regression (oder gewöhnliche kleinste Quadrate) zielt darauf ab, die Auswirkungen eines oder mehrerer Prädiktoren auf eine bestimmte Ausgabe zu messen und vorherzusagen, indem die am besten passende Gerade durch die bereitgestellten Datenpunkte (d. h. Trainingsdaten) ermittelt wird. Die logistische Regression zielt darauf ab, die Klassenwahrscheinlichkeiten anhand einer binären Ausgabe bei einer Reihe von Prädiktoren zu bestimmen. Mit anderen Worten: Die lineare Regression ermöglicht kontinuierliche quantitative Vorhersagen, während die logistische Regression diskrete kategorische Vorhersagen ermöglicht.5

Natürlich ist die Eingabe-Ausgabe-Beziehung nicht immer eindeutig, wenn die Anzahl der Prädiktoren in einem der Regressionsmodelle zunimmt, und erfordert eine Anpassung der Regressionsformel. Geben Sie die Regularisierung ein. Es gibt drei Hauptformen der Regularisierung für regression Modelle. Beachten Sie, dass es sich bei dieser Liste nur um eine kurze Übersicht handelt. Die Anwendung dieser Regularisierungstechniken bei der linearen oder der logistischen Regression variiert geringfügig.

- Die Lasso-Regression (oder L1-Regularisierung) ist eine Regularisierungstechnik, die hochwertige, korrelierte Koeffizienten bestraft. Es führt einen Regularisierungsterm (auch Strafterm genannt) in die Verlustfunktion der Summe der quadratischen Fehler (SSE) des Modells ein. Dieser Strafterm ist der absolute Wert der Summe der Koeffizienten. Durch den Hyperparameter Lambda (λ) gesteuert, werden die Gewichtungen ausgewählter Merkmale auf Null reduziert. Die Lasso-Regression entfernt dabei multikollineare Merkmale vollständig aus dem Modell.

- Die Ridge-Regression (oder L2-Regularisierung) ist eine Regularisierungstechnik, die hochwertige Koeffizienten ähnlich bestraft, indem ein Strafterm in die SSE-Verlustfunktion eingeführt wird. Sie unterscheidet sich jedoch von der Lasso-Regression. Erstens ist der Strafterm in der Ridge-Regression die quadrierte Summe der Koeffizienten und nicht der absolute Wert der Koeffizienten. Zweitens ermöglicht die Ridge-Regression keine Merkmalsauswahl. Während der Strafterm der Lasso-Regression Merkmale aus dem Modell entfernen kann, indem er Koeffizientenwerte auf Null schrumpfen lässt, schrumpft die Ridge-Regression die Merkmalsgewichte nur in Richtung Null, aber nie auf Null.

– Die elastische Netzregulierung kombiniert im Wesentlichen sowohl die Ridge- als auch die Lasso-Regression, fügt aber sowohl die L1- als auch die L2-Strafbegriffe in die SSE-Verlustfunktion ein. L2 und L1 leiten ihren Straftermwert ab, indem sie den absoluten Wert der Summe der Merkmalsgewichtungen quadrieren oder verwenden. Elastic Net fügt diese beiden Strafwerte in die Gleichung der Kostenfunktion (SSE) ein. Auf diese Weise adressiert Elastic Net die Multikollinearität und ermöglicht gleichzeitig die Auswahl von Funktionen.6

In der Statistik werden diese Methoden auch als „Koeffizientenschrumpfung“ bezeichnet, da sie die Koeffizientenwerte der Prädiktoren im Vorhersagemodell schrumpfen lassen. Bei allen drei Techniken wird die Stärke der Strafmaßnahme durch Lambda gesteuert, das mithilfe verschiedener Kreuzvalidierungsverfahren berechnet werden kann.