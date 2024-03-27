Ein Ansatz zur Schätzung von Scope-3-Emissionen besteht darin, Finanztransaktionsdaten (zum Beispiel Ausgaben) als Indikator für Emissionen im Zusammenhang mit gekauften Gütern und/oder Dienstleistungen zu nutzen. Die Umwandlung dieser Finanzdaten in einen Bestand an THG-Emissionsdaten erfordert Informationen über die Auswirkungen der THG-Emissionen des erworbenen Produkts oder der Dienstleistung.

Das US Environmentally-Extended Input-Output (USEEIO) ist ein Framework zur Lebenszyklusbewertung (LCA), das die ökonomischen und ökologischen Ströme von Gütern und Dienstleistungen innerhalb der Vereinigten Staaten nachzeichnet. USEEIO bietet einen umfassenden Datensatz und eine Methodik, die ökonomische Input-Output-Analysen mit Umweltdaten verknüpft, um die mit wirtschaftlichen Aktivitäten verbundenen Umweltfolgen abzuschätzen. Innerhalb von USEEIO werden Waren und Dienstleistungen anhand ihrer gemeinsamen Umweltmerkmale in 66 categories, sogenannte Warenklassen, eingeteilt. Diese Rohstoffklassen sind mit Emissionsfaktoren verknüpft, die zur Schätzung der Umweltauswirkungen anhand von Ausgabendaten verwendet werden.

Der Eora MRIO (Multi-region input-output) Datensatz ist ein weltweit anerkannter ausgabenbasierter Emissionsfaktorensatz, der die intersektoralen Transfers zwischen 15.909 Sektoren in 190 Ländern dokumentiert. Der Eora-Faktorensatz wurde modifiziert, um ihn an die USEEIO-Kategorisierung von 66 zusammenfassenden Klassifizierungen pro Land anzupassen. Dies beinhaltet die Zuordnung der 15.909 Sektoren, die in den Eora26 categories und detaillierteren nationalen Sektorklassifizierungen enthalten sind, zu den USEEIO 66 spend categories.

Hier kommen LLMs ins Spiel. In den letzten Jahren wurden bemerkenswerte Fortschritte bei der Entwicklung umfangreicher Grundlagen-Sprachmodelle für natürliche Sprachverarbeitung (NLP) erzielt. Diese Innovationen haben im Vergleich zu herkömmlichen Modellen des maschinellen Lernens (ML) eine starke Leistung gezeigt, insbesondere in Szenarien, in denen gelabelte Daten knapp sind. Die Nutzung der Funktionen dieser großen, vortrainierten NLP-Modelle in Kombination mit Techniken zur Domänenanpassung, die eine effiziente Nutzung begrenzter Daten ermöglichen, birgt ein erhebliches Potenzial für die Bewältigung der Herausforderung, die mit der Bilanzierung der Umweltauswirkungen von Scope 3 verbunden ist.

Unser Ansatz besteht darin, Foundation-Modelle so abzustimmen, dass sie Environmentally-Extended Input-Output (EEIO)-Warenklassen von Bestellungen oder Hauptbucheinträgen erkennen, die in natürlicher Sprache verfasst sind. Anschließend berechnen wir die mit den Ausgaben verbundenen Emissionen unter Verwendung von EEIO-Emissionsfaktoren (Emissionen pro ausgegebenem Dollar), die aus Supply Chain GHG Emission Factors for US Commodities and Industries für US-zentrierte Datensätze und dem Eora MRIO (Multi-region input-output) für globale Datensätze stammen. Mit diesem Framework können Unternehmen die Berechnung der Scope-3-Emissionen vereinfachen und optimieren.

Abbildung 1 veranschaulicht das Framework für die Schätzung von Scope-3-Emissionen anhand eines großen Sprachmodells. Dieses Rahmenwerk umfasst vier verschiedene Module: Datenvorbereitung, Domänenanpassung, Klassifikation und Emissionsberechnung.