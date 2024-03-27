Il crescente interesse per il calcolo e la divulgazione delle emissioni GHG Scope 3 ha acceso i riflettori sui metodi di calcolo delle emissioni. Una delle metodologie di calcolo Scope 3 più comuni utilizzate dalle organizzazioni è il metodo basato sulla spesa, la cui implementazione può richiedere molto tempo e risorse. Questo articolo esplora un modo innovativo per semplificare la stima delle emissioni GHG scope 3 utilizzando AI e modelli linguistici di grandi dimensioni (LLM) per aiutare a categorizzare i dati delle transazioni finanziarie in modo da allinearli ai fattori di emissione basati sulla spesa.
Le emissioni Scope 3, chiamate anche indirette, comprendono le emissioni di gas serra (GHG) che si verificano nella catena del valore di un'organizzazione e che in quanto tali non sono sotto il suo diretto controllo operativo o proprietà. In termini più semplici, queste emissioni provengono da fonti esterne, come quelle associate a fornitori e clienti, e vanno oltre le operazioni principali dell'azienda.
Uno studio CDP del 2022 ha rilevato che, per le aziende che riportano al CDP, le emissioni presenti nella loro supply chain rappresentano in media 11,4 volte più emissioni rispetto alle emissioni operative.
Lo stesso studio ha dimostrato che il 72% delle aziende che hanno risposto al CDP ha segnalato solo le proprie emissioni operative (Scope 1 e/o 2). Alcune aziende cercano di stimare le emissioni di Scope 3 raccogliendo dati dai fornitori e categorizzandoli manualmente, ma i progressi sono ostacolati da sfide come l'ampia base di fornitori, la profondità delle supply chain, la complessità dei processi di raccolta dati e da ingenti risorse.
Un approccio per stimare le emissioni Scope 3 consiste nell'utilizzare i dati sulle transazioni finanziarie (ad esempio, la spesa) quale proxy per le emissioni associate ai beni e/o servizi acquistati. La conversione di questi dati finanziari in un inventario delle emissioni di gas serra richiede informazioni sull'impatto delle emissioni di gas serra del prodotto o servizio acquistato.
Il modello US Environmentally-Extended Input-Output (USEEIO) è un framework di valutazione del ciclo di vita (LCA) che traccia i flussi economici e ambientali di beni e servizi all'interno degli Stati Uniti. L'USEEIO offre un set di dati e una metodologia completi che uniscono l'analisi economica di IO con i dati ambientali per stimare le conseguenze associate alle attività economiche. All'interno dell'USEEIO, beni e servizi sono classificati in 66 categorie, denominate classi di merci, in base alle caratteristiche ambientali comuni. Queste classi di materie prime sono associate a fattori di emissione utilizzati per stimare gli impatti ambientali con i dati di spesa.
Il set di dati Eora MRIO (Multi-region input-output) è un insieme di fattori di emissione basati sulla spesa riconosciuto a livello globale che documenta i trasferimenti intersettoriali tra 15.909 settori in 190 paesi. Il set di fattori Eora è stato modificato per allinearsi alla categorizzazione USEEIO di 66 classificazioni riassuntive per paese. Ciò comporta la mappatura dei 15.909 settori presenti nelle categorie Eora26 e nelle classificazioni settoriali nazionali più dettagliate alle 66 categorie di spesa USEEIO.
Ed è qui che entrano in gioco gli LLM. Negli ultimi anni sono stati compiuti notevoli progressi nella creazione di estesi modelli di linguaggio di base per l'elaborazione del linguaggio naturale (NLP). Queste innovazioni hanno mostrato prestazioni forti rispetto ai modelli convenzionali di machine learning (ML), in particolare in situazioni in cui i dati etichettati scarseggiano. Utilizzare le funzionalità di questi grandi modelli NLP pre-addestrati, combinate con tecniche di adattamento del dominio che utilizzano in modo efficiente dati limitati, presenta un potenziale significativo per affrontare la sfida associata alla spiegazione dell'impatto ambientale di Scope 3.
Il nostro approccio prevede la messa a punto dei foundation model per riconoscere classi di commodity Environmentally-Extended Input-Output (EEIO) per ordini di acquisto o voci del libro mastro scritte in linguaggio naturale. Successivamente, calcoliamo le emissioni associate alla spesa utilizzando i fattori di emissione EEIO (emissioni per dollaro speso) ricavati dalla Supply Chain GHG Emission Factors for US Commodities and Industries per i set di dati riguardanti gli Stati Uniti e dall'Eora MRIO (Multi-region input-output) per i set di dati globali. Questo framework aiuta a snellire e semplificare il processo di calcolo delle emissioni Scope 3 per le aziende.
La Figura 1 illustra il framework per la stima delle emissioni Scope 3 utilizzando un modello linguistico di grandi dimensioni. Questo framework comprende quattro moduli distinti: preparazione dei dati, adattamento del dominio, classificazione e calcolo delle emissioni.
Abbiamo condotto esperimenti approfonditi coinvolgendo diversi LLM all'avanguardia, tra cui roberta-base, bert-base-uncased e distilroberta-base-climate-f. Inoltre, abbiamo esplorato modelli classici non-foundation, basati su approcci di vettorizzazione TF-IDF e Word2Vec. Il nostro obiettivo era quello di valutare il potenziale dei foundation model (FM) nella stima delle emissioni Scope 3 utilizzando i registri delle transazioni finanziarie come proxy per beni e servizi. I risultati sperimentali indicano che gli LLM sintonizzati presentano miglioramenti significativi rispetto all'approccio di classificazione zero-shot. Inoltre, hanno superato tecniche classiche di text mining come TF-IDF e Word2Vec, offrendo prestazioni pari a quelle della classificazione di un esperto di dominio.
Utilizzare gli LLM nel processo di stima delle emissioni di Scope 3 è un approccio nuovo e promettente..
Come spiegato in precedenza, i dati sulla spesa sono più facilmente disponibili in un'organizzazione e sono un indicatore comune della quantità di beni/servizi. Tuttavia, sfide come il riconoscimento delle materie prime e la mappatura possono sembrare difficili da affrontare. Perché?
Ecco dove i foundation model basati sul deep learning per l'NLP possono essere efficienti in un'ampia gamma di compiti di classificazione NLP, quando la disponibilità di dati etichettati è insufficiente o limitata. Utilizzare grandi modelli NLP pre-addestrati con adattamento di dominio e dati limitati ha il potenziale di supportare il calcolo delle emissioni Scope 3.
In conclusione, calcolare le emissioni Scope 3 con il supporto degli LLM rappresenta un progresso significativo nella gestione dei dati per la sostenibilità. I risultati promettenti derivanti dall'utilizzo di LLM avanzati ne evidenziano il potenziale per accelerare le valutazioni dell'impronta dei gas serra. L'integrazione pratica in software come la IBM Envizi ESG Suite può semplificare il processo aumentando la velocità di insight.
