Un approccio per stimare le emissioni Scope 3 consiste nell'utilizzare i dati sulle transazioni finanziarie (ad esempio, la spesa) quale proxy per le emissioni associate ai beni e/o servizi acquistati. La conversione di questi dati finanziari in un inventario delle emissioni di gas serra richiede informazioni sull'impatto delle emissioni di gas serra del prodotto o servizio acquistato.

Il modello US Environmentally-Extended Input-Output (USEEIO) è un framework di valutazione del ciclo di vita (LCA) che traccia i flussi economici e ambientali di beni e servizi all'interno degli Stati Uniti. L'USEEIO offre un set di dati e una metodologia completi che uniscono l'analisi economica di IO con i dati ambientali per stimare le conseguenze associate alle attività economiche. All'interno dell'USEEIO, beni e servizi sono classificati in 66 categorie, denominate classi di merci, in base alle caratteristiche ambientali comuni. Queste classi di materie prime sono associate a fattori di emissione utilizzati per stimare gli impatti ambientali con i dati di spesa.

Il set di dati Eora MRIO (Multi-region input-output) è un insieme di fattori di emissione basati sulla spesa riconosciuto a livello globale che documenta i trasferimenti intersettoriali tra 15.909 settori in 190 paesi. Il set di fattori Eora è stato modificato per allinearsi alla categorizzazione USEEIO di 66 classificazioni riassuntive per paese. Ciò comporta la mappatura dei 15.909 settori presenti nelle categorie Eora26 e nelle classificazioni settoriali nazionali più dettagliate alle 66 categorie di spesa USEEIO.

Ed è qui che entrano in gioco gli LLM. Negli ultimi anni sono stati compiuti notevoli progressi nella creazione di estesi modelli di linguaggio di base per l'elaborazione del linguaggio naturale (NLP). Queste innovazioni hanno mostrato prestazioni forti rispetto ai modelli convenzionali di machine learning (ML), in particolare in situazioni in cui i dati etichettati scarseggiano. Utilizzare le funzionalità di questi grandi modelli NLP pre-addestrati, combinate con tecniche di adattamento del dominio che utilizzano in modo efficiente dati limitati, presenta un potenziale significativo per affrontare la sfida associata alla spiegazione dell'impatto ambientale di Scope 3.

Il nostro approccio prevede la messa a punto dei foundation model per riconoscere classi di commodity Environmentally-Extended Input-Output (EEIO) per ordini di acquisto o voci del libro mastro scritte in linguaggio naturale. Successivamente, calcoliamo le emissioni associate alla spesa utilizzando i fattori di emissione EEIO (emissioni per dollaro speso) ricavati dalla Supply Chain GHG Emission Factors for US Commodities and Industries per i set di dati riguardanti gli Stati Uniti e dall'Eora MRIO (Multi-region input-output) per i set di dati globali. Questo framework aiuta a snellire e semplificare il processo di calcolo delle emissioni Scope 3 per le aziende.

La Figura 1 illustra il framework per la stima delle emissioni Scope 3 utilizzando un modello linguistico di grandi dimensioni. Questo framework comprende quattro moduli distinti: preparazione dei dati, adattamento del dominio, classificazione e calcolo delle emissioni.