Un enfoque para estimar las emisiones de alcance 3 es aprovechar los datos de transacciones financieras (por ejemplo, el gasto) como proxy de las emisiones asociadas a bienes o servicios adquiridos. La conversión de estos datos financieros en un inventario de emisiones de GEI requiere información sobre el impacto de las emisiones de GEI del producto o servicio adquirido.

El US Environmentally-Extended Input-Output (USEEIO) es un marco de evaluación del ciclo de vida (LCA) que rastrea los flujos económicos y ambientales de bienes y servicios dentro de los Estados Unidos. El USEEIO ofrece un conjunto de datos y una metodología completos que fusionan el análisis económico de OI con datos medioambientales para estimar las consecuencias medioambientales asociadas a las actividades económicas. Dentro del USEEIO, los bienes y servicios se categorizan en 66 categorías de gasto, denominadas clases de mercancías, basadas en sus características ambientales comunes. Estas clases de productos básicos están asociadas a factores de emisión utilizados para estimar los impactos ambientales utilizando datos de gasto.

El conjunto de datos Eora MRIO (Multi-region input-output) es un conjunto de factores de emisión basados en el gasto reconocido a nivel mundial que documenta las transferencias intersectoriales entre 15 909 sectores en 190 países. El conjunto de factores Eora se ha modificado para alinearse con la categorización USEEIO de 66 clasificaciones resumidas por país. Esto implica mapear los 15 909 sectores que se encuentran en las categorías de Eora26 y clasificaciones sectoriales nacionales más detalladas a las categorías de gastos de la USEEIO 66.

Aquí es donde entran en juego los LLM. En los últimos años, se han logrado avances notables en la creación de amplios modelos lingüísticos básicos para el procesamiento del lenguaje natural (PNL). Estas innovaciones han demostrado un gran rendimiento en comparación con los modelos convencionales de machine learning (ML), sobre todo en escenarios en los que escasean los datos etiquetados. Aprovechar las capacidades de estos grandes modelos de PLN preentrenados, combinados con técnicas de adaptación de dominio que hacen un uso eficiente de datos limitados, presenta un potencial significativo para abordar el desafío asociado con la contabilidad del impacto ambiental de alcance 3.

Nuestro enfoque consiste en ajustar los modelos fundacionales para reconocer las clases de materias primas de Entrada-Salida ambientalmente ampliadas (EEIO) de órdenes de compra o entradas de libro mayor escritas en lenguaje natural. Posteriormente, calculamos las emisiones asociadas al gasto utilizando los factores de emisión EEIO (emisiones por dólar gastado) obtenidos de Supply Chain GHG Emission Factors for US Commodities and Industries para conjuntos de datos centrados en Estados Unidos, y el Eora MRIO (Multi-region input-output) para conjuntos de datos globales. Este marco ayuda a agilizar y simplificar el proceso para que las empresas calculen las emisiones de alcance 3.

La figura 1 ilustra el marco para la estimación de emisiones de alcance 3 empleando un modelo de lenguaje grande. Este marco consta de cuatro módulos distintos: preparación de los datos, adaptación del dominio, clasificación y cálculo de emisiones.