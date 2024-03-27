Un enfoque para estimar las emisiones de Alcance 3 es aprovechar los datos de transacciones financieras (por ejemplo, gastos) como proxy de las emisiones asociadas con los bienes o servicios adquiridos. La conversión de estos datos financieros en un inventario de emisiones de GEI requiere información sobre el impacto de las emisiones de GEI del producto o servicio adquirido.

El US Environmentally-Extended Input-Output (USEEIO) es un marco de evaluación que rastrea los flujos económicos y ambientales de bienes y servicios dentro de los Estados Unidos. USEEIO ofrece un conjunto de datos y una metodología integrales que fusionan el análisis económico de OI con datos ambientales para estimar las consecuencias ambientales asociadas con las actividades económicas. Dentro de USEEIO, los bienes y servicios se categorizan en 66 categorías de gasto, denominadas clases de mercancías, basadas en sus características ambientales comunes. Estas clases de productos básicos están asociadas con factores de emisión utilizados para estimar los impactos ambientales utilizando datos de gastos.

El conjunto de datos Eora MRIO (Multi-región entrada-resultados) es un conjunto de factores de emisión basados en el gasto reconocido a nivel mundial que documenta las transferencias intersectoriales entre 15 909 sectores en 190 países. El conjunto de factores Eora se modificó para alinearse con la categorización USEEIO de 66 clasificaciones resumidas por país. Esto implica mapear los 15 909 sectores que se encuentran en las categorías Eora26 y clasificaciones sectoriales nacionales más detalladas a las categorías de gasto USEEIO 66.

Aquí es donde entran en juego los LLM. En los últimos años, se han logrado avances notables en la elaboración de amplios modelos de lenguaje fundacional para el procesamiento del lenguaje natural (PLN). Estas innovaciones han mostrado un sólido rendimiento en comparación con los modelos convencionales de machine learning (ML), especialmente en escenarios en los que escasean los datos etiquetados. Aprovechar las capacidades de estos grandes modelos de PLN previamente entrenados, combinados con técnicas de adaptación de dominio que hacen un uso eficiente de datos limitados, presenta un potencial significativo para abordar el desafío asociado con la contabilidad del impacto ambiental de Alcance 3.

Nuestro enfoque implica ajustar los modelos fundacionales para reconocer las clases de productos básicos de entrada-salida ambientalmente ampliados (EEIO) de órdenes de compra o entradas de libro mayor que están escritas en lenguaje natural. Posteriormente, calculamos las emisiones asociadas con el gasto utilizando factores de emisión EEIO (emisiones por $ gastado) obtenidos de Factores de emisión de gases de efecto invernadero de la cadena de suministro para industrias y bienes en EE. UU. para conjuntos de datos centrados en EE. UU., y Eora MRIO (entrada-salida multirregional) para conjuntos de datos globales. Este marco ayuda a agilizar y simplificar el proceso para que las compañías calculen las emisiones de Alcance 3.

La Figura 1 ilustra el marco para la estimación de emisiones en el Alcance 3 empleando un modelo de lenguaje de gran tamaño. Esta infraestructura comprende cuatro módulos distintos: preparación de datos, adaptación del dominio, clasificación y cálculo de emisiones.