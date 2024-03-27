Uma abordagem para estimar as emissões do escopo 3 é aproveite dados de transações financeiras (por exemplo, gastos) como substitutos para emissões associadas a bens e/ou serviços adquiridos. A conversão desses dados financeiros em inventário de emissões de GEE requer informações sobre o impacto das emissões de GHG do produto ou serviço adquirido.

O Input-Output Ambientalmente Estendido dos EUA (USEEIO) é um framework de avaliação do ciclo de vida (LCA) que rastreia fluxos econômicos e ambientais de bens e serviços dentro dos Estados Unidos. A USEEIO oferece um conjunto de dados abrangente e uma metodologia que mescla a análise econômica de IO com dados ambientais para estimar as consequências ambientais associadas às atividades econômicas. Dentro da USEEIO, os bens e serviços são categorizados em 66 categorias, referidas como classes de commodities, com base em suas características ambientais comuns. Essas classes de commodities estão associadas a fatores de emissão usados para estimar impactos ambientais usando dados de despesas.

O conjunto de dados Eora MRIO (input-output multirregional) é um conjunto de fatores de emissão baseados em gastos reconhecidos globalmente que documenta as transferências intersetoriais entre 15.909 setores em 190 países. O conjunto de fatores Eora foi modificado para se alinhar à categorização USEEIO de 66 classificações resumidas por país. Isso envolve mapear os 15.909 setores encontrados nas categorias Eora26 e classificações de setores nacionais mais detalhadas para as categorias de gastos do USEEIO.

É aqui que os LLMs entram em ação. Nos últimos anos, avanços notáveis foram alcançados na elaboração de modelos de linguagem de base abrangentes para processamento de linguagem natural (PLN). Essas inovações demonstraram um forte desempenho em comparação com os modelos convencionais de aprendizado de máquina (ML), particularmente em cenários com escassez de dados rotulados. Capitalizar os recursos desses grandes modelos de PLN pré-treinados, combinado com técnicas de adaptação de domínio que fazem uso eficiente de dados limitados, apresenta um potencial significativo para enfrentar o desafio associado à contabilização do impacto ambiental do Escopo 3.

Nossa abordagem envolve o ajuste fino modelos de base para reconhecer classes de mercadorias de Entrada-Saída Ambientalmente Estendidas (EEIO) de pedidos de compra ou lançamentos contábeis escritos em linguagem natural. Em seguida, calculamos as emissões associadas aos gastos usando os fatores de emissão EEIO (emissões por dólar gasto) provenientes do Fatores de Emissão de Gases de Efeito Estufa da Cadeia de Suprimentos para Commodities e Setores dos EUA para conjuntos de dados centrados nos EUA, e o Eora MRIO (Multi-região input-input) para conjuntos de dados globais. Esse framework ajuda a simplificar o processo para as empresas calcularem as emissões do escopo 3.

A figura 1 ilustra o framework para a estimativa de emissões do escopo 3 empregando um grande modelo de linguagem. Esse framework compreende quatro módulos distintos: preparação de dados, adaptação de domínio, classificação e computação de emissão.