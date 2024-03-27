估算范围 3 排放量的一种方法是利用金融交易数据（例如支出）作为与所购买的商品和/或服务相关的排放量的替代指标。将此类金融数据转化为温室气体排放清单，需要了解所购产品或服务产生的温室气体排放影响。

美国环境扩展投入产出 (USEEIO) 是一种生命周期评估 (LCA) 框架，用于追踪美国境内商品与服务的经济及环境流动。USEEIO 提供全面的数据集和方法论，将经济投入产出分析与环境数据相结合，以估计与经济活动相关的环境后果。USEEIO 将商品和服务根据其共同的环境特征分为 66 个支出类别（称为商品类别）。这些商品类别与用于根据支出数据评估环境影响的排放因子相关联。

Eora MRIO（多区域投入产出）数据集是全球公认的基于支出的排放因子集，记录了 190 个国家或地区 15,909 个行业之间的跨行业转移。Eora 因子集已修改，使其与 USEEIO 对每个国家或地区的 66 个汇总分类相一致。这涉及到将 Eora26 类别和更详细的国家行业分类中发现的 15,909 个行业映射到 USEEIO 的 66 个支出类别。

这就是 LLM 发挥作用的地方。近年来，在构建用于自然语言处理 (NLP) 的广泛基础语言模型方面取得了显著进展。与传统的机器学习 (ML) 模型相比，这些创新表现出强大的性能，特别是在标记数据短缺的情况下。利用这些大型预训练 NLP 模型的功能，结合有效利用有限数据的领域适应技术，为应对范围 3 环境影响核算相关的挑战提供了巨大的潜力。

我们的方法涉及对基础模型进行微调，以识别以自然语言编写的采购订单或分类账条目的环境扩展投入产出 (EEIO) 商品类别。随后，我们使用 EEIO 排放因子（每美元支出的排放量）计算与支出相关的排放量，这些排放因子源自以美国为中心的数据集的美国商品和行业供应链温室气体排放因子，以及全球数据集的 Eora MRIO（多区域投入产出）。该框架有助于简化企业计算范围 3 排放量的流程。

图 1 展示了采用大型语言模型估算范围 3 排放量的框架。该框架由四个不同的模块组成：数据准备、领域适应、分类和排放计算。