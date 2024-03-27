对范围 3 温室气体排放计算和披露兴趣的增加使得排放计算方法成为关注的焦点。组织常用的范围 3 计算方法之一是基于支出的方法，但这种方法实施起来可能既耗时又耗费资源。本文探索了利用 AI 和大型语言模型 (LLM) 简化范围 3 温室气体排放估算的创新方法，以帮助对金融交易数据进行分类，使其与基于支出的排放因子保持一致。
范围 3 排放也称为间接排放，包括发生在组织价值链中的温室气体排放 (GHG)，因此不在组织的直接运营控制或所有权范围内。简而言之，这些排放来自外部来源，例如与供应商和客户相关的排放，超出了公司的核心运营范围。
2022 年 CDP 的一项研究发现，对于向 CDP 报告的公司而言，其供应链中产生的排放量平均是其运营排放量的 11.4 倍。
同一项研究表明，向 CDP 报告的公司中有 72% 仅报告了其运营排放量（范围 1 和/或 2）。一些公司试图通过收集供应商的数据并手动对数据进行分类来估算范围 3 的排放量，但由于供应商数量庞大、供应链深度、数据收集过程复杂以及资源需求巨大等挑战，进展受到阻碍。
估算范围 3 排放量的一种方法是利用金融交易数据（例如支出）作为与所购买的商品和/或服务相关的排放量的替代指标。将此类金融数据转化为温室气体排放清单，需要了解所购产品或服务产生的温室气体排放影响。
美国环境扩展投入产出 (USEEIO) 是一种生命周期评估 (LCA) 框架，用于追踪美国境内商品与服务的经济及环境流动。USEEIO 提供全面的数据集和方法论，将经济投入产出分析与环境数据相结合，以估计与经济活动相关的环境后果。USEEIO 将商品和服务根据其共同的环境特征分为 66 个支出类别（称为商品类别）。这些商品类别与用于根据支出数据评估环境影响的排放因子相关联。
Eora MRIO（多区域投入产出）数据集是全球公认的基于支出的排放因子集，记录了 190 个国家或地区 15,909 个行业之间的跨行业转移。Eora 因子集已修改，使其与 USEEIO 对每个国家或地区的 66 个汇总分类相一致。这涉及到将 Eora26 类别和更详细的国家行业分类中发现的 15,909 个行业映射到 USEEIO 的 66 个支出类别。
这就是 LLM 发挥作用的地方。近年来，在构建用于自然语言处理 (NLP) 的广泛基础语言模型方面取得了显著进展。与传统的机器学习 (ML) 模型相比，这些创新表现出强大的性能，特别是在标记数据短缺的情况下。利用这些大型预训练 NLP 模型的功能，结合有效利用有限数据的领域适应技术，为应对范围 3 环境影响核算相关的挑战提供了巨大的潜力。
我们的方法涉及对基础模型进行微调，以识别以自然语言编写的采购订单或分类账条目的环境扩展投入产出 (EEIO) 商品类别。随后，我们使用 EEIO 排放因子（每美元支出的排放量）计算与支出相关的排放量，这些排放因子源自以美国为中心的数据集的美国商品和行业供应链温室气体排放因子，以及全球数据集的 Eora MRIO（多区域投入产出）。该框架有助于简化企业计算范围 3 排放量的流程。
图 1 展示了采用大型语言模型估算范围 3 排放量的框架。该框架由四个不同的模块组成：数据准备、领域适应、分类和排放计算。
我们进行了广泛的实验，涉及多个尖端的 LLM，包括 roberta-base、bert-base-uncased 和 distilroberta-base-climate-f。此外，我们还探索了基于 TF-IDF 和 Word2Vec 向量化方法的非基础经典模型。我们的目标是评估基础模型 (FM) 在利用金融交易记录作为商品与服务的替代指标来估算范围 3 排放量方面的潜力。实验结果表明，经过微调的 LLM 相比零样本分类方法表现出显著的改进。此外，它们的性能优于 TF-IDF 和 Word2Vec 等经典文本挖掘技术，其性能与领域专家分类相当。
在估算范围 3 排放量的过程中使用 LLM 是一种很有前景的新方法。。
如前所述，支出数据在组织内部更易获取，且常被用作商品/服务数量的替代指标。然而，商品识别和映射等挑战似乎难以应对。这是为什么？
当标注数据不足或有限时，基于深度学习的 NLP 基础模型可以在各种 NLP 分类任务中发挥高效作用。在数据有限的情况下，利用大型预训练 NLP 模型和领域适应性，有望为范围 3 排放计算提供支持。
总之，在 LLM 的支持下计算范围 3 排放量是可持续发展数据管理方面的一大进步。采用先进的 LLM 所带来的可喜成果凸显了其在加快温室气体足迹评估方面的潜力。将 LLM 与 IBM Envizi ESG Suite 等软件的实际整合可以简化流程，同时加快洞察分析的速度。
