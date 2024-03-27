スコープ3の温室効果ガス排出量の計算と開示への関心の高まりにより、排出量の計算方法に注目が集まっています。組織が使用するより一般的なスコープ3の計算方法論の1つは、支出ベースの方法であり、これを実装するには時間とリソースが大量にかかる場合があります。この記事では、AIと大規模言語モデル（LLM）を活用してスコープ3のGHG排出量の推定を合理化する革新的な方法について説明します。これにより、金融取引データを支出ベースの排出係数に合わせて分類することができます。
間接排出とも呼ばれるスコープ3排出量には、組織のバリュー・チェーン内で発生し、組織の直接の運営管理や所有に基づいていない温室効果ガス排出（GHG）が含まれます。より単純に言うと、これらの排出量は、サプライヤーや顧客に関連する排出量などの外部要因から生じ、企業の中核業務の範囲外にあるものです。
2022 年の CDP の調査によると、CDP に報告している企業の場合、サプライチェーンで発生する排出量は、自社の事業活動による排出量よりも平均で 11.4 倍多いことがわかりました。
同じ調査では、CDP対応企業の 72% が自社の事業排出量（スコープ1または2）のみを報告していることが示されました。一部の企業は、サプライヤーからデータを収集し、手動でデータを分類することでスコープ３排出量を推定しようとしていますが、大規模なサプライヤー基盤、大規模なサプライチェーン、複雑なデータ収集プロセス、リソースなどの課題によってその進展が妨げられています。
スコープ3排出量を推定するための1つのアプローチは、購入した商品やサービスに関連する排出量のプロキシーとして金融取引データ（支出など）を活用することです。この財務データをGHG排出量インベントリーに変換するには、購入した製品またはサービスのGHG排出量の影響に関する情報が必要です。
米国環境拡張投入量 (USEEIO)は、米国内の商品およびサービスの経済的および環境的フローを追跡するライフサイクル評価 (LCA) フレームワークです。USEEIOは、経済IO分析と環境データを融合して、経済活動に伴う環境上の影響を推定する包括的なデータセットと方法論を提供しています。USEEIO内では、商品とサービスは、共通の環境特性に基づいて、商品クラスと呼ばれる66の支出カテゴリーに分類されます。これらの商品クラスは、支出データを使用して環境影響を推定するために使用される排出係数に関連付けられます。
Eora MRIO (Multi-region input-output)データセットは、190の国または地域にわたる15,909のセクター間のセクター間移転を文書化した、世界的に認められた支出ベースの排出係数セットです。Eora係数セットは、国または地域ごとの66の要約分類のUSEEIO分類に合わせて変更されました。これには、Eora26カテゴリおよびより詳細な国家セクター分類にまたがる15.909セクターをUSEEIO 66支出カテゴリにマッピングすることが含まれます。
ここでLLMの出番です。近年、自然言語処理 (NLP) のための広範な基礎言語モデルの作成において目覚ましい進歩が見られました。これらのイノベーションは、特にラベル付きデータが不足しているシナリオにおいて、従来の機械学習（ML）モデルと比較して強力なパフォーマンスを示しています。これらの大規模な事前トレーニング済みNLPモデルの機能を活用し、限られたデータを効率的に使用するドメイン適応手法と組み合わせることで、スコープ3環境影響の計算に関連する課題に取り組むための大きな可能性が提示されます。
我々のアプローチでは、自然言語で記述された発注書や元帳項目から環境拡張型インプット・アウトプット（EEIO）商品クラスを認識するために、基盤モデルを微調整します。続いて、米国中心のデータセットの場合は米国商品・産業別サプライチェーン温室効果ガス排出係数、およびグローバル・データセットの場合はEora MRIO (Multi-region input-Output) からそれぞれ取得した EEIO 排出係数（支出額（ドル）あたりの排出量）を使用して、支出に関連する排出量を計算します。このフレームワークは、企業がスコープ3排出量を計算するプロセスを合理化し、簡素化するのに役立ちます。
図1は、大規模言語モデルを採用したスコープ3排出量推定のフレームワークを示しています。このフレームワークは、データ準備、ドメイン適応、分類、排出量計算という4つの異なるモジュールで構成されています。
私たちは、roberta-base、bert-base-uncased、distilroberta-base-climate-fなど、いくつかの最先端のLLMを含む大規模な実験を実施しました。さらに、TF-IDFおよびWord2Vecベクトル化アプローチに基づいた非基盤古典モデルを調査しました。私たちの目的は、商品やサービスの代用として金融取引記録を使用してスコープ3排出量を推定する際の基盤モデル（FM）の可能性を評価することでした。この実験では、微調整されたLLMがゼロショット分類アプローチよりも大幅に改善されることが結果として示されています。さらに、FMでは、TF-IDFやWord2Vecなどの従来のテキスト・マイニング技術よりも優れたパフォーマンスを発揮し、ドメイン専門家による分類と同等のパフォーマンスを示しました。
スコープ3排出量を見積もるプロセスにLLMを採用することは、有望な新しいアプローチです。
前述のように、支出データは組織内でより利用しやすく、商品やサービスの量を表す一般的な代理指標となります。ただし、商品認識やマッピングなどの課題に取り組むのは困難に思えます。なぜでしょうか。
ここでは、ラベル付けされたデータの入手が不十分であったり、限られていたりする場合には、ディープラーニングに基づく基盤モデルが、NLPの幅広い分類タスクにおいては効率的です。限られたデータでドメイン適応を行う大規模な事前トレーニング済み NLP モデルを活用すると、スコープ 3 排出量の計算をサポートできる可能性があります。
結論として、LLMのサポートを得てスコープ3排出量を計算することは、サステナビリティーのためのデータ管理の大きな進歩を意味します。高度なLLMの採用から得られる有望な結果は、GHGフットプリント評価を加速する可能性を浮き彫りにします。IBM Envizi ESG Suiteなどのソフトウェアに実用的に統合すると、プロセスが簡素化すると同時に、インサイトを得るまでのスピードが向上します。
