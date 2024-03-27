Meningkatnya minat terhadap penghitungan dan pengungkapan emisi GRK Lingkup 3 telah menyoroti metode penghitungan emisi. Salah satu metodologi perhitungan Lingkup 3 yang lebih umum yang digunakan organisasi adalah metode berbasis pengeluaran, yang dapat memakan waktu dan padat sumber daya untuk diterapkan. Artikel ini menjelajahi cara inovatif untuk merampingkan estimasi emisi GRK Lingkup 3 dengan memanfaatkan AI dan Model Bahasa Besar (LLM) untuk membantu mengategorikan data transaksi keuangan agar selaras dengan faktor emisi berbasis pengeluaran.
Emisi Lingkup 3, juga disebut emisi tidak langsung, mencakup emisi gas rumah kaca (GRK) yang terjadi dalam rantai nilai organisasi dan dengan demikian, tidak berada di bawah kendali operasional langsung atau kepemilikan. Dalam istilah yang lebih sederhana, emisi ini muncul dari sumber eksternal, seperti emisi yang terkait dengan pemasok dan pelanggan dan berada di luar operasi inti perusahaan.
Sebuah studi CDP 2022 menemukan bahwa untuk perusahaan yang melapor ke CDP, emisi yang terjadi dalam rantai pasokan mereka mewakili rata-rata 11,4x lebih banyak emisi daripada emisi operasional mereka.
Studi yang sama menunjukkan bahwa 72% perusahaan yang menanggapi CDP hanya melaporkan emisi operasional mereka (Lingkup 1 dan/atau 2). Beberapa perusahaan mencoba memperkirakan emisi Lingkup 3 dengan mengumpulkan data dari pemasok dan mengategorikan data secara manual, tetapi kemajuan terhambat oleh tantangan seperti basis pemasok yang besar, dalamnya rantai pasokan, proses pengumpulan data yang rumit, dan persyaratan sumber daya yang substansial.
Salah satu pendekatan untuk memperkirakan emisi Lingkup 3 adalah dengan memanfaatkan data transaksi keuangan (misalnya, pengeluaran) sebagai proksi untuk emisi yang terkait dengan barang dan/atau jasa yang dibeli. Mengkonversi data keuangan ini menjadi inventaris emisi GRK memerlukan informasi tentang dampak emisi GRK dari produk atau layanan yang dibeli.
US Environmentally-Extended Input-Output (USEEIO) adalah kerangka kerja penilaian siklus hidup (LCA) yang melacak arus ekonomi dan lingkungan barang dan jasa di Amerika Serikat. USEEIO menawarkan kumpulan data dan metodologi komprehensif yang menggabungkan analisis IO ekonomi dengan data lingkungan untuk memperkirakan konsekuensi lingkungan yang terkait dengan kegiatan ekonomi. Dalam USEEIO, barang dan jasa dikategorikan ke dalam 66 kategori, disebut sebagai kelas komoditas, berdasarkan karakteristik lingkungan umum mereka. Kelas komoditas ini dikaitkan dengan faktor emisi yang digunakan untuk memperkirakan dampak lingkungan menggunakan data pengeluaran.
Kumpulan data Eora MRIO (Multi-region input-output) adalah kumpulan faktor emisi berbasis pengeluaran yang diakui secara global yang mendokumentasikan transfer antar sektoral di antara 15.909 sektor di 190 negara. Kumpulan faktor Eora telah dimodifikasi agar selaras dengan kategorisasi USEEIO dari 66 klasifikasi ringkasan per negara. Ini melibatkan pemetaan 15.909 sektor yang ditemukan di seluruh kategori Eora26 dan klasifikasi sektor nasional yang lebih rinci ke categories pengeluaran USEEIO 66.
Di sinilah LLM berperan. Dalam beberapa tahun terakhir, langkah luar biasa telah dicapai dalam menyusun model bahasa dasar yang ekstensif untuk pemrosesan bahasa alami (NLP). Inovasi ini telah menunjukkan kinerja yang kuat dibandingkan dengan model machine learning (ML) konvensional, terutama dalam skenario di mana data berlabel kekurangan pasokan. Memanfaatkan kemampuan model NLP pra-terlatih yang besar ini, dikombinasikan dengan teknik adaptasi domain yang memanfaatkan data terbatas secara efisien, menghadirkan potensi signifikan untuk mengatasi tantangan yang terkait dengan penghitungan dampak lingkungan Lingkup 3.
Pendekatan kami melibatkan penyempurnaan model dasar untuk mengenali kelas komoditas Environmentally-Extended Input-Output (EEIO) dari pesanan pembelian atau entri buku besar yang ditulis dalam bahasa alami. Selanjutnya, kami menghitung emisi yang terkait dengan pengeluaran menggunakan faktor emisi EEIO (emisi per $ yang dibelanjakan) yang bersumber dari Supply Chain GHG Emission Factors for US Commodities and Industries untuk kumpulan data yang berpusat di AS, dan Eora MRIO ( input-output multi-wilayah) untuk kumpulan data global. Kerangka kerja ini membantu merampingkan dan menyederhanakan proses bagi bisnis untuk menghitung emisi Lingkup 3.
Gambar 1 menggambarkan kerangka kerja untuk estimasi emisi Lingkup 3 menggunakan model bahasa besar. Kerangka kerja ini terdiri dari empat modul yang berbeda: persiapan data, adaptasi domain, klasifikasi dan perhitungan emisi.
Kami melakukan eksperimen ekstensif yang melibatkan beberapa LLM mutakhir termasuk roberta-base, bert-base-uncased, dan distilroberta-base-climate-f. Selain itu, kami jelajahi model klasik non-dasar berdasarkan pendekatan vektorisasi TF-IDF dan Word2Vec. Tujuan kami adalah untuk menilai potensi model dasar (FM) dalam memperkirakan emisi Lingkup 3 menggunakan catatan transaksi keuangan sebagai proxy untuk barang dan jasa. Hasil eksperimen menunjukkan bahwa LLM yang disetel dengan baik menunjukkan peningkatan yang signifikan dibandingkan pendekatan klasifikasi zero-shot. Selain itu, mereka mengungguli teknik penambangan teks klasik seperti TF-IDF dan Word2Vec, memberikan kinerja setara dengan klasifikasi pakar domain.
Mempekerjakan LLM dalam proses memperkirakan emisi Lingkup 3 adalah pendekatan baru yang menjanjikan..
Seperti yang dijelaskan sebelumnya, data pengeluaran lebih mudah tersedia dalam suatu organisasi dan merupakan proxy umum dari jumlah barang/jasa. Namun, tantangan seperti pengenalan komoditas dan pemetaan tampaknya sulit untuk diatasi. Mengapa?
Di sinilah model dasar berbasis pembelajaran mendalam untuk NLP dapat efisien di berbagai tugas klasifikasi NLP ketika ketersediaan data berlabel tidak mencukupi atau terbatas. Memanfaatkan model NLP besar yang telah dilatih sebelumnya dengan adaptasi domain dengan data terbatas berpotensi mendukung perhitungan emisi Lingkup 3.
Kesimpulannya, menghitung emisi Lingkup 3 dengan dukungan LLM merupakan kemajuan signifikan dalam manajemen data untuk keberlanjutan. Hasil yang menjanjikan dari mempekerjakan LLM tingkat lanjut menyoroti potensi mereka untuk mempercepat penilaian jejak GRK. Integrasi praktis ke dalam perangkat lunak seperti IBM Envizi ESG Suite dapat menyederhanakan proses sekaligus meningkatkan kecepatan insight.
