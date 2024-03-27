العلامات
الاستدامة

تسريع حساب انبعاثات النطاق الثالث: النماذج اللغوية الكبيرة من أجل الإنقاذ

منظر جوي لرصيف التحميل مع الحاويات

لقد أدى الاهتمام المتزايد بحساب والإفصاح عن النطاق الثالث لانبعاثات غازات الاحتباس الحراري إلى تسليط الضوء على أساليب حساب الانبعاثات. واحدة من أكثر منهجيات الحساب شيوعاً في النطاق الثالث التي تستخدمها المؤسسات هي الطريقة القائمة على الإنفاق، والتي قد تكون مستهلكة للوقت وتستغرق الكثير من الموارد في التنفيذ. تتناول هذه المقالة طريقة مبتكرة لتبسيط تقدير النطاق الثالث لانبعاثات غازات الاحتباس الحراري باستخدام الذكاء الاصطناعي والنماذج اللغوية الكبيرة (LLMs) للمساعدة في تصنيف بيانات المعاملات المالية لتتوافق مع عوامل الانبعاثات القائمة على الإنفاق.

لماذا يصعب حساب انبعاثات النطاق الثالث؟

انبعاثات النطاق الثالث، والتي تسمى أيضاً الانبعاثات غير المباشرة، تشمل انبعاثات غازات الدفيئة (GHG) التي تحدث في سلسلة القيمة للمؤسسة، وبالتالي فهي ليست تحت سيطرتها التشغيلية المباشرة أو ملكيتها. وبعبارات أبسط، تنشأ هذه الانبعاثات من مصادر خارجية، مثل الانبعاثات المرتبطة بالموردين والعملاء وهي خارج نطاق العمليات الأساسية للشركة.

وجدت دراسة أجرتها مؤسسة CDP (مشروع الإفصاح عن الكربون) لعام 2022 أنه بالنسبة للشركات التي تقدم تقاريرها إلى CDP، فإن الانبعاثات التي تحدث في سلسلة التوريد الخاصة بها تمثل في المتوسط 11.4 ضعفًا من الانبعاثات التشغيلية.

أظهرت الدراسة نفسها أن 72% من الشركات المستجيبة لمشروع الكشف عن الكربون (CDP) أبلغت عن انبعاثاتها التشغيلية فقط (النطاق 1 و/أو 2). تحاول بعض الشركات تقدير انبعاثات النطاق الثالث من خلال جمع البيانات من الموردين وتصنيف البيانات يدوياً، لكن التقدم يعيقه تحديات مثل قاعدة الموردين الكبيرة، وعمق سلسلة التوريد، وعمليات جمع البيانات المعقدة، ومتطلبات الموارد الكبيرة.

استخدام النماذج اللغوية الكبيرة لتقدير انبعاثات النطاق الثالث لتسريع الوقت اللازم للحصول على رؤى

يتمثل أحد أساليب تقدير انبعاثات النطاق الثالث في الاستفادة من بيانات المعاملات المالية (على سبيل المثال، الإنفاق) كبديل للانبعاثات المرتبطة بالسلع و / أو الخدمات المشتراة. تحويل هذه البيانات المالية إلى مخزون انبعاثات غازات الدفيئة يتطلب معلومات حول تأثير انبعاثات غازات الدفيئة للمنتج أو الخدمة المشتراة.

المدخلات والمخرجات البيئية الممتدة في الولايات المتحدة (USEEIO) هو إطار تقييم لدورة الحياة (LCA) يتتبع التدفقات الاقتصادية والبيئية للسلع والخدمات داخل الولايات المتحدة. يقدم USEEIO مجموعة بيانات ومنهجية شاملة تدمج تحليل الدخل والإنفاق الاقتصادي مع البيانات البيئية لتقدير العواقب البيئية المرتبطة بالأنشطة الاقتصادية. داخل USEEIO، تصنف السلع والخدمات إلى 66 فئة إنفاق، يشار إليها بفئات السلع، بناءً على خصائصها البيئية المشتركة. وترتبط فئات السلع هذه بعوامل الانبعاثات المستخدمة لتقدير التأثيرات البيئية باستخدام بيانات الإنفاق.

تعد مجموعة بيانات Eora MRIO (المدخلات والمخرجات متعددة المناطق) مجموعة عوامل انبعاث معتمدة عالمياً على الإنفاق توثق التحويلات بين 15909 قطاع عبر 190 دولة. وقد تم تعديل مجموعة عوامل Eora لتتماشى مع تصنيفات المدخلات والمخرجات البيئية الممتدة في الولايات المتحدة (USEEIO) التي تضم 66 تصنيفًا موجزًا لكل بلد. يشمل ذلك ربط القطاعات البالغ عددها 15909 والموجودة عبر فئات Eora البالغ عددها 26 وتصنيفات قطاعية وطنية أكثر تفصيلاً إلى فئات إنفاق USEEIO البالغ عددها 66.

هنا يأتي دور النماذج اللغوية الكبيرة (LLM). في السنوات الأخيرة، تم تحقيق خطوات ملحوظة في صياغة نماذج لغوية أساسية واسعة النطاق لمعالجة اللغة الطبيعية (NLP). أظهرت هذه الابتكارات أداءً قوياً مقارنة بنماذج التعلم الآلي (ML)، خاصة في السيناريوهات التي يكون فيها عدد البيانات المصنّفة قليلاً. إن الاستفادة من قدرات نماذج معالجة اللغة الطبيعية الكبيرة المدربة مسبقًا، جنبًا إلى جنب مع تقنيات تكييف المجال التي تستخدم البيانات المحدودة بكفاءة، يمثل إمكانات كبيرة لمواجهة التحدي المرتبط بحساب التأثير البيئي للنطاق الثالث.

يتضمن نهجنا ضبط نماذج الأساس للتعرف على فئات سلع المدخلات-المخرجات الممتدة بيئياً (EEIO) لأوامر الشراء أو إدخالات دفتر الأستاذ المكتوبة بلغة طبيعية. بعد ذلك، نقوم بحساب الانبعاثات المرتبطة بالإنفاق باستخدام عوامل انبعاثات EEIO (الانبعاثات لكل دولار يتم إنفاقه) المستمدة من عوامل انبعاثات غازات الدفيئة لسلسلة توريد السلع والصناعات لمجموعات البيانات التي تتمحور حول الولايات المتحدة، وEora MRIO (المخرجات والإدخال متعددة المناطق) لمجموعات البيانات العالمية. يساعد هذا الإطار في تبسيط وتسهيل العملية التي تتيح للشركات حساب انبعاثات النطاق الثالث.

يوضح الشكل 1 إطار تقدير الانبعاثات في النطاق الثالث باستخدام نموذج لغوي كبير. يتكون هذا الإطار من أربع وحدات مميزة: إعداد البيانات، تكييف المجال، التصنيف، وحساب الانبعاثات.

إطار عمل لتقدير انبعاثات النطاق 3 باستخدام نموذج لغوي كبير (LLM) الشكل 1: إطار عمل لتقدير انبعاثات النطاق الثالث باستخدام النماذج اللغوية الكبيرة

لقد أجرينا تجارب مكثفة شملت العديد من النماذج اللغوية الكبيرة المتطورة المتميزة بما في ذلك roberta-base، وBert-base-uncased، و distilroberta-base-climate-f. بالإضافة إلى ذلك، قمنا باستكشاف النماذج الكلاسيكية غير التأسيسية استنادًا إلى نهجي TF-IDF و Word2Vec المتجهين. كان هدفنا تقييم إمكانات نماذج الأساس في تقدير انبعاثات النطاق الثالث باستخدام سجلات المعاملات المالية كمؤشر للسلع والخدمات. تشير النتائج التجريبية إلى أن النماذج اللغوية الكبيرة المضبوطة بدقة تُظهر تحسينات كبيرة على نهج التصنيف الصفري. علاوة على ذلك، تفوقت على تقنيات استكشاف النصوص الكلاسيكية مثل TF-IDF وWord2Vec، وقدمت أداء بمستوى تصنيف الخبير في المجال.

مقارنة نتائج الأساليب المختلفة الشكل 2: مقارنة نتائج النُهج المختلفة

دمج الذكاء الاصطناعي في مجموعة IBM Envizi ESG Suite لحساب انبعاثات النطاق الثالث

استخدام النماذج اللغوية الكبيرة في عملية تقدير انبعاثات النطاق الثالث هو نهج جديد واعد..

كما تم شرحه سابقاً، فإن بيانات الإنفاق متاحة بسهولة أكبر في المؤسسة وتعد نموذجاً شائعاً لكمية السلع/الخدمات. ومع ذلك، قد يبدو من الصعب معالجة تحديات مثل التعرف على السلع وتعيينها. لماذا؟

  • أولاً، لأن المنتجات والخدمات المشتراة موصوفة باللغات الطبيعية بأشكال مختلفة، ولهذا السبب يصعب التعرف على السلع من أوامر الشراء / إدخال دفتر الأستاذ.
  • ثانيًا، نظرًا لوجود ملايين المنتجات والخدمات التي قد لا يتوفر عامل الانبعاثات القائم على الإنفاق لها. وهذا يجعل التعيين اليدوي لفئة السلعة/الخدمة والمنتج/الخدمة أمراً بالغ الصعوبة، إن لم يكن مستحيلاً.

هنا يأتي دور نماذج الأساس القائمة على التعلم العميق لمعالجة اللغة الطبيعية (NLP) التي يمكن أن تكون فعالة عبر مجموعة واسعة من مهام تصنيف معالجة اللغة الطبيعية عندما يكون توفر البيانات المصنفة غير كافٍ أو محدود. إن الاستفادة من نماذج معالجة اللغة الطبيعية (NLP) المدربة مسبقًا مع التكيف مع المجال باستخدام بيانات محدودة من الممكن أن تدعم حساب انبعاثات النطاق الثالث.

الخلاصة

في الختام، يمثل حساب انبعاثات النطاق الثالث بدعم من النماذج اللغوية الكبيرة تقدماً كبيراً في إدارة البيانات من أجل الاستدامة. تظهر النتائج الواعدة من استخدام النماذج اللغوية الكبيرة المتقدمة إمكاناتها في تسريع تقييمات بصمة انبعاثات غازات الدفيئة. يمكن أن يبسط التكامل العملي في البرمجيات مثل IBM Envizi ESG Suite العملية مع زيادة سرعة الوصول إلى الرؤى.

مؤلف

Manikandan Padmanaban

Research Software Engineer at IBM India Research Laboratory

Jagabondhu Hazra

STSM

Sub-theme Lead, Future of Climate

Shantanu Godbole

Lead

IBM Middle East Research Center

Tamara Robinson

WW Product Marketing Leader

IBM Envizi

IBM Envizi

Envizi

Ayushi Jain

Product Marketing Manager Data & AI

Juan Bernabe-Moreno

Director IBM Research Europa / Ireland and UK

