ما زيادة البيانات؟

المؤلفين

Jacob Murel Ph.D.

Senior Technical Content Creator

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

ما المقصود بتعزيز البيانات؟

تعزيز البيانات يعتمد على استخدام البيانات المتوفرة مسبقا لتوليد عينات بيانات جديدة، مما يساهم في تحسين أداء النموذج وقدرته على التعميم.

يُشير تعزيز البيانات بمعناه العام إلى طرق لاستكمال ما يُعرَف باسم مجموعات البيانات غير المكتملة من خلال توفير نقاط بيانات مفقودة من أجل زيادة قابلية تحليل مجموعة البيانات.1 يظهر هذا في التعلم الآلي من خلال إنشاء نسخ معدلة من البيانات الموجودة مسبقًا لزيادة حجم مجموعة البيانات وتنوعها. بذلك، في سياق التعلم الآلي، تُعَد البيانات المعززة تزويدًا اصطناعيًا للبيانات الحقيقية التي قد تكون غير متوفرة.

تعمل زيادة البيانات على تحسين تطوير نموذج التعلم الآلي وتعميمه. بعبارة أخرى، يمكن لزيادة البيانات تقليل فرط التخصيص وتحسين فاعلية النموذج.2 إن مجموعات البيانات الكبيرة والمتنوعة تعني أداءً محسّنًا للنموذج، وهو من البديهيات في مجال التعلم الآلي. ومع ذلك، قد يكون جمع بيانات كافية أمرًا صعبًا بسبب عدة عوامل، منها الاعتبارات الأخلاقية ومخاوف الخصوصية، أو الجهد الكبير المطلوب لتجميع البيانات يدويًا. توفِّر زيادة البيانات وسيلة فعَّالة لزيادة حجم مجموعة البيانات وتنوعها. في الواقع، يستخدم الباحثون زيادة البيانات على نطاق واسع لتصحيح مجموعات البيانات غير المتوازنة.3

يوفر العديد من إطارات عمل التعلم العميق، مثل PyTorch وKeras وTensorflow، وظائف لتعزيز البيانات، وخاصةً مجموعات البيانات المكوَّنة من الصور. كما اعتُمدت حزمة Ablumentations من Python (متوفرة على Github) في العديد من مشاريع المصدر المفتوح. يُتيح Albumentations تعزيز بيانات الصور والنصوص.

زيادة البيانات مقابل البيانات الاصطناعية

لاحظ أن تعزيز البيانات يختلف عن البيانات الاصطناعية. من المسلَّم به أن كليهما من خوارزميات التوليد التي تضيف بيانات جديدة إلى مجموعة البيانات من أجل تحسين أداء نماذج التعلم الآلي. ومع ذلك، تُشير البيانات الاصطناعية إلى الإنشاء التلقائي للبيانات الاصطناعية بالكامل. ومن الأمثلة على ذلك استخدام الصور التي أنشأها الكمبيوتر، على عكس بيانات العالم الحقيقي، لتدريب نموذج اكتشاف الكائنات. على النقيض من ذلك، فإن تعزيز البيانات ينسخ البيانات الموجودة ويحوّل تلك النسخ لزيادة تنوع البيانات في مجموعة معينة وكميتها.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

تقنيات زيادة البيانات

هناك مجموعة متنوعة من طرق زيادة البيانات. تعتمد التقنيات المحددة التي تُستخدَم لزيادة البيانات على طبيعة البيانات التي يعمل بها المستخدم. لاحظ أن زيادة البيانات عادةً ما تنفَّذ أثناء المعالجة المسبقة على مجموعة بيانات التدريب. تبحث بعض الدراسات في تأثير الزيادة على التحقق من الصحة أو مجموعة الاختبار، لكن تطبيقات الزيادة خارج مجموعات التدريب نادرة.4

تكبير الصور

نُفِّذت زيادة البيانات على نطاق واسع في البحث لمجموعة من مهام رؤية الكمبيوتر، بدءًا من تصنيف الصور ووصولًا إلى اكتشاف الأشياء. وعلى هذا النحو، توجد ثروة من الأبحاث حول كيفية تحسين الصور المعززة لأداء الشبكات العصبية التلافيفية (CNNs) المتطورة في معالجة الصور.

تصنِّف العديد من البرامج التعليمية والموارد غير الأكاديمية زيادة بيانات الصور إلى فئتين: التحولات الهندسية والتحولات الضوئية (أو مساحة اللون). ويتكون كلاهما من المعالجة البسيطة نسبيًا لملفات الصور. تشير الفئة الأولى إلى التقنيات التي تغيِّر مساحة الصورة الأصلية وتخطيطها، مثل تغيير الحجم أو التكبير أو تغيير الاتجاه (مثل التدوير الأفقي). تعمل التحولات الضوئية على تغيير قنوات RGB (الأحمر والأخضر والأزرق) للصورة. تتضمن أمثلة التحول الضوئي ضبط التشبع وتدرج اللون الرمادي في الصورة.5

مثال على التكبير الأساسي لصورة القط

بعض المصادر يصنف حقن الضوضاء مع التحولات الهندسية،6 بينما يصنفها البعض الآخر مع التحولات الضوئية.7 يقوم حقن الضوضاء بإدراج وحدات بكسل عشوائية باللون الأسود أو الأبيض أو أي لون آخر في صورة ما وفقًا لتوزيع Gaussian.

مثال على حقن الضوضاء لتكبير الصور

كما يوضح حقن الضوضاء، فإن التصنيف الثنائي لتقنيات تكبير الصور إلى صور هندسية وصور ضوئية يفشل في تغطية المجموعة الكاملة من استراتيجيات التكبير الممكنة، أما تقنيات تكبير الصور المستبعدة فهي تصفية النواة (شحذ الصورة أو طمسها) وخلط الصور، ومن أمثلة هذا الاقتصاص العشوائي والتصحيح، وتعمل هذه التقنية بتجميع أقسام من عدة صور بشكل عشوائي لإنشاء صورة جديدة، وتكون هذه الصورة الجديدة عبارة عن صورة مركبة مصنوعة من الأقسام المختارة من الصور المدخلة. ومن التقنيات ذات الصلة المسح العشوائي، والذي يحذف جزءًا عشوائيًا من الصورة.8 تُعَد هذه المهام مفيدة في مهام التعرف على الصور؛ فقد تتطلب حالات الاستخدام الحقيقية آلات لتحديد الأشياء المحجوبة جزئيًا.

تصور لعملية قص عشوائية لصورة كلب الجولدن ريتريفر

إن الزيادة على مستوى المثيل هي زيادة أخرى، وتعمل الزيادة على مستوى المثيل بشكل أساسي على نسخ المناطق المصنفة (مثل، المربعات المحيطة) من إحدى الصور وإدراجها في صورة أخرى. يدرِّب هذا النهج الصورة على تحديد الأشياء على خلفيات مختلفة وكذلك الأشياء التي تحجبها أشياء أخرى. وتُعَد الزيادة على مستوى المثيل نهجًا بارزًا بشكل خاص لمهام التعرف الخاصة بالمنطقة، مثل مهام اكتشاف الأشياء وتجزئة الصور.9

تكبير النصوص

تتكون زيادة البيانات النصية -مثلها مثل تعزيز الصور- من العديد من التقنيات والأساليب المستخدمة عبر مجموعة من مهام معالجة اللغة الطبيعية (NLP). تعمل بعض الموارد على تقسيم زيادة النصوص إلى طرق قائمة على القواعد (أو "سهلة") وطرق عصبية، بالطبع، كما هو الحال مع التقسيم الثنائي لتقنيات تعزيز الصور، فإن هذه التصنيف ليس شاملًا بالكامل.

وتشمل النهج القائمة على القواعد تقنيات بسيطة نسبيًا للبحث والاستبدال، مثل الحذف أو الإدراج العشوائي، وتشمل النهج القائمة على القواعد أيضًا استبدال المرادفات، وفي هذه الاستراتيجية، تُستبدل كلمة أو أكثر في سلسلة ما بالمرادفات الخاصة بكل منها كما هو مسجل في قاموس مرادفات محدد مسبقًا، مثل WordNet أو Paraphrase Database، كما يُعَد عكس الجمل وبنيها للمجهول، بحيث يُبدَّل المفعول به والفاعل، من أمثلة النهج القائمة على القواعد.10

التصور البياني لزيادات النصوص القائمة على القواعد

وفقًا لتصنيفها، تستخدِم الطرق العصبية الشبكات العصبية لإنشاء عينات نصية جديدة من البيانات المدخلة، وإحدى الطرق العصبية البارزة هي الترجمة العكسية، وتستخدِم هذه الطريقة الترجمة الآلية لترجمة البيانات المدخلة إلى لغة الهدف ثم إعادتها إلى لغة الإدخال الأصلية، وبهذه الطريقة، تستفيد الترجمة العكسية من الفروق اللغوية التي تؤدي إلى ترجمات آلية لتوليد تباينات دلالية في مجموعة بيانات أحادية اللغة لغرض التكبير، وتشير الأبحاث إلى أن هذا فعَّال لتحسين أداء نموذج الترجمة الآلية.11

تصوُّر لتقنيات تعزيز الترجمة باستخدام العبارة "أنا أرقص في النادي".

يُعَد خلط تكبيرات النصوص استراتيجية أخرى، حيث ينشر هذا النهج طرق الحذف والإدراج المستندة إلى القواعد باستخدام تضمينات الشبكة العصبية. وعلى وجه التحديد، تُنشئ المحولات المدربة مسبقًا (مثل BERT) تضمينات للنص على مستوى الكلمة أو الجملة، وتحوِّل النص إلى نقاط متجهة، كما هو الحال في نموذج حقيبة الكلمات. يهدف تحويل النص إلى نقاط متجهة بشكل عام إلى التقاط التشابه اللغوي، أي أن الكلمات أو الجمل القريبة من بعضها البعض في فضاء المتجه يُعتقد أنها تشترك في معانٍ أو ترددات متشابهة. وتعمل عمليات التكبير المختلطة على إقحام السلاسل النصية ضمن مسافة محددة من بعضها البعض لإنتاج بيانات جديدة تمثِّل مجموعة من بيانات الإدخال.12

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

الأبحاث الحديثة

يكافح العديد من المستخدمين لتحديد استراتيجيات زيادة البيانات التي يجب تنفيذها. هل تختلف تقنيات زيادة البيانات من حيث الفاعلية بين مجموعات البيانات والمهام؟ تشير الأبحاث المقارنة حول تقنيات تعزيز البيانات إلى أن استخدام أشكال متعددة من التعزيز له تأثير إيجابي أكبر مقارنةً باستخدام تقنية واحدة، ولكن تحديد المجموعة المثلى من التقنيات يعتمد على مجموعة البيانات والمهمة.13 ولكن كيف يمكن اختيار التقنيات المثلى؟

الزيادة المؤتمتة

لمعالجة هذه المشكلة، لجأت الأبحاث إلى زيادة البيانات المؤتمتة، يستخدم أحد مناهج التعزيز الآلي التعلم المعزز لتحديد تقنيات التعزيز التي تحقق أعلى دقة في مجموعة بيانات معينة.14 وقد أظهر هذا النهج أنه ينفِّذ استراتيجيات تحسِّن الأداء على كل من البيانات داخل العينة وخارجها.15 وهناك نهج واعد آخر للتعزيز الآلي يحدد ويعزز الإيجابيات الزائفة من مخرجات المصنِّف. وبهذه الطريقة، تحدِّد الزيادة المؤتمتة أفضل الاستراتيجيات لتصحيح العناصر التي يتم تصنيفها بشكل خطأ بشكل متكرر.16

الشبكات التوليدية

في الآونة الأخيرة ، تحولت الأبحاث إلى الشبكات والنماذج التوليدية لتحديد الاستراتيجية المثالية التابعة للمهمة17 والتابعة للفئة18. ويشمل هذا العمل مع شبكات الخصومة التوليدية (GANs). إن شبكات الخصومة التوليدية (GANs) هي شبكات تعلم عميق تُستخدَم عادةً لإنشاء البيانات الاصطناعية، وتبحث الأبحاث الحديثة في استخدامها لزيادة البيانات. عدة تجارب، مثلًا، تقترح أن عمليات زيادة البيانات الاصطناعية لمجموعات صور الصحة البشرية تزيد من أداء نموذج التصنيف19 والتجزئة20 أكثر مما تقدمه الزيادات الكلاسيكية. وفي سياق متصل، يستفيد البحث في مجال زيادة النصوص من النماذج اللغوية الكبيرة (LLMs) وروبوتات المحادثة لإنشاء بيانات مزودة. تستخدم هذه التجارب النماذج اللغوية الكبيرة لإنشاء عينات مزودة من البيانات المدخلة باستخدام تقنيات الخلط والمرادفات، ما يظهر تأثيرًا إيجابيًا أكبر لنماذج تصنيف النصوص من تلك الناتجة عن الزيادة الكلاسيكية.21

يستخدم الباحثون والمطورون تقنيات زيادة البيانات عند تدريب النماذج على مهام التعلم الآلي المختلفة على نطاق واسع. وعلى النقيض من ذلك، تُعَد البيانات الاصطناعية جانبًا جديدًا نسبيًا في مجال البحث. تظهر التجارب المقارنة التي يتم إجراؤها على البيانات الاصطناعية مقابل البيانات الحقيقية نتائج مختلطة، حيث تتفوق النماذج المدربة بالكامل على البيانات الاصطناعية في بعض الأحيان، بينما يكون أداؤها أضعف من النماذج المدربة على بيانات العالم الحقيقي في أحيان أخرى. وقد لا يكون أمرًا مثيرًا للدهشة حين يشير هذا البحث إلى أن البيانات الاصطناعية تكون مفيدة للغاية عندما تعكس خصائص بيانات العالم الحقيقي.22

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا
الحواشي

جميع الروابط تؤدي إلى صفحات خارج موقع ibm.com.

f Martin Tanner and Wing Hung Wong, “The Calculation of Posterior Distributions by Data Augmentation,” Journal of the American Statistical Association, Vol. 82, No. 398 (1987), pp. 528-540.

2 Sylvestre-Alvise Rebuffi, Sven Gowal, Dan Andrei Calian, Florian Stimberg, Olivia Wiles, and Timothy A Mann, “Data Augmentation Can Improve Robustness,” Advances in Neural Information Processing Systems, Vol. 34, 2021.

3 Manisha Saini and Seba Susan, “Tackling class imbalance in computer vision: A contemporary review,” Artificial Intelligence Review, Vol. 54, 2023.

4 Fabio Perez, Cristina Vasconcelos, Sandra Avila, and Eduardo Valle, “Data Augmentation for Skin Lesion Analysis,” OR 2.0 Context-Aware Operating Theaters, Computer Assisted Robotic Endoscopy, Clinical Image-Based Procedures, and Skin Image Analysis, 2018.

5 Connor Shorten and Taghi M. Khoshgoftaa, “A survey on Image Data Augmentation for Deep Learning,” Journal of Big Data, 2019.

6 Duc Haba, Data Augmentation with Python, Packt Publishing, 2023.

7 Mingle Xu, Sook Yoon, Alvaro Fuentes, and Dong Sun Park, “A Comprehensive Survey of Image Augmentation Techniques for Deep Learning,” Patter Recognition, Vol. 137.

8 Connor Shorten and Taghi M. Khoshgoftaa, “A survey on Image Data Augmentation for Deep Learning,” Journal of Big Data, 2019, . Terrance DeVries and Graham W. Taylor, “Improved Regularization of Convolutional Neural Networks with Cutout,” 2017.

9 Zhiqiang Shen, Mingyang Huang, Jianping Shi, Xiangyang Xue, and Thomas S. Huang, “Towards Instance-Level Image-To-Image Translation,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 3683-3692،. Golnaz Ghiasi, Yin Cui, Aravind Srinivas, Rui Qian, Tsung-Yi Lin, Ekin D. Cubuk, Quoc V. Le, and Barret Zoph, “Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segmentation,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, pp. 2918-2928.

10 Connor Shorten, Taghi M. Khoshgoftaar and Borko Furht, “Text Data Augmentation for Deep Learning,” Journal of Big Data, 2021, . Junghyun Min, R. Thomas McCoy, Dipanjan Das, Emily Pitler, and Tal Linzen, “Syntactic Data Augmentation Increases Robustness to Inference Heuristics,” Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, 2020, pp. 2339-2352.

11 Connor Shorten, Taghi M. Khoshgoftaar, and Borko Furht, “Text Data Augmentation for Deep Learning,” Journal of Big Data, 2021, . Rico Sennrich, Barry Haddow, and Alexandra Birch, “Improving Neural Machine Translation Models with Monolingual Data,” Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, 2016, pp. 86-96.

12 Connor Shorten, Taghi M. Khoshgoftaar, and Borko Furht, “Text Data Augmentation for Deep Learning,” Journal of Big Data, 2021. Lichao Sun, Congying Xia, Wenpeng Yin, Tingting Liang, Philip Yu, and Lifang He, “Mixup-Transformer: Dynamic Data Augmentation for NLP Tasks,” Proceedings of the 28th International Conference on Computational Linguistics, 2020. Hongyu Guo, Yongyi Mao, and Richong Zhang, “Augmenting Data with Mixup for Sentence Classification: An Empirical Study,” 2019.

13 Suorong Yang, Weikang Xiao, Mengchen Zhang, Suhan Guo, Jian Zhao, and Furao Shen, “Image Data Augmentation for Deep Learning: A Survey,” 2023. Alhassan Mumuni and Fuseini Mumuni, “Data augmentation: A comprehensive survey of modern approaches,” Array, Vol. 16, 2022. Evgin Goveri, “Medical image data augmentation: techniques, comparisons and interpretations,” Artificial Intelligence Review, Vol. 56, 2023, pp. 12561-12605.

14 Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan, and Quoc V. Le, “AutoAugment: Learning Augmentation Strategies From Data,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 113-123.

15 Barret Zoph, Ekin D. Cubuk, Golnaz Ghiasi, Tsung-Yi Lin, Jonathon Shlens, and Quoc V. Le, “Learning Data Augmentation Strategies for Object Detection,” Proceedings of the 16th European Conference on Computer Vision, 2020.

16 Sandareka Wickramanayake, Wynne Hsu, and Mong Li Lee, “Explanation-based Data Augmentation for Image Classification,” Advances in Neural Information Processing Systems, Vol. 34, 2021.

17 rishna Chaitanya, Neerav Karani, Christian F. Baumgartner, Anton Becker, Olivio Donati, and Ender Konukoglu, “Semi-supervised and Task-Driven Data Augmentation,” Proceedings of the 26th International Conference on Information Processing in Medical Imaging, 2019.

18 Cédric Rommel, Thomas Moreau, Joseph Paillard, and Alexandre Gramfort, “ADDA: Class-wise Automatic Differentiable Data Augmentation for EEG Signals,” International Conference on Learning Representations, 2022.

19 Maayan Frid-Adar, Idit Diamant, Eyal Klang, Michal Amitai, Jacob Goldberger, and Hayit Greenspan, “GAN-based synthetic medical image augmentation for increased CNN performance in liver lesion classification,” Neurocomputing, 2018, pp. 321-331.

20 Veit Sandfort, Ke Yan, Perry Pickhardt, and Ronald Summers, “Data augmentation using generative adversarial networks (CycleGAN) to improve generalizability in CT segmentation tasks,” Scientific Reports, 2019.

21 Kang Min Yoo, Dongju Park, Jaewook Kang, Sang-Woo Lee, and Woomyoung Park, “GPT3Mix: Leveraging Large-scale Language Models for Text Augmentation,” Findings of the Association for Computational Linguistics: EMNLP 2021, pp. 2225-2239. Haixing Dai, Zhengliang Liu, Wenxiong Liao, Xiaoke Huang, Yihan Cao, Zihao Wu, Lin Zhao, Shaochen Xu, Wei Liu, Ninghao Liu, Sheng Li, Dajiang Zhu, Hongmin Cai, Lichao Sun, Quanzheng Li, Dinggang Shen, Tianming Liu, and Xiang Li, “AugGPT: Leveraging ChatGPT for Text Data Augmentation,” 2023.

22 Bram Vanherle, Steven Moonen, Frank Van Reeth, and Nick Michiels, “Analysis of Training Object Detection Models with Synthetic Data,” 33rd British Machine Vision Conference, 2022. Martin Georg Ljungqvist, Otto Nordander, Markus Skans, Arvid Mildner, Tony Liu, and Pierre Nugues, “Object Detector Differences When Using Synthetic and Real Training Data,” SN Computer Science, Vol. 4, 2023. Lei Kang, Marcal Rusinol, Alicia Fornes, Pau Riba, and Mauricio Villegas, “Unsupervised Writer Adaptation for Synthetic-to-Real Handwritten Word Recognition,” Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2020, pp. 3502-3511.