تقييم أثر اختلاف نموذج التمثيل النصي على أداء أنظمة وصف الصور

المؤلفون

  • جعفر الخير
  • سامر سليمان
  • رشا معلا

الكلمات المفتاحية:

التعلم العميق، معالجة اللغات الطبيعية، التمثيل الصوري، التمثيل النصي، نموذج FastText، نموذج GloVe.

الملخص

        يناقش البحث الحالي أحد أهم وأحدث المواضيع في مجال تعلم الآلة عموماً والتعلم العميق خصوصاً وهو أنظمة وصف الصور. تم في هذا البحث بناء نظام لوصف الصور يعتمد على النموذج ResNet50 وهو نموذج تعلم عميق مدرب مبني على أساس الشبكات العصبية الالتفافية CNN والذي يولد أشعة سمات التمثيل الصوري. أما في التمثيل النصي فقد اعتمدت خمس نماذج وصف مختلفة تعتمد بالأساس على نموذجي GloVe و FastText المقدمين من قبل تويتر وفيسبوك بالترتيب، حيث تم دراسة تأثير اختلاف معاجم المفردات على أداء نظام الوصف المقترح. استخدمت مجموعة بيانات MS-COCO العالمية حيث أخذت مجموعة جزئية منها مؤلفة من 10000 صورة، بحيث خصص 9000 صورة منها لمجموعة التدريب Training والتحقق Validation، أما لعملية الاختبار فقد تم اختيار 1000 صورة من مجموعة البيانات مختلفة عن صور التدريب والتحقق ، وتم تطبيق الاختبارات على النماذج الخمسة المصممة.

        لمعرفة دقة الوصف الناتج عن النماذج المقترحة ومدى درجة تطابق جمل الوصف الفعلية مع جمل الوصف الناتجة، تم استخدام قياسات الأداء التالية Top-1, Top-5, Average of Depth Similarity , Accuracy، BLEU. بينت النتائج العملية تفوق الأنظمة المعتمدة على نماذج FastText على الرغم من أنها تستغرق زمناً أطول من نماذج GloVe.

 

 

التنزيلات

منشور

2020-10-01

كيفية الاقتباس

1.
الخير ج, سليمان س, معلا ر. تقييم أثر اختلاف نموذج التمثيل النصي على أداء أنظمة وصف الصور. Tuj-eng [انترنت]. 1 أكتوبر، 2020 [وثق 19 مايو، 2024];42(4). موجود في: https://journal.tishreen.edu.sy/index.php/engscnc/article/view/9915