عناصر مشابهة

Multi-document Arabic Tex Summarization

تفصيل البيانات البيبلوغرافية
الناشر: غزة
المؤلف الرئيسي: Harazin, Karim S. (مؤلف)
مؤلفين آخرين: Ashour, Wesam M. Z. (Advisor)
التاريخ الميلادي:2015
الصفحات:1 - 71
رقم MD:734949
نوع المحتوى: رسائل جامعية
اللغة:English
قواعد المعلومات:Dissertations
الدرجة العلمية:رسالة ماجستير
الجامعة:الجامعة الإسلامية (غزة)
الكلية:كلية الهندسة
مواضيع:
رابط المحتوى:
الوصف
المستخلص:مع النمو السريع للبيانات على شبكة الأنترنت، أصبح هناك حاجة ملحة لأنظمة التلخيص الآلي للنصوص. الكثير من الأبحاث أجريت على اللغة الإنجليزية وغيرها من اللغات الأوروبية. على الرغم من التطور في الأبحاث، إلا أنه لا يوجد دعم كبير للغة العربية. هذا البحث يعنى بإنشاء نظام تلخيص آلي للنصوص المتعددة المصادر المكتوبة باللغة العربية. إن أكبر التحديات التي تواجه تلخيص النصوص متعددة المصادر هي: إزالة البيانات الزائدة عن الحاجة وإعادة ترتيب الجمل بشكل مقروء. في هذا البحث أيضا، ناقشنا إمكانية استخدام طرق التلخيص الآلي للنصوص من مصدر واحد لتلخيص النصوص متعددة المصادر. بالإضافة إلى ذلك قمنا بعرض نظام تلخيص إلى يعتمد على نظرية البنية البلاغية للمستندات CST. استخدام ال CST يساعد على تحديد العلاقات البلاغية بين الجمل من مختلف المصادر. إن الاختلاف الرئيسي بين النظام المقترح وباقي الأنظمة العريبة المستخدمة للتلخيص الآلي هو استخدام البنية البلاغية للمستندات في استخرج الأجزاء المهمة من النصوص. في عملية تقييم أداء النظام، تم استخدام معيار ROUGE الذي يقيس مدى تشابه نتيجة التلخيص الآلي بالتلخيص اليدوي. تم مقارنة النظام المقترح بعشرة أنظمة أخرى، النظام المقترح الذي يعتمد على البنية البلاغية للمستندات كان من بين أول ثلاثة أنظمة أعطت نتائج جيدة.