عناصر مشابهة

Sentences Ordering Approach for Multi-Document Summarization in Domain Specific Text Documen

تفصيل البيانات البيبلوغرافية
العنوان بلغة أخرى:تلخيص الوثائق المتعددة وترتيب الجمل في مجال نصوص الوثائق
الناشر: عمان
المؤلف الرئيسي: Al Nuaimy, Hamid Ali (مؤلف)
مؤلفين آخرين: Al Mashaikhi, Akram Othman (Advisor)
التاريخ الميلادي:2016
الصفحات:1 - 95
رقم MD:788655
نوع المحتوى: رسائل جامعية
اللغة:English
قواعد المعلومات:Dissertations
الدرجة العلمية:رسالة ماجستير
الجامعة:جامعة عمان العربية
الكلية:كلية العلوم الحاسوبية والمعلوماتية
مواضيع:
رابط المحتوى:
الوصف
المستخلص:في هذه الرسالة نستخدم ثلاث تقنيات لتوليد الملخصات. الأول هو استخدام(TF-IDF) لحساب درجة أهمية الجملة بالاعتماد على مقياس التشابه ((cosine similarity لاختيار الجمل الأكثر أهمية في الوثائق. Stack decoder يستخدم كنموذج لبناء عمليات التلخيص. الثاني هو عملية تجميع البيانات باستخدام خوارزمية ) k means clustering) واختيار التمثيل الأكبر من الجمل في هذه المرحلة. الثالث هو بناء ال graph formulation with threshold =0.5 بالاعتماد على (clique problem ) يستخدم ال graph لبناء الارتباطات بين الجمل المتماثلة. بالإضافة إلى ذلك نستخدم ال linear function, sigmoid function لحساب القيم الافتراضية والحصول على درجة أهمية للجمل. يستخدم النظام لتوليد الملخصات 100 كلمة أو اكثر بالاعتماد على ال constant وذلك من مجموعة البيانات DUC 2004 .