عناصر مشابهة

Comparison between Similarity Measurments of Vector Space Model on Arabic Text

تفصيل البيانات البيبلوغرافية
المصدر:مجلة المنارة للبحوث والدراسات
الناشر: جامعة آل البيت - عمادة البحث العلمي
المؤلف الرئيسي: Kanaan, Ghassan (مؤلف)
مؤلفين آخرين: Hanandedh, Essam (م. مشارك)
المجلد/العدد:مج 16, ع 3
محكمة:نعم
الدولة:الأردن
التاريخ الميلادي:2010
الصفحات:73 - 85
DOI:10.33985/0531-016-003-006
ISSN:1026-6844
رقم MD:347608
نوع المحتوى: بحوث ومقالات
قواعد المعلومات:AraBase
EduSearch
EcoLink
HumanIndex
IslamicInfo
مواضيع:
رابط المحتوى:
الوصف
المستخلص:في هذا البحث قمنا باختيار ملخصات من 242 وثيقة باللغة العربية وهذه الملخصات كانت متخصصة في علمي الحاسوب ونظم المعلومات، لقد قمنا ببناء نظـام اسـترجاع لمعالجة البيانات باللغة العربية، وتم تطبيق تقنية الفهرسة التلقائية على الوثائق العربيـة، بحيث تم بناء النظام باستخدام نمـوذج المتجهـات الموجهـةVector Space model) ) باستخدام أربعة أصناف استخدمت حساب درجة التشابه بين الاستعلام والوثيقـة وتمـت مقارنة النتائج لهذه الأصناف من المتجهات، وكانت النتيجة إن صنف الاحتمـال أظهـر أفضلية في عملية الاسترجاع مقارنة مع باقي أنواع المتجهات.

This paper has selected 242 Arabic abstract documents which were used by (Hmeidi & Kanaan, 1997). All these abstracts are about computer science and information systems. We also designed and built an automatic information retrieval system from scratch to handle Arabic data. The system was implemented in C# NET language, and Runs on IBM/PCs and compatible microcomputer. An automatic indexing technique has been implemented for this corpus. The system was built using Vector Space Model (VSM), In this model all mesurments were taken. Cosine measure, Dice measure, Jaccard measure, Dice measure, Jaccard measure, and Inner product similarity were used. The retrieval results using. at the retrieval result is better than the retrieval result for in Arabic documents.

وصف العنصر:ملخص لبحث منشور باللغة الإنجليزية