مقاربة جديدة لقياس التشابه الدلالي للجمل العربية

تفصيل البيانات البيبلوغرافية
العنوان بلغة أخرى:	A Novel Approach for the Measurement of the Semantic Similarity of Arabic Sentences
المصدر:	مجلة العلوم والتكنولوجيا
الناشر:	المجلس الأعلى للغة العربية
المؤلف الرئيسي:	زواوي، سامية (مؤلف)
مؤلفين آخرين:	رزاق، خالد (م. مشارك), كزار، عقبة (م. مشارك)
المجلد/العدد:	ع2
محكمة:	نعم
الدولة:	الجزائر
التاريخ الميلادي:	2020
الصفحات:	11 - 32
ISSN:	2716-7674
رقم MD:	1255325
نوع المحتوى:	بحوث ومقالات
اللغة:	Arabic
قواعد المعلومات:	AraBase HumanIndex
مواضيع:	الدلالات اللغوية \| اللغة العربية \| الجمل العربية \| النحو العربي
رابط المحتوى:	PDF (صورة)

صورة الغلاف

QR قانون

الوصف
المستخلص:	إن قياس التشابه الدلالي له أهمية كبيرة في مجال معالجة اللغة الطبيعية. حيث يسمح بحساب التشابه بين المصطلحات المختلفة من أجل إجراء التقريبات. تستخدم العديد من عمليات البحث الأخيرة تقنيات الويب والدلالات اللغوية لإيجاد درجة التشابه بين مصطلحين من خلال مطابقة المعنى والعلاقات بينهما. لكن معظم مقاييس التشابه الموجودة حاليا تعاني من تدهور دقة الحساب بسبب الاختلاف في البنية النحوية والدلالية للجملتين المراد مقارنتهما. نقدم في هذه الورقة مقاربة جديدة لقياس التشابه الدلالي بين الجمل العربية. لقد درسنا بعض الطرق الموجودة لقياس التشابه، ثم طبقنا عملية توسع جديدة، تعتمد على المعلومات الدلالية المستخرجة من الأنطولوجيا العربية (Arabic Ontology). لقد تم التأكد من أداء النهج المقترح من خلال حساب ارتباط بيرسون (Pearson correlation) بين القيم المحسوبة والأحكام البشرية. وقمنا بتقييمه على مجموعات البيانات المرجعية لـSemEval-2017 و STS للجمل العربية. وبناء على نتائجنا التجريبية المتحصل عليها، فإن عملية التوسع باستخدام الأنطولوجيا العربية، أعطت تحسنا كبيرا من حيث دقة التشابه مقارنة بالطرق الموجودة في نفس المجال. The measure of semantic similarity is of great interest in the field of natural language processing. It allows calculating the similarity between different terms in order to perform estimations. Several recent searches use semantic web and ontology technologies to find the degree of similarity between two terms by matching the meaning and relationships between them. Most of the existing similarity measures suffer from calculation accuracy degradation due to the difference in the grammatical and semantic structure of the two sentences to be compared. In this paper, we introduce a novel approach for the measurement of semantic similarity between Arabic sentences. We examined some existing methods of measuring similarity. Then, we apply a new expansion process that is guided by the semantics information extracted from an Arabic ontology. The performance of the proposed approach is confirmed through the Pearson correlation between the calculated scores and human judgments. We evaluate our approach on SemEval-2017 and STS benchmark datasets for Arabic sentences. Based on our experimental results, the expansion process, using Arabic ontology, gives a significant improvement in terms of similarity accuracy compared to existing methods in the area.