عناصر مشابهة
مقاربة جديدة لقياس التشابه الدلالي للجمل العربية
العنوان بلغة أخرى: | A Novel Approach for the Measurement of the Semantic Similarity of Arabic Sentences |
---|---|
المصدر: | مجلة العلوم والتكنولوجيا |
الناشر: |
المجلس الأعلى للغة العربية
|
المؤلف الرئيسي: | |
مؤلفين آخرين: | , |
المجلد/العدد: | ع2 |
محكمة: | نعم |
الدولة: | الجزائر |
التاريخ الميلادي: | 2020 |
الصفحات: | 11 - 32 |
ISSN: | 2716-7674 |
رقم MD: | 1255325 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | Arabic |
قواعد المعلومات: | AraBase HumanIndex |
مواضيع: | |
رابط المحتوى: |
|
المستخلص: | إن قياس التشابه الدلالي له أهمية كبيرة في مجال معالجة اللغة الطبيعية. حيث يسمح بحساب التشابه بين المصطلحات المختلفة من أجل إجراء التقريبات. تستخدم العديد من عمليات البحث الأخيرة تقنيات الويب والدلالات اللغوية لإيجاد درجة التشابه بين مصطلحين من خلال مطابقة المعنى والعلاقات بينهما. لكن معظم مقاييس التشابه الموجودة حاليا تعاني من تدهور دقة الحساب بسبب الاختلاف في البنية النحوية والدلالية للجملتين المراد مقارنتهما. نقدم في هذه الورقة مقاربة جديدة لقياس التشابه الدلالي بين الجمل العربية. لقد درسنا بعض الطرق الموجودة لقياس التشابه، ثم طبقنا عملية توسع جديدة، تعتمد على المعلومات الدلالية المستخرجة من الأنطولوجيا العربية (Arabic Ontology). لقد تم التأكد من أداء النهج المقترح من خلال حساب ارتباط بيرسون (Pearson correlation) بين القيم المحسوبة والأحكام البشرية. وقمنا بتقييمه على مجموعات البيانات المرجعية لـSemEval-2017 و STS للجمل العربية. وبناء على نتائجنا التجريبية المتحصل عليها، فإن عملية التوسع باستخدام الأنطولوجيا العربية، أعطت تحسنا كبيرا من حيث دقة التشابه مقارنة بالطرق الموجودة في نفس المجال. The measure of semantic similarity is of great interest in the field of natural language processing. It allows calculating the similarity between different terms in order to perform estimations. Several recent searches use semantic web and ontology technologies to find the degree of similarity between two terms by matching the meaning and relationships between them. Most of the existing similarity measures suffer from calculation accuracy degradation due to the difference in the grammatical and semantic structure of the two sentences to be compared. In this paper, we introduce a novel approach for the measurement of semantic similarity between Arabic sentences. We examined some existing methods of measuring similarity. Then, we apply a new expansion process that is guided by the semantics information extracted from an Arabic ontology. The performance of the proposed approach is confirmed through the Pearson correlation between the calculated scores and human judgments. We evaluate our approach on SemEval-2017 and STS benchmark datasets for Arabic sentences. Based on our experimental results, the expansion process, using Arabic ontology, gives a significant improvement in terms of similarity accuracy compared to existing methods in the area. |
---|