عناصر مشابهة

التشابه والاختلاف في الوحدات المعجمية بين عربية التراث والعربية المعاصرة

تفصيل البيانات البيبلوغرافية
المصدر:مجلة اللسانيات العربية
الناشر: مجمع الملك سلمان العالمي للغة العربية
المؤلف الرئيسي: التميمي، أفراح بنت عبدالعزيز (مؤلف)
المجلد/العدد:ع14
محكمة:نعم
الدولة:السعودية
التاريخ الميلادي:2022
التاريخ الهجري:1443
الصفحات:81 - 98
DOI:10.60161/1482-000-014-005
ISSN:1658-7421
رقم MD:1254579
نوع المحتوى: بحوث ومقالات
اللغة:Arabic
قواعد المعلومات:Open
AraBase
مواضيع:
رابط المحتوى:
الوصف
المستخلص:تتنزل هذه الورقة في مجال معالجة اللغات الطبيعية، وتطبق منهج التجميع الذي يعد منهجا في تعلم الآلة غير الموجه، والمستفاد منه أيضا في تعلم الآلة الموجه لتحسين جودة التصنيف. وأكشف فيها عن التشابه والاختلاف في الوحدات المعجمية بين العربية التراثية، والعربية المعاصرة. وتجيب هذه الورقة عن السؤال الآتي: هل ثمة تشابه معجمي في الوحدات المعجمية بين العربيتين التراثية والمعاصرة؟ وقد اعتمدت في ذلك على مدونتين جمعتهما، مثلت الأولى العربية التراثية، فيما مثلت الثانية العربية المعاصرة. وقد حسبت بعدي التشابه والاختلاف باستعمال خوارزمية جاكارد. وكشفت النتائج عن حجم الاختلاف الكبير في الوحدات المعجمية بين العربيتين، وعن تشاركهما وتشابههما بدرجة قدرها 0.31، مما يعني النمو المعجمي الهائل من جانب العربية المعاصرة.

Similarity and dissimilarity in the lexical units between heritage and contemporary Arabic This paper belongs to the field of NLP and applies the clustering method. The latter is based on unsupervised ML, which improves supervised ML in terms of classification systems. I revealed the similarity and dissimilarity between heritage and contemporary Arabic at the level of lexical units. This paper answers the following question. Is there a lexical similarity in the lexical units between the heritage and the contemporary Arabic? I relied on two collected corpora. The former represented heritage Arabic while the latter represented contemporary Arabic. I calculate the similarity and dissimilarity adopting Jaccard algorithm. The results showed the similarity between the two corpora with the score of 0.31. This indicates that there was a significant growth in the contemporary lexicon.