عناصر مشابهة

المصادر الصريحة المميزة في العربية: دراسة لغوية حاسوبية

تفصيل البيانات البيبلوغرافية
العنوان بلغة أخرى:Gerundivization in Arabic: A Computational Linguistic Study
المصدر:مجلة الآداب
الناشر: جامعة الملك سعود - كلية الآداب
المؤلف الرئيسي: التميمي، أفراح بنت عبدالعزيز (مؤلف)
المجلد/العدد:مج34, ع1
محكمة:نعم
الدولة:السعودية
التاريخ الميلادي:2021
التاريخ الهجري:1443
الصفحات:45 - 58
DOI:10.33948/1300-034-001-003
ISSN:1018-3612
رقم MD:1296525
نوع المحتوى: بحوث ومقالات
اللغة:Arabic
قواعد المعلومات:AraBase
مواضيع:
رابط المحتوى:
الوصف
المستخلص:تستهدف هذه الورقة استخلاص المصادر الصريحة المميزة بأنواعها من العربية التراثية والعربية المعاصرة باستعمال إحدى خوارزميات تعلم الآلة غير الموجه، وهي خوارزمية الاستخلاص الآلي السريع للكلمات المميزة RAKE، ثم تنظر فيما تتميز به المصادر المميزة في العربية التراثية عن المصادر المميزة في العربية المعاصرة انطلاقا من أطوالها، مفترضة نمو طول المصدر في العربية المعاصرة. وقد استخلصت أولا جميع الكلمات المميزة في كل من العربية التراثية والعربية المعاصرة، وحذف ما اشتركت به العربيتين من كلمات مميزة، ثم جذعت بقية الكلمات المميزة بالاستعانة بمقطع آلي، وفصلت المصادر عن بقية الكلمات باستعمال محلل نحوي. وفي المرحلة الأخيرة صنفت المصادر المميزة حسب أطوال حروفها؛ للوقوف على ما يميز كل عربية عن الأخرى في المصادر. وقد أظهرت قائمتا المصادر المميزة اختلافا واضحا تجلى في زيادة متوسط طول الكلمة في المصادر المميزة في العربية المعاصرة، الذي فسر بحدوث تطورات اجتماعية في تلك الفترة تستدعي زيادات في الكلمات تكون عادة إلصاقيه؛ لعدم قدرة المصادر ذات الأطوال القصيرة على التعبير عن المفاهيم المستحدثة.

This paper aims to extract keywords classed as gerunds from the heritage and contemporary Arabic language. The Rapid Automatic Keyword Extraction algorithm (RAKE algorithm), which is based on automated machine learning, was used for such purpose in Python. It then considers what distinguishes the gerund-classed keywords in heritage Arabic from the gerund-classed keywords in contemporary Arabic based on the gerund lengths, assuming the growth of gerund lengths in contemporary Arabic. I first extracted all keywords from the heritage and contemporary Arabic language. The keywords intersected between the two eras were removed. Afterwards, I tokenized and tagged keywords using a part of speech tagger to define gerunds. Finally, I categorized the gerund-classed according to the character length. This was to show what distinguishes gerund-classed keywords in heritage Arabic from gerund-classed keywords in contemporary Arabic. The two gerund-classed keyword lists showed that word length average increased in the contemporary gerund-classed keywords, due to social developments that generated new concepts developed and formulated by new suffixes. Also, short gerund-classed keywords cannot express the new concepts.