عناصر مشابهة

الفهرسة الدلالية الكامنة وتخصيص دركليه الكامن لنمذجة موضوعات الشعر العربي عبر العصور

تفصيل البيانات البيبلوغرافية
المصدر:مجلة اللسانيات العربية
الناشر: مجمع الملك سلمان العالمي للغة العربية
المؤلف الرئيسي: المجبول، سلطان بن ناصر (مؤلف)
المجلد/العدد:ع14
محكمة:نعم
الدولة:السعودية
التاريخ الميلادي:2022
التاريخ الهجري:1443
الصفحات:57 - 80
DOI:10.60161/1482-000-014-004
ISSN:1658-7421
رقم MD:1254572
نوع المحتوى: بحوث ومقالات
اللغة:Arabic
قواعد المعلومات:Open
AraBase
مواضيع:
رابط المحتوى:
LEADER 03505nam a22002417a 4500
001 2005615
024 |3 10.60161/1482-000-014-004 
041 |a ara 
044 |b السعودية 
100 |9 669152  |a المجبول، سلطان بن ناصر  |e مؤلف  |g Almujaiwel, Sultan 
245 |a الفهرسة الدلالية الكامنة وتخصيص دركليه الكامن لنمذجة موضوعات الشعر العربي عبر العصور 
260 |b مجمع الملك سلمان العالمي للغة العربية  |c 2022  |g يناير  |m 1443 
300 |a 57 - 80 
336 |a بحوث ومقالات  |b Article 
520 |a تستكشف هذه الدراسة أداء خوارزميات نمذجة الموضوعات في معالجة اللغة الطبيعية على النصوص الشعرية العربية. تتوافر هذه النصوص في بيانات مفتوحة المصدر، وتتضمن 58 ألف قصيدة لستمئة وثلاثة وخمسين شاعرا من خمسة عصور: الجاهلي، والإسلامي، والعباسي، والأندلسي، والحديث. استخدمت خوارزمية التحليل الدلالي الكامن، وتخصيص دركليه الكامن غير الأمثل، ثم تخصيص دركليه الكامن بالنموذج الأمثل، وذلك لاستخراج عشرة موضوعات من كل مجموعة من مجموعات البيانات. ظهرت نتائج التفسير غير مرضية في النموذج الأول والنموذج الثاني. أجريت تحسينات في النموذج الثالث بمقياس CV لتحديد درجة التماسك، ونتج منها توليد موضوعات ذات قابلية تفسيرية دقيقة للموضوعات الشعرية.  |b The current paper entitled “Latent Semantic Indexing and Latent Dirichlet Allocation: Topic modeling for Arabic poetry through the ages” explores the performance of topic modeling algorithms in NLP for texts of Arabic poetry. The latter are available as open- source data covering texts from Arabic poetry, including 58,000 poems composed by 653 poets from five periods ranging from the pre-Islamic, the Islamic, the Abbasid and the Andalusian times to the present day. Latent Semantic Indexing, Latent Dirichlet Allocation and Optimizing Latent Dirichlet Allocation were deployed to extract ten topics from each of the data sets. Utilizing the first and the second models has resulted in an unconvincing performance. Improvements were made to the third model using the Cv measure of coherence score, resulting in topics with maximum human-interpretable capacity of the generated poetic topics. 
653 |a الشعر العربي  |a الموضوعات الشعرية  |a نمذجة الموضوعات  |a التحليل الدلالي الكامن  |a الفهرسة الدلالية الكامنة 
692 |a تعلم الآلة  |a نمذجة الموضوعات  |a التحليل الدلالي الكامن  |a تجزئة القيمة المفردة  |a تخصيص دركليه الكامن  |b Machine Learning  |b Topic Modeling  |b Latent Semantic Analysis  |b Singular Value Decomposition  |b Latent Dirichlet Allocation 
773 |4 اللغة واللغويات  |6 Language & Linguistics  |c 004  |f Allisaniyat Alarabiyah  |l 014  |m ع14  |o 1482  |s مجلة اللسانيات العربية  |t Arab linguistics journal  |v 000  |x 1658-7421 
856 |u 1482-000-014-004.pdf 
930 |d y  |p y  |q n 
995 |a Open 
995 |a AraBase 
999 |c 1254572  |d 1254572