عناصر مشابهة

Automatic Multi-Dialect Analysis of Arabic

تفصيل البيانات البيبلوغرافية
المصدر:مجلة التواصل اللساني
الناشر: مؤسسة العرفان للإستشارات التربوية والتطوير المهني
المؤلف الرئيسي: Lee, Mark (مؤلف)
مؤلفين آخرين: Al Meman, Khalid (Advisor)
المجلد/العدد:مج16, ملحق
محكمة:نعم
الدولة:المغرب
التاريخ الميلادي:2014
الصفحات:95 - 108
ISSN:0851-6774
رقم MD:597022
نوع المحتوى: بحوث ومقالات
اللغة:English
قواعد المعلومات:AraBase
مواضيع:
رابط المحتوى:
الوصف
المستخلص:In this paper we address the problem of the analysis of multi-dialect Arabic morphology. Our method involves the synthesis of two methods. The first method is linguistic, using an adopted Modern Standard Arabic (MSA) Morphology Analyser to first deal with dialect prefixes and suffixes and then analyse remaining word fragment. This method improves accuracy of dialect words by 69%. The second method involves segmenting the word and using ‘the web as corpus' to estimate the frequency of different segment combinations which then are used to guess the correct base form. The overall synthesis is shown to have 94% accuracy on a corpus of Arabic dialects.