عناصر مشابهة
Language modeling of Arabic dialects
المصدر: | وقائع الندوة الدولية : المعالجة الآلية للغة العربية |
---|---|
الناشر: |
معهد الدراسات والأبحاث للتعريب
|
المؤلف الرئيسي: | |
مؤلفين آخرين: | |
محكمة: | نعم |
الدولة: | المغرب |
التاريخ الميلادي: | 2007 |
الصفحات: | 252 - 262 |
رقم MD: | 593921 |
نوع المحتوى: | بحوث المؤتمرات |
اللغة: | English |
قواعد المعلومات: | AraBase |
مواضيع: | |
رابط المحتوى: |
|
المستخلص: | This paper describes several approaches to language modeling of Arabic dialects using Modern Standard Arabic (MSA) data. We build a baseline language model on words and experiment with various techniques of data transformation to account for differences between MSA and Colloquial Arabic. Specifically, we describe three methods of data transformation: morphological simplification (stemming), lexical transductions, and syntactic transformations. We compare the performance of each method with that of the baseline language model. While the best performing model remains the one built using only dialectal data, these techniques allow us to obtain an improvement over the baseline MSA model. |
---|---|
وصف العنصر: | المقال باللغة الانجليزية |