عناصر مشابهة

I-Arabic: Computational Attempts and Corpus Issues in Modern Arabic

تفصيل البيانات البيبلوغرافية
العنوان بلغة أخرى:العربية في عصر التكنولوجيا: مقاربات حاسوبية وإشكاليات المتون في اللغة العربية الحديثة
المصدر:مجلة جامعة مصر للدراسات الإنسانية
الناشر: جامعة مصر للعلوم والتكنولوجيا
المؤلف الرئيسي: Younis, Nagwa Ibrahim (مؤلف)
المجلد/العدد:مج3, ع3
محكمة:نعم
الدولة:مصر
التاريخ الميلادي:2023
الصفحات:301 - 325
ISSN:2735-5861
رقم MD:1391355
نوع المحتوى: بحوث ومقالات
اللغة:English
قواعد المعلومات:HumanIndex
مواضيع:
رابط المحتوى:
LEADER 05029nam a22002297a 4500
001 2141651
041 |a eng 
044 |b مصر 
100 |a Younis, Nagwa Ibrahim  |e Author  |9 343025 
245 |a I-Arabic:   |b Computational Attempts and Corpus Issues in Modern Arabic 
246 |a العربية في عصر التكنولوجيا:  |b مقاربات حاسوبية وإشكاليات المتون في اللغة العربية الحديثة 
260 |b جامعة مصر للعلوم والتكنولوجيا  |c 2023  |g يوليو 
300 |a 301 - 325 
336 |a بحوث ومقالات  |b Article 
520 |a تواجه اللغة العربية الحديثة العديد من التحديات المتعلقة باستخدام الأساليب القائمة على الكمبيوتر لتحليل البيانات العربية. تشمل هذه الأساليب معالجة اللغة الطبيعية، والتعلم الآلي، ولغويات المتن، من بين أمور أخرى. تتناول هذه الورقة البحثية التحديات والمحاولات الحاسوبية والنموذج المقترح: I-Arabic... أحد التحديات الرئيسية في استخدام الأساليب الحاسوبية للغة العربية هو الافتقار إلى موارد لغوية كبيرة وعالية الجودة، مثل: متن النصوص، والبيانات المشروحة والموارد المعجمية. ويرجع ذلك إلى عوامل مختلفة، بما في ذلك تنوع اللهجات العربية، ومحدودية توافر النصوص العربية الرقمية. والتحدي الآخر هو تعقيد الصرف العربي وبناء الجملة، والذي يمكن أن يشكل صعوبات الخوارزميات معالجة اللغة الطبيعية. تعتبر اللغة العربية لغةً شديدة التصريف، مع نظام غني من السوابق واللواحق، وتغييرات حروف العلة الداخلية التي يمكن أن تؤثر على معنى الكلمات ووظيفتها. بالإضافة إلى ذلك، تتمتع اللغة العربية بترتيب كلمات مرن، ونظام معقد من الاتفاق النحوي. وعلى الرغم من هذه التحديات، كانت هناك جهود كبيرة لتطوير الأدوات والموارد الحاسوبية للغة العربية، بما في ذلك إنشاء مجموعة اللغة العربية، وتطوير خوارزميات معالجة اللغة الطبيعية المصممة خصيصا للغة العربية. هذه الجهود لديها القدرة على تسهيل البحث في مختلف المجالات، بما في ذلك اللغويات وتحليل وسائل التواصل الاجتماعي والترجمة الآلية.   |b Modern Arabic encounters many challenges concerning the use of computer-based methods for analyzing Arabic data. These methods include natural language processing, machine learning, and corpus linguistics, among others. This paper addresses the challenges, the computational attempts, and a proposed model: I-Arabic. One of the main challenges in using computational methods for Arabic is the lack of large, high-quality language resources, such as text corpora, annotated data, and lexical resources. This is due to various factors, including the diversity of Arabic dialects and the limited availability of digitized Arabic texts. Another challenge is the complexity of Arabic morphology and syntax, which can pose difficulties for natural language processing algorithms. Arabic is a highly inflected language, with a rich system of prefixes, suffixes, and internal vowel changes that can affect the meaning and function of words. Additionally, Arabic has a flexible word order and a complex system of grammatical agreement. Despite these challenges, there have been significant efforts to develop computational tools and resources for Arabic, including the creation of Arabic language corpora and the development of natural language processing algorithms specifically tailored to Arabic. These efforts have the potential to facilitate research in various fields, including linguistics, social media analysis, and machine translation. 
653 |a وسائل التواصل الاجتماعي  |a النصوص الرقمية  |a النصوص العربية  |a الترجمة الآلية 
692 |a اللغة العربية الحديثة  |a محاولات حاسوبية  |a المتون العربية  |b Modern Arabic  |b Computational Attempts  |b Arabic Corpus  |b I-Arabic 
773 |4 العلوم الإنسانية ، متعددة التخصصات  |6 Humanities, Multidisciplinary  |c 008  |f Maǧallaẗ Ǧāmiʿaẗ Miṣr Lil Dirāsāt Al-Insāniyyaẗ  |l 003  |m مج3, ع3  |o 2337  |s مجلة جامعة مصر للدراسات الإنسانية  |v 003  |x 2735-5861 
856 |u 2337-003-003-008.pdf 
930 |d y  |p y  |q n 
995 |a HumanIndex 
999 |c 1391355  |d 1391355