عناصر مشابهة

التحقيق النظري للنماذج في خوارزمية تخفيض الأبعاد متعددة العوامل المعممة للأنماط الظاهرية الترتيبية

تفصيل البيانات البيبلوغرافية
العنوان بلغة أخرى:Theory-Based Model Validation in the Generalized Multifactor Dimensionality Reduction Algorithm for Ordinal Phenotypes
المصدر:المجلة العراقية للعلوم الإحصائية
الناشر: جامعة الموصل - كلية علوم الحاسوب والرياضيات
المؤلف الرئيسي: عثمان، محمد إبراهيم (مؤلف)
مؤلفين آخرين: الخالدى، زيد طارق صالح عباوى (م. مشارك)
المجلد/العدد:مج20, ع2
محكمة:نعم
الدولة:العراق
التاريخ الميلادي:2023
الصفحات:212 - 224
ISSN:1680-855X
رقم MD:1445537
نوع المحتوى: بحوث ومقالات
اللغة:Arabic
قواعد المعلومات:EcoLink
مواضيع:
رابط المحتوى:
LEADER 07687nam a22002417a 4500
001 2191498
041 |a ara 
044 |b العراق 
100 |9 766182  |a عثمان، محمد إبراهيم  |e مؤلف  |g Othman, Mohammed Ibraheem 
245 |a التحقيق النظري للنماذج في خوارزمية تخفيض الأبعاد متعددة العوامل المعممة للأنماط الظاهرية الترتيبية 
246 |a Theory-Based Model Validation in the Generalized Multifactor Dimensionality Reduction Algorithm for Ordinal Phenotypes 
260 |b جامعة الموصل - كلية علوم الحاسوب والرياضيات  |c 2023  |g ديسمبر 
300 |a 212 - 224 
336 |a بحوث ومقالات  |b Article 
520 |a تشير الدراسات السريرية إلى العلاقة الوثيقة بين بعض الأمراض ووجود تداخلات محددة بين العوامل الجينية وكما هو الحال في كثير من الدراسات، فإن كشف التداخلات الجينية ذات التأثير الكبير على ظهور الأمراض الوراثية يحتاج إلى تحليلات إحصائية مستفيضة. وبسبب الحجم الهائل للبيانات الجينية في الجنس البشري، فكان لا بد من تطوير طرق إحصائية مكيفة للتعامل مع البيانات الأبعاد العالية. تعد خوارزمية تخفيض الأبعاد متعددة العوامل Multifactor Dimensionality Reduction (MDR) أحد الخوارزميات اللامعلمية الرائدة في هذا المجال. حيث تعمل الخوارزمية على تخفيض أبعاد البيانات الجينية للحصول على أهم تداخل ذات تأثير مباشر على زيادة احتمالية ظهور الأمراض الوراثية. وتعتمد الخوارزمية في تكوينها على مجموعة من الإجراءات اللامعلمية لتشخيص التداخل الجيني الأعلى تأثيرا على متغيرات الاستجابة الثنائية حصرا. وكأي طريقة إحصائية، فإن هذه الخوارزمية لا تخلو من نقاط الضعف والمحددات التطبيقية، لذا كان لا بد من تطوير الخوارزمية لتجاوز المعوقات. أحد نقاط الضعف في هذه الخوارزمية هي عدم إمكانية الخوارزمية من التعامل مع البيانات التي تحتوي على متغير استجابة من النوع الترتيبي. طور بعض الباحثين تعميما لخوارزمية تخفيض الأبعاد متعددة العوامل لتمكينها من العامل مع البيانات الترتيبي. مع ذلك فإن الخوارزمية المعممة أكثر تعقيدا من الخوارزمية الأصلية. لذلك اقترحنا تطوير الخوارزمية المعممة تطويرا بسيطا وذلك بتوظيف الانحدار اللوجستي الترتيبي في تصنيف الأفراد في العينة، مع الإبقاء على جميع خطوات الخوارزمية الأصلية دون تغيير. ومن ناحية أخرى، فإن خوارزمية MDR تعتمد أسلوبا لا معلميا للتحقق من معنوية التداخلات المرشحة في الخوارزمية. وينبني هذا الإجراء اللامعلمي على فكرة الاختبارات التبادلية، وهو يستهلك وقتا زمنيا طويلا جدا مقارنة بالإجراءات المعلمية المعتمدة على الأساليب النظرية. اقترح بعض الباحثين استخدام توزيع القيمة المتطرفة المعمم للتحقق من المعنوية الإحصائية للتداخلات المرشحة، لكن لم يرد استخدام هذا الأسلوب إلا مع المتغيرات المعتمدة المستمرة والثنائية. تم في هذا البحث توظيف الأسلوب النظري المعتمد على توزيع القيمة المتطرفة المعمم بدلا من الاختبارات التبادلية المعتمدة في الخوارزمية وذلك عندما يكون متغير الاستجابة من النوع الترتيبي.  |b Clinical studies indicate a close relationship between some diseases and the presence of specific interactions between genetic factors. As is the case in many studies, revealing genetic interactions that have a significant impact on the emergence of genetic diseases requires extensive statistical analyses. Because of the enormous volume of genetic data in the human race, it was necessary to develop statistical methods adapted to deal with high-dimensional data. Multifactor Dimensionality Reduction (MDR) is one of the leading nonparametric algorithms in this field. The algorithm reduces the dimensions of genetic data to obtain the most important interaction that has a direct impact on increasing the likelihood of genetic diseases appearing. In its composition, the algorithm relies on a set of nonparametric procedures to diagnose genetic interference with the highest impact exclusively on binary response variables. Like any statistical method, this algorithm is not devoid of weaknesses and application limitations, so the algorithm had to be developed to overcome the obstacles. One of the weaknesses of this algorithm is that the algorithm cannot handle data sets with ordinal response variable. Some researchers have developed a generalization of the multifactor dimensionality reduction algorithm to enable it to work with ordinal data. However, the generalized algorithm is more complex than the original algorithm. Therefore, we proposed developing the original algorithm in a simple way by employing ordinal logistic regression to classify individuals in the sample, while keeping all steps of the original algorithm unchanged. On the other hand, the MDR algorithm adopts a non-parametric method to verify the significance of the interferences nominated in the algorithm. This nonparametric procedure is based on the idea of permutational tests, and it consumes a very long time compared to parametric procedures that relies on theoretical approaches. Some researchers have suggested using the generalized extreme value distribution to verify the statistical significance of candidate interactions, but this method has only been used with continuous and binary dependent variables. In this research, the theoretical method based on the generalized extreme value distribution was employed instead of the permutational tests adopted in the algorithm when the response variable is of the ordinal type. 
653 |a الأمراض الوراثية  |a العوامل الجينية  |a الخوارزميات الإحصائية 
692 |a خوارزمية تخفيض الأبعاد  |a الانحدار اللوجستي الترتيبي  |a التداخلات الجينية  |a الأنماط الظاهرية  |b Dimensionality Reduction Algorithm  |b Ordinal Logistic Regression  |b Genetic Interactions  |b Phenotypes 
700 |9 100854  |a الخالدى، زيد طارق صالح عباوى  |e م. مشارك  |g Al-Khaledi, Zaid Tariq Saleh  
773 |4 الاقتصاد  |6 Economics  |c 017  |e Iraqi Journal of Statistical Science  |f Al-maǧallaẗ al-ʻirāqiyyaẗ li-l-ʻulūm al-iḥsāʼiyyaẗ  |l 002  |m مج20, ع2  |o 1147  |s المجلة العراقية للعلوم الإحصائية  |v 020  |x 1680-855X 
856 |u 1147-020-002-017.pdf 
930 |d n  |p y  |q n 
995 |a EcoLink 
999 |c 1445537  |d 1445537