عناصر مشابهة

Using Genetic Algorithm in Outlier Detection for Regression Model

تفصيل البيانات البيبلوغرافية
المصدر:مجلة التربية والعلم
الناشر: جامعة الموصل - كلية التربية
المؤلف الرئيسي: Algamal, Zakariya Yahya (مؤلف)
مؤلفين آخرين: Thabet, Hamsa M. (Co-Author)
المجلد/العدد:مج27, ع3
محكمة:نعم
الدولة:العراق
التاريخ الميلادي:2018
الصفحات:136 - 142
DOI:10.33899/edusj.2018.159314
ISSN:1812-125X
رقم MD:1201596
نوع المحتوى: بحوث ومقالات
اللغة:English
قواعد المعلومات:EduSearch
مواضيع:
رابط المحتوى:
الوصف
المستخلص:Linear regression model is commonly used to analyze data from many fields. Sometimes the data under research contains outliers, and it is important that these outliers be identified in the course of the correct statistical analysis. In this article we used genetic algorithm (GA) with three type of objective functions, Akaike information criterion (AIC), Bayesian information criterion (BIC), and Hannan–Quinn information criterion (HQIC) to detect the problem of masking and swamping outliers in linear regression model. Two well– known data sets have been studied and we conclude that GA doing-well in detection these type of outliers when using AIC and HQIC comparingwithBIC.

يعتبر تحليل الانحدار الخطي من أكثر الأساليب الإحصائية استخداما في تحليل البيانات في اغلب التطبيقات. في بعض الأحيان تحتوي البيانات قيد البحث على مجموعة من القيم الشاذة ويكون من الضروري جدا تشخيص هذه القيم لضمان صحة التحليل الإحصائي. في هذا البحث استخدمنا الخوارزمية الجينية مع ثلاث أنواع من دوال الهدف وهي معيار اكاكي للمعلومات معيار بيز للمعلومات ومعيار هانان-كيون للمعلومات لتشخيص مشكلة التقنع والإخفاء للقيم الشاذة في نموذج الانحدار الخطي. تم استخدام مجموعتين من البيانات المدروسة مسبقا والمعتمدة عالميا في بحثنا هذا تم التوصل إلى أن استخدام الخوارزمية الجينية في تشخيص القيم المقنعة والمخفية مقارنة باستخدام معيار أكاكي ومعيار هافانركون للمعلومات كدوال للهدف مقارنة بمعيار بيز للمعلومات.