عناصر مشابهة

استخدام نماذج ARIMA والغابة العشوائية للتنبؤ ببيانات الانواء الجوية

تفصيل البيانات البيبلوغرافية
العنوان بلغة أخرى:Using ARIMA and Random Forest Models for Climatic Datasets
المصدر:المجلة العراقية للعلوم الإحصائية
الناشر: جامعة الموصل - كلية علوم الحاسوب والرياضيات
المؤلف الرئيسي: الجبوري، عدي زكي جرجس (مؤلف)
مؤلفين آخرين: الحنون، أسامة بشير شكر (م. مشارك)
المجلد/العدد:ع36
محكمة:نعم
الدولة:العراق
التاريخ الميلادي:2022
الصفحات:64 - 84
ISSN:1680-855X
رقم MD:1339244
نوع المحتوى: بحوث ومقالات
اللغة:Arabic
قواعد المعلومات:EcoLink
مواضيع:
رابط المحتوى:
الوصف
المستخلص:إن لتغيرات المناخ دورا مؤثرا قد يؤدي إلى مشكلات كثيرة على صحة الإنسان وبقية الكائنات الحية لذا فإنه من الضروري دراستها والتنبؤ بها للحد أو للتقليل من أضرارها من خلال التخطيط لها والسيطرة عليها. إن المشكلة الرئيسية تكمن في عدم خطية هذا النوع من البيانات وفوضويتها. ومن أشهر أساليب السلاسل الزمنية استخداما هي نماذج الانحدار الذاتي والمتوسطات المتحركة المنمذجة Integrated Autoregressive and Moving Average model (ARIMA) كنماذج سلاسل زمنية تقليدية أحادية المتغير. إن مثل هذه النماذج لا يمكنها التعامل بصورة سليمة مع البيانات غير الخطية فتظهر نتائج تنبؤ قليلة الدقة. في هذا البحث تم استخدام بيانات الأنواء الجوية متمثلة بدرجات الحرارة الصغرى وكميات التبخر لأحد محطات الأنواء الجوية الزراعية في محافظة نينوي. يهدف هذا البحث إلى تحقيق التجانس في البيانات خلال المواسم المختلفة وإيجاد أنموذج يتعامل مع البيانات غير الخطية ويعطي أقل خطأ للتنبؤ مقارنة بالنموذج التقليدي ARIMA. لذلك فقد تم استخدام أنموذج أكثر تلاؤما مع بيانات الأنواء الجوية ليعطي تنبؤات غاية في الدقة يدعى نموذج الغابة العشوائية Random Forest (RF). إن من أهم أسباب تحسين نتائج التنبؤ هو اعتماد نموذج RF في اتخاذ القرار على العديد من أشجار الانحدار غير المرتبطة والذي يؤدي كل منها إلى قرار مستقل وأن القرار النهائي سيكون بالغالبية المطلقة لمجاميع أشجار الانحدار. تم الحصول على نتائج تنبؤ أكثر دقة باستخدام نموذج RF مقارنة بنتائج تنبؤات ARIMA في مرحلتي التدريب والاختبار. من ذلك فإنه تم استنتاج أفضلية مطلقة لنموذج RF إذا ما قورن مع نموذج ARIMA التقليدي عند التنبؤ بالبيانات المناخية.

The climatic changes have important role which may lead to huge problems for the health of human and other organisms, therefore it is necessary to study and forecast this type of datasets to reduce. the damages through planning and controlling for these changes in the future. The main problem can be summarized in the nonlinearity of climatic dataset and its chaotic changes. The common approach is the integrated autoregressive and moving average model (ARIMA) as traditional univariate time series approach. Therefore, more appropriate model for studying the climatic data has been proposed for obtaining more accurate forecasting, it can be called random forest (RF) model. This model cannot deal with nonlinear data correctly and that may lead to inaccurate forecasting results. In this thesis, climatic datasets are studied represented by minimum air temperature and rational humidity for agricultural meteorological station in Nineveh. This thesis aims to satisfy data homogeneity through different seasons and find suitable model deal with nonlinear data correctly with minimal forecasting error comparing to ARIMA as traditional model. The research found the adequate of the model for this type of data, as it was found that there are some factors that contribute to the increase in the number of deaths in the epidemic, such as the advanced age of the patient, the length of stay in the hospital, the percentage of oxygen in the patient's blood, in addition to the incidence of some chronic diseases such as asthma. The study recommended a more in-depth study of other types of these models, and the use of other estimation methods, in addition to paying attention to the methods of data recording by the city health department.