تعداد نشریات | 23 |
تعداد شمارهها | 368 |
تعداد مقالات | 2,890 |
تعداد مشاهده مقاله | 2,566,186 |
تعداد دریافت فایل اصل مقاله | 1,821,847 |
مدلسازی خطی و تحلیل رگرسیون: مروری کوتاه بر مزایا و معایب مدلسازی خطی و شرایط استفاده از مدل رگرسیون | ||
بیوتکنولوژی و بیوشیمی غلات | ||
مقاله 7، دوره 3، شماره 2، تیر 1403، صفحه 346-360 اصل مقاله (474.36 K) | ||
نوع مقاله: مروری | ||
شناسه دیجیتال (DOI): 10.22126/cbb.2024.11198.1086 | ||
نویسندگان | ||
آرمین ساعدموچشی* 1؛ سودابه ساعدی2؛ فاطمه انصارشوریجه3؛ عباس زضایی زاد1؛ امین صادقی4 | ||
1بخش تحقیقات علوم زراعی و باغی، مرکز تحقیقات و آموزش کشاورزی و منابع طبیعی کرمانشاه، مرکز تحقیقات، آموزش و ترویج کشاورزی، کرمانشاه، ایران. | ||
2بخش گیاهپزشکی، دانشکده کشاورزی، دانشگاه رازی، کرمانشاه، ایران. | ||
3گروه مهندسی منابع طبیعی، دانشکده کشاورزی، دانشگاه شیراز، شیراز، ایران. | ||
4گروه گیاهپزشکی، دانشکده کشاورزی، دانشگاه کردستان، سنندج، ایران. | ||
چکیده | ||
مقدمه: امروزه بستههای نرمافزاری قدرتمند و کاربردی، تحلیل دادهها را ساده کرده و در نتیجه کاربرد علم داده را در تمام زمینههای تحقیقاتی توسعه داده است. بر این اساس، رگرسیون تقریباً در تمام جنبههای علومزیستی، از سلامت انسان گرفته تا کشاورزی و علوم دامی اعمال شده است. اما در دهههای گذشته اشتباهات شایان توجهی در استفاده از این مدل گزارش شده است. هدف از این مقاله بررسی مدلسازی با این روش مهم آماری و آشنا کردن خوانندگان جهت کاربرد درست این روش و مفروضات و شرایط استفاده از آن است. مواد و روشها: در این مقاله مروری از دادههای واقعی استفاده گردیده است و نحوه انجام تحلیلهای انجام شده در نرمافزارهای آماری SAS و R و کدهای مربوط به آنها در قسمت پیوست آورده شده است. یافتهها: در مفروضات مورد نیاز مدل رگرسیونی، باقیماندههای مدل باید به طور نرمال توزیع شده باشند، اما انجام آزمون نرمال بودن برای مقادیر واقعی متغیر پاسخ یا هر یک از متغیرهای مستقل اجباری نیست. از سوی دیگر، تقریباً تمام روشهای تست توزیع نرمال، مانند Kolmogorov-Smirnov، برای تعداد زیاد داده، طراحی شدهاند. این نشان میدهد که استفاده از چنین روشهایی برای آزمون نرمال بودن باقیماندههای مدل تخمین زده شده بر اساس تعداد داده پایین، عمدتاً کمتر از صد مورد، چندان دقیق نخواهد بود. موضوع دیگر مربوط به همخطی بین متغیرهای مستقل است. باید به این نکته توجه کرد که یافتن ضریب همبستگی برابر با صفر (R = 0) حتی بین هر جفت متغیر تصادفی جداگانه بسیار دشوار است. بنابراین در تمامی مدلهای رگرسیونی به نوعی همبستگی بین متغیرهای مستقل وجود خواهد داشت، اما موضوع مهم این است که فقط همبستگی زیاد باعث ایجاد مشکلات شدید در مدل میشود. پیشنهاد میگردد که به جای استفاده از روش ساده همبستگی از روشهای تخصصی مانند ضریب تورم واریانس (VIF) یا تجزیه و تحلیل مؤلفه اصلی (PCA) برای تشخیص شدت همخطی استفاده گردد. یکی دیگر از مفروضات رگرسیون مربوط به خطی بودن مدل است که گاهی تبدیل این مشکل را برطرف کند. باید توجه شود که تبدیل دادهها منجر به تغییر واحد متغیرها یا تغییر جهت برداری آنها در یک فضای هندسی و در برخی موارد تغییر ساختار صحیح آنها می شود. نتیجهگیری: در مدل رگرسیون با افزایش تعداد داده، درجه آزادی خطا به سرعت افزایش می یابد و میانگین مجذور خطای نهایی به میزان قابل توجهی کاهش می یابد. مقدار کم میانگینمربعاتخطا منجر به یک مدل بسیار معنیدار میشود. در مقابل، پراکندگی نقاط داده در اطراف خط رگرسیون ممکن است بسیار گسترده باشد. به همین دلیل، استفاده از ضریبتبیین که معمولاً معیار مناسبی برای تست برازش مدل است. هرچه پراکندگی نقاط مربوط به دادهها در اطراف خط رگرسیون گستردهتر باشد، مقدار ضریب تعیین کمتر است. مقادیر بالای این ضریب نشان دهنده مدل مناسب برای مجموعه دادههای مورد استفاده است. یک مقدار مناسب برای ضریبتبیین را نمی توان بین دامنهای از مقادیر برای همه آزمایشها توصیه کرد. | ||
کلیدواژهها | ||
آزمون دوربین واتسون؛ باقیماندههای مدل؛ توزیع نرمال باقیمانده؛ رگرسیون چندگانه؛ میانگین مربعات خطا | ||
مراجع | ||
Aliakbari, M., A. Saed-Moucheshi, H. Hasheminasab, H. Pirasteh-Anosheh, M. T. Asad and Y. Emam. 2013. Suitable stress indices for screening resistant wheat genotypes under water deficit conditions. International journal of Agronomy Plant Production, 4(10), 2672-2695 Astivia, O. L. O. and B. D. Zumbo. 2019. Heteroskedasticity in Multiple Regression Analysis: What it is, How to Detect it and How to Solve it with Applications in R and SPSS. Practical Assessment, Research & Evaluation, 24, 265-279. Bagya Lakshmi, H., M. Gallo and R. M. Srinivasan. 2018. Comparison of regression models under multi-collinearity. Electronic Journal of Applied Statistical Analysis, 11(1), 340-368. Baum, C. F. and A. Lewbel. 2019. Advice on using heteroskedasticity-based identification. The Stata Journal, 19(4), 757-767. Bazilevsky, M. P. 2018. Research of new criteria for detecting first-order residuals autocorrelation in regression models. Mathematics and Mathematical Modeling, 6(3), 13-25. James, G., D. Witten, T. Hastie, R. Tibshirani, G. James, D. Witten, T. Hastie and R. Tibshirani. 2021. Linear model selection and regularization. An introduction to statistical learning: with applications in R, 10, 225-288. Kabaila, P., D. Farchione, S. Alhelli and N. Bragg. 2021. The effect of a Durbin–Watson pretest on confidence intervals in regression. Statistica Neerlandica, 75, 4-23. Lio, W. and B. Liu. 2018. Residual and confidence interval for uncertain regression model with imprecise observations. Journal of Intelligent & Fuzzy Systems, 35(2), 2573-2583. Morrissey, M. B. and G. D. Ruxton. 2018. Multiple regression is not multiple regressions: the meaning of multiple regression and the non-problem of collinearity. Philosophy, Theory, and Practice in Biology, 10(3), 563-588. Saed-Moucheshi, A., E. Fasihfar, H. Hasheminasab, A. Rahmani and A. Ahmadi. 2013a. A review on applied multivariate statistical techniques in agriculture and plant science. International journal of Agronomy and Plant Production, 4, 127-141. Saed-Moucheshi, A., M. Pessarakli and B. Heidari. 2013b. Comparing relationships among yield and its related traits in mycorrhizal and nonmycorrhizal inoculated wheat cultivars under different water regimes using multivariate statistics. International Journal of Agronomy, 13(13), 345-365. Saed-Moucheshi, A., H. Razi, A. Dadkhodaie, M. Ghodsi and M. Dastfal. 2019. Association of biochemical traits with grain yield in triticale genotypes under normal irrigation and drought stress conditions. Australian Journal of Crop Science, 13(2), 272-295. Souza, L. C., R. M. C. R. Souza, G. J. A. Amaral and T. M. Silva Filho. 2017. A parametrized approach for linear regression of interval data. Knowledge-Based Systems, 131, 149-159. Vosough, A., R. Ghouchani and A. Saed-Moucheshi. 2015. Genotypic Variation and Heritability of Antioxidant related Traits in Wheat Landraces of Iran. Biological Forum, 7(2), 43-55 | ||
آمار تعداد مشاهده مقاله: 250 تعداد دریافت فایل اصل مقاله: 161 |