تقييم أداء خوارزمية تعظيم التوقع و طريقة التعويض المتعدد في إنحدار بيتا
##plugins.themes.academic_pro.article.main##
الملخص
معالجة البيانات المفقودة، تظل تحديًا أساسيًا في النمذجة الإحصائية، لا سيما في نماذج الانحدار. تُقيّم هذه الدراسة وتُقارن بين تقنيتين شائعتي الاستخدام في المعالجة، وهما خوارزمية تعظيم التوقع (EM) والتعويض المتعدد (MI)، وذلك في سياق انحدار بيتا. تُقدّر خوارزمية تعظيم التوقع القيم المفقودة تكراريًا من خلال تعظيم دالة الاحتمال، بينما تُولّد خوارزمية التعويض المتعدد مجموعة بيانات متعددة معقولة لمراعاة عدم اليقين في البيانات المفقودة. باستخدام مجموعة بيانات إنتاج البنزين مع فقد مُستحثّ اصطناعيًا عند نسب 5% و10% و15%، قمنا بتقييم أداء كلتا الطريقتين عبر دوال ربط ومُقدّرات امكان مُختلفة. تُشير النتائج إلى أنه على الرغم من فعالية كلتا الطريقتين عند مستويات فقد منخفضة، إلا أن خوارزمية تعظيم التوقع تُنتج باستمرار تقديرات للمعالم أكثر دقة عند مستويات فقد معتدلة (حوالي 10%)، مع الحفاظ على أداء قوي مع ازدياد مستوى الفقد، خاصةً عند اقترانها بدالة ربط log-log. قد تُقدّم هذه النتائج رؤى قيّمة للباحثين والممارسين الذين يتعاملون مع البيانات غير المكتملة في نماذج انحدار بيتا.