Search In this Thesis
   Search In this Thesis  
العنوان
الانحدار شبه المعلمي باستخدام اسلوب باييز مع التطبيق /
المؤلف
يوسف، هيثم مسعد السيد.
هيئة الاعداد
باحث / هيثم مسعد السيد يوسف
مشرف / احمد فتحي محمود
مشرف / سحر عادل رافت
مناقش / احمد محمود جاد
الموضوع
الاحصاء الرياضي.
تاريخ النشر
2015.
عدد الصفحات
175ص. :
اللغة
العربية
الدرجة
الدكتوراه
التخصص
الإحصاء والاحتمالات
تاريخ الإجازة
1/1/2015
مكان الإجازة
اتحاد مكتبات الجامعات المصرية - الاحصاء والرياضة والتامين
الفهرس
يوجد فقط 14 صفحة متاحة للعرض العام

from 32

from 32

المستخلص

ملخص يُعد ظهور المدخل شبه المعلمى فى نماذج الإنحدار ثمرةً للتكامل بين كل من المدخلين المعلمى واللامعلمى معاً, و يعتبر نموذج الإنحدار شبه المعلمى والمكون من شقين الشق الأول معلمى والآخر لامعلمى نموذجا وسطا بين نموذجى الإنحدار المعلمى و الإنحدار اللامعلمى حيث أنه يمثل دمجاً بين جزء معلمى وجزء لامعلمى , وحديثا تطورت تلك النماذج تطوراً كبيراً, وتُستخدم نماذج الانحدار شبه المعلمية لدراسة العلاقة بين المتغير التابع والمتغيرات المفسرة عندما تكون الصيغة الرياضية للعلاقة بين المتغير التابع وواحد أو أكثر من المتغيرات المفسرة معلومة مع وجود متغير مفسر على الأقل الشكل الرياضى للعلاقة بينه وبين المتغير التابع غير معلومة.
وتجمع نماذج الإنحدار شبه المعلمية بين مزايا نماذج الانحدار المعلمية ومرونة نماذج الانحدار اللامعلمية, ورغم تنوع نماذج الإنحدار شبه المعلمية إلا أن أهمها هو ما يطلق عليه نموذج الإنحدار شبه المعلمى الخطى الجزئى المُعَمَّم (GPLM) والذى يعتبر امتداداً شبه معلمياً للنموذج المعلمى الخطى المُعَمَّم (GLM), ويتم تقدير نموذج (GPLM) وذلك عن طريق تقدير شقيه , وهما متجه المعالم β فى الشق المعلمى و الدالة الممهدة m(.) فى الشق اللامعلمى , وتقوم الفكرة الأساسية لتقدير هذا النموذج على أن مقدر المعالم يمكن الحصول عليه من خلال معرفة الدالة الممهدة , وكذلك فإن مقدر الدالة المُمَهِّدة يمكن الحصول عليه من خلال معرفة مقدرالمعالم , وطرق تقدير النموذج الخطى الجزئى المُعَمَّم (GPLM) تشمل ثلاث طرق هى طريقة سمة الإمكان و طريقة سبكمان المُعَمَّمة و طريقة التوفيق الخلفى, والطرق الثلاث تقوم على استخدام طريقة النواه فى تقدير الشق اللامعلمى من النموذج, والجدير بالذكر أن خواريزمات الطرق الثلاث يمكن تلخيصها فى خطوات ثلاث كالتالى:-
خواريزم (1) استخدام قيم مبدئية لكل من متجة المعالم β والدالة الممهدة m(.) .
خواريزم (2) تحديث متجه المعالم β حتى يتم التقارب.
خواريزم (3) تحديث مقدر الدالة الممهدة m(.) حتى يتم التقارب .
ولقد تركزت اسهامات الباحثين فى الأونة الأخيرة لتحسين كفاءة مقدرات الإنحدار شبه المعلمى فى اتجاهين أساسيين الأول هو التركيز على بناء مقدرات ذات كفاءة عالية للشق المعلمى من النموذج فى حين تركزت محاولات الإتجاة الثانى على الشق اللامعملى من النموذج إلا أن أيا من هذه المحاولات لم تستخدم أسلوب باييز فى تحسين كفاءة مقدرات الإنحدار شبه المعلمى فى الشق المعلمى من النموذج , حيث يختلف أسلوب باييز عن الأساليب التقليدية فى أن أسلوب باييز يعتبر المعلمة β متغيراً عشوائىاً له توزيع احتمالى يُسمى ” بالتوزيع القبلى ” يعبر عن معلوماتنا السابقة حولβ ويصف درجة إعتقادنا فى القيم الممكنة لها قبل سحب العينة ومن هنا تبرز أهمية الدراسة حيث تعتبر الدراسة باكورة استخدام أسلوب باييز فى تقدير الشق المعلمى فى نماذج الإنحدار شبه المعلمية عموماُ وهى محاولة لتحسين كفاءة مقدرات (GPLM) و (SLRM) على وجة التحديد.
قدمت الرسالة توليفة متنوعة من الإشتقات الجبرية للتوزيعات البعدية المشتركة والهامشية متعددة المتغيرات لمتجة الإستجابة اعتمدت على مجموعة متنوعة من التوزيعات القبلية لمتجة المعالم المراد تقديره و تم حساب مقدرات باييز فى كل حالة على حده إعتماداً على دالة خسارة مربع الخطأ.
كما قدمت الرسالة خواريزمات جديدة مبنية على استخدام مقدرات باييز المعتمدة على دالة خسارة مربع الخطأ لبناء مقدرات أكفأ للشق المعلمى من النموذج, والخواريزمات التالية تُلخص فكرة استخدام أسلوب باييز فى الشق المعلمى من نموذج (GPLM) باستخدام التوزيعات القبلية المرافقة أو باستخدام أسلوب التوزيعات القبلية غير المُعَلَّمة:-
خواريزم (1) معرفة التوزيع الإحتمالى لمتغير الإستجابة Y بشرط أن يكون عضواً فى العائلة الأسية.
خواريزم (2) الحصول دالة الإمكان للتوزيع الإحتمالى لمتغير الإستجابة Y والمتحصل عليه فى الخطوة الأولى.
خواريزم (3) اختيار التوزيع القبلي المناسب لمتجة المعالم β .
خواريزم (4) استخدام دالة الإمكان للتوزيع الإحتمالى لمتغير الإستجابة و التوزيع القبلي لمتجة المعالم فى اشتقاق التوزيع البعدى باستخدام نظرية باييز و بالتالى الحصول على متوسط التوزيع البعدى وتباينه ومن ثَمَّ الحصول على مُقَدِّر باييز لمتجة المعالم β ̂_Bayes اعتماداً على دالة خسارة مربع الخطأ.
خواريزم (5) استخدام نتائج الخطوة الرابعة فى الحصول على دالة ربط جديدة تلخص كل المعلومات المتحصل عليها .
خواريزم (6) استخدام مُقَدِّر باييز لمتجة المعالم β ̂_Bayes كمقدر مبدئي لمتجة المعالم β فى تقدير معالم النموذج وذلك باستخدام الطرق الثلاث المستخدمة فى التقدير, وبناءً على الخواريزمات السابقة فإن الرسالة قدمت تعديلاً مقترحاً على الطرق المستخدمة فى عملية التقدير.
اشتملت الرسالة على جانبين تطبيقيين, الجانب الأول استُخدامتْ فيه المحاكاة فى الحكم على فعالية المعالجات المقترحة لنموذج (GPLM) وفى الكشف عن كفاءة واتساق مقدراته من خلال مجموعة من العينات وُلدت بياناتها وفق مجموعة من المحاور التى تعكس العوامل المختلفة التى قد تؤثر على أداء النموذج عند القيام بتنفيذه فى الواقع العملى وتمت إجراء مقارنات بين مقدرات نموذج (GPLM) فى حالة استخدام أسلوب باييز فى حالة عدم استخدامه.
تم تنفيذ تجارب المحاكاة باستخدام ستة أحجام للعينات هى (n=50) و (n=100) و (n=200) و (n=500) و (n=1000) و (n=2000) بغرض كشف سلوك مقدرات الطرق الثلاث المستخدمة فى التقدير مع عينات من أحجام مختلفة واستنتاج الخصائص التقاربية لمقدرات تلك الطرق , و مقارنة نتائج الطرق الثلاثة المستخدمة فى التقدير فى حالة استخدام معالجة باييز وفى حالة عدم استخدامها , واستخدمـت فى توليد البيانات طـريقة مونت كارلو بتكرارات ( Replicates=500 ) لكل تجربة , وتم استخدام قيم معينة لمعلمة التمهيد (معلمة انتظام شكل التوزيع) هى ( h=2 , 1 , 0.5 , 0.2 ) حيث يشتمل الشق اللامعلمى من النموذج على متغير واحد فقط للتبسيط واستخدمت دالة النواة للتوزيع الطبيعى, أما الشق المعلمى من النموذج فيشتمل على متغيرين تفسيريين 〖X_2 و X〗_1 يتبع كل واحد منهما التوزيع الطبيعى وكذلك فإن المتغير التابع يتبع التوزيع الطبيعى , كما أن الأخطاء العشوائية تتبع التوزيع الطبيعى القياسى.
أُجريت تجارب المحاكاة على مرحلتين حيث تمثل نتائج المرحلة الأولى من تجارب المحاكاة معلومات قبلية تم التحصل عليها و استخدامها طبقا لنظرية باييز وصياغتها فى صورة توزيعات قبلية ودمج ما بها من معلومات مع دالة الإمكان الخاصة بالتوزيع الإحتمالى لمتغير الإستجابة واستنتاج مقدرات باييز واستخدامها كقيم مبدأية فى عملية التقدير فى المرحلة الثانية من تجارب المحاكاة عوضا عن تلك القيم المبدأية التى تفترضها الطرق الثلاث, تمت عملية المقارنة بين مقدرات النماذج المختلفة بناءً على مجموعة من المعايير فبالنسبة للشق المعلمى أستُخدم معيارمتوسط مربعات الخطأ لمتجه المعالم AMSE (β ̂), و بالنسبة للشق اللامعلمى من النموذج استُخدم معيارمتوسط مربعات الخطأ للدالة الممهدة (m ̂) AMSE أما قيما يخص النموذج ككل تم استخدام معيار متوسط ”الإنحراف” Deviance وبه تم قياس ”فجوة التوفيق” للنموذج ككل.
ويمكن سرد أهم النتائج فى النقاط التالية:-
● فى العينات من الحجم (n=50 و n=100) تفوقت طريقة التوفيق الخلفى على طريقة سمة الإمكان وطريقة سبكمان المُعَمَّمة .أما فى حالة العينات من الحجم (n=200 و n=500 ) فإن أفضلية طريقة معينة على باقى الطرق الأخرى قد لا تكون محسومة بشكل واضح .وفى العينات ذات الحجم (n=1000 و n=2000) تفوقت طريقة سمة الإمكان وطريقة سبكمان المُعَمَّمة على طريقة التوفيق الخلفى . أى أنه زاد حجم العينة كانت طريقة سمة الإمكان وطريقة سبكمان أفضل فى التقدير وكلما قل حجم العينة كانت طريقة التوفيق الخلفى أفضل فى التقدير.
● كما لُوحظ أن أسلوب باييز على وجه العموم يُعطى قيما أقل لمتوسط الإنحراف بصرف النظر عن الطريقة المستخدمة فى التقدير .
● استخدام التوزيعات القبلية المرافقة يُعطى قيما أقل لمتوسط الإنحراف من نظيراتها فى حالة استخدام أسلوب التوزيعات القبلية غير المعلمة بصرف النظر عن حجم العينة وقيمة معلمة التمهيد وهو ما يتفق مع النتائج النظرية.
● استخدام اسلوب معالجة باييز فى حالة ندرة أو انعدام المعلومات المسبقة عن متجة المعالم أى فى حالة استخدام التوزيعات القبلية غير المعلمة يُعطى نفس النتائج التى يُتحصل عليها فى حالة عدم استخدام أسلوب معالجة باييز حيث أنه فى كلا الحالتين تبدأ عملية التقدير باستخدام القيم المبدئية التى افترضتها الطرق الثلاث وهو ما يتفق مع النتائج النظرية.
● تزداد سرعة التقارب فى حالة استخدام التوزيعات القبلية المرافقة عنها فى حالة التوزيعات القبلية غير المعلمة حيث تقرب قيم AMSE (β ̂) و AMSE (m ̂) من الصفر مع استخدام التورزيعات القبلية المرافقة بصورة أسرع من اقتراب قيم نفس المعاريين فى حالة استخدام التوزيعات القبلية غير المعلمة .
● تميزت مقدرات (GPLM) باستخدام مقدر باييز β ̂_Bayes بأنها حققت أقل تباين تقاربى مما يجعل استخدام المعالجات المقترحة المبنية على الإستفادة من المعلومات القبلية تُعطى مقدرأت أكفأ تقاربيا .
أما الجانب الثانى تم فيه تطبيق معالجة باييز المقترحة فى حالة استخدام نموذج (SLRM) على عينة مكونة من 400 مشاهدة شملت 14 متغيراً مستقلاً قُسمت إلى مجموعتين, الأولى منهما شملت المتغيرات المترية (عُمر طالب الإئتمان ومبلغ القرض ومدة القرض) وعُولجت العلاقة بينها وبين المتغير التابع لامعلميا, والثانية تضمنت المتغيرات غير الكمية ثنائية ومتعددة الصفات وعُولجت العلاقة بينها وبين المتغير التابع بصورة معلمية حيث تم الحصول على بيانات العينة من سجلات البنك الأهلى المصرى عن الفترة 2010-2005 .
حيث أن من أهم التطبيقات العملية التى تُظهر قوة النماذج شبه المعلمية هو استخدام نموذج (GPLM)على بيانات تصنيف الائتمان لذا فإن الدراسة قدمت تطبيقاً على بيانات فعلية بغرض مقارنة نتائج التقديرات فى حالة استخدام اسلوب معالجة باييز وفى حالة عدم استخدامها باستخدم طريقة سمة الإمكان والمعالجة الباييزية الخاصة وتم التعرُّف على أهم المتغيرات الهامة وتم استخدامها فى تصنيف طالبى الإئتمان وكانت أهم نتائج الدراسة التطبيقية كالتالى:-
● طبقا لنموذج (PLRM) فإن أهم المتغيرات المستقلة التى تؤثر فى المتغير التابع هى كالتالى ( مرتبة طبقا لدرجة تأثيرها فى المتغير التابع ) هى متغير ملكية طالب الائتمان لبطاقة ائتمان ومتغير ملكية طالب الائتمان للمدخرات ومتغير وجود ضمانات لدى طالب الائتمان وفى المرتبة الأخيرة يأتى متغير غرض الائتمان فى التأثر على المتغير التابع, أما بقية المتغيرا المستقلة وهى فلم تُظهر معاملات انحدارها أية معنوية عند مستوى معنوية (∝=0.05) .
● طبقا لنموذج (SLRM) فإن أهم المتغيرات المستقلة التى تؤثر فى المتغير التابع كانت نفس المتغيرات الأربعة السابق ذكرها بالإضافة إلى متغير نوع المشروع وجاء فى المرتبة الأخير فى التأثير على المتغير التابع أما بقية المتغيرات المستقلة فلم تُظهر معاملات انحدارها أية معنوية عند مستوى معنوية (∝=0.05) .
● رغم جودة نتائج نموذج (PLRM) إلا أنه أهمل أثر متغير نوع المشروع حيث أبرز نموذج (SLRM) معنويته عند مستوى معنوية (∝=0.05) وكذلك فإن استخدام أسلوب معالجة باييز أظهر معنوية نفس المتغير عند نفس مستوى المعنوية.
● استخدام اسلوب معالجة باييز فى حالة انعدام المعلومات المسبقة عن متجة المعالم أى فى حالة استخدام التوزيعات القبلية غير المعلمة يُعطى نفس النتائج التى يُتحصل عليها فى حالة عدم استخدام أسلوب معالجة باييز حيث أنه فى كلا الحالتين تبدأ عملية التقدير باستخدام القيم المبدئية التى افترضتها الطرق الثلاث.
● استخدام اسلوب معالجة باييز عموما يعطى تقديرات لها أقل قيم ممكنه من الأخطاء المعيارية وأقل عدد ممكن من المحاولات التكرارية , وأقل قيم ممكنه من الإنحراف إلا أنه لم تُظهر النتائج طبقا للدراسة والبيانات المستخدمة فيها والتوزيعات القبلية المفترضة أفضلية معينة للتوزيعات القبلية المرافقة على التوزيعات القبلية غير المعلمة أو أسلوب جيفريز ولعل ذلك يرجع إلى تتطابق التوزيع القبلى فى حالة التوزيعات القبلية المرافقة مع التوزيعات القبلية غير المعلمة.
اشتملت الرسالة على سبعة أبواب الأول قدم إطاراً عاما عن البحث وأهدافه ومشكلته الأساسية ومحتوياته وقدمت نماذج الانحدار المعلمى وطرق تقديرها ونظرة تاريخية حولها فى الباب الثانى أما الباب الثالث تم فيه عرض الإنحدار اللامعلمى ونماذج الانحدار اللامعلمى وطرق تقديرها وممهداتها مع التركيز على دالة النواة وعُرض المدخل شبه المعلمى فى الباب الرابع من حيث نظرة تاريخية حوله وأهم نماذجه وطرق تقديرها أما الباب الخامس من البحث فيتناول عرض نظرية باييز ونظرية الانحدار الباييزى كما قدم الإشتقاقات الجبرية للحصول على التوزيعات البعدية ومقدرات باييز المستخدمة فى تقدير نموذج (GPLM) و نموذج (SLRM) كما عرض الخواريزمات الجديدة المستخدمة فى عملية التقدير والمعالجات الباييزية المقترحة على طرق التقدير وخُصِّصّ الباب السادس للجانب التطبيقى من الدراسة ويشتمل على دراسة محاكاة على مرحلتين لمقارنة سلوك طرق تقدير نموذج (GPLM) مع أحجام مختلفة من العينات ومع قيم مختلفة لمعلمة التمهيد فى حالة إستخدام معالجة باييز وفى حالة عدم استخدامها كما اشتمل على دراسة تطبيقية على بيانات فعلية لبيان أثر إستخدام معالجة باييز فى حالة نموذج (SLRM) و عُرضت النتائج سواء فيما يخص دراسة المحاكاة أو الدراسة التطبيقية ونُوقشت فى الباب السابع من الرسالة فى مبحثين منفصلين كما تضمن الباب السابع مجموعة من النقاط البحثية المستقبلية, واشتملت الرسالة على خمسة ملاحق الأول عرض النتائج التفصيلية للمحاكاة والثانى يحتوى على بيانات العينة بعد تكويدها والثالث اشتمل على الوصف البيانى لمتغيرات العينة والرابع قدم النتائج التفصيلية للشق اللامعلمى من نموذج (SLRM) أما الخامس وهو الأخير قدم التميثل البيانى لنتائج تقديرات الشق اللامعلمى للمتغيرات X_1 و X_2 و X_3 وهى المتغيرات التى عُولجت لامعلميا فى النموذج.
مشكلة البحث
تعتبر مشكلة البحث الأساسية هى تحسين كفاءة مقدرات الإنحدار شبه المعلمى باستخدام أسلوب باييز و تحديداً اهتم البحث بتحسين كفاءة مقدرات نموذج (GPLM) ونموذج (SLRM) باستخدام أسلوب باييز فى الشق المعلمى من هذين النموذجين عن طريق تقديم خواريزمات جديدة وتقديم اشتقاقات جبرية للتوزيع البعدى لمتغير الإستجابة باستخدام التوزيعات القبلية المرافقة والتوزيعات القبلية غير المعلمة واستخدام مقدرات باييز كمقدرات مبدأية فى عملية التقدير .
(1.3) أهداف البحث
1- تقديم مقدرات أكثر كفاءة لنماذج الإنحدار شبه المعلمية باستخدام أسلوب باييز.
2- إشتقاق توزيعات بعدية مختلفة لمتغير الإستجابة إعتماداً على توزيعات قبلبة يتم فرضها واستخدام مقدرات باييز المتحصل عليها كمقدرات مبدأية فى عملية التقدير.
3- مقارنة النتائج فى حالة عدم استخدام إسلوب باييز وفى حالة إستخدامه.
4- دراسة سلوك مقدرات طرق تقدير نموذج (GPLM) باستخدام دراسة المحاكاة.
5- مقارنة نتائج تقديرات الطرق المختلفة المستخدمة فى تقدير نموذج (GPLM) باستخدام دراسة المحاكاة.
6- تقديم معالجة باييز لنموذج (SLRM) ومقارنة النتائج عن طريق استخدام بيانات فعلية.
(1.4) محتويات الرسالة
تتكون الرسالة من سبعة أبواب كما يلى :-
الباب الأول:-
يقدم إطار البحث و مشكلة البحث و أهدافه و التنظيم المقترح له.
الباب الثانى:-
يعرض نماذج الإنحدار المعلمية والصورة العامة لها و بعض طرق تقدير هذه النماذج ونظرة تاريخية حولها.
الباب الثالث:-
يهدف إلى تقديم نماذج الإنحدار اللامعلمية ومُمَهِّداتها والصورة العامة لها وطرق تقدير هذا النوع من النماذج ونظرة تاريخة حولها.
الباب الرابع:-
يتم فيه تقديم نماذج الانحدار شبه المعلمية بشئ من التفصيل من حيث الصورة العامة لها ونظرة تاريخية حولها و طرق تقدير هذه النماذج مع التركيز على طرق تقدير نموذج (GPLM) و نموذج (SLRM).
الباب الخامس:-
يتناول عرض نظرية باييز واستخدام أسلوب باييز فى تقدير معلمات الانحدار كما قدم الإشتقاقات الجبرية للحصول على التوزيعات البعدية ومقدرات باييز المستخدمة فى تقدير نموذج (GPLM) و نموذج (SLRM) كما عرض الخواريزمات الجديدة المستخدمة فى عملية التقدير والمعالجات الباييزية المقترحة على طرق التقدير.
الباب السادس:-
خُصِّصّ للجانب التطبيقى من الدراسة ويشتمل على دراسة محاكاة على مرحلتين لمقارنة سلوك طرق تقدير نموذج (GPLM) مع أحجام مختلفة من العينات ومع قيم مختلفة لمعلمة التمهيد فى حالة إستخدام معالجة باييز وفى حالة عدم استخدامها , و دراسة تطبيقية على بيانات فعلية لبيان أثر إستخدام معالجة باييز فى حالة نموذج (SLRM) .
الباب السابع:-
يعرض مناقشة النتائج و يقدم موضوعات مقترحة لبحوث مستقبلية. وبعده عُرضت الملاحق الخمسة وقائمة المراجع و الملخص باللغة العربية.