Search In this Thesis
   Search In this Thesis  
العنوان
Detecting Fraudulent Of Credit Card Using Statistical Methods Of Data Mining /
المؤلف
Sheriff, Aya Sami Mustafa.
هيئة الاعداد
باحث / آيه سامي مصطفى شريف
مشرف / محمد جوده هنداوي
مشرف / رحاب شحاته محمود
مناقش / مجدي مليجي عبد الحليم
مناقش / مدثر طه ابو الخير
الموضوع
Statistical Methods.
تاريخ النشر
2022.
عدد الصفحات
104 P. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
الرياضيات
الناشر
تاريخ الإجازة
8/11/2022
مكان الإجازة
جامعة بنها - كلية التجارة - الاحصاء والرياضه والتامين
الفهرس
Only 14 pages are availabe for public view

from 126

from 126

Abstract

ملخص البحث :
أدى وباء كورونا (Covid-19) إلى تقييد حركة الناس إلى مستوى ما، مما جعل من الصعب شراء المنتجات والخدمات في وضع عدم الاتصال بالآخرين، مما أدى إلى ثقافة الاعتماد المتزايد على خدمات الإنترنت. لذلك يعد الاحتيال أحد أهم الاهتمامات المتعلقة باستخدام بطاقات الائتمان، وهو أمر صعب بشكل خاص في مجال الشراء عبر الإنترنت. نتيجة لذلك، هناك حاجة ماسة لاكتشاف أفضل استراتيجية لاستخدام آليات التنقيب في البيانات لمنع جميع معاملات بطاقات الائتمان الاحتيالية تقريبًا. لذلك أدى نمو تكنولوجيا المعلومات إلى وجود عدد كبير من قواعد البيانات والمعلومات في مختلف المجالات. ويتم إجراء العديد من الدراسات من أجل تغيير هذه البيانات المهمة لاستخدامها في المستقبل.
يمكن الكشف عن الاحتيال من خلال تقييم سلسلة من بيانات معاملات العملاء من المعاملات السابقة. عادة ما تقوم البنوك أو سلطات المعاملات الأخرى بإخطار عملائها بشأن إحدى المعاملات إذا لاحظت أي اختلاف عن الأنماط المتاحة والفعلية؛ لذلك تعتبر السلطات أن المعاملة قد تكون احتيالية. اتجهت البنوك وشركات بطاقات الائتمان لاستخدام طرق لتحديد الاحتيال خلال COVID-19، مثل التنقيب في البيانات، وهو اكتشاف فريد يزيل التقنيات والطرق التقليدية ويمكنه أيضًا العمل على مجموعات البيانات الضخمة التي لا يمكن للناس الوصول إليها بسرعة.
كما تنقسم طرق التنقيب عن البيانات إلى فئتين:
(Supervised Techniques, Unsupervised Techniques)
تكمن المشكلة في مجموعات أدلة التحديات والعقبات، حيث ان الغالبية العظمى من المدفوعات حقيقية، مع وجود عدد صغير من المدفوعات الاحتيالية. لذا يواجه المحققون مشكلات كبيرة في تطوير إطار عمل دقيق وفعال لمنع الاحتيال يكون منخفضًا في (False Negatives) مع تحديد أنشطة الاحتيال بشكل فعال. كما نواجه مشكله اخري في تحديد المعاملات الاحتيالية بحيث لا يتم تحميل العملاء رسومًا على المعاملات التي لم يكملوها سنقوم بسرد بعض من المشكلات:
 تم حفظ كميات هائلة من البيانات على أساس يومي، وينبغي أن يكون التصميم الأساسي سريعًا بما يكفي للاستجابة بشكل مناسب للاحتيال.
 قد تكون المعلومات الخاطئة مشكلة كبيرة أيضًا، لأنه لا يتم الكشف عن جميع السلوكيات الاحتيالية أو الإبلاغ عنها.
 المعلومات غير المتوازنة، أي أن الغالبية العظمى من المعاملات (99.8٪) ليست احتيالية، مما يجعل من الصعب اكتشاف النشاط الاحتيالي.
 الأساليب التكيفية التي يستخدمها المحتالون ضد النظام.
لذلك تبدو عملية جمع بيانات بطاقة الائتمان متشتتة جدًا وغير منتظمة نظرًا لأنها تحتوي على عمليات نقل شرعية أكثر من عمليات النقل الاحتيالية. هذا يعني أن التنبؤ قد يحصل على معدل استدعاء مرتفع دون الكشف عن المعاملة الاحتيالية. وتم استخدام (Feature selection)، هو أسلوب جيد للتعامل مع مثل هذه المشكلة. يمكن زيادة (Training datasets) حتى أثناء الإفراط في أخذ عينة من فئة الأقلية الكبيرة، وبنسبة عادلة لفئة الأغلبية المهمة مرة أخرى، بحيث تضاعف التقنية الجديدة احتمالية مثل هذا التنبؤ الصحيح. لدينا نظرة عامة أكثر شمولاً لهذه الأدوات واستخدام (supervised and un-supervised techniques).
الهــــدف مــــن الدراســـة:
الهدف الرئيسي يكمن في ان نصور نظامًا فعالًا للكشف عن الاحتيال في بطاقات الائتمان مع إطار عمل الملاحظات، استنادًا إلى تقنيات التعلم الآلي والتحليل الإحصائي. لذلك قمنا باستخدام تقنية (SMOTE) تم استخدام (Feature selection)، وتم تقسيم مجموعة البيانات إلى جزئين: بيانات يتم التدريب عليها (Training data) وبيانات الاختبار
(Testing data). الآليات المستخدمة في التجربة هي Ada Boost (ADB) تظهر النتائج أنه من أفضل الآليات والطرق للكشف عن الاحتيال في بطاقة الائتمان بدقة عالية. ومن أجل تحقيق هذا الهدف تم تنظيم الدراسة على النحو التالي:
الفصل الأول: يحتوي على مقدمة عن موضوع الدراسة والهدف من الدراسة.
الفصل الثاني: يتناول بعض التعاريف الهامه للتنقيب في البيانات، والتقنيات والخوارزميات والنماذج والتطبيقات إلى استخدمت في التنقيب في البيانات، وسرد لعدد من الدراسات السابقة في الموضوع محل الدراسة.
الفصل الثالث: يتناول بعض المفاهيم للكشف عن عمليات الاحتيال على بطاقات الائتمان ومراجعة شاملة للتقنيات وطرق التنقيب في البيانات التي تم استخدامها واستخراج الأنماط والمعلومات القيمة منها.
الفصل الرابع: يقدم التحليل الإحصائي للكشف عن الاحتيال في بطاقات الائتمان.
الفصل الخامس: يقدم تطبيق الطريقة المقترحة على بيانات فعليه.
الفصل السادس: يعرض نتائج الدراسة وتلخيص لاهم النقاط بالدراسة واخيرا بعض الاقتراحات لمزيد من الدراسات في نفس المجال.