Minimizing false positive rate of intrusion detection systems using deep learning

آل مسفر, عبد الرحيم بن رقعان سعد ; Almusfir, Abdulrahim Ruqan Saad ; الشهري, حسن بن أحمد . مشرف (2020)

رسالة ماجستير - جامعة نايف العربية للعلوم الأمنية-كلية أمن الحاسب والمعلومات، قسم أمن المعلومات، تخصص أمن المعلومات،

67 ورقة : جداول، أشكال

Thesis

The problem: Classifying the network flow as benign or malicious (DDos attack) with a low false positive rate.

Research objectives: • Recognize new solutions for preventing, detecting, responding and analysing cybersecurity attacks. • Be aware of the advantages of deep learning compared to machine learning techniques. • Recognize existing intrusion detection datasets. • Recognize data science process and tools. • Illustrate how to build and evaluate the generated model.

Research methodology and tools: This thesis investigates deep neural networks and data science for detecting malicious attacks. Main results: • It shows that selecting the relevant feature is a powerful tool for analyzing a big dataset. • It shows that the efficiency of deep neural networks for minimizing the false positive rate is more advanced than the efficiency of K-Nearest neighbors and Naïve Classifier.

Main recommendations: • Focusing on multi-classification instead of binary classification. • Testing the proposed method for other intrusion detection datasets. Comparing the performance of the system to other machine learning techniques: SVM.

المشكلة:تصنيف تدفق الشبكة على أنه حميد أو هجوم ضار بمعدل إيجابي كاذب منخفض.

أهداف البحث• :التعرف على الحلول الجديدة لمنع هجمات الأمن السيبراني والكشف عنها والاستجابة لها وتحليلها. • الدراية بمزايا التعلم العميق مقارنة بتقنيات التعلم الآلي. • التعرف على قواعد البيانات الموجودة للكشف عن التسلل في الشبكات. • التعرف على مراحل وأدوات علم البيانات. • توضيح كيفية بناء وتقييم النموذج الخاص بالتعلم العميق.

منهجيات وأدوات البحث: • تستهدف هذه الرسالة استخدام الشبكات العصبية العميقة وعلم البيانات للكشف عن الهجمات الخبيثة. • يظهر أن اختيار الخصائص ذات الصلة يعتبر أداة قوية لتحليل مجموعة بيانات كبيرة. • يظهر أن المعدل الإيجابي الكاذب للشبكات العصبية العميقة أقل من المعدل الإيجابي الكاذب للتقنيات التعلم الآلي K-Nearest Neighborsو Naïve Classifier.

التوصيات الرئيسية: • التركيز على التصنيف المتعدد بدلاً من التصنيف الثنائي. • اختبار الطريقة المقترحة لمجموعات من قواعد البيانات الأخرى للكشف عن التسلل. • مقارنة النظام المقترح بتقنيات التعلم الآلي الأخرى مثل SVM