Enhanced Phishing Detection : A Hybrid SVM-Genetic Algorithm Approach
الكلمات المفتاحية:
Genetic Algorithm، Machine Learning، Phishing Website Detection، Support Vector Machineالملخص
نظرًا لأن الإنترنت أصبح جزءًا أساسيًا من حياة البشر، يستمتع عدد متزايد من الأشخاص بالراحة التي توفرها الإنترنت. ومع زيادة عدد مستخدمي الويب وتطبيقاته ونظرًا لأن غالبية المؤسسات المالية والعامة قامت مؤخرًا بترقية وتعزيز الخدمات المباشرة عبر الإنترنت المقدمة لعملائها، بالتالي تتزايد الهجمات على منصات الإنترنت المختلفة بشكل تدريجي. يستخدم المهاجمون أساليب مختلفة لسرقة المعلومات الحساسة للمستخدمين، إحدى الحيل الأكثر شيوعًا هي مواقع التصيد الاحتيالي. لذلك ظهرت الحاجة إلى التصدي لهذه الهجمات والتحسين المستمر للتقنيات التي تعمل على اكتشافها، والتي من ضمنها أساليب التعلم الآلي التي تعمل على تصنيف ما إذا كان الموقع تصيدًا أم لا. وذلك اعتمادًا على عدد من البيانات التي يتم الحصول عليها من صفحات الويب الاخرى. نتيجة لذلك تهدف هذه الأطروحة إلى اقتراح وسيلة للكشف وتصنيف مواقع الويب الاحتيالية باستخدام خوارزمية Support Vector Machine وتحسينها باستخدام الخوارزمية الجينية Genetic Algorithm للحصول على أفضل دقة في التصنيف، بالإضافة لاستخدامها كخوارزمية لاختيار أفضل الميزات من الميزات المستخرجة. تتكون مجموعة البيانات التي تم جمعها من 12,000عينة، حيث تم جمع عناوين الويب الغير شرعية من موقع PhishTank وتم جمع عناوين الويب الشرعية من موقعKaggle وتم استخدام مقاييسaccuracy, precision, recall and F1-score لتقييم أداء الطريقة المقترحة. تمت مقارنة النتائج المتحصل عليها مع نتائج دراسة سابقة باستخدام خوارزميتي SVM مع Ant Colony Optimization. حيث اظهرت هذه النتائج أن دقة التصنيف للنهج المقترح حققت %97.62 وهي أعلى بنسبة %9.29 من نموذج SVM التقليدي، وتساوت تقريبا مع النموذج SVM-ACO الاخر.
المراجع
Haenlein, M., and Kaplan, A.: ‘A brief history of artificial intelligence: On the past, present, and future of artificial intelligence’, California management review, 2019, 61, (4), pp. 5-14
Helm, J.M., Swiergosz, A.M., Haeberle, H.S., Karnuta, J.M., Schaffer, J.L., Krebs, V.E., Spitzer, A.I., and Ramkumar, P.N.: ‘Machine learning and artificial intelligence: definitions, applications, and future directions’, Current reviews in musculoskeletal medicine, 2020, 13, (1), pp. 69-76.
Bhatia, P.: ‘Data mining and data warehousing: principles and practical techniques’ (Cambridge University Press, 2019. 2019).
Ludl, C., McAllister, S., Kirda, E., and Kruegel, C., On the effectiveness of techniques to detect phishing sites, in The Detection of Intrusions and Malware, and Vulnerability Assessment, Springer, 2007, pp. 20–39
Aburrous, M., Mohammed, R., Dahal, K., and Thabtah, F. (2011). Phishing website detection using intelligent data mining techniques, University of Bradford.
Tanaka and J. Suzuki, “Web and Database Technologies”, Proc. of ACM SIGMOD, pp. 10-22, 201 APWG, “Phishing activity trends report, 3rd Quarter 2018".
Eint, S., Chaw, T., Hayato, Y., A Survey of URL-based Phishing Detection, DEIM Forum, 2019.
M. M. Elsheh and K. Swayeb, "Phishing Website Detection Using a Hybrid Approach Based on Support Vector Machine and Ant Colony Optimization," in 2023 IEEE 3rd International Maghreb Meeting of the Conference on Sciences and Techniques of Automatic Control and Computer Engineering (MI-STA), 2023, pp. 402-406.
Pandey, A., Gill, N., Sai Prasad Nadendla, K., and Thaseen, I.S.: ‘Identification of phishing attack in websites using random forest-svm hybrid model’, in Editor (Ed.)^(Eds.): ‘Book Identification of phishing attack in websites using random forest-svm hybrid model’ (Springer, 2020, edn.), pp. 120-128
A. Ozcan, C. Catal, E. Donmez, and B. Senturk, "A hybrid DNN–LSTM model for detecting phishing URLs," Neural Computing and Applications, vol. 35, pp. 4957-4973, 2023.
S. Remya, M. J. Pillai, K. K. Nair, S. R. Subbareddy, and Y. Y. Cho, "An effective detection approach for phishing URL using ResMLP," IEEE access, vol. 12, pp. 79367-79382, 2024.
Elsheh, M.M. and Abolawaifa, E., 2025. Hybrid Stacking Ensemble Model for Phishing URL Detection Using PCA and Machine Learning. Journal of Technology Research, pp.515-525.
PhishTank. (2023). Developer Information. Available: https://www.phishtank.com/developer_info.php. Accessed: Apr. 24, 2023.
Kaggle. (2023). Developer Information. Available: https:// https://www.kaggle.com/datasets. Accessed: Apr. 24, 2023.
M. Aydin and N. Baykal, "Feature extraction and classification phishing websites based on URL," 2015.
A. S. Raja, R. Vinodini, and A. Kavitha, "Lexical features based malicious URL detection using machine learning techniques," Materials Today: Proceedings, vol. 47, pp. 163-166, 2021.
W. Ali and A. A. Ahmed, "Hybrid intelligent phishing website prediction using deep neural networks with genetic algorithm‐based feature selection and weighting," IET Information Security, vol. 13, pp. 659-669, 2019
Q. Zou, L. Ni, T. Zhang, and Q. Wang, "Deep learning-based feature selection for remote sensing scene classification," IEEE Geoscience and remote sensing letters, vol. 12, pp. 2321-2325, 2015.
Scikit-learn. (2023). Sklearn.svm.SVC. available: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html. Accessed: Apr. 23,2023.
B. Bischl, M. Binder, M. Lang, T. Pielok, J. Richter, S. Coors, et al., "Hyperparameter optimization: Foundations, algorithms, best practices, and open challenges," Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, vol. 13, p. e1484, 2023.
J. Brownlee, Optimization for machine learning: Machine Learning Mastery, 2021.
S.-J. Bu and H.-J. Kim, "Optimized URL Feature Selection Based on Genetic-Algorithm-Embedded Deep Learning for Phishing Website Detection," Electronics, vol. 11, p. 1090, 2022.
Sklearn-deap. (2023). Available: https://github.com/rsteca/sklearn-deap/blob/master/evolutionary_search/optimize.py . Accessed: May, 16,2023.
التنزيلات
منشور
كيفية الاقتباس
إصدار
القسم
الرخصة
الحقوق الفكرية (c) 2026 محمد مصباح الشح، Sarah Al-mabrouk Ebayou

هذا العمل مرخص بموجب Creative Commons Attribution 4.0 International License.
