عنوان المقالة:تأثير اختيار الميزة على اكتشاف مواقع الويب المخادعة دراسة تجريبية حول اختيار مجموعة فرعية قوية للميزات من أجل التصنيف الفعال The Effect of Feature Selection on Phish Website Detection An Empirical Study on Robust Feature Subset Selection for Effective Classification
الدكتورة هبة زهير زيدان | Dr. Hiba Zuhair | 4918
نوع النشر
مجلة علمية
المؤلفون بالعربي
هبة زهير، علي سلامات، مازلينا صالح
المؤلفون بالإنجليزي
Hiba Zuhair, Ali Selamat,Mazleena Salleh
الملخص العربي
ي الآونة الأخيرة ، أتاحت الحملات المحدودة لمكافحة التصيد الاحتيالي للمتصيدين المزيد من الفرص لتجاوز عمليات الخداع المتقدمة. علاوة على ذلك ، أدى الفشل في ابتكار تقنيات تصنيف مناسبة لتحديد هذه الخداع بشكل فعال إلى تدهور عملية اكتشاف مواقع التصيد الاحتيالي. وبالتالي ، استغلال كالجديد ؛ قليل؛ تنبؤي؛ والميزات الفعالة قدر الإمكان كتحدي رئيسي للحفاظ على مرونة الاكتشاف. وبالتالي ، تم تنفيذ بعض الأعمال السابقة للتحقيق وتطبيق طرق معينة مختارة لتطوير تقنيات التصنيف الخاصة بهم. ومع ذلك ، لم تتفق أي دراسة بشكل عام على طريقة اختيار الميزة التي يمكن استخدامها كأفضل مساعد لتحسين أداء التصنيف. ومن هنا ، قامت هذه الدراسة بفحص هذه الأساليب تجريبياً وتأثيراتها على أداء التصنيف. علاوة على ذلك ، فإنه يوصي ببعض المعايير المعززة لتقييم نتائجها ويقدم مساهمة في المشكلة المطروحة. تم في هذه الدراسة فحص الميزات الهجينة ومجموعات البيانات ذات الأبعاد المنخفضة والعالية وطرق اختيار الميزات المختلفة ونماذج التصنيف. نتيجة لذلك ، أظهرت النتائج تحسنًا ملحوظًا في دقة الكشف مع زمن انتقال منخفض ، بالإضافة إلى مكاسب جديرة بالملاحظة في المتانة وقابلية التنبؤ. على الرغم من أن اختيار مجموعة فرعية مثالية للميزات كان مهمة صعبة ، إلا أن النتائج التي تم الحصول عليها من هذه الدراسة قد وفرت مجموعة فرعية من الميزات الأكثر فائدة قدر الإمكان للاختيار القوي والتصنيف الفعال في مجال اكتشاف التصيد.
الملخص الانجليزي
Recently, limited anti-phishing campaigns have given phishers more possibilities to bypass through their advanced deceptions. Moreover, failure to devise appropriate classification techniques to effectively identify these deceptions has degraded the detection of phishing websites. Consequently, exploiting as new; few; predictive; and effective features as possible has emerged as a key challenge to keep the detection resilient. Thus, some prior works had been carried out to investigate and apply certain selected methods to develop their own classification techniques. However, no study had generally agreed on which feature selection method that could be employed as the best assistant to enhance the classification performance. Hence, this study empirically examined these methods and their effects on classification performance. Furthermore, it recommends some promoting criteria to assess their outcomes and offers contribution on the problem at hand. Hybrid features, low and high dimensional data sets, different feature selection methods, and classification models were examined in this study. As a result, the findings displayed notably improved detection precision with low latency, as well as noteworthy gains in robustness and prediction susceptibilities. Although selecting an ideal feature subset was a challenging task, the findings retrieved from this study had provided the most advantageous feature subset as possible for robust selection and effective classification in the phishing detection domain.
تاريخ النشر
01/11/2015
الناشر
SAI-International Journal of Advanced Computer Science and Applications
رقم المجلد
6
رقم العدد
10
الصفحات
221-232
رابط الملف
تحميل (87 مرات التحميل)
الكلمات المفتاحية
phish website; phishing detection; feature selection; classification model
رجوع