عنوان المقالة:عنقدة قواعد البيانات باستخدام التقنيات الذكية Database Clustering using Intelligent Techniques
عباس خضير عباس | Abbas Khudhair Abbas | 1827
Publication Type
Journal
Arabic Authors
عباس خضير عباس ، احمد طارق صادق
English Authors
Abbas Khudhair Abbas and Ahmed Tariq Sadeq
Abstract
نتيجة للتطور الهائل في استخدام قواعد البيانات وامتلاك كميات كبيرة وضخمة من البيانات التي يتم جمعها في قواعد البيانات، فأن عملية التحليل العنقودي (العنقدة) لقواعد البيانات اصبحت في الآونة الأخيرة موضوعا مهما للغاية في مجال البحث عن واستخراج البيانات. ففي مجال التنقيب عن البيانات تركزت الجهود على إيجاد طرق اكثر كفاءة وفعالية في تحليل وعنقدة قواعد البيانات الكبيرة. تقترح هذه الأطروحة طريقتين جديدتين لعنقدة قواعد البيانات، الاولى تقوم بتطوير خوارزمية العنقدة K-Mean Clustering من خلال دمجها مع خوارزمية البحث باستخدام التجاور او التقارب Variable Neighborhood Search ، والثانية تقوم بتطوير خوارزمية العنقدة K-Mean Clustering من خلال دمجها مع خوارزمية بحث طائر الواق واق Cuckoo Search ، حيث ان الخوارزميات المقترحة لا تحتاج إلى إدخال القيم يدويا الى نقاط التمركز (نقاط العنقدة) حيث يتم ايجاد هذه القيم بشكل تلقائي للحصول على أفضل المجموعات مع استخدام خوارزميات التدقيق او سماحية مجموعات العنقدة. تم إجراء التجارب على العديد من قواعد البيانات ذات أحجام مختلفة، البعض منها تم الحصول عليها من الموقع الالكتروني لجامعة كاليفورنيا في ايرفين والخاصة بتعلم الآلة Machine Learning التي تحتوي على 246 مستودع لقواعد البيانات والتي تقدم كخدمة للمجتمع لغرض استخدامها كأمثلة جاهزة لقواعد البيانات لتعلم الآلة والبعض الاخر هي قواعد بيانات خاصة مستخدمة في الدوائر والمؤسسات الحكومية.
Abstract
Owing to the huge amounts of data collected in databases cluster analysis has recently become a highly active topic in data mining research. In data mining, efforts have focused on finding methods for efficient and effective cluster analysis in large database. This thesis proposes two new partitioning cluster methods, first is modified k-mean clustering algorithm with variable Neighborhood Search as a metaheuristic search and the second is modified k-mean clustering algorithm with cuckoo search as swarm intelligence. The proposed algorithms does not need to enter the value of cluster points, instead of that it finds it automatically to get the best clustering with using the clustering validity. This represents its fundamental characteristic. The experiments were made on many different sizes of database, some of which are obtained from UC Irvine Machine Learning Repository which maintains 246 data sets as a service to the machine learning community and some private databases used in government offices. From these experiments, it is concluded that these methods reduce the time which is needed to get the best solution at a half time which is needed to perform same actions and in the same time the iterations to get the best solution are reduced. In addition, these proposed clustering methods give the best quality (as performance) compared with other clustering methods, the performance are improved between (10% - 20%). Finally, to design and implement the system to solve the proposed algorithm, some software and hardware requirements are needed minimum requirements, such as XP Operating System and Visual Basic 6.0 as software requirements and 1.7 GHz Microprocessor, 2GB RAM and 40GB Hard Disk.
Publication Date
9/1/2014
Publisher
Al-Nahrain Journal of Science
Volume No
17
Issue No
3
Pages
195-203
External Link
https://www.anjs.edu.iq/index.php/anjs/article/view/426
Keywords
cluster , database , intelligent , technique , swarm , data mining , machine learning , k-mean , metaheuristic
رجوع