تقييم نماذج التعلم الآلي للتحليلات التنبؤية لاكتشاف أمراض الكبد باستخدام البيانات الضخمة للرعاية الصحية -أريد

عنوان المقالة:تقييم نماذج التعلم الآلي للتحليلات التنبؤية لاكتشاف أمراض الكبد باستخدام البيانات الضخمة للرعاية الصحية Evaluating Machine Learning Models for Predictive Analytics of Liver Disease Detection using Healthcare Big Data

أ.د. أحمد سلامة | Prof. Dr. Ahmed Salama | 11434

نوع النشر: مقال علمي
المؤلفون بالعربي: أحمد سلامة وأخرون
المؤلفون بالإنجليزي: Osama Mohareb Khaled, Ahmed Zakareia Elsherif, Ahmed Salama, Mostafa Herajy, Elsayed Elsedimy
الملخص العربي: تُصنف أمراض الكبد ضمن أكثر المشكلات الصحية انتشارًا على مستوى العالم، مما يتسبب في حدوث معدلات مرضية ووفيات كبيرة. يسمح الاكتشاف المبكر لأمراض الكبد بالتدخل في الوقت المناسب، مما قد يمنع تطور مثل هذه الأمراض إلى مراحل أكثر شدة مثل تليف الكبد أو سرطان الكبد. ولتحقيق هذه الغاية، تم تطوير العديد من نماذج التعلم الآلي سابقًا للتنبؤ المبكر بأمراض الكبد بين المرضى المحتملين. ومع ذلك، فإن كل نموذج له حدوده في الدقة والأداء. في هذه الورقة، نقدم مقارنة شاملة لثلاثة نماذج مختلفة للتعلم الآلي يمكن استخدامها لتعزيز التنبؤ بأمراض الكبد وإدارتها. نستخدم مجموعة بيانات كبيرة مكونة من 32000 سجل لتقييم أداء كل نموذج. أولاً، ننفذ تقنية المعالجة المسبقة لتصحيح البيانات المفقودة أو التالفة في مجموعات بيانات أمراض الكبد، مما يضمن سلامة البيانات. بعد ذلك، نقارن أداء ثلاثة نماذج آلية: أقرب جيران (KNN) وخوارزمية بايز الساذجة الغاوسية (Gaussian NB) والغابات العشوائية (RF). لقد استنتجنا أن خوارزمية RF تظهر أداءً متفوقًا في تقييمنا، حيث تتفوق في كل من الدقة التنبؤية والقدرة على تصنيف المرضى بدقة فيما يتعلق بوجود أمراض الكبد. تظهر نتائجنا أن خوارزمية RF تتفوق على النماذج الأخرى بناءً على العديد من مقاييس الأداء بما في ذلك الدقة: 97.3٪، والدقة: 97٪، والتذكر: 96٪، ودرجة f1: 95٪.
الملخص الانجليزي: Liver diseases rank among the most prevalent health issues globally, causing significant morbidity and mortality. Early detection of liver diseases allows for timely intervention, which can prevent the progression of such diseases to more severe stages such as cirrhosis or liver cancer. To this end, many machine learning models have been previously developed to early predict liver diseases among potential patients. However, each model has its accuracy and performance limitations. In this paper, we present a comprehensive comparison of three different machine learning models that can be employed to enhance the prediction and management of liver diseases. We utilize a big data set of 32,000 records to evaluate the performance of each model. First, we implement a preprocessing technique to rectify missing or corrupt data in liver disease datasets, ensuring data integrity. Afterwards, we compare the performance of three machine models: k-nearest neighbors (KNN), gaussian naive Bayes (Gaussian NB) and random forest (RF). We concluded that the RF algorithm demonstrates superior performance in our evaluation, excelling in both predictive accuracy and the ability to classify patients accurately regarding the presence of liver disease. Our results show that RF outperforms other models based on several performance metrics including accuracy: 97.3%, precision: 97%, recall: 96%, and f1-score: 95%.
تاريخ النشر: 01/01/2025
الناشر: International Journal of Electrical and Computer Engineering (IJECE)
رقم المجلد: 15
رقم العدد: 1
ISSN/ISBN: 2722-2578
رابط DOI: 10.11591/ijece.v15i1
الصفحات: 1162-1174
رابط الملف: تحميل (0 مرات التحميل)
رابط خارجي: https://ijece.iaescore.com/index.php/IJECE
الكلمات المفتاحية: Machine Learning Models, Healthcare Big Data

رجوع