عنوان المقالة:نظرة عامة على استخدام تنقيب البيانات والتقنيات اللغوية في بناء نظم الكشف المبكر المعتمد على المدونات في قطاع الرعاية الصحية AN OVERVIEW ON THE USE OF DATA MINING AND LINGUISTICS TECHNIQUES FOR BUILDING MICROBLOG-BASED EARLY DETECTION SYSTEMS IN THE HEALTHCARE SECTOR
حيدر محمدحبيب مجيد | Haider M. Habeeb | 6584
نوع النشر
مجلة علمية
المؤلفون بالعربي
حيدر محمد حبيب، د. نبيل هاشم الاعرجي
المؤلفون بالإنجليزي
Haider M. Habeeb, Nabeel Al-A’araji
الملخص العربي
أصبح استخدام شبكات التواصل الاجتماعي مثل Facebook و Twitter أكثر شيوعا من أجل تبادل الأخبار والمعلومات ونشرها في الوقت الحقيقي. حيث يتيح Twitter على وجه الخصوص النشر الفوري للرسائل القصيرة على شكل مدونة قصيرة (تغريدة) إلى المتابعين. يستعرض هذا العمل الأدبيات لاستكشاف وفحص كيفية استخدام OSNs ، مثل أداة المدونات الصغيرة Twitter ، في اكتشاف انتشار الأوبئة. تسلط ورقة البحث هذه الضوء على التحديات الكبيرة في مجال معالجة اللغات الطبيعية عند استخدام أنظمة الكشف المبكر عن الأمراض التي تعتمد على المدونات الصغيرة. على سبيل المثال ، بيانات النصية الصغيرة عبارة عن مجموعة غير منظمة من الرسائل القصيرة (140 حرفًا على Twitter )، مع استخدام الضوضاء واللغة الإنجليزية بشكل غير قياسي. ومن ثم ، يبحث البحث حاليًا في مجال اللغويات من أجل تحديد دلالات النص واستخدام تقنيات استخراج البيانات من أجل استخراج معلومات مفيدة للكشف عن انتشار المرض. علاوة على ذلك، يناقش البحث التطبيقات وأنظمة الكشف المبكر عن الأمراض القائمة على شبكات OSN ويحدد اتجاهات البحوث المستقبلية بشأن تحسين هذه النظم على أساس مجموعة من أساليب اللغويات وأساليب استخراج البيانات وأنظمة التوصية.
الملخص الانجليزي
The usage of Online Social Networks (OSN), such as Facebook and Twitter are becoming more and more popular in order to exchange and disseminate news and information in real-time. Twitter in particular allows the instant dissemination of short messages in the form of microblogs to followers. This Survey reviews literature to explore and examine the usage of how OSNs, such as the microblogging tool Twitter, can help in the detection of spreading epidemics. The paper highlights significant challenges in the field of Natural Language Processing (NLP) when using microblog based Early Disease Detection Systems. For instance, microblogging data is an unstructured collection of short messages (140 characters in Twitter), with noise and non-standard use of the English language. Hence, research is currently exploring the field of linguistics in order to determine the semantics of the text and uses data mining techniques in order to extract useful information for disease spread detection. Furthermore, the survey discusses applications and existing early disease detection systems based on OSNs and outlines directions for future research on improving such systems based on a combination of linguistics methods, data mining techniques and recommendation systems.
تاريخ النشر
01/05/2015
الناشر
International Journal of Computer Science and Information Technologies
رقم المجلد
7
رقم العدد
5
ISSN/ISBN
0975-4660
رابط DOI
DOI:10.5121/ijcsit.2015.7511
الصفحات
143-155
رابط خارجي
https://airccj.org/csecfp/library/find.php?SZ=A&page=199
الكلمات المفتاحية
Data Mining, Social Networks, Healthcare
رجوع