عنوان المقالة:الكشف عن التفاعلات الدوائية الضارة باستخدام التحليل الدلالي الكامن Adverse Drug Reaction Detection Using Latent Semantic Analysis
احمد عادل نافع | Ahmed Adil Nafea | 2996
Publication Type
Journal
Arabic Authors
احمد عادل نافع و نازليا عمر و محمد ماهر العاني
English Authors
Ahmed Adil Nafea, Nazlia Omar and Mohammed M. AL-Ani
Abstract
يعد الكشف عن التفاعلات الدوائية الضارة (ADRs) أحد المعلومات المهمة لتحديد وجهة نظر المريض بشأن دواء واحد. بحثت معظم الدراسات في استخراج التفاعلات الدوائية الضائرة من الشبكات الاجتماعية ، حيث يشارك المستخدمون آرائهم حول دواء معين. استخدمت بعض الدراسات مصطلحات مثيرة للكشف عن التفاعلات الدوائية الضائرة. أظهرت مثل هذه الدراسات أداءً رائعًا من حيث استخراج ADR. ومع ذلك ، فإن هذه الشروط فقط لن تكون كافية لأنها تحتاج إلى التمديد بشكل دوري عند اكتشاف آثار جانبية جديدة أو كيانات طبية جديدة ذات صلة. بالإضافة إلى ذلك ، فإن مساحة الميزة ذات المصطلحات المشغلة تفتقر إلى الدلالات الكامنة. تهدف هذه الدراسة إلى اقتراح طريقة دلالية تعتمد على التحليل الدلالي الكامن (LSA) لتحسين اكتشاف ADR. تم استخدام مجموعة بيانات معيارية في التجارب جنبًا إلى جنب مع العديد من عمليات المعالجة المسبقة التي تم تطبيقها بما في ذلك إزالة كلمة التوقف ، والترميز والقطع بثلاثة مصنفات تم تدريبها على LSA المقترح ، وهي Support Vector Machine (SVM) و Naïve Bayes ( ملحوظة) والانحدار الخطي (LR). بالإضافة إلى ذلك ، تم استخدام عرضين للوثائق ، وهما مصطلح التردد (TF) وتردد الوثيقة المعكوس للتردد (TF-IDF). أظهرت النتائج أن LSA المقترح تفوق في الأداء على شروط بدء التشغيل الموسعة الأساسية من خلال تحقيق 82٪ من مقياس F لمجموعة البيانات. يسلط هذا التفوق الضوء على استخدام LSA حيث يمكن تحديد المراسلات الدلالية بشكل صحيح بدلاً من استخدام قائمة محددة مسبقًا من مصطلحات التشغيل.
Abstract
Detecting Adverse Drug Reactions (ADRs) is one of the important information for determining the view of the patient on one drug. Most studies have investigated the extraction of ADRs from social networks, in which users share their opinion on a particular medication. Some studies have used trigger terms to detect ADRs. Such studies showed remarkable performance in terms of extracting ADR. However, these terms only would not be sufficient since it needs to be extended periodically when new side effects or new medical-related entities are being discovered. In addition, the feature space with trigger terms would lack latent semantic. This study aims to propose a semantic method based on Latent Semantic Analysis (LSA) for improving the detection of ADR. A benchmark dataset has been used in the experiments along with several pre-processing operations that have been applied including stop word removal, tokenization and stemming with three classifiers that were trained on the proposed LSA, namely Support Vector Machine (SVM), Naïve Bayes (NB) and Linear Regression (LR). In addition, two representations of documents were used, namely Term Frequency (TF) and Term Frequency-Inverse Document Frequency (TF-IDF). Results showed that the proposed LSA outperformed the baseline extended trigger terms by achieving 82% of F-measure for the dataset. Such superiority highlights the use of LSA where the semantic correspondences could be identified correctly rather than using a predefined list of trigger terms.
Publication Date
10/28/2021
Publisher
Journal of Computer Science
Volume No
17
Issue No
10
ISSN/ISBN
1549-3636
DOI
DOI: https://doi.org/10.3844/jcssp.2021.960.970
Pages
960-970
File Link
تحميل (0 مرات التحميل)
External Link
https://thescipub.com/abstract/jcssp.2021.960.970
Keywords
Adverse Drug Reaction, Latent Semantic Analysis, Naïve Bayes, Support Vector Machine, Linear Regression
رجوع