عنوان المقالة:الكشف اللغوي عن الأخبار الكاذبة في وسائل التواصل الاجتماعي Linguistic-Based Detection of Fake News in Social Media
محمد مهيوب البحيري | Mohammad Mahyoob | 3521
- نوع النشر
- مقال علمي
- المؤلفون بالعربي
- د. محمد مهيوب , د. جيهان الجرادي , د. مساعد الرحيلي
- المؤلفون بالإنجليزي
- Mohammad Mahyoob Jeehaan Algaraady Musaad Alrahaili
- الملخص العربي
- جذب النمو الهائل للأخبار المزيفة وتأثيرها كمجال بحثي ساخن انتباه الجمهور وهدد سلامتهم في السنوات الأخيرة. ومع ذلك ، هناك مجموعة واسعة من الموضات المطورة للكشف عن المحتويات المزيفة ، سواء تلك الأساليب القائمة على الإنسان أو النهج القائمة على الآلة ؛ أظهر كلاهما عدم كفاية وقيود ، لا سيما تلك الأساليب الأوتوماتيكية بالكامل. الغرض من هذه الدراسة التحليلية للغة الأخبار الإعلامية هو التحقيق والتعرف على السمات اللغوية ومساهمتها في تحليل البيانات للكشف عن النصوص الإخبارية المزيفة والحقيقية وتصفيتها والتمييز بينها. تحدد هذه الدراسة الاستخدامات الواعدة للمؤشرات اللغوية وتضيف نظرة غير تقليدية إلى حد ما إلى الأدبيات السابقة. يستخدم تحليل البيانات النوعية والكمية كأسلوب تحليلي لتحديد الفروق الدقيقة المنهجية بين الأخبار المزيفة والواقعية من حيث اكتشاف ومقارنة 16 سمة ضمن فئات رئيسية للسمات اللغوية (السمات المعجمية والنحوية ) المخصصة يدويًا للنصوص الإخبارية. تتكون مجموعات البيانات التي تم الحصول عليها من المستندات الصحيحة المتاحة للجمهور على موقع Politi-fact ومجموعة البيانات الأولية (الاختبارية) التي تم جمعها عشوائيًا من المنشورات الإخبارية على صفحات Facebook. تظهر النتائج أن الميزات اللغوية ، وخاصة السمات النحوية ، تساعد في تحديد النصوص غير الموثوقة وتوضح أن معظم الأخبار الاختبارية تميل إلى أن تكون مقالات غير موثوقة.
- الملخص الانجليزي
- The tremendous growth and impact of fake news as a hot research field gained the public’s attention and threatened their safety in recent years. However, there is a wide range of developed fashions to detect fake contents, either those human-based approaches or machine-based approaches; both have shown inadequacy and limitations, especially those fully automatic approaches. The purpose of this analytic study of media news language is to investigate and identify the linguistic features and their contribution in analyzing data to detect, filter, and differentiate between fake and authentic news texts. This study outlines promising uses of linguistic indicators and adds a rather unconventional outlook to prior literature. It utilizes qualitative and quantitative data analysis as an analytic method to identify systematic nuances between fake and factual news in terms of detecting and comparing 16 attributes under three main linguistic features categories (lexical, grammatical, and syntactic features) assigned manually to news texts. The obtained datasets consist of publicly available right documents on the Politi-fact website and the raw (test) data set collected randomly from news posts on Facebook pages. The results show that linguistic features, especially grammatical features, help determine untrustworthy texts and demonstrate that most of the test news tends to be unreliable articles.
- تاريخ النشر
- 17/11/2020
- الناشر
- International Journal of English Linguistics
- رقم المجلد
- 11
- رقم العدد
- 1
- ISSN/ISBN
- 1923-869X/1923-8703
- رابط DOI
- 10.5539/ijel.v11n1p99
- الصفحات
- 99-109
- رابط الملف
- تحميل (65 مرات التحميل)
- رابط خارجي
- https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3652758
- الكلمات المفتاحية
- : fake news detection, data mining, linguistic features, text classification, content analysis, social media