ئارزو محمد مصطفى


النظرية والنظرة العامة لفهم التعلم الخاضع للإشراف (Supervised Machine Learning)- جزء الثاني

ئارزو محمد مصطفى | Arazo Mohammed Mustafa


25/11/2023 القراءات: 869  



فكرة عمل لـ 6 خوارزميات التعلم الخاضع للإشراف الشائعة (نظرة عامة)
الآن، أصبح لدينا فهم أساسي للعملية بشكل العام. سنتعرف على كيفية عمل واستخدامات خوارزميات التعلم الآلي الخاضعة للإشراف الشائعة:

1. الانحدار الخطي (Linear Regression):
وكما يوحي الاسم، يتم استخدامه في مهام الانحدار مثل التنبؤ بأسعار الأسهم، والتنبؤ بدرجات الحرارة، وتقدير احتمالية تطور المرض، وما إلى ذلك. نحاول التنبؤ بالهدف (المتغير التابع) باستخدام مجموعة التسميات (المتغيرات المستقلة). يفترض أن لدينا علاقة خطية بين ميزات الإدخال لدينا ووالمخرج (التسمية). تدور الفكرة المركزية حول التنبؤ بالخط الأكثر ملاءمة لنقاط البيانات لدينا عن طريق تقليل الخطأ بين قيمنا الفعلية والمتوقعة. ويمثل هذا الخط بالمعادلة:

Y= b0 + b1X
حيث ان:
‏Y= الإخراج المتوقع.
‏X = ميزة الإدخال أو مصفوفة الميزات في الانحدار الخطي المتعدد
‏b0 = التقاطع (حيث يعبر الخط المحور Y).
‏b1 = الميل أو المعامل الذي يحدد انحدار الخط.

ويقدر ميل الخط (الوزن) وتقاطعه (التحيز). يمكن استخدام هذا الخط بشكل أكبر لإجراء التنبؤات. على الرغم من أنه النموذج الأبسط والمفيد لتطوير خطوط الأساس، إلا أنه حساس للغاية للقيم المتطرفة التي قد تؤثر على موضع الخط.


صورة من Primo.ai


2. الانحدار اللوجستي (Logistic Regression):
على الرغم من أنه يحتوي على انحدار في اسمه، إلا أنه يستخدم بشكل أساسي لمشاكل التصنيف الثنائي. ويتنبأ باحتمالية النتيجة الإيجابية (المتغير التابع) والتي تقع في نطاق من 0 إلى 1. من خلال تحديد الحد(threshold) (عادة 0.5)، على سبيل مثال عندما نقوم بتصنيف نقاط البيانات: النقاط الذين لديهم قيمة يساوي او أكبر من (0.5)، ينتمون إلى الفئة الإيجابية، والعكس صحيح بالنسبة لنقاط الذين لديهم قيمة اقل من (0.5)، ينتمون إلى الفئة السلبية. يحسب الانحدار اللوجستي هذا الاحتمال باستخدام الدالة السيني (sigmoid وتسمي ايضا دالة التنشيط هي دالة رياضية لها منحنى على شكل حرف S) المطبقة على المجموعة الخطية لميزات الإدخال المحددة على النحو التالي:



حيث ان:
‏P(Y=1) = احتمال أن تنتمي نقطة البيانات إلى الفئة الإيجابيةز
‏X1 ,... ,Xn = ميزات الإدخال
‏b0,....,bn = أوزان الإدخال التي تتعلمها الخوارزمية أثناء التدريب
مثل ما ذكرنا هذه الدالة هي في شكل منحنى S ويحول أي نقطة بيانات إلى درجة احتمالية ضمن نطاق (0 - 1). يمكنك رؤية الرسم البياني أدناه لفهم أفضل:


صورة من Wikipedia

تشير القيمة الأقرب إلى 1 إلى ثقة أعلى في النموذج في تنبؤاته. تمامًا مثل الانحدار الخطي، فهو معروف ببساطته ولكن لا يمكننا إجراء التصنيف متعدد الفئات دون تعديل الخوارزمية الأصلية.

3. أشجار القرار (Decision Trees)
على عكس الخوارزميتين المذكورتين أعلاه، يمكن استخدام أشجار القرار لكل من مهام التصنيف والانحدار. لديها هيكل هرمي تماما مثل المخططات الانسيابية. في كل عقدة، يتم اتخاذ قرار بشأن المسار بناءً على بعض قيم الميزات المستقلة (X). تستمر العملية الى ان نصل إلى العقدة الأخيرة التي تصور القرار النهائي. فيما يلي بعض المصطلحات الأساسية التي يجب أن تكون على دراية بها:

 العقدة الجذرية: تسمى العقدة العليا التي تحتوي على مجموعة البيانات بأكملها بالعقدة الجذرية. نختار بعد ذلك أفضل ميزة باستخدام بعض الخوارزميات لتقسيم مجموعة البيانات إلى شجرتين فرعيتين أو أكثر.
 العقد القرار: تمثل كل عقدة داخلية ميزة محددة وقاعدة قرار لتحديد الاتجاه المحتمل التالي لنقطة البيانات.
 العقد الفرعية (او تسمى اوراق): يشار إلى العقد النهائية التي تمثل تسمية الفئة باسم العقد الورقية.

ولتوضيح أكثر يمكنك رؤية الشكل أدناه:

صورة من javatpoint
وعند تنبأ بالقيم العددية المستمرة لحل مشكلة الانحدار. مع نمو حجم مجموعة البيانات، فإنها تسبب التشويش الذي يؤدي إلى overfitting وهي نوع من أنواع اخطا في بناء نموذج. يمكن التعامل مع هذا الخطأ عن طريق تقليم شجرة القرار. نقوم بإزالة الفروع التي لا تحسن بشكل كبير من دقة قراراتنا. يساعد هذا في إبقاء شجرتنا مركزة على أهم العوامل ويمنعها من الضياع في التفاصيل.


صورة من قبل Jake Hoare

4. الغابة عشوائية (Random Forest)
يمكن أيضًا استخدام الغابة العشوائية لكل من مهام التصنيف والانحدار. إنها مجموعة من أشجار القرار تعمل معًا لإجراء التنبؤ النهائي. يمكنك أن تفكر في الأمر على أنه لجنة من الخبراء تتخذ قرارًا جماعيًا. وهنا كيف يعمل:

 أخذ عينات البيانات: بدلاً من أخذ مجموعة البيانات بأكملها مرة واحدة، فإنه يأخذ عينات عشوائية من خلال عملية تسمى bootstrapping أو bagging.
 تحديد المتغيرات (X) أكثر اهمية (Feature Selection): بالنسبة لكل شجرة قرار في مجموعة عشوائية، يتم أخذ المجموعة الفرعية العشوائية من المتغيرات في الاعتبار عند اتخاذ القرار بدلاً من مجموعة المتغيرات الكاملة.
 التصويت: بالنسبة للتصنيف، تدلي كل شجرة قرار في الغابة العشوائية بصوتها ويتم اختيار الفرع الذي حصل على أعلى الأصوات. بالنسبة للانحدار، نقوم بمتوسط القيم التي تم الحصول عليها من جميع الأشجار.
على الرغم من أنه يقلل من تأثير overfitting الناتج عن أشجار القرار الفردية، إلا أنه مكلف من الناحية الحسابية. إحدى الكلمات التي ستقرأها بشكل متكرر في الأدبيات هي أن الغابة العشوائية هي اسلوب تعلم جماعي (ensemble learning method)، مما يعني أنها تجمع بين نماذج متعددة لتحسين الأداء العام.

5. دعم آلات المتجهات (Support Vector Machines) ومختصرها (SVM)
يتم استخدامه بشكل أساسي لمشاكل التصنيف ولكن يمكنه التعامل مع مهام الانحدار أيضًا. يحاول العثور على أفضل مستوى تشعبي يفصل بين الفئات المميزة باستخدام النهج الإحصائي، على عكس النهج الاحتمالي للانحدار اللوجستي. يمكننا استخدام SVM الخطي للبيانات القابلة للفصل خطيً


الانحدار الخطي، الانحدار اللوجستي، أشجار القرار ، (SVM)


يجب تسجيل الدخول للمشاركة في اثراء الموضوع