5 أنواع من نماذج الانحدار في التعلم الآلي يجب أن تعرفها

This post is also available in: English (الإنجليزية) हिन्दी (الهندية)

ما هو تحليل الانحدار؟

تحليل الانحدار هو وسيلة للعثور على الاتجاهات في البيانات. على سبيل المثال ، تريد معرفة ما إذا كان هناك أي صلة بين مقدار ما تأكله ومقدار وزنك ؛ يمكن أن يساعدك تحليل الانحدار في العثور على ذلك.

سيوفر لك تحليل الانحدار معادلة للرسم البياني بحيث يمكنك عمل تنبؤات حول بياناتك. تسمى معادلة الانحدار هذه نموذج الانحدار. يُطلق على متغير النتيجة (يُشار إليه عمومًا بـ “y”) الاستجابة أو المتغير التابع ، ويطلق على متغير المتنبئ (يشار إليه عمومًا بـ “x”) متغير توضيحي أو متغير مستقل).

على سبيل المثال ، إذا زاد وزن شخص ما خلال السنوات القليلة الماضية ، فيمكنه التنبؤ بمدى وزنه في السنوات الخمس أو العشر سنوات القادمة إذا استمر نفس الاتجاه. هنا يسمى عدد السنوات المتغير التوضيحي أو المستقل ويسمى الوزن بالاستجابة أو المتغير التابع.

نموذج الانحدار والتعلم الآلي

تحليل الانحدار هو طريقة للتنبؤ بالأحداث المستقبلية بين متغير تابع ومتغير واحد أو أكثر. إنه أحد أكثر نماذج التعلم الآلي شيوعًا. وهي تختلف عن نماذج التصنيف لأنها تقدر قيمة عددية ، بينما تحدد نماذج التصنيف الفئة التي تنتمي إليها الملاحظة. الاستخدامات الرئيسية لتحليل الانحدار هي التنبؤ ونمذجة السلاسل الزمنية وإيجاد علاقة السبب والنتيجة بين المتغيرات.

أنواع نماذج الانحدار

هناك أنواع عديدة من نماذج الانحدار التي يمكنك استخدامها. غالبًا ما يعتمد الاختيار على نوع البيانات التي لديك للمتغير التابع ونوع النموذج الذي يوفر أفضل ملاءمة. تتم مناقشة نماذج الانحدار الأكثر استخدامًا أدناه:

1. الانحدار الخطي

إنه أبسط نموذج انحدار يستخدم للتحليل التنبئي. وهي تتألف من متغير توقع ومتغير تابع مرتبط ببعضهما البعض بطريقة خطية.

الشكل العام لمعادلة الانحدار الخطي هو y = ax b ، حيث y هو متغير تابع و x متغير مستقل له b باعتباره المنحدر (أو التدرج) و c تقاطع y (النقطة التي يتقاطع فيها الخط مع y -محور) من الخط.

what is regression analysisLinear Regression

يجب عليك استخدام الانحدار الخطي حيث ترتبط المتغيرات الخاصة بك بشكل خطي. على سبيل المثال ، إذا كنت تتوقع تأثير زيادة الإنفاق الإعلاني على المبيعات.

2. الانحدار اللوجستي

عندما يكون للمتغير التابع قيمة منفصلة ، يتم استخدام نموذج الانحدار اللوجستي. المتغير المنفصل هو المتغير الذي يمكن أن يحتوي على إحدى القيمتين (إما 0 أو 1 ، صواب أو خطأ ، أسود أو أبيض ، بريد عشوائي أو ليس بريد عشوائي ، وهكذا).

يستخدم الانحدار اللوجستي منحنى سيني لإظهار العلاقة بين المتغير التابع والمتغير (المتغيرات) المستقلة. ومع ذلك ، يعمل الانحدار اللوجستي بشكل أفضل مع مجموعات البيانات الكبيرة التي لها تكرار متساوٍ تقريبًا للقيم في المتغيرات التابعة. الشكل العام لمعادلة الانحدار اللوجستي هو P = 1 / (1 e– (a bx)).

what is regression analysisLogistic Regression

يتم استخدام النموذج اللوجستي لنمذجة احتمالية وجود فئة أو حدث معين مثل النجاح / الفشل ، أو الفوز / الخسارة ، أو الحياة / الموت ، أو الصحة / المرض. يمكن توسيع هذا ليشمل عدة فئات من الأحداث مثل تحديد ما إذا كانت الصورة تحتوي على قطة أو كلب أو أسد ، إلخ. سيتم تعيين احتمالية بين 0 و 1 لكل كائن في الصورة ؛ بمجموع واحد.

3. ريدج الانحدار

يتم تنفيذ انحدار ريدج لتحليل العديد من بيانات الانحدار. عندما يحدث تعدد الخط ، تصبح حسابات المربعات الصغرى غير متحيزة ، ثم يتم لصق درجة التحيز بحسابات الانحدار التي تؤدي إلى تقليل الأخطاء المعيارية من خلال انحدار التلال.

بكلمات بسيطة ، أحيانًا يصبح نموذج الانحدار معقدًا للغاية ويقترب من الإفراط في التجهيز ، لذلك من المفيد تقليل التباين في النموذج وحفظه من التخصيص الزائد. لذا فإن انحدار التلال يصحح حجم المعاملات.

يعمل انحدار ريدج كإجراء علاجي يستخدم لتخفيف العلاقة الخطية المتداخلة بين المتنبئين للنموذج نظرًا لأن النموذج يشتمل على متغيرات مميزة مرتبطة ، لذلك تم تأكيد النموذج النهائي وصارمته في مقاربته القصوى.

4. انحدار اللاسو

مثل انحدار التلال ، فإن الانحدار lasso (مشغل محدد الانكماش الأقل مطلقًا) هو أسلوب تنظيم آخر يقلل من تعقيد النموذج. يقوم بذلك عن طريق حظر الحجم المطلق لمعامل الانحدار. هذا يجعل قيمة المعامل أقرب إلى الصفر ، وهو ما لا يحدث مع انحدار التلال.

تتمثل ميزة هذا النموذج في أنه يمكنه استخدام تحديد الميزة ، مما يتيح لك تحديد مجموعة من الميزات من مجموعة البيانات لبناء النموذج. من خلال استخدام الميزات المطلوبة فقط – وتعيين الباقي على أنه صفر – يتجنب الانحدار lasso overfitting.

5. انحدار متعدد الحدود

نماذج الانحدار متعدد الحدود مجموعة بيانات غير خطية باستخدام نموذج خطي. إنه يعادل صنع ربط مربّع في ثقب دائري. إنه يعمل بطريقة مشابهة للانحدار الخطي المتعدد (وهو مجرد انحدار خطي ولكن مع متغيرات مستقلة متعددة) ولكنه يستخدم منحنى غير خطي. يتم استخدامه عند وجود نقاط البيانات بطريقة غير خطية.

what is regression analysisPolynomial Regression

يحول النموذج نقاط البيانات هذه إلى ميزات متعددة الحدود لدرجة معينة ونماذجها باستخدام نموذج خطي. يتضمن هذا أفضل ملاءمة لهم باستخدام خط متعدد الحدود ، والذي يكون منحنيًا ، بدلاً من الخط المستقيم الذي يظهر في الانحدار الخطي.

أضف تعليق