7 خطوات أساسية في التعلم الآلي

This post is also available in: English (الإنجليزية) हिन्दी (الهندية)

التعلم الآلي هو تطبيق للذكاء الاصطناعي (AI) يوفر للأنظمة القدرة على التعلم والتحسين تلقائيًا من التجربة دون أن تكون مبرمجة بشكل واضح يركز التعلم الآلي على تطوير برامج الكمبيوتر التي يمكنها الوصول إلى البيانات واستخدامها للتعلم بأنفسهم.

تبدأ عملية التعلم بالملاحظات أو البيانات ، مثل الأمثلة أو الخبرة المباشرة أو التعليمات ، للبحث عن أنماط في البيانات واتخاذ قرارات أفضل في المستقبل بشأن الأمثلة التي نقدمها. الهدف الأساسي هو السماح لأجهزة الكمبيوتر بالتعلم تلقائيًا دون تدخل بشري أو مساعدة وتعديل الإجراءات وفقًا لذلك.

الخطوات الأساسية في تعلم الآلة

يمكن تقسيم عملية التعلم الآلي إلى 7 خطوات. لفهم هذه الخطوات ، دعنا نفكر في نموذج يتم تدريبه على التمييز بين الفاكهة سواء كانت تفاحة أو برتقالية. في العالم الحقيقي ، يكون التعلم الآلي قادرًا على القيام بمهام أكثر تعقيدًا. ومع ذلك ، لشرح العملية ، يتم أخذ المثال أعلاه في الاعتبار.

1. جمع البيانات

جمع البيانات هو عملية جمع وقياس المعلومات من مصادر مختلفة. باستخدام البيانات التي نجمعها لتطوير حلول الذكاء الاصطناعي (AI) والتعلم الآلي ، يجب جمعها وتخزينها بطريقة منطقية لمشكلة العمل.

لاستخدام نموذج للتمييز بين الفاكهة ، يمكن استخدام معلمات مختلفة لتصنيف الفاكهة على أنها تفاحة أو برتقالة. لتبسيط الأمور ، دعنا نأخذ سمتين فقط يستخدمهما نموذجنا – اللون والشكل. باستخدام هذه الميزات ، نأمل أن يتمكن نموذجنا من التمييز بدقة بين هاتين الثمار.

وبالتالي ، يمكن تلخيص البيانات التي تم جمعها في هذا على النحو التالي:

لونشكلفاكهة
أحمرجولة مخروطيةتفاحة
البرتقاليمستدير – كرويالبرتقالي

ستكون هناك حاجة إلى آلية لجمع البيانات للميزتين المختارين لدينا. على سبيل المثال ، لجمع البيانات عن اللون ، قد نستخدم مطيافًا ، وبالنسبة للشكل ، قد نستخدم صورًا للفاكهة. سنحاول الحصول على أكبر عدد ممكن من أنواع التفاح والبرتقال المختلفة لإنشاء مجموعة لميزاتنا لجمع البيانات.

يتيح لك جمع البيانات تسجيل الأحداث الماضية حتى نتمكن من استخدام تحليل البيانات للعثور على الأنماط المتكررة. من هذه الأنماط ، يمكنك بناء نماذج تنبؤية باستخدام خوارزميات التعلم الآلي التي تبحث عن الاتجاهات وتتنبأ بالتغييرات المستقبلية.

تعد النماذج التنبؤية جيدة فقط مثل البيانات التي يتم إنشاؤها منها ، لذا فإن ممارسات جمع البيانات الجيدة ضرورية لتطوير نماذج عالية الأداء. يجب أن تكون البيانات خالية من الأخطاء وتحتوي على معلومات ذات صلة بالمهمة المطروحة. على سبيل المثال ، لن يستفيد النموذج المقترح المدروس في مثال من حجم الفاكهة حيث يمكن أن يكون حجم التفاح والبرتقال متماثلين.

2. تحضير البيانات

قد يكون إعداد البيانات من أصعب الخطوات في أي مشروع للتعلم الآلي. والسبب هو أن كل مجموعة بيانات مختلفة ومخصصة للغاية للمشروع.

إعداد البيانات (يشار إليه أيضًا باسم “المعالجة المسبقة للبيانات”) هو عملية تحويل البيانات الأولية بحيث يمكن تشغيلها من خلال خوارزميات التعلم الآلي لعمل تنبؤات.

CodingHero - 7 خطوات أساسية في التعلم الآلي 1 11 Basic Machine Learning Terms Kids Should Know 952 31

على سبيل المثال ، بمجرد جمع البيانات للميزتين الرئيسيتين ، ستكون خطوتنا التالية هي إعداد البيانات لمزيد من الخطوات. ينصب التركيز الرئيسي في هذه المرحلة على التعرف على أي تحيزات محتملة في مجموعات البيانات الخاصة بنا وتقليلها للسمتين. هذا لأننا لا نريد أن يكون للبيانات أي تأثير على خيارات النموذج. علاوة على ذلك ، سوف نفحص مجموعات البيانات الخاصة بنا بحثًا عن أي انحراف تجاه فاكهة معينة. سيساعد هذا مرة أخرى في تحديد وتصحيح التحيز المحتمل لأنه سيعني أن النموذج سيكون بارعًا في تحديد فاكهة واحدة بشكل صحيح ولكنه قد يصارع مع الفاكهة الأخرى.

يمكن أن تكون عملية إعداد البيانات معقدة بسبب مشكلات مثل:

  • السجلات المفقودة أو غير المكتملة: من الصعب الحصول على كل نقطة بيانات لكل سجل في مجموعة البيانات. تظهر البيانات المفقودة أحيانًا كخلايا فارغة أو قيم أو حرف معين.
  • القيم المتطرفة أوالحالات الشاذة: غالبًا ما تظهر القيم غير المتوقعة في توزيع القيم ، خاصة عند العمل مع بيانات من مصادر غير معروفة تفتقر إلى ضوابط التحقق من صحة البيانات الضعيفة.
  • البيانات المهيكلة / المنسقة بشكل غير صحيح: تحتاج البيانات أحيانًا إلى الاستخراج إلى تنسيق أو موقع مختلف. هناك طريقة جيدة لمعالجة هذا الأمر وهي استشارة خبراء المجال أو الانضمام إلى البيانات من مصادر أخرى.
  • القيم غير المتسقة والمتغيرات الفئوية غير المعيارية: غالبًا عند دمج البيانات من مصادر متعددة ، يمكن أن ينتهي بنا الأمر بتغيرات في المتغيرات كما في مثالنا “RD” المسجلة بدلاً من “الجولة”.

3. اختيار نموذج

اختيار نوع النموذج هو مسار العمل التالي لدينا بمجرد أن ننتهي من الخطوات المتمحورة حول البيانات. اختيار النموذج هو عملية اختيار نموذج تعلم آلي واحد نهائي من بين مجموعة من نماذج التعلم الآلي المرشحة لمجموعة بيانات التدريب. اختيار النموذج هو الذي يمكن تطبيقه عبر أنواع مختلفة من النماذج (على سبيل المثال ، الانحدار اللوجستي ، SVM، KNN ، وما إلى ذلك) وعبر نماذج من نفس النوع تم تكوينها باستخدام معلمات تشعبية مختلفة للطراز (على سبيل المثال ، نواة مختلفة في SVM).

تم تصميم هذه النماذج بأهداف مختلفة في الاعتبار. على سبيل المثال ، تكون بعض الطرز أكثر ملاءمة للتعامل مع النصوص بينما قد يكون طراز آخر مجهزًا بشكل أفضل للتعامل مع الصور. فيما يتعلق بنموذجنا ، فإن نموذج الانحدار الخطي البسيط مناسب للتمييز بين الفاكهة. في هذه الحالة ، سيكون نوع الفاكهة هو المتغير التابع لنا بينما يكون لون الفاكهة وشكل الفاكهة متنبئين أو متغيرين مستقلين.

4. تدريب نموذج

يعد تدريب النموذج جزءًا رئيسيًا من عملية التعلم الآلي. يتم تنفيذ الجزء الأكبر من “التعلم” في هذه المرحلة. نستخدم هنا جزء من مجموعة البيانات المخصصة للتدريب لتعليم نموذجنا أداء التنبؤ.

كما في حالة مثالنا ، تم تخصيص مجموعة البيانات التي تم جمعها في المراحل السابقة للتدريب لتعليم نموذجنا التفريق بين الثمرتين. إذا نظرنا إلى نموذجنا من منظور رياضي ، فإن المدخلات ، أي ، ميزتنا 2 سيكون لها معاملات. تسمى هذه المعاملات بأوزان الميزات. عملية تحديد القيم هي من التجربة والخطأ. في البداية ، نختار قيمًا عشوائية لهم ونقدم المدخلات. تتم مقارنة المخرجات التي تم تحقيقها بالإخراج الفعلي ويتم تقليل الفرق إلى الحد الأدنى من خلال تجربة قيم مختلفة. يتم تكرار التكرارات باستخدام إدخالات مختلفة من مجموعة بيانات التدريب الخاصة بنا حتى يصل النموذج إلى مستوى الدقة المطلوب.

5. تقييم نموذج

مع تدريب النموذج ، يجب اختباره لمعرفة ما إذا كان سيعمل بشكل جيد في مواقف العالم الحقيقي. هذا هو السبب في استخدام جزء مجموعة البيانات التي تم إنشاؤها للتقييم للتحقق من كفاءة النموذج. هذا يضع النموذج في سيناريو حيث قد يواجه مواقف لم تكن جزءًا من تدريبه.

في حالتنا ، قد يعني ذلك محاولة تحديد نوع تفاحة أو برتقالة جديدة تمامًا على النموذج. ومع ذلك ، من خلال التدريب ، يجب أن يكون النموذج قادرًا بدرجة كافية على التنبؤ بما إذا كانت الفاكهة تفاحة أم برتقالة.

يصبح التقييم مهمًا للغاية عندما يتعلق الأمر بالتطبيقات التجارية. يسمح التقييم لعلماء البيانات بالتحقق مما إذا كانت الأهداف التي وضعوا لتحقيقها قد تحققت أم لا. إذا كانت النتائج غير مرضية ، فيجب إعادة النظر في الخطوات السابقة حتى يمكن تحديد السبب الجذري وراء ضعف أداء النموذج ، وبالتالي تصحيحه.

6. ضبط Hyperparameter

المعلمة الفائقة هي معلمة يتم تعيين قيمتها قبل بدء عملية التعلم. تختلف المعلمات التشعبية عن المعلمات ، وهي المعاملات الداخلية أو الأوزان لنموذج تم العثور عليه بواسطة خوارزمية التعلم. على عكس المعلمات ، يتم تحديد المعلمات الفائقة من قبل الممارس عند تكوين النموذج.

إذا نجح التقييم ، ننتقل إلى خطوة ضبط المعلمة الفائقة تحاول هذه الخطوة تحسين النتائج الإيجابية التي تحققت أثناء خطوة التقييم. على سبيل المثال ، سنرى ما إذا كنا نجعل نموذجنا أفضل في التعرف على التفاح والبرتقال. هناك طرق مختلفة يمكننا من خلالها تحسين النموذج.

عادةً ما يكون من الصعب معرفة القيم التي يجب استخدامها للمعلمات الفائقة لخوارزمية معينة في مجموعة بيانات معينة ، لذلك من الشائع استخدام استراتيجيات البحث العشوائي أو الشبكي لقيم معلمات تشعبية مختلفة.

كلما زاد عدد المعلمات الفائقة للخوارزمية التي تحتاج إلى ضبطها ، كانت عملية الضبط أبطأ. لذلك ، من المستحسن تحديد مجموعة فرعية دنيا من معلمات النموذج الفائقة للبحث أو الضبط. أحدهم هو إعادة النظر في خطوة التدريب واستخدام عمليات مسح متعددة لبيانات التدريب لتدريب النموذج.

7. التنبؤ

يشير التوقع إلى ناتج خوارزمية بعد أن يتم تدريبها على مجموعة بيانات تاريخية وتطبيقها على البيانات الجديدة عند التنبؤ باحتمالية نتيجة معينة. ستولد النتيجة قيمًا لمتغير غير معروف لكل سجل في البيانات الجديدة ، مما يسمح لمنشئ النموذج بتحديد القيمة التي ستكون على الأرجح.

يجب أن يكون نموذج الفاكهة الخاص بنا الآن قادرًا على الإجابة على سؤال ما إذا كانت الفاكهة المعطاة تفاحة أم برتقالة.

CodingHero - 7 خطوات أساسية في التعلم الآلي 1 11 Basic Machine Learning Terms Kids Should Know 952 32

يمكن أن تكون كلمة “توقع” مضللة. في بعض الحالات ، يعني هذا أنك تتوقع نتيجة مستقبلية ، مثل استخدامك للتعلم الآلي لتحديد الإجراء التالي الأفضل في حملة تسويقية. وفي أحيان أخرى ، يتعلق “التنبؤ” ، على سبيل المثال ، بما إذا كانت المعاملة التي حدثت بالفعل احتيالية أم لا. في هذه الحالة ، تمت المعاملة بالفعل ، لكنك تقوم بتخمين مستنير حول ما إذا كانت شرعية أم لا ، مما يسمح لك باتخاذ الإجراء المناسب.

أضف تعليق