• Home
  • /
  • Blog
  • /
  • 11 مصطلحًا أساسيًا لتعلم الآلة يجب أن يعرفه الأطفال

11 مصطلحًا أساسيًا لتعلم الآلة يجب أن يعرفه الأطفال

شروط التعلم الآلي

This post is also available in: English (الإنجليزية) हिन्दी (الهندية)

التعلم الآلي هو مجال فرعي للذكاء الاصطناعي (AI) يركز على تصميم الأنظمة التي يمكنها التعلم من واتخاذ القرارات والتنبؤات بناءً على البيانات. يمكّن التعلم الآلي أجهزة الكمبيوتر من التصرف واتخاذ قرارات تعتمد على البيانات بدلاً من برمجتها بشكل صريح لتنفيذ مهمة معينة. كان التعلم الآلي في طليعة العديد من التطورات التكنولوجية في السنوات الأخيرة مثل السيارات ذاتية القيادة ورؤية الكمبيوتر وأنظمة التعرف على الكلام.

شروط تعلم الآلة الأساسية

في ما يلي 11 مصطلحًا للتعلم الآلي يجب أن يعرفه الأطفال وكل مبتدئ في التعلم الآلي:

1. التجميع

التجميع هو في الأساس نوع من طرق التعلم غير الخاضعة للإشراف. طريقة التعلم غير الخاضعة للإشراف هي طريقة نرسم بها مراجع من مجموعات البيانات التي تتكون من بيانات الإدخال دون الاستجابات المصنفة. بشكل عام ، يتم استخدامه كعملية لإيجاد بنية المعنى ، والعمليات الأساسية التوضيحية ، والميزات التوليدية ، والتجمعات المتأصلة في مجموعة من الأمثلة.

التجميع هو مهمة تقسيم السكان أو نقاط البيانات إلى عدد من المجموعات بحيث تكون نقاط البيانات في نفس المجموعات أكثر تشابهًا مع نقاط البيانات الأخرى في نفس المجموعة وتختلف عن نقاط البيانات في المجموعات الأخرى. إنها في الأساس مجموعة من الأشياء على أساس التشابه والاختلاف بينهما.

دعنا نفهم أسلوب التجميع باستخدام مثال العالم الحقيقي للمول: عندما تزور أي مركز تسوق ، فإنك تلاحظ أن العناصر ذات الاستخدام المماثل يتم تجميعها معًا. مثل القمصان مجمعة في قسم واحد والبنطلونات في الأقسام الأخرى. وبالمثل ، في أقسام الخضار ، يتم تجميع التفاح والموز والمانجو وما إلى ذلك في أقسام منفصلة ، بحيث يمكنك بسهولة معرفة العناصر. تعمل تقنية التجميع أيضًا بنفس الطريقة.

شروط تعلم الآلة الأساسية
تجمع

تستخدم تقنية التجميع على نطاق واسع في مختلف المهام. على سبيل المثال ، يتم استخدامه بواسطة Amazonفي نظام التوصيات الخاص بها لتقديم توصيات وفقًا للبحث السابق عن المنتجات. تستخدم Netflix أيضًا هذه التقنية للتوصية بالأفلام ومسلسلات الويب لمستخدميها وفقًا لسجل المشاهدة.

بعض الاستخدامات الأكثر شيوعًا لهذه التقنية هي:

  • تجزئة السوق
  • تحليل البيانات الإحصائية
  • تحليل الشبكة الاجتماعية
  • تقطيع الصورة
  • إكتشاف عيب خلقي

2. الانحدارات

يستخدم علماء البيانات أنواعًا مختلفة من خوارزميات التعلم الآلي لاكتشاف الأنماط في البيانات الضخمة التي تؤدي إلى رؤى قابلة للتنفيذ. على مستوى عالٍ ، يمكن تصنيف هذه الخوارزميات المختلفة إلى مجموعتين بناءً على الطريقة التي “يتعلمون بها” البيانات لعمل تنبؤات: التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. يعد تحليل الانحدار أحد الأساليب المستخدمة في خوارزميات التعلم الآلي الخاضعة للإشراف.

يتكون تحليل الانحدار من مجموعة من طرق التعلم الآلي التي تسمح لنا بالتنبؤ بمتغير نتيجة مستمر (ص) بناءً على قيمة متغير واحد أو متغير متعدد للتنبؤ (x). الهدف من نموذج الانحدار هو بناء معادلة رياضية تحدد y كدالة لمتغير (متغيرات) x. بعد ذلك ، يمكن استخدام هذه المعادلة للتنبؤ بالنتيجة (ص) على أساس القيم الجديدة لمتغير (متغيرات) التوقع x.

هناك أنواع مختلفة من الانحدار يتم استخدامها في علم البيانات والتعلم الآلي. كل نوع له أهميته الخاصة في سيناريوهات مختلفة ، ولكن في جوهرها ، تحلل جميع طرق الانحدار تأثير المتغير المستقل على المتغيرات التابعة. بعض نماذج الانحدار الأكثر شيوعًا هي:

  • Linear Regression
  • الانحدار اللوجستي
  • الانحدار متعدد الحدود
  • دعم الانحدار المتجه
  • انحدار شجرة القرار
  • الانحدار العشوائي للغابات
  • انحدار ريدج
  • انحدار لاسو

دعونا ننظر في مثال لفهم مفهوم الانحدار. لنفترض أن هناك شركة تسويق A ، تقوم بأنواع مختلفة من الإعلانات كل عام وتحصل على مبيعات على ذلك. توضح القائمة أدناه المبلغ الذي تم إنفاقه على الإعلان والمبيعات المقابلة في السنوات الخمس الماضية:

إعلان (بمائة دولار)المبيعات (بمائة دولار)
901000
1201300
1501800
1001200
1301380

خلال السنة السادسة ، خصصت إحدى الشركات 20000 دولار للإعلان وتريد معرفة المبيعات المحتملة التي ستحققها.

في السيناريو أعلاه ، نستخدم نموذج الانحدار الخطي للصيغة y = ax b ، حيث y (المبيعات) متغير تابع (متنبئ) ، x (إعلان) متغير مستقل و a و b ثوابت انحدار.

3. قاعدة البيانات

تعد قاعدة البيانات مكونًا ضروريًا في التعلم الآلي. إذا كنت ترغب في إنشاء نظام تعلم آلي ، فستحتاج إما إلى جمع البيانات من الموارد العامة أو إنشاء بيانات جديدة. تم دمج جميع مجموعات البيانات المستخدمة في التعلم الآلي معًا لتشكيل قاعدة البيانات. بشكل عام ، يقسم علماء البيانات البيانات إلى ثلاث فئات:

  • مجموعة بيانات القطار: تُستخدم مجموعة بيانات القطار لنماذج التدريب. من خلال التدريب ، ستتمكن نماذج التعلم الآلي من التعرف على السمات المهمة للبيانات.
  • التحقق من صحة مجموعة البيانات: يتم استخدام التحقق من مجموعة البيانات لاقتطاع معاملات النماذج ومقارنة النماذج لاختيار أفضلها. يختلف التحقق من صحة مجموعة البيانات عن مجموعة بيانات القطار ، ولا يمكن استخدامه في قسم التدريب أو قد يحدث زيادة في التجهيز ويؤثر سلبًا على توليد البيانات الجديدة.
  • مجموعة بيانات الاختبار: بمجرد تأكيد النموذج ، يتم استخدام مجموعة بيانات اختبار لاختبار أداء النموذج في مجموعة بيانات جديدة.

في التعلم الآلي التقليدي ، تبلغ نسبة مجموعات البيانات الثلاث هذه 50: 25: 25 ؛ ومع ذلك ، لا تحتاج بعض النماذج إلى الكثير من الضبط أو يمكن أن تكون مجموعة بيانات القطار في الواقع مزيجًا من التدريب والتحقق من الصحة ، ومن ثم يمكن أن تكون نسبة القطار: الاختبار 70: 30.

4. معالجة اللغة الطبيعية

تعد معالجة اللغة الطبيعية (NLP) مفهومًا شائعًا جدًا للتعلم الآلي. لقد أتاح للكمبيوتر قراءة لغة الإنسان ودمجها في جميع أنواع العمليات.

تشمل أكثر تطبيقات البرمجة اللغوية العصبية شيوعًا ما يلي:

  • تصنيف وفرز النص:يتعامل هذا مع تصنيف النصوص إلى فئات مختلفة ، أو فرز قائمة من النصوص على أساس مدى صلتها بالموضوع. على سبيل المثال ، يمكن استخدامه لحجب رسائل البريد العشوائي (عن طريق تحليل ما إذا كانت رسائل البريد الإلكتروني هي رسائل بريد إلكتروني غير مرغوب فيها أم لا) ، أو يمكن استخدامه أيضًا من الناحية التجارية لتحديد واستخراج المعلومات المتعلقة بمنافسيك.
  • تحليل المشاعر:من خلال تحليل المشاعر ، سيكون الكمبيوتر قادرًا على فك رموز المشاعر ، مثل الغضب والحزن والبهجة وما إلى ذلك من خلال تحليل السلاسل النصية. لذلك سيكون الكمبيوتر قادرًا بشكل أساسي على معرفة ما إذا كان الناس يشعرون بالسعادة أو الحزن أو الغضب أثناء كتابتهم في الكلمات أو الجمل. يستخدم هذا على نطاق واسع في استطلاعات رضا العملاء لتحليل شعور العملاء تجاه المنتج.
  • استخلاص المعلومات: هذا بشكل أساسي لتلخيص فقرة طويلة في نص قصير ، مثل إنشاء ملخص.
  • التعرف على الكيان المُسمّى: لنفترض أنك استخرجت مجموعة من بيانات ملف التعريف الفوضوية مثل العنوان ورقم الهاتف والاسم وغير ذلك الكثير الممزوجة ببعضها البعض. ألا ترغب في أن تتمكن من تنظيف هذه البيانات بطريقة سحرية بحيث يتم تحديدها جميعًا ومطابقتها مع أنواع البيانات المناسبة؟ هذا هو بالضبط كيف يساعد التعرف على الكيانات المسماة في تحويل المعلومات الفوضوية إلى بيانات منظمة.
  • التعرف على الكلام: التعرف على الكلام المعروف أيضًا باسم التعرف التلقائي على الكلام (ASR) ، أو التعرف على الكلام على الكمبيوتر ، أو تحويل الكلام إلى نص ، هو قدرة تمكن البرنامج من معالجة الكلام البشري في تنسيق مكتوب.
  • فهم اللغة الطبيعية وتوليدها: تستخدم NLU جهاز كمبيوتر لتحويل التعبيرات البشرية إلى تعبيرات كمبيوتر. على العكس من ذلك ، فإن توليد اللغة الطبيعية هو تحويل تعابير الكمبيوتر إلى تعبيرات بشرية. تُستخدم هذه التقنية بشكل شائع مع البشر الذين يتواصلون مع الروبوتات.
  • الترجمة الآلية: تقوم الترجمة الآلية تلقائيًا بترجمة النصوص إلى لغة أخرى (أو إلى أي لغة معينة).

5. overfitting و underfitting

يعد التجهيز الزائد والتركيب غير المناسب مشكلتين رئيسيتين تحدثان في التعلم الآلي وتقليل أداء نماذج التعلم الآلي.

الهدف الرئيسي لكل نموذج من نماذج التعلم الآلي هو التعميم جيدًا. التعميم هنا هو قدرة نموذج التعلم الآلي على توفير مخرجات مناسبة من خلال تكييف مجموعة معينة من المدخلات غير المعروفة. هذا يعني أنه بعد توفير التدريب على مجموعة البيانات ، يمكن أن ينتج عنه نتائج موثوقة ودقيقة. ومن ثم ، فإن التجهيز الزائد والتركيب الناقص هما المصطلحان اللذان يحتاجان إلى التحقق من أداء النموذج وما إذا كان النموذج معممًا بشكل جيد أم لا.

قبل الانتقال إلى هذين المصطلحين ، دعنا أولاً نفهم هذين المصطلحين المرتبطين – التحيز والتباين.

  • التحيز: الافتراضات التي وضعها النموذج لتسهيل تعلم الوظيفة.
  • التباين: إذا قمت بتدريب بياناتك على بيانات التدريب وحصلت على خطأ منخفض جدًا ، فعند تغيير البيانات ثم تدريب نفس النموذج السابق واجهت خطأً كبيرًا ، يسمى هذا التباين.

التقليل من الملاءمة: يُقال إن نموذج التعلم الآلي غير ملائم عندما لا يتمكن من التقاط الاتجاه الأساسي للبيانات. يؤدي عدم الملائمة إلى تدمير دقة نموذج التعلم الآلي الخاص بنا. حدوثه يعني ببساطة أن نموذجنا لا يناسب البيانات بشكل كافٍ.

يحدث ذلك عادةً عندما يكون لدينا بيانات أقل لبناء نموذج دقيق وأيضًا عندما نحاول بناء نموذج خطي ببيانات غير خطية. في مثل هذه الحالات ، تكون قواعد نموذج التعلم الآلي سهلة ومرنة للغاية بحيث لا يمكن تطبيقها على الحد الأدنى من البيانات ، وبالتالي من المحتمل أن يقدم النموذج الكثير من التوقعات الخاطئة. يمكن تجنب عدم الملائمة باستخدام المزيد من البيانات وتقليل الميزات أيضًا عن طريق اختيار الميزة.

غير مناسب – تحيز مرتفع وتباين منخفض.

Overfitting: يُقال إن نموذج التعلم الآلي قد تم تجهيزه بشكل زائد عندما نقوم بتدريبه بالكثير من البيانات. عندما يتم تدريب النموذج على الكثير من البيانات ، فإنه يبدأ في التعلم من الضوضاء وإدخالات البيانات غير الدقيقة في مجموعة البيانات الخاصة بنا. في هذه الحالة ، لا يصنف النموذج البيانات بشكل صحيح ، بسبب كثرة التفاصيل والضوضاء.

أسباب فرط التخصيص هي الأساليب غير المعلمية وغير الخطية لأن هذه الأنواع من خوارزميات التعلم الآلي تتمتع بمزيد من الحرية في بناء النموذج بناءً على مجموعة البيانات وبالتالي يمكنها بسهولة بناء نماذج غير واقعية. الحل لتجنب فرط التخصيص هو استخدام خوارزمية خطية إذا كان لدينا بيانات خطية أو باستخدام معلمات مثل أقصى عمق إذا كنا نستخدم أشجار القرار.

overfitting – تحيز منخفض وتباين كبير.

شروط تعلم الآلة الأساسية

6. التعلم تحت الإشراف

التعلم الخاضع للإشراف هو مجموعة من نماذج التعلم الآلي التي تعلم نفسها بالقدوة. هذا يعني أن البيانات الخاصة بمهمة التعلم الآلي الخاضعة للإشراف يجب أن يتم تصنيفها (يتم تعيين فئة الحقيقة الأساسية المناسبة). على سبيل المثال ، إذا كنا نرغب في بناء نموذج للتعلم الآلي للتعرف على ما إذا كان نص معين يتعلق بالتسويق ، فنحن بحاجة إلى تزويد النموذج بمجموعة من الأمثلة المصنفة (معلومات نصية إذا كانت تتعلق بالتسويق أم لا). بالنظر إلى مثال جديد غير مرئي ، يتنبأ النموذج بهدفه – على سبيل المثال ، للمثال المذكور ، ملصق (على سبيل المثال ، 1 إذا كان النص يتعلق بالتسويق و 0 بخلاف ذلك).

7. التعلم غير الخاضع للإشراف

تعلم نماذج التعلم غير الخاضعة للرقابة نفسها عن طريق الملاحظة. البيانات المقدمة إلى هذا النوع من الخوارزمية غير مصنفة (لا توجد قيمة حقيقة أساسية معطاة للخوارزمية). نماذج التعلم غير الخاضعة للإشراف قادرة على إيجاد بنية العلاقات بين المدخلات المختلفة. أهم نوع من أساليب التعلم غير الخاضعة للرقابة هو “التجميع”.

8. تعزيز التعلم

يختلف التعلم المعزز في منهجه عن التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. في التعلم المعزز ، تلعب الخوارزمية “لعبة” تهدف فيها إلى تعظيم المكافأة. تحاول الخوارزمية أساليب مختلفة أو “تحركات” باستخدام التجربة والخطأ وترى أيها يعزز أكبر قدر من الربح.

حالات الاستخدام الأكثر شيوعًا للتعلم المعزز هي تعليم الكمبيوتر لحل مكعب روبيك أو لعب الشطرنج ، ولكن هناك ما هو أكثر من التعلم المعزز من مجرد الألعاب. في الآونة الأخيرة ، هناك عدد متزايد من حلول التعلم المعزز في عروض الأسعار في الوقت الفعلي ، حيث يكون النموذج مسؤولاً عن تقديم عروض أسعار في مكان للإعلان ومكافأته هي معدل تحويل العميل.

9. الشبكة العصبية

الشبكات العصبية هي مجموعة واسعة جدًا من نماذج التعلم الآلي. الفكرة الرئيسية من وراءهم هي محاكاة سلوك العقل البشري عند معالجة البيانات. تمامًا مثل الشبكات التي تربط الخلايا العصبية الحقيقية في الدماغ البشري ، تتكون الشبكات العصبية الاصطناعية من طبقات. كل طبقة عبارة عن مجموعة من الخلايا العصبية ، وكلها مسؤولة عن اكتشاف أشياء مختلفة. تعالج الشبكة العصبية البيانات بشكل تسلسلي ، مما يعني أن الطبقة الأولى فقط هي التي تتصل مباشرة بالمدخل. تكتشف جميع الطبقات اللاحقة المعالم بناءً على ناتج الطبقة السابقة ، مما يمكّن النموذج من معرفة المزيد والمزيد من الأنماط المعقدة في البيانات مع زيادة عدد الطبقات. عندما يزداد عدد الطبقات بسرعة ، يُطلق على النموذج غالبًا نموذج التعلم العميق.

10. الرؤية الحاسوبية

رؤية الكمبيوتر هي مجال ذكاء اصطناعي يركز على تحليل وفهم بيانات الصور والفيديو. تشمل المشكلات التي نراها غالبًا في رؤية الكمبيوتر ما يلي:

  • تصنيف الصور: تصنيف الصور هو مهمة رؤية كمبيوتر تعلم الكمبيوتر التعرف على صور معينة. على سبيل المثال ، تدريب نموذج للتعرف على أشياء معينة ظهرت في أي مكان محدد.
  • الكشف عن الهدف: الكشف عن الهدف هو تعليم النماذج للكشف عن فئة معينة من سلسلة من الفئات المحددة مسبقًا ، واستخدام المستطيلات لوضع دائرة حولها. على سبيل المثال ، يمكن استخدام اكتشاف الهدف لتكوين أنظمة التعرف على الوجوه. يمكن للنموذج اكتشاف كل مسألة محددة مسبقًا وإبرازها.
  • تجزئة الصورة: تجزئة الصورة هي عملية تقسيم الصورة الرقمية إلى مقاطع متعددة (مجموعات من البيكسلات ، تُعرف أيضًا بالبكسل الفائق). الهدف من التجزئة هو تبسيط و / أو تغيير تمثيل الصورة إلى شيء أكثر أهمية وأسهل في التحليل.
  • اختبار الأهمية: بمجرد جمع بيانات العينة من خلال دراسة أو تجربة قائمة على الملاحظة ، يسمح الاستدلال الإحصائي للمحللين بتقييم الأدلة لصالح بعض الادعاءات حول المجتمع الذي تم أخذ العينة منه. تُعرف طرق الاستدلال المستخدمة لدعم المطالبات القائمة على بيانات العينة أو رفضها باسم اختبارات الأهمية.

11. TensorFlow

TensorFlow هي مكتبة مفتوحة المصدر طورتها Google لتنفيذ مشاريع التعلم الآلي. تم إنشاؤه بواسطة فريق Google Brain وتم إصداره في عام 2015 بموجب ترخيص Apache 2.0. اليوم ، هي واحدة من أكثر الأدوات انتشارًا في عالم التعلم الآلي ، خاصة لبناء شبكات من الخلايا العصبية.

على الرغم من استخدام TensorFlow بشكل أساسي في مجال التعلم الآلي ، إلا أنه يمكن استخدامه أيضًا لأنواع أخرى من الخوارزميات التي تتطلب مهام حساب رقمية باستخدام الرسوم البيانية للبيانات.

هناك بدائل أخرى لـ TensorFlow في السوق مثل PyTorch من Facebook و MXNet من Amazon.

Image Credit: Background vector created by starline – www.freepik.com

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}
>