5 أنواع من التوزيعات الاحتمالية لخوارزميات تعلم الآلة المثالية

This post is also available in: English (الإنجليزية) हिन्दी (الهندية)

تعد البيانات أهم جزء في جميع تحليلات البيانات والتعلم الآلي والذكاء الاصطناعي. بدون بيانات ، لا يمكننا تدريب أي نموذج وستذهب جميع الأبحاث الحديثة والأتمتة سدى. تنفق الشركات الكبيرة الكثير من المال فقط لجمع أكبر قدر ممكن من البيانات. قبل الانتقال إلى أنواع مختلفة من التوزيعات الاحتمالية ، دعنا نرى ما هو التوزيع الاحتمالي.

ما هو التوزيع الاحتمالي؟

التوزيع الاحتمالي هو دالة إحصائية تصف جميع القيم المحتملة والاحتمالات التي يمكن أن يتخذها متغير عشوائي ضمن نطاق معين. يتم تقييد هذا النطاق بين الحد الأدنى والحد الأقصى للقيم الممكنة ، ولكن على وجه التحديد حيث من المحتمل أن يتم رسم القيمة المحتملة على توزيع الاحتمالات يعتمد على عدد من العوامل. تتضمن هذه العوامل متوسط ​​التوزيع (المتوسط) والانحراف المعياري والانحراف والتفرطح.

تعد التوزيعات الاحتمالية جزءًا لا يتجزأ من التعلم الآلي لأنها تساعد في تحليل البيانات وتصورها.

المتغيرات المنفصلة والمستمرة

قبل الانتقال إلى أنواع الاحتمالات المختلفة ، دعنا نفهم بعض المصطلحات الأساسية المرتبطة بالموضوع. يعتمد نوع التوزيع الاحتمالي على ما إذا كان المتغير يحتوي على قيم منفصلة أو قيم مستمرة.

يمكن للمتغير المنفصل أن يأخذ مجموعة محدودة من القيم من نطاق معين من القيم. على سبيل المثال ، عدد الطلاب في الفصل ، وعدد الأسئلة في ورقة الاختبار ، وعدد الأطفال في الأسرة ، وما إلى ذلك كلها متغيرات منفصلة.

يمكن أن يأخذ المتغير المستمر أي قيمة من نطاق معين من القيم. على سبيل المثال ، يعد طول الشخص ووزن الشخص ودرجة الحرارة وما إلى ذلك كلها متغيرات مستمرة.

أنواع التوزيعات الاحتمالية

فيما يلي توزيعات الاحتمال الأكثر شيوعًا المستخدمة في التطبيقات المختلفة.

1. توزيع برنولي

توزيع برنولي هو توزيع احتمالي منفصل ، مما يعني أنه يهتم بالمتغيرات العشوائية المنفصلة. ينطبق توزيع برنولي على الأحداث التي لها تجربة واحدة ونتيجتان محتملتان. فيما يلي بعض الأمثلة على مثل هذه التجارب (المعروفة باسم تجربة برنولي).

  • هل ستُلقى قطعة نقود على رأسها؟ هنا ، نظرًا لرمي العملة مرة واحدة فقط ، يكون عدد المحاولات واحدًا وله نتيجتان محتملتان. “الرأس” و “الذيل” (الحصول على “الرأس” يعد نجاحًا والحصول على “الذيل” فشل).
  • هل سأدحرج ستة مع نرد؟ هنا ، تم قلب القالب مرة واحدة ، وبالتالي فإن عدد التجارب واحد وله نتيجتان محتملتان. 6 أو “ليس 6” (الحصول على 6 يعد نجاحًا والحصول على “ليس 6” يعد إخفاقًا).
  • هل يجتاز الطالب الامتحان؟ نظرًا لأن الاختبار يتم إجراؤه مرة واحدة فقط ، فإن عدد التجارب هنا أيضًا واحد وله نتيجتان محتملتان. ينجح او يفشل.

في جميع تجارب برنولي ، يمكن التفكير في النتيجتين المحتملتين من حيث “النجاح” أو “الفشل”.

توزيع برنولي هو في الأساس عملية حسابية تسمح لك بإنشاء نموذج لمجموعة النتائج المحتملة لتجربة برنولي. لذلك ، عندما يكون لديك حدث له نتيجتان محتملتان فقط ، يمكّنك توزيع برنولي من حساب احتمال كل نتيجة.

دعونا نفهم الآن كيف يتم حساب احتمالية وقوع حدث. يحتوي توزيع برنولي على نتيجتين محتملتين فقط ، وهما 1 (نجاح) و 0 (فشل) وتجربة واحدة. دعونا نعتبر أن المتغير العشوائي X يمكن أن يأخذ القيمة 1 مع الاحتمال p والقيمة 0 مع الاحتمال q (حيث q = 1 – p).

يتم إعطاء دالة الكتلة الاحتمالية بواسطة: px (1 – p) 1 – x ، حيث يمكن أن تأخذ x القيمة 0 أو 1.

What is a Probability DistributionBernoulli Distribution

يلعب توزيع برنولي دورًا مهمًا في تحليلات البيانات وعلوم البيانات والتعلم الآلي. بعض الأمثلة

  • عامل تصفية البريد العشوائي الذي يكتشف ما إذا كان يجب تصنيف البريد الإلكتروني على أنه “بريد عشوائي” أم “ليس بريدًا عشوائيًا”.
  • نموذج يمكنه التنبؤ بما إذا كان العميل سيتخذ إجراءً معينًا أم لا.

2. التوزيع الموحد

التوزيع الموحد هو مصطلح يستخدم لوصف شكل من أشكال التوزيع الاحتمالي حيث يكون لكل نتيجة محتملة احتمالية متساوية لحدوثها. الاحتمال ثابت لأن لكل متغير فرص متساوية في أن يكون النتيجة.

على سبيل المثال ، إذا وقفت في زاوية شارع وبدأت في تسليم فاتورة بقيمة 100 دولار بشكل عشوائي إلى أي شخص محظوظ يمر بجواره ، فسيكون لكل عابر فرصة متساوية في الحصول على المال. النسبة المئوية للاحتمال 1 مقسومة على العدد الإجمالي للنتائج (عدد المارة). ومع ذلك ، إذا كنت تفضل الأشخاص القصيرين أو النساء ، فستكون لديهم فرصة أكبر في الحصول على فاتورة 100 دولار مقارنة بالمارة الآخرين. لا يمكن وصف ذلك بأنه احتمال موحد.

يتم إعطاء دالة الكثافة للتوزيع المنتظم بواسطة f (x) = 1 / (b – a) ، a ≤ x ≤ b

What is a Probability DistributionUniform Distribution

تأمل المثال التالي.

يتم توزيع عدد الباقات التي يتم بيعها يوميًا في محل لبيع الزهور بشكل موحد بحد أقصى 40 و 10 على الأقل.

لنحاول حساب احتمال انخفاض المبيعات اليومية بين 15 و 30.

احتمال انخفاض المبيعات اليومية بين 15 و 30 هو (30-15) / (40-10) = 0.5.

احتمال وقوع الحدث بين x1 و x2 هو (x2 – x1) / (b – a). في المثال أعلاه x1 = 15 ، x2 = 30 و a = 10 ، b = 40.

وبالمثل ، فإن احتمال أن تكون المبيعات اليومية أكبر من 20 هو (40 – 20) / (40-10) = 0.667.

واحتمال أن تكون المبيعات اليومية أقل من 25 هو (25-10) / (40-10) = 0.5.

3. التوزيع ذو الحدين

دعونا ننظر في حالة لعبة الكريكيت. افترض أنك ربحت القرعة اليوم وهذا يشير إلى نجاح الحدث. أنت تقذف مرة أخرى لكنك تفقد هذه المرة إذا ربحت رمية اليوم ، فهذا لا يستلزم أن تفوز بالرمية غدًا.

التوزيع ذو الحدين هو توزيع احتمالي منفصل ، مما يعني أنه معني بالمتغيرات العشوائية المنفصلة. يمكن اعتباره مجرد احتمال لنتيجة “نجاح” أو “فشل” في تجربة تتكرر عدة مرات. بشكل عام ، التجربة ذات الحدين هي تجربة برنولي تتكرر “n” عدد المرات.

دعونا نفهم الآن كيف يتم حساب احتمالية وقوع حدث. للتوزيع ذي الحدين نتيجتان محتملتان فقط ، وهما 1 (نجاح) و 0 (فشل) ، وعدد “n” من المحاولات. دعونا نعتبر أن المتغير العشوائي X يمكن أن يأخذ القيمة 1 مع الاحتمال p والقيمة 0 مع الاحتمال q (حيث q = 1 – p).

دالة الكتلة الاحتمالية تعطى بواسطة: nCxpx (1 – p) n – x ، حيث nCx = n! / (x! (n – x)!).

What is a Probability DistributionBinomial Distribution

تأمل المثال التالي.

احتمال فوز الفريق بالمباراة هو 0.8 (80٪). إذا لعبت 5 مباريات وأردت أن تعرف ما هو احتمال فوزها بثلاث مباريات.

هنا ، p = 0.8 ، q = 1 – 0.8 = 0.2 ، n = 5 ، x = 3 لذلك ، فإن احتمال الفوز بثلاث مباريات من أصل 5 سيكون (5! / (3! (5 – 3)!) (0.83) (0.2) 5-3 = 0.2048 (20.48٪).

4. التوزيع الطبيعي

التوزيع الطبيعي ، الذي يسمى أحيانًا منحنى الجرس ، هو توزيع يحدث بشكل طبيعي في العديد من المواقف. إنه توزيع مستمر. على سبيل المثال ، يظهر منحنى الجرس في اختبارات مثل SATو GRE. سيحرز معظم الطلاب متوسطًا ، بينما يحصل عدد أقل من الطلاب على B أو D.

حتى أن نسبة أقل من الطلاب حصلوا على درجة F أو A. وهذا يخلق توزيعًا يشبه الجرس. منحنى الجرس متماثل ، أي أن الخط الموجود في مركز المنحنى (الذي يمثل المتوسط ​​والوسيط وطريقة التوزيع) يقسم المنحنى إلى نصفين متساويين. نصف البيانات سوف تقع على يسار المتوسط ​​؛ النصف سوف يسقط على اليمين.

What is a Probability DistributionNormal Distribution Curve

تخبرك القاعدة التجريبية بنسبة البيانات التي تقع ضمن عدد معين من الانحرافات المعيارية عن المتوسط:

  • يقع 68.3٪ من البيانات ضمن انحراف معياري واحد عن المتوسط.
  • 95.5٪ من البيانات تقع ضمن انحرافين معياريين عن المتوسط.
  • 99.7٪ من البيانات تقع ضمن ثلاثة انحرافات معيارية عن المتوسط.

5. توزيع بواسون

توزيع بواسون هو توزيع منفصل يقيس احتمالية حدوث عدد معين من الأحداث في فترة زمنية محددة. في مجال التمويل ، يمكن استخدام توزيع Poisson لنمذجة وصول أوامر الشراء أو البيع الجديدة التي تم إدخالها في السوق أو الوصول المتوقع للأوامر في أماكن تداول محددة. توزيعات Poisson مفيدة جدًا لأجهزة توجيه الطلبات الذكية والتداول الحسابي.

يتم إعطاء دالة الكتلة الاحتمالية للمتغير العشوائي X بواسطة: P (X = x) = e-𝜇 (𝜇x / x!) ،

حيث 𝜇 هو متوسط ​​عدد الأحداث و x هو عدد الأحداث في تلك الفترة الزمنية.

What is a Probability DistributionPoisson Distribution

دعنا نفكر في المثال التالي لفهمه بشكل أفضل. يتلقى مركز خدمة العملاء عشرة رسائل بريد إلكتروني كل ساعة وأنت مهتم بإيجاد احتمال أن يتلقى مركز خدمة العملاء ستة رسائل بريد إلكتروني في الساعة التالية. هنا ، 𝜇 = 10 و x = 6 ، لذا فإن الاحتمال المطلوب سيكون P (X = 6) = e-10 (106/6!) = 0.0631 = 6.31٪.

أضف تعليق