• Home
  • /
  • Blog
  • /
  • एमएल में हाइपोथिसिस टेस्टिंग – बच्चों को समझाया गया

एमएल में हाइपोथिसिस टेस्टिंग – बच्चों को समझाया गया

एमएल में हाइपोथिसिस टेस्टिंग

This post is also available in: English (English) العربية (Arabic)

मशीन लर्निंग प्रैक्टिशनर के पास एल्गोरिदम की परंपरा है और मॉडल व्याख्यात्मकता जैसे अन्य चिंताओं से ऊपर परिणाम और मॉडल कौशल पर व्यावहारिक ध्यान केंद्रित है।

सांख्यिकीविद अनुप्रयुक्त सांख्यिकी और सांख्यिकीय अधिगम के नाम से लगभग एक ही प्रकार की मॉडलिंग समस्याओं पर काम करते हैं। गणितीय पृष्ठभूमि से आने के कारण, वे मॉडलों के व्यवहार और पूर्वानुमानों की व्याख्यात्मकता पर अधिक ध्यान केंद्रित करते हैं।

एक ही समस्या के लिए दो दृष्टिकोणों के बीच घनिष्ठ संबंध का अर्थ है कि दोनों क्षेत्रों को एक-दूसरे से बहुत कुछ सीखना है। एमएल मॉडल कई सांख्यिकीय अवधारणाओं का उपयोग करते हैं और ऐसा ही एक है हाइपोथिसिस टेस्टिंग।

एमएल में हाइपोथिसिस टेस्टिंग

मशीन लर्निंग मॉडल को उनके औसत प्रदर्शन के आधार पर चुना जाता है, जिसकी गणना अक्सर k-fold क्रॉस-सत्यापन का उपयोग करके की जाती है।

सबसे अच्छा माध्य प्रदर्शन वाला एल्गोरिदम खराब औसत प्रदर्शन वाले एल्गोरिदम से बेहतर होने की उम्मीद है। लेकिन क्या होगा यदि औसत प्रदर्शन में अंतर एक सांख्यिकीय अस्थायी के कारण होता है?

इसका समाधान सांख्यिकीय हाइपोथिसिस टेस्टिंग का उपयोग करके मूल्यांकन करना है कि किन्हीं दो एल्गोरिदम के बीच औसत प्रदर्शन में अंतर वास्तविक है या नहीं।

मशीन लर्निंग मॉडल को उनके औसत प्रदर्शन के आधार पर चुना जाता है, जिसकी गणना अक्सर k-fold क्रॉस-सत्यापन का उपयोग करके की जाती है।

मॉडल चयन में विभिन्न मशीन लर्निंग एल्गोरिदम या मॉडलिंग पाइपलाइनों के एक सूट का मूल्यांकन करना और उनके प्रदर्शन के आधार पर उनकी तुलना करना शामिल है।

मॉडल या मॉडलिंग पाइपलाइन जो आपके प्रदर्शन मीट्रिक के अनुसार सर्वश्रेष्ठ प्रदर्शन प्राप्त करती है, उसे अंतिम मॉडल के रूप में चुना जाता है जिसका उपयोग आप नए डेटा पर पूर्वानुमान लगाने के लिए कर सकते हैं।

यह क्लासिकल मशीन लर्निंग एल्गोरिदम और डीप लर्निंग के साथ रिग्रेशन और क्लासिफिकेशन प्रेडिक्टिव मॉडलिंग टास्क पर लागू होता है। यह हमेशा एक ही प्रक्रिया है।

समस्या यह है कि आप कैसे जानते हैं कि दो मॉडलों के बीच का अंतर वास्तविक है न कि केवल एक सांख्यिकीय अस्थायी?

एक सांख्यिकीय परिकल्पना परीक्षण का उपयोग करके इस समस्या का समाधान किया जा सकता है।

हाइपोथिसिस टेस्टिंग क्या है?

हाइपोथिसिस टेस्टिंग सांख्यिकीय अनुमान का एक रूप है जो जनसंख्या पैरामीटर या जनसंख्या संभाव्यता वितरण के बारे में निष्कर्ष निकालने के लिए नमूने से डेटा का उपयोग करता है।

सबसे पहले, पैरामीटर या वितरण के बारे में एक अस्थायी धारणा बनाई जाती है। इस धारणा को नल्ल हाइपोथिसिस कहा जाता है और इसे H0 द्वारा निरूपित किया जाता है। एक वैकल्पिक हाइपोथिसिस (जिसे Ha दर्शाया गया है), जो कि नल्ल हाइपोथिसिस में बताई गई बातों के विपरीत है, को तब परिभाषित किया जाता है।

हाइपोथिसिस टेस्टिंग प्रक्रिया में यह निर्धारित करने के लिए नमूना डेटा का उपयोग करना शामिल है कि H0 को अस्वीकार किया जा सकता है या नहीं। यदि H0 को अस्वीकार कर दिया जाता है, तो सांख्यिकीय निष्कर्ष यह है कि वैकल्पिक हाइपोथिसिस Ha सत्य है।

Hypothesis Testing in ML

उदाहरण के लिए, मान लें कि एक रेडियो स्टेशन उस संगीत का चयन करता है जिसे वह इस धारणा के आधार पर चलाता है कि उसके सुनने वाले दर्शकों की औसत आयु 30 वर्ष है। यह निर्धारित करने के लिए कि क्या यह धारणा मान्य है, H0: μ = 30 के रूप में दी गई नल्ल हाइपोथिसिस के साथ एक हाइपोथिसिस टेस्टिंग आयोजित किया जा सकता है और वैकल्पिक हाइपोथिसिस Ha: μ ≠ 30 के रूप में दी गई है।

सुनने वाले श्रोताओं के व्यक्तियों के नमूने के आधार पर, नमूना माध्य आयु, की गणना की जा सकती है और यह निर्धारित करने के लिए उपयोग किया जा सकता है कि H0 को अस्वीकार करने के लिए पर्याप्त सांख्यिकीय साक्ष्य हैं या नहीं। संकल्पनात्मक रूप से, नमूने का एक मान जो 30 के “करीब” है, नल्ल हाइपोथिसिस के अनुरूप है, जबकि नमूना का एक मान जो 30 से “करीब नहीं” है, वैकल्पिक हाइपोथिसिस के लिए समर्थन प्रदान करता है। जिसे “करीबी” और “करीबी नहीं” माना जाता है, वह के नमूने वितरण का उपयोग करके निर्धारित किया जाता है।

हाइपोथिसिस टेस्टिंग आयोजित करने की प्रक्रिया

जब आप एक हाइपोथिसिस टेस्टिंग कर रहे हैं, तो आपको अपने नमूने में परिवर्तनशीलता और आपका नमूना कितना बड़ा है, दोनों को ध्यान में रखना होगा। इस जानकारी के आधार पर, आप इस बात का आकलन करना चाहेंगे कि क्या कोई अंतर आपको दिखाई दे रहा है या नहीं, या यदि वे केवल संयोग के कारण हैं। यह औपचारिक रूप से एक प्रक्रिया के माध्यम से किया जाता है जिसे हाइपोथिसिस टेस्टिंग कहा जाता है।

हाइपोथिसिस टेस्टिंग में पाँच चरण हैं:

  • नल्ल हाइपोथिसिस निर्दिष्ट करें
  • वैकल्पिक हाइपोथिसिस निर्दिष्ट करें
  • सिग्नीफिकेन्स लेवल निर्धारित करें
  • टेस्ट स्टेटिस्टिक और संबंधित पी-वैल्यू की गणना करें
  • निष्कर्ष निकालना

चरण 1: नल्ल हाइपोथिसिस निर्दिष्ट करें

नल्ल हाइपोथिसिस (H0) दो या दो से अधिक समूहों या कारकों के बीच कोई प्रभाव, संबंध या अंतर नहीं होने का बयान है। शोध अध्ययनों में, एक शोधकर्ता आमतौर पर नल्ल हाइपोथिसिस को खारिज करने में रुचि रखता है।

उदाहरण:

  • 0 से 5 वर्ष की आयु में इंटुबैषेण दरों में कोई अंतर नहीं है।
  • हस्तक्षेप और नियंत्रण समूहों की जीवित रहने की दर समान होती है (या, हस्तक्षेप से जीवित रहने की दर में सुधार नहीं होता है)।
  • चोट के प्रकार के बीच कोई संबंध नहीं है और रोगी को प्रीहॉस्पिटल सेटिंग में IV प्राप्त हुआ है या नहीं।

चरण 2: वैकल्पिक हाइपोथिसिस निर्दिष्ट करें

वैकल्पिक हाइपोथिसिस (Ha) यह कथन है कि कोई प्रभाव या अंतर है। यह आमतौर पर वह हाइपोथिसिस है जिसे साबित करने में शोधकर्ता रुचि रखता है। वैकल्पिक परिकल्पना एकतरफा हो सकती है (केवल एक दिशा प्रदान करती है, जैसे, निचला) या दो तरफा। हम अक्सर दो तरफा परीक्षणों का उपयोग करते हैं, तब भी जब हमारी सच्ची परिकल्पना एकतरफा होती है क्योंकि वैकल्पिक परिकल्पना को स्वीकार करने के लिए इसे शून्य परिकल्पना के खिलाफ अधिक सबूत की आवश्यकता होती है।

उदाहरण:

  • इंटुबैषेण की सफलता दर रोगी के इलाज की उम्र (दो तरफा) के साथ भिन्न होती है।
  • नियंत्रण (एकतरफा) की तुलना में हस्तक्षेप समूह के लिए कार्डियक अरेस्ट से पुनर्जीवन का समय कमहै।
  • चोट के प्रकार और रोगी को प्रीहॉस्पिटल सेटिंग (दो तरफा) में IV प्राप्त हुआ है या नहीं, के बीच एक संबंध है।

चरण 3: सिग्नीफिकेन्स लेवल (α) सेट करें

सिग्नीफिकेन्स लेवल (यूनानी अक्षर अल्फा- α द्वारा दर्शाया गया) आम तौर पर 0.05 पर सेट किया जाता है। इसका मतलब यह है कि जब आपकी नल्ल हाइपोथिसिस वास्तव में सच होती है तो 5% संभावना है कि आप अपनी वैकल्पिक परिकल्पना को स्वीकार करेंगे। सिग्नीफिकेन्स लेवल जितना छोटा होगा, नल्ल हाइपोथिसिस को अस्वीकार करने के लिए, या दूसरे शब्दों में, वैकल्पिक हाइपोथिसिस का समर्थन करने के लिए आवश्यक प्रमाण का बोझ उतना ही अधिक होगा।

चरण 4: परीक्षण आंकड़े और संबंधित पी-मान की गणना करें

हाइपोथिसिस टेस्टिंग आम तौर पर एक परीक्षण आंकड़े का उपयोग करता है जो समूहों की तुलना करता है या चर के बीच संघों की जांच करता है। चर के बीच संबंध स्थापित किए बिना एकल नमूने का वर्णन करते समय, आमतौर पर एक विश्वास अंतराल का उपयोग किया जाता है।

यदि आपकी नल्ल हाइपोथिसिस सत्य है, तो पी-वैल्यू अकेले संयोग से एक नमूना आंकड़े प्राप्त करने की संभावना का वर्णन करता है। यह p-मान आपके परीक्षण आँकड़ों के परिणाम के आधार पर निर्धारित किया जाता है। हाइपोथिसिस के बारे में आपके निष्कर्ष आपके पी-मान और आपके सिग्नीफिकेन्स लेवल पर आधारित हैं।

उदाहरण:

  • p-value = 0.01 यह शुद्ध संयोग से 100 में से 1 बार होगा यदि आपकी अशक्त हाइपोथिसिस सत्य है। संयोग से सख्ती से होने की संभावना नहीं है।

उदाहरण:

  • p-value = 0.75 यदि आपकी अशक्त हाइपोथिसिस सत्य है तो यह 100 बार में 75 बार होगा। संयोग से सख्ती से होने की बहुत संभावना है।

यदि आप एक हाइपोथिसिस (जिसे बहु परीक्षण कहा जाता है) का मूल्यांकन करने के लिए बड़ी संख्या में परीक्षण करते हैं, तो आपको महत्व स्तर या पी-मान की गणना के अपने पदनाम में इसके लिए नियंत्रण करने की आवश्यकता है। उदाहरण के लिए, यदि तीन परिणाम किसी दवा या अन्य हस्तक्षेप की प्रभावशीलता को मापते हैं, तो आपको इन तीन विश्लेषणों के लिए समायोजन करना होगा।

चरण 5: निष्कर्ष निकालना

  1. p-मान अपनी वैकल्पिक हाइपोथिसिस के पक्ष में अपनी नल्ल हाइपोथिसिस को अस्वीकार करें। आपका परिणाम सांख्यिकीय रूप से महत्वपूर्ण है।
  2. p-मान > सिग्नीफिकेन्स लेवल (α) => अपनी नल्ल हाइपोथिसिस को अस्वीकार करने में विफल। आपका परिणाम सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

हाइपोथिसिस टेस्टिंग स्थापित नहीं किया गया है ताकि आप पूरी तरह से एक नल्ल हाइपोथिसिस साबित कर सकें। इसलिए, जब आप नल्ल हाइपोथिसिस के खिलाफ सबूत नहीं पाते हैं, तो आप नल्ल हाइपोथिसिस को अस्वीकार करने में विफल रहते हैं। जब आप अशक्त हाइपोथिसिस के खिलाफ पर्याप्त मजबूत सबूत पाते हैं, तो आप अशक्त हाइपोथिसिस को अस्वीकार कर देते हैं। आपके निष्कर्ष भी आपकी वैकल्पिक हाइपोथिसिस के बारे में एक बयान में तब्दील हो जाते हैं। एक हाइपोथिसिस टेस्टिंग के परिणाम प्रस्तुत करते समय, अपने निष्कर्षों में वर्णनात्मक आंकड़े भी शामिल करें। एक निश्चित सीमा के बजाय सटीक पी-मानों की रिपोर्ट करें। उदाहरण के लिए, “युवा रोगियों के साथ रोगी की उम्र से इंटुबैषेण दर में काफी अंतर होता है, जिसमें सफल इंटुबैषेण की दर कम होती है (पी = 0.02)।” यहां दो और उदाहरण दिए गए हैं जिनमें निष्कर्ष कई अलग-अलग तरीकों से बताया गया है।

Hypothesis Testing in ML

उदाहरण:

  • H0: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में कोई अंतर नहीं है।
  • Ha: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर है।
  • α = 0.05; हस्तक्षेप समूह के लिए अस्तित्व में 20% की वृद्धि; पी-मान = 0.002

निष्कर्ष:

  • वैकल्पिक हाइपोथिसिस के पक्ष में नल्ल हाइपोथिसिस को अस्वीकार करें।
  • हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर सांख्यिकीय रूप से महत्वपूर्ण था।
  • नियंत्रण (पी = 0.001) की तुलना में हस्तक्षेप समूह के लिए जीवित रहने में 20% की वृद्धि हुई थी।

उदाहरण:

  • H0: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में कोई अंतर नहीं है।
  • Ha: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर है।
  • α = 0.05; हस्तक्षेप और नियंत्रण समूह के बीच अस्तित्व में 5% की वृद्धि; पी-वैल्यू = 0.20।

निष्कर्ष:

  • नल्ल हाइपोथिसिस को अस्वीकार करने में विफल।
  • हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं था।
  • नियंत्रण (पी = 0.20) की तुलना में हस्तक्षेप समूह के अस्तित्व में कोई उल्लेखनीय वृद्धि नहीं हुई।

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}
>