This post is also available in: English (English) العربية (Arabic)
मशीन लर्निंग प्रैक्टिशनर के पास एल्गोरिदम की परंपरा है और मॉडल व्याख्यात्मकता जैसे अन्य चिंताओं से ऊपर परिणाम और मॉडल कौशल पर व्यावहारिक ध्यान केंद्रित है।
सांख्यिकीविद अनुप्रयुक्त सांख्यिकी और सांख्यिकीय अधिगम के नाम से लगभग एक ही प्रकार की मॉडलिंग समस्याओं पर काम करते हैं। गणितीय पृष्ठभूमि से आने के कारण, वे मॉडलों के व्यवहार और पूर्वानुमानों की व्याख्यात्मकता पर अधिक ध्यान केंद्रित करते हैं।
एक ही समस्या के लिए दो दृष्टिकोणों के बीच घनिष्ठ संबंध का अर्थ है कि दोनों क्षेत्रों को एक-दूसरे से बहुत कुछ सीखना है। एमएल मॉडल कई सांख्यिकीय अवधारणाओं का उपयोग करते हैं और ऐसा ही एक है हाइपोथिसिस टेस्टिंग।
एमएल में हाइपोथिसिस टेस्टिंग
मशीन लर्निंग मॉडल को उनके औसत प्रदर्शन के आधार पर चुना जाता है, जिसकी गणना अक्सर k-fold क्रॉस-सत्यापन का उपयोग करके की जाती है।
सबसे अच्छा माध्य प्रदर्शन वाला एल्गोरिदम खराब औसत प्रदर्शन वाले एल्गोरिदम से बेहतर होने की उम्मीद है। लेकिन क्या होगा यदि औसत प्रदर्शन में अंतर एक सांख्यिकीय अस्थायी के कारण होता है?
इसका समाधान सांख्यिकीय हाइपोथिसिस टेस्टिंग का उपयोग करके मूल्यांकन करना है कि किन्हीं दो एल्गोरिदम के बीच औसत प्रदर्शन में अंतर वास्तविक है या नहीं।
मशीन लर्निंग मॉडल को उनके औसत प्रदर्शन के आधार पर चुना जाता है, जिसकी गणना अक्सर k-fold क्रॉस-सत्यापन का उपयोग करके की जाती है।
मॉडल चयन में विभिन्न मशीन लर्निंग एल्गोरिदम या मॉडलिंग पाइपलाइनों के एक सूट का मूल्यांकन करना और उनके प्रदर्शन के आधार पर उनकी तुलना करना शामिल है।
मॉडल या मॉडलिंग पाइपलाइन जो आपके प्रदर्शन मीट्रिक के अनुसार सर्वश्रेष्ठ प्रदर्शन प्राप्त करती है, उसे अंतिम मॉडल के रूप में चुना जाता है जिसका उपयोग आप नए डेटा पर पूर्वानुमान लगाने के लिए कर सकते हैं।
यह क्लासिकल मशीन लर्निंग एल्गोरिदम और डीप लर्निंग के साथ रिग्रेशन और क्लासिफिकेशन प्रेडिक्टिव मॉडलिंग टास्क पर लागू होता है। यह हमेशा एक ही प्रक्रिया है।
समस्या यह है कि आप कैसे जानते हैं कि दो मॉडलों के बीच का अंतर वास्तविक है न कि केवल एक सांख्यिकीय अस्थायी?
एक सांख्यिकीय परिकल्पना परीक्षण का उपयोग करके इस समस्या का समाधान किया जा सकता है।
हाइपोथिसिस टेस्टिंग क्या है?
हाइपोथिसिस टेस्टिंग सांख्यिकीय अनुमान का एक रूप है जो जनसंख्या पैरामीटर या जनसंख्या संभाव्यता वितरण के बारे में निष्कर्ष निकालने के लिए नमूने से डेटा का उपयोग करता है।
सबसे पहले, पैरामीटर या वितरण के बारे में एक अस्थायी धारणा बनाई जाती है। इस धारणा को नल्ल हाइपोथिसिस कहा जाता है और इसे H0 द्वारा निरूपित किया जाता है। एक वैकल्पिक हाइपोथिसिस (जिसे Ha दर्शाया गया है), जो कि नल्ल हाइपोथिसिस में बताई गई बातों के विपरीत है, को तब परिभाषित किया जाता है।
हाइपोथिसिस टेस्टिंग प्रक्रिया में यह निर्धारित करने के लिए नमूना डेटा का उपयोग करना शामिल है कि H0 को अस्वीकार किया जा सकता है या नहीं। यदि H0 को अस्वीकार कर दिया जाता है, तो सांख्यिकीय निष्कर्ष यह है कि वैकल्पिक हाइपोथिसिस Ha सत्य है।
उदाहरण के लिए, मान लें कि एक रेडियो स्टेशन उस संगीत का चयन करता है जिसे वह इस धारणा के आधार पर चलाता है कि उसके सुनने वाले दर्शकों की औसत आयु 30 वर्ष है। यह निर्धारित करने के लिए कि क्या यह धारणा मान्य है, H0: μ = 30 के रूप में दी गई नल्ल हाइपोथिसिस के साथ एक हाइपोथिसिस टेस्टिंग आयोजित किया जा सकता है और वैकल्पिक हाइपोथिसिस Ha: μ ≠ 30 के रूप में दी गई है।
सुनने वाले श्रोताओं के व्यक्तियों के नमूने के आधार पर, नमूना माध्य आयु, x̄ की गणना की जा सकती है और यह निर्धारित करने के लिए उपयोग किया जा सकता है कि H0 को अस्वीकार करने के लिए पर्याप्त सांख्यिकीय साक्ष्य हैं या नहीं। संकल्पनात्मक रूप से, नमूने का एक मान जो 30 के “करीब” है, नल्ल हाइपोथिसिस के अनुरूप है, जबकि नमूना का एक मान जो 30 से “करीब नहीं” है, वैकल्पिक हाइपोथिसिस के लिए समर्थन प्रदान करता है। जिसे “करीबी” और “करीबी नहीं” माना जाता है, वह x̄ के नमूने वितरण का उपयोग करके निर्धारित किया जाता है।
हाइपोथिसिस टेस्टिंग आयोजित करने की प्रक्रिया
जब आप एक हाइपोथिसिस टेस्टिंग कर रहे हैं, तो आपको अपने नमूने में परिवर्तनशीलता और आपका नमूना कितना बड़ा है, दोनों को ध्यान में रखना होगा। इस जानकारी के आधार पर, आप इस बात का आकलन करना चाहेंगे कि क्या कोई अंतर आपको दिखाई दे रहा है या नहीं, या यदि वे केवल संयोग के कारण हैं। यह औपचारिक रूप से एक प्रक्रिया के माध्यम से किया जाता है जिसे हाइपोथिसिस टेस्टिंग कहा जाता है।
हाइपोथिसिस टेस्टिंग में पाँच चरण हैं:
- नल्ल हाइपोथिसिस निर्दिष्ट करें
- वैकल्पिक हाइपोथिसिस निर्दिष्ट करें
- सिग्नीफिकेन्स लेवल निर्धारित करें
- टेस्ट स्टेटिस्टिक और संबंधित पी-वैल्यू की गणना करें
- निष्कर्ष निकालना
चरण 1: नल्ल हाइपोथिसिस निर्दिष्ट करें
नल्ल हाइपोथिसिस (H0) दो या दो से अधिक समूहों या कारकों के बीच कोई प्रभाव, संबंध या अंतर नहीं होने का बयान है। शोध अध्ययनों में, एक शोधकर्ता आमतौर पर नल्ल हाइपोथिसिस को खारिज करने में रुचि रखता है।
उदाहरण:
- 0 से 5 वर्ष की आयु में इंटुबैषेण दरों में कोई अंतर नहीं है।
- हस्तक्षेप और नियंत्रण समूहों की जीवित रहने की दर समान होती है (या, हस्तक्षेप से जीवित रहने की दर में सुधार नहीं होता है)।
- चोट के प्रकार के बीच कोई संबंध नहीं है और रोगी को प्रीहॉस्पिटल सेटिंग में IV प्राप्त हुआ है या नहीं।
चरण 2: वैकल्पिक हाइपोथिसिस निर्दिष्ट करें
वैकल्पिक हाइपोथिसिस (Ha) यह कथन है कि कोई प्रभाव या अंतर है। यह आमतौर पर वह हाइपोथिसिस है जिसे साबित करने में शोधकर्ता रुचि रखता है। वैकल्पिक परिकल्पना एकतरफा हो सकती है (केवल एक दिशा प्रदान करती है, जैसे, निचला) या दो तरफा। हम अक्सर दो तरफा परीक्षणों का उपयोग करते हैं, तब भी जब हमारी सच्ची परिकल्पना एकतरफा होती है क्योंकि वैकल्पिक परिकल्पना को स्वीकार करने के लिए इसे शून्य परिकल्पना के खिलाफ अधिक सबूत की आवश्यकता होती है।
उदाहरण:
- इंटुबैषेण की सफलता दर रोगी के इलाज की उम्र (दो तरफा) के साथ भिन्न होती है।
- नियंत्रण (एकतरफा) की तुलना में हस्तक्षेप समूह के लिए कार्डियक अरेस्ट से पुनर्जीवन का समय कमहै।
- चोट के प्रकार और रोगी को प्रीहॉस्पिटल सेटिंग (दो तरफा) में IV प्राप्त हुआ है या नहीं, के बीच एक संबंध है।
चरण 3: सिग्नीफिकेन्स लेवल (α) सेट करें
सिग्नीफिकेन्स लेवल (यूनानी अक्षर अल्फा- α द्वारा दर्शाया गया) आम तौर पर 0.05 पर सेट किया जाता है। इसका मतलब यह है कि जब आपकी नल्ल हाइपोथिसिस वास्तव में सच होती है तो 5% संभावना है कि आप अपनी वैकल्पिक परिकल्पना को स्वीकार करेंगे। सिग्नीफिकेन्स लेवल जितना छोटा होगा, नल्ल हाइपोथिसिस को अस्वीकार करने के लिए, या दूसरे शब्दों में, वैकल्पिक हाइपोथिसिस का समर्थन करने के लिए आवश्यक प्रमाण का बोझ उतना ही अधिक होगा।
चरण 4: परीक्षण आंकड़े और संबंधित पी-मान की गणना करें
हाइपोथिसिस टेस्टिंग आम तौर पर एक परीक्षण आंकड़े का उपयोग करता है जो समूहों की तुलना करता है या चर के बीच संघों की जांच करता है। चर के बीच संबंध स्थापित किए बिना एकल नमूने का वर्णन करते समय, आमतौर पर एक विश्वास अंतराल का उपयोग किया जाता है।
यदि आपकी नल्ल हाइपोथिसिस सत्य है, तो पी-वैल्यू अकेले संयोग से एक नमूना आंकड़े प्राप्त करने की संभावना का वर्णन करता है। यह p-मान आपके परीक्षण आँकड़ों के परिणाम के आधार पर निर्धारित किया जाता है। हाइपोथिसिस के बारे में आपके निष्कर्ष आपके पी-मान और आपके सिग्नीफिकेन्स लेवल पर आधारित हैं।
उदाहरण:
- p-value = 0.01 यह शुद्ध संयोग से 100 में से 1 बार होगा यदि आपकी अशक्त हाइपोथिसिस सत्य है। संयोग से सख्ती से होने की संभावना नहीं है।
उदाहरण:
- p-value = 0.75 यदि आपकी अशक्त हाइपोथिसिस सत्य है तो यह 100 बार में 75 बार होगा। संयोग से सख्ती से होने की बहुत संभावना है।
यदि आप एक हाइपोथिसिस (जिसे बहु परीक्षण कहा जाता है) का मूल्यांकन करने के लिए बड़ी संख्या में परीक्षण करते हैं, तो आपको महत्व स्तर या पी-मान की गणना के अपने पदनाम में इसके लिए नियंत्रण करने की आवश्यकता है। उदाहरण के लिए, यदि तीन परिणाम किसी दवा या अन्य हस्तक्षेप की प्रभावशीलता को मापते हैं, तो आपको इन तीन विश्लेषणों के लिए समायोजन करना होगा।
चरण 5: निष्कर्ष निकालना
- p-मान अपनी वैकल्पिक हाइपोथिसिस के पक्ष में अपनी नल्ल हाइपोथिसिस को अस्वीकार करें। आपका परिणाम सांख्यिकीय रूप से महत्वपूर्ण है।
- p-मान > सिग्नीफिकेन्स लेवल (α) => अपनी नल्ल हाइपोथिसिस को अस्वीकार करने में विफल। आपका परिणाम सांख्यिकीय रूप से महत्वपूर्ण नहीं है।
हाइपोथिसिस टेस्टिंग स्थापित नहीं किया गया है ताकि आप पूरी तरह से एक नल्ल हाइपोथिसिस साबित कर सकें। इसलिए, जब आप नल्ल हाइपोथिसिस के खिलाफ सबूत नहीं पाते हैं, तो आप नल्ल हाइपोथिसिस को अस्वीकार करने में विफल रहते हैं। जब आप अशक्त हाइपोथिसिस के खिलाफ पर्याप्त मजबूत सबूत पाते हैं, तो आप अशक्त हाइपोथिसिस को अस्वीकार कर देते हैं। आपके निष्कर्ष भी आपकी वैकल्पिक हाइपोथिसिस के बारे में एक बयान में तब्दील हो जाते हैं। एक हाइपोथिसिस टेस्टिंग के परिणाम प्रस्तुत करते समय, अपने निष्कर्षों में वर्णनात्मक आंकड़े भी शामिल करें। एक निश्चित सीमा के बजाय सटीक पी-मानों की रिपोर्ट करें। उदाहरण के लिए, “युवा रोगियों के साथ रोगी की उम्र से इंटुबैषेण दर में काफी अंतर होता है, जिसमें सफल इंटुबैषेण की दर कम होती है (पी = 0.02)।” यहां दो और उदाहरण दिए गए हैं जिनमें निष्कर्ष कई अलग-अलग तरीकों से बताया गया है।
उदाहरण:
- H0: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में कोई अंतर नहीं है।
- Ha: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर है।
- α = 0.05; हस्तक्षेप समूह के लिए अस्तित्व में 20% की वृद्धि; पी-मान = 0.002
निष्कर्ष:
- वैकल्पिक हाइपोथिसिस के पक्ष में नल्ल हाइपोथिसिस को अस्वीकार करें।
- हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर सांख्यिकीय रूप से महत्वपूर्ण था।
- नियंत्रण (पी = 0.001) की तुलना में हस्तक्षेप समूह के लिए जीवित रहने में 20% की वृद्धि हुई थी।
उदाहरण:
- H0: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में कोई अंतर नहीं है।
- Ha: हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर है।
- α = 0.05; हस्तक्षेप और नियंत्रण समूह के बीच अस्तित्व में 5% की वृद्धि; पी-वैल्यू = 0.20।
निष्कर्ष:
- नल्ल हाइपोथिसिस को अस्वीकार करने में विफल।
- हस्तक्षेप और नियंत्रण समूहों के बीच अस्तित्व में अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं था।
- नियंत्रण (पी = 0.20) की तुलना में हस्तक्षेप समूह के अस्तित्व में कोई उल्लेखनीय वृद्धि नहीं हुई।