विज्ञान

'पी-हैकिंग' वैज्ञानिकों को मालिश के परिणाम देता है। यह विधि उन सांख्यिकीय खामियों को दूर कर सकती है

Neha Dani
28 Aug 2022 6:06 AM GMT
पी-हैकिंग वैज्ञानिकों को मालिश के परिणाम देता है। यह विधि उन सांख्यिकीय खामियों को दूर कर सकती है
x
बिंदुओं को बदलना किसी परिणाम को सांख्यिकीय रूप से महत्वपूर्ण होने से कम करने के लिए पर्याप्त नहीं है, तो इसे नाजुक माना जाता है।

विज्ञान की खोज को डेटा के चक्रव्यूह में महत्व की खोज के लिए डिज़ाइन किया गया है। कम से कम, इस तरह इसे काम करना चाहिए।

कुछ खातों के अनुसार, 2010 में कॉर्नेल विश्वविद्यालय के एक सामाजिक मनोवैज्ञानिक डेरिल बेम ने व्यक्तित्व और सामाजिक मनोविज्ञान के प्रतिष्ठित जर्नल में एक 10-वर्षीय विश्लेषण प्रकाशित किया, जो व्यापक रूप से स्वीकृत सांख्यिकीय विधियों के साथ प्रदर्शित करता है कि एक्स्ट्रासेंसरी धारणा (ईएसपी) , मूल रूप से "छठी इंद्रिय", एक देखने योग्य घटना थी। बेम के साथी पेपर के परिणामों को दोहरा नहीं सकते थे, जो अब हम "पी-हैकिंग" कहते हैं, सांख्यिकीय रूप से महत्वपूर्ण और प्रकाशित करने योग्य-परिणामों की तलाश में आपके डेटा की मालिश और अधिक विश्लेषण करने की प्रक्रिया को दोष देते हैं।
एक परिकल्पना का समर्थन या खंडन करने के लिए, लक्ष्य 0.05 से कम के "पी-वैल्यू" रिकॉर्ड करके सांख्यिकीय महत्व स्थापित करना है, रोचेस्टर विश्वविद्यालय में पोस्ट-डॉक्टरेट शोधकर्ता और सांख्यिकीविद् बेंजामिन बेयर बताते हैं, जिसका हालिया काम संबोधित करता है इस मुद्दे। पी-वैल्यू में "पी" संभाव्यता के लिए खड़ा है और यह एक उपाय है कि एक शून्य परिकल्पना परिणाम बनाम मौका कितना संभव है।
उदाहरण के लिए, यदि आप परीक्षण करना चाहते हैं कि सभी गुलाब लाल हैं या नहीं, तो आप एक नमूने में अन्य रंगों के लाल गुलाब और गुलाब की संख्या की गणना करेंगे और मूल्यों की तुलना करने के लिए एक परिकल्पना परीक्षण करेंगे। यदि यह परीक्षण 0.05 से कम के पी-मान को थूकता है, तो आपके पास यह दावा करने के लिए सांख्यिकीय रूप से महत्वपूर्ण आधार हैं कि केवल लाल गुलाब मौजूद हैं-भले ही आपके फूलों के नमूने के बाहर सबूत अन्यथा सुझाव देते हैं।
इस विचार का समर्थन करने के लिए पी-मानों का दुरुपयोग करना कि ईएसपी मौजूद है, अपेक्षाकृत हानिरहित हो सकता है, लेकिन जब इस अभ्यास का उपयोग चिकित्सा परीक्षणों में किया जाता है, तो इसके बहुत घातक परिणाम हो सकते हैं, बेयर कहते हैं। "मुझे लगता है कि बड़ा जोखिम यह है कि गलत निर्णय लिया जा सकता है," वे बताते हैं। "विज्ञान और सांख्यिकी में यह बड़ी बहस हो रही है, यह पता लगाने की कोशिश कर रहा है कि यह प्रक्रिया अधिक सुचारू रूप से कैसे हो सकती है और यह निर्णय वास्तव में हैं उन्हें क्या होना चाहिए, इसके आधार पर। "
बेयर 2021 के अंत में पीएनएएस पत्रिका में अपने पूर्व कॉर्नेल सलाहकार और सांख्यिकी के प्रोफेसर मार्टिन वेल्स के साथ प्रकाशित एक पेपर पर पहले लेखक थे, जिन्होंने देखा कि कैसे नए आंकड़े पी-मानों के उपयोग में सुधार कर सकते हैं। उन्होंने जिस मीट्रिक को देखा, उसे फ्रैगिलिटी इंडेक्स कहा जाता है और इसे पी-वैल्यू को पूरक और बेहतर बनाने के लिए डिज़ाइन किया गया है।
यह माप डेटा सेट की नाजुकता को उसके कुछ डेटा बिंदुओं पर सकारात्मक से नकारात्मक परिणाम में फ़्लिप करने का वर्णन करता है - उदाहरण के लिए, यदि कोई रोगी जो किसी दवा से सकारात्मक रूप से प्रभावित होता है, तो वास्तव में कोई प्रभाव नहीं पड़ता है। यदि इनमें से केवल कुछ डेटा बिंदुओं को बदलना किसी परिणाम को सांख्यिकीय रूप से महत्वपूर्ण होने से कम करने के लिए पर्याप्त नहीं है, तो इसे नाजुक माना जाता है।


Next Story