दिल्ली-एनसीआर

संख्या खेल: सांख्यिकी का जेकिल और हाइड व्यक्तित्व

Gulabi Jagat
15 July 2023 4:30 PM GMT
संख्या खेल: सांख्यिकी का जेकिल और हाइड व्यक्तित्व
x
भारतीय सांख्यिकी संस्थान 91 वर्ष पुराना है। लगभग एक शताब्दी के अस्तित्व के बावजूद, भारत सरकार की आधिकारिक सांख्यिकीय एजेंसी के आंकड़ों को कई लोगों द्वारा संदेह की दृष्टि से देखा जा रहा है। वास्तव में, हमारे पुरातन सांख्यिकीय ढांचे पर नवीनतम बहस देश द्वारा 29 जून को राष्ट्रीय सांख्यिकी दिवस मनाए जाने के कुछ ही सप्ताह बाद शुरू हुई है।
वामपंथी, दक्षिणपंथी और 'केंद्र' (सरकार) के प्रसिद्ध अर्थशास्त्री इस बात पर मौखिक रूप से आदान-प्रदान करने में व्यस्त हैं कि कैसे उप-इष्टतम कार्यप्रणाली और नमूनाकरण त्रुटियां अक्सर वास्तविक प्रगति का आकलन करने में विफलता या इसकी कमी का कारण बन सकती हैं।
आधिकारिक आर्थिक आंकड़ों के प्रति शत्रुता इस हद तक पहुंच गई है कि सभी आधिकारिक आंकड़े, भले ही वैध हों, सरकार की पीठ थपथपाने की चाल के रूप में देखे जाते हैं।
साथ ही, इस बात से भी इनकार नहीं किया जा सकता कि पिछले दशक में हुए महत्वपूर्ण संशोधनों के बावजूद, भारत की सांख्यिकीय पद्धतियों में सटीकता में सुधार लाने और विश्वास वापस पाने के लिए उनमें पूर्ण बदलाव की आवश्यकता है।
एक वैश्विक घटना
आधिकारिक आंकड़ों पर अविश्वास केवल भारत तक ही सीमित नहीं है। सांख्यिकीय हेरफेर या सांख्यिकीय अपराध हर जगह होते हैं, और आश्चर्यजनक रूप से, उनमें से कुछ ने जान भी ले ली है। नीचे, द न्यू इंडियन एक्सप्रेस कुछ कुख्यात लोगों का विवरण देता है।
डेटा को गलत तरीके से पेश करने के मामले में फार्मास्युटिकल उद्योग किसी से पीछे नहीं है। स्वास्थ्य सेवा क्षेत्र में सबसे बड़ी सांख्यिकीय आपदाओं में से एक 1996 की है जब पर्ड्यू फार्मा ने अमेरिका में अपनी नशे की दवा ऑक्सीकॉन्टिन लॉन्च की, जिसने देश में सबसे दुर्बल स्वास्थ्य संकटों में से एक को जन्म दिया और ओपिओइड की लत की एक लहर शुरू हुई जिसने हजारों लोगों की जान ले ली। ज़िंदगियाँ।
एक सुरक्षित, गैर-नशे की लत वाली दवा के रूप में विज्ञापित, जो दर्द से राहत के लिए अत्यधिक प्रभावी थी, पर्ड्यू की मार्केटिंग रणनीति ने उत्पाद के लिए एफडीए अनुमोदन प्राप्त करने के लिए एक अनैतिक और भ्रामक ग्राफ का उपयोग किया। इससे डॉक्टरों को यह विश्वास हो गया कि यह दवा नशे की लत नहीं है क्योंकि यह रोगी के रक्त में लंबे समय तक रहती है, जिससे वापसी के लक्षणों से बचने में मदद मिलती है। हालाँकि, बाद में यह पाया गया कि ग्राफ़ ने बिक्री बढ़ाने के लिए दवा की प्रभावकारिता को गलत तरीके से दिखाया और पर्ड्यू को अपने आपराधिक कार्यों के लिए 600 मिलियन डॉलर का जुर्माना भरने के लिए मजबूर होना पड़ा।
एक और प्रसिद्ध आपदा, जिसमें आंकड़ों ने भूमिका निभाई, वह 1986 में थी, जब उनके अंतरिक्ष शटल 'चैलेंजर' के उड़ान के बमुश्किल 73 सेकंड के भीतर विस्फोट हो जाने से सात अंतरिक्ष यात्री मारे गए थे। बाद की जांच में ठोस रॉकेट बूस्टर इंजीनियरों द्वारा सांख्यिकीय विश्लेषण में एक बड़ी खामी पाई गई, जिन्होंने शून्य घटनाओं वाली उड़ानों को अपने विश्लेषण से बाहर कर दिया था क्योंकि उन्हें लगा कि उन उड़ानों ने कोई प्रासंगिक जानकारी नहीं दी थी।
हालाँकि, बाद में यह पाया गया कि बिना किसी घटना के सभी उड़ानें 65 डिग्री से ऊपर के तापमान पर लॉन्च की गईं, जबकि चैलेंजर को ठंडे दिन में लॉन्च किया गया था जब तापमान 39 डिग्री फ़ारेनहाइट था। इंजीनियरों का मानना ​​था कि लॉन्च तापमान और उड़ान पर ओ-रिंग (गैस या तरल रिसाव को रोकने वाली एक यांत्रिक सील) की घटनाओं की संख्या के बीच कोई संबंध नहीं था, जबकि कमीशन की गई जांच से निष्कर्ष निकला कि '...ओ-रिंग प्रदर्शन से पता चला होगा कम तापमान में ओ-रिंग क्षति का सहसंबंध।'
हालांकि उन्नत सांख्यिकीय तरीकों की बदौलत समय के साथ ऐसी घातक घटनाओं में कमी आई है, लेकिन आंकड़ों का दुरुपयोग नहीं रुका है। प्रौद्योगिकी और उन्नत डेटा विश्लेषण उपकरणों की उपलब्धता के बावजूद, कोई भी डेटा हेरफेर के माध्यम से कुछ भी साबित कर सकता है। ऐसी गलतियों को कुछ दशक पहले ही माफ किया जा सकता था जब सांख्यिकीय पद्धतियां अभी भी आकार ले रही थीं और सर्वेक्षण त्रुटियों को अनुभव की कमी के परिणाम के रूप में देखा जा सकता था।
डेटा की जानबूझ कर की गई गलत व्याख्या की बात करें तो डेरेल हफ की 1954 की किताब 'हाउ टू लाई विद स्टैटिस्टिक्स' अपनी शैली में एक क्लासिक है। 129 पेजर में डेटा दुरुपयोग की बढ़ती प्रवृत्ति के कई उदाहरण हैं। इसका नमूना लें:
1950 के एक सर्वेक्षण में पाया गया कि येल विश्वविद्यालय में, 1924 की कक्षा की औसत आय $25,111 प्रति वर्ष थी। लेकिन जल्द ही, यह महसूस किया गया कि सर्वेक्षण ने काफी बढ़ा हुआ आंकड़ा प्रस्तुत किया है, क्योंकि नमूने में ऐसे समूहों को शामिल नहीं किया गया है जो औसत को कम कर सकते थे। इसके अलावा, इसने केवल उन लोगों का सर्वेक्षण किया जिन्होंने प्रतिक्रिया देने की जहमत उठाई और केवल उनका ही सर्वेक्षण किया जिन्हें येल ढूंढ सका।
इसके बाद लिटरेरी डाइजेस्ट का 1936 का कुख्यात सर्वेक्षण है जो अपने त्रुटिपूर्ण सर्वेक्षण परिणामों के कारण सामने आया। पत्रिका ने 1920 के बाद से हर अमेरिकी चुनाव पर एक सर्वेक्षण चलाया था और 1932 के चुनाव की सटीक भविष्यवाणी करने के बाद आधिकारिक दर्जा भी हासिल कर लिया था। हालाँकि, बाद के सर्वेक्षण में अपूरणीय दरारें देखी गईं। सर्वेक्षण में डाइजेस्ट के 10 मिलियन ग्राहकों (बड़े पैमाने पर रिपब्लिकन झुकाव के साथ) का एक पक्षपातपूर्ण नमूना था, और रिपब्लिकन राष्ट्रपति पद के उम्मीदवार अल्फ लैंडन के लिए एक शानदार जीत की भविष्यवाणी की गई थी, जबकि वास्तविक चुनाव मौजूदा फ्रैंकलिन रूजवेल्ट ने जीता था।
डेरेल को आँकड़ों के साथ झूठ बोलने की सुंदरता का विवरण देने में आनंद आया। यदि आपसे कहा जाए कि पड़ोस में औसत आय 10,000 पाउंड प्रति वर्ष थी, जो बाद में घटकर 2,000 पाउंड प्रति वर्ष हो जाती है, तो यह सच में झूठ नहीं हो सकता है। दोनों आंकड़े वैध और कानूनी रूप से निकाले जा सकते हैं। लेकिन ट्रिक हर बार एक अलग तरह के औसत का उपयोग कर रही थी। 10,000 पाउंड का आंकड़ा क्षेत्र के सभी परिवारों की आय का माध्य या अंकगणितीय औसत हो सकता है। आप इसे सभी आय को जोड़कर और वहां मौजूद परिवारों की संख्या से विभाजित करके प्राप्त करते हैं। छोटा आंकड़ा माध्यिका हो सकता है, और आपको बताता है कि आधे परिवारों के पास प्रति वर्ष 2,000 पाउंड से अधिक है और आधे के पास कम है।
चालू वर्ष में कटौती करें तो औसत एक पेचीदा क्षेत्र बना हुआ है। एक प्रासंगिक उदाहरण चार्ल्स व्हीलन ने अपनी 2015 की पुस्तक नेकेड स्टैटिस्टिक्स में प्रस्तुत किया है:
मान लीजिए कि हम नागरिकों की आर्थिक भलाई का एक सरल लेकिन सटीक माप चाहते हैं और यह पता लगाना चाहते हैं कि क्या मध्यम वर्ग अमीर हो रहा है, गरीब हो रहा है, या बस उसी स्थान पर रह रहा है। जैसा कि व्हीलन कहते हैं, एक उचित उत्तर - हालांकि किसी भी तरह से सही उत्तर नहीं है - एक पीढ़ी या लगभग 30 वर्षों के दौरान देश में प्रति व्यक्ति आय में परिवर्तन की गणना करना होगा। प्रति व्यक्ति आय एक साधारण औसत है: कुल आय को जनसंख्या के आकार से विभाजित किया जाता है। उस माप के अनुसार, अमेरिका में औसत आय 1980 में $7,787 से बढ़कर 2010 में $26,487 हो गई।
हालाँकि यह तकनीकी रूप से सही है, और यह सच्चाई से बहुत दूर भी हो सकता है। एक के लिए, आंकड़े मुद्रास्फीति के लिए समायोजित नहीं किए गए हैं। इससे भी बड़ी समस्या यह है कि औसत आय एक औसत नागरिक की आय के बराबर नहीं है। "प्रति व्यक्ति आय में देश में अर्जित सारी आय शामिल होती है और इसे लोगों की संख्या से विभाजित किया जाता है, जो हमें इस बारे में कुछ भी नहीं बताता है कि कौन उस आय का कितना हिस्सा कमा रहा है। शीर्ष 1% की आय में विस्फोटक वृद्धि प्रति व्यक्ति आय बढ़ा सकती है अन्य 99% की जेब में कोई और पैसा डाले बिना व्यक्ति आय में उल्लेखनीय वृद्धि हुई। औसत अमेरिकी की मदद के बिना देश की औसत आय बढ़ सकती है," उन्होंने निष्कर्ष निकाला।
अन्य प्रमुख उदाहरणों में जहां आँकड़े गलत हो गए, वह अल्बर्ट किन्से की मानव पुरुष में यौन व्यवहार पर विवादास्पद पुस्तक थी, जो 1948 में प्रकाशित हुई थी। 800 पेज का यह ग्रंथ राष्ट्रीय बेस्ट-सेलर था, लेकिन इसकी 'सुविधा' के लिए सांख्यिकीविदों द्वारा इसकी आलोचना की गई और इसे चुनौती दी गई। नमूनाकरण,' पूर्वाग्रह और अशुद्धि की संभावना। दूसरे शब्दों में, किन्से ने अपने शोध में लगभग 5,300 पुरुषों और 6,000 महिलाओं का साक्षात्कार लिया, लेकिन कोई स्पष्ट नमूनाकरण पद्धति का पालन नहीं किया और इसलिए उनके सभी निष्कर्ष अंततः बेकार साबित हुए।
ये विज्ञापन या राजनीतिक वर्ग द्वारा उपयोग किए जाने वाले भ्रामक आंकड़ों के अनगिनत मामलों में से कुछ हैं।
हालाँकि, इसका मतलब यह नहीं है कि आँकड़े अक्सर गलत होते हैं या सांख्यिकीय विश्लेषण शायद ही कभी सच्चाई का खुलासा करते हैं।
उदाहरण के लिए, जैसा कि अर्थशास्त्री टिम हारफोर्ड ने अपनी पुस्तक हाउ टू मेक द वर्ल्ड ऐड अप में बताया है, यह 1954 में रिचर्ड हिल डॉल और ऑस्टिन ब्रैडफोर्ड द्वारा किए गए एक अध्ययन था जिसने स्थापित किया कि यह सिगरेट धूम्रपान था, न कि वाहनों का धुआं, जो वृद्धि का कारण बना। फेफड़ों के कैंसर में. वह एक अमूल्य खोज थी।
फिर भी, कोई उन असंख्य बुद्धिमानीपूर्ण बातों को नज़रअंदाज़ नहीं कर सकता जो हमें चेतावनी देती हैं कि कैसे डेटा और ग्राफ़ दिखाने से ज़्यादा छिपाते हैं। इसलिए, आज की दुनिया में जहां डेटा हर जगह है, खराब डेटा से बाहर निकलने का एकमात्र तरीका डफेल के गहन शब्दों में पाया जा सकता है: बदमाश पहले से ही चालें जानते हैं (आंकड़ों में हेरफेर करने के लिए); ईमानदार व्यक्तियों को आत्मरक्षा के लिए इन्हें अवश्य सीखना चाहिए।
Next Story