अध्याय 02 आंकड़ों का संग्रह
1. परिचय
पिछले अध्याय में आपने अर्थशास्त्र क्या है, इसके बारे में पढ़ा है। आपने अर्थशास्त्र में सांख्यिकी की भूमिका और महत्व के बारे में भी अध्ययन किया है। इस अध्याय में आप डेटा के स्रोतों और डेटा संग्रह की विधि के बारे में पढ़ेंगे। डेटा संग्रह का उद्देश्य किसी समस्या के समाधान के लिए ठोस और स्पष्ट प्रमाण प्रस्तुत करना है।
अर्थशास्त्र में आप अक्सर इस तरह के कथन से सामना करते हैं,
“कई उतार-चढ़ावों के बाद खाद्यान्न का उत्पादन 1970-71 में 108 मिलियन टन से बढ़कर 1978-79 में 132 मिलियन टन हो गया, लेकिन 1979-80 में फिर घटकर 108 मिलियन टन रह गया। खाद्यान्न का उत्पादन फिर लगातार बढ़ता रहा और 2015-16 में 252 मिलियन टन तथा 2016-17 में 272 मिलियन टन तक पहुँच गया।”
इस कथन में आप देख सकते हैं कि विभिन्न वर्षों में खाद्यान्न का उत्पादन समान नहीं रहता है। यह वर्ष दर वर्ष और फसल दर फसल बदलता रहता है। चूँकि ये मान बदलते हैं, इन्हें चर कहा जाता है। चरों को आमतौर पर अक्षरों $\mathrm{X}, \mathrm{Y}$ या $\mathrm{Z}$ द्वारा दर्शाया जाता है। किसी चर का प्रत्येक मान एक प्रेक्षण होता है। उदाहरण के लिए, भारत में खाद्यान्न का उत्पादन निम्नलिखित सारणी में दिखाए अनुसार 1970-71 में 108 मिलियन टन से लेकर 2016-17 में 272 मिलियन टन तक बदलता रहा है। वर्षों को चर $X$ और भारत में खाद्यान्न का उत्पादन (मिलियन टन में) को चर $Y$ द्वारा दर्शाया गया है।
सारणी 2.1 भारत में खाद्यान्न का उत्पादन (मिलियन टन)
| X | Y |
|---|---|
| 1970-71 | 108 |
| 1978-79 | 132 |
| 1990-91 | 176 |
| 1997-98 | 194 |
| 2001-02 | 212 |
| 2015-16 | 252 |
| 2016-17 | 272 |
यहाँ इन चरों $X$ और $Y$ के मान ‘डेटा’ हैं, जिनसे हम भारत में खाद्यान्न उत्पादन के बारे में जानकारी प्राप्त कर सकते हैं। खाद्यान्न उत्पादन में उतार-चढ़ाव को जानने के लिए हमें विभिन्न वर्षों के लिए भारत में खाद्यान्न उत्पादन का ‘डेटा’ चाहिए। ‘डेटा’ एक उपकरण है, जो जानकारी प्रदान करके समस्याओं को समझने में मदद करता है।
आप सोच रहे होंगे कि ‘डेटा’ आता कहाँ से है और हम इन्हें कैसे एकत्र करते हैं? निम्नलिखित खंडों में हम डेटा के प्रकार, डेटा संग्रह की विधि और उपकरणों और डेटा प्राप्त करने के स्रोतों पर चर्चा करेंगे।
2. डेटा के स्रोत क्या हैं?
सांख्यिकीय डेटा दो स्रोतों से प्राप्त किया जा सकता है। शोधकर्ता किसी पूछताछ आयोजित करके डेटा एकत्र कर सकता है। ऐसे डेटा को प्राथमिक डेटा कहा जाता है, क्योंकि ये प्रथम सूचना पर आधारित होते हैं। मान लीजिए आप किसी फिल्म स्टार की स्कूली छात्रों में लोकप्रियता के बारे में जानना चाहते हैं। इसके लिए आपको बड़ी संख्या में स्कूली छात्रों से पूछताछ करनी होगी, उनसे प्रश्न पूछकर वांछित जानकारी एकत्र करनी होगी। आपको जो डेटा मिलता है, वह प्राथमिक डेटा का उदाहरण है।
यदि डेटा किसी अन्य एजेंसी द्वारा एकत्रित और संसाधित (जांच-परख और सारणीबद्ध) किए गए हैं, तो उन्हें द्वितीयक डेटा कहा जाता है। इन्हें या तो प्रकाशित स्रोतों जैसे सरकारी रिपोर्ट, दस्तावेज़, समाचार-पत्र, अर्थशास्त्रियों द्वारा लिखी पुस्तकों से या किसी अन्य स्रोत, उदाहरण के लिए किसी वेबसाइट से प्राप्त किया जा सकता है। इस प्रकार, जो स्रोत डेटा को पहली बार एकत्रित और संसाधित करता है, उसके लिए वे प्राथमिक डेटा होते हैं और बाद में उनका उपयोग करने वाले सभी स्रोतों के लिए वे द्वितीयक डेटा होते हैं। द्वितीयक डेटा के उपयोग से समय और लागत की बचत होती है। उदाहरण के लिए, आपने छात्रों के बीच फिल्मस्टार की लोकप्रियता पर डेटा एकत्रित करके एक रिपोर्ट प्रकाशित की। यदि कोई व्यक्ति समान अध्ययन के लिए आपके द्वारा एकत्रित डेटा का उपयोग करता है, तो वह द्वितीयक डेटा बन जाता है।
3. हम डेटा कैसे एकत्रित करते हैं?
क्या आप जानते हैं कि कोई निर्माता किसी उत्पाद के बारे में या कोई राजनीतिक दल उम्मीदवार के बारे में कैसे निर्णय लेता है? वे एक बड़े समूह से किसी विशेष उत्पाद या उम्मीदवार के बारे में प्रश्न पूछकर सर्वेक्षण करते हैं। सर्वेक्षण का उद्देश्य कुछ विशेषताओं जैसे मूल्य, गुणवत्ता, उपयोगिता (उत्पाद के मामले में) और लोकप्रियता, ईमानदारी, निष्ठा (उम्मीदवार के मामले में) का वर्णन करना होता है। सर्वेक्षण का उद्देश्य डेटा एकत्रित करना है। सर्वेक्षण व्यक्तियों से सूचना एकत्र करने की एक विधि है।
उपकरण की तैयारी
सर्वेक्षणों में प्रयोग किए जाने वाला सबसे सामान्य उपकरण प्रश्नावली/साक्षात्कार अनुसूची होता है। प्रश्नावली या तो उत्तरदाता स्वयं भरता है या फिर इसे शोधकर्ता (गणक) या प्रशिक्षित जांचकर्ता द्वारा भरवाया जाता है। प्रश्नावली/साक्षात्कार अनुसूची तैयार करते समय निम्नलिखित बातों को ध्यान में रखना चाहिए;
- प्रश्नावली अत्यधिक लंबी नहीं होनी चाहिए। प्रश्नों की संख्या यथासंभव न्यूनतम होनी चाहिए।
प्रश्नावली सरल होनी चाहिए और अस्पष्ट या कठिन शब्दों से बचना चाहिए।
- प्रश्नों को ऐसे क्रम में व्यवस्थित करना चाहिए ताकि उत्तर देने वाला व्यक्ति सहज महसूस करे।
- प्रश्नों की श्रृंखला सामान्य से विशिष्ट की ओर बढ़नी चाहिए। प्रश्नावली सामान्य प्रश्नों से शुरू होकर अधिक विशिष्ट प्रश्नों की ओर आगे बढ़नी चाहिए। उदाहरण के लिए:
खराब $Q$
(i) क्या बिजली शुल्क में वृद्धि उचित है?
(ii) क्या आपके क्षेत्र में बिजली आपूर्ति नियमित है?
अच्छा $Q$
(i) क्या आपके क्षेत्र में बिजली आपूर्ति नियमित है?
(ii) क्या बिजली शुल्क में वृद्धि उचित है?
- प्रश्न सटीक और स्पष्ट होने चाहिए। उदाहरण के लिए,
खराब $Q$
प्रस्तुतदिखाई देने के लिए आप अपनी आय का कितना प्रतिशत कपड़ों पर खर्च करते हैं?
अच्छा $Q$
आप अपनी आय का कितना प्रतिशत कपड़ों पर खर्च करते हैं?
- प्रश्न अस्पष्ट नहीं होने चाहिए। उन्हें उत्तरदाताओं को तेजी, सही और स्पष्ट रूप से उत्तर देने में सक्षम बनाना चाहिए। उदाहरण के लिए:
खराब $Q$
क्या आप एक महीने में पुस्तकों पर बहुत पैसा खर्च करते हैं?
अच्छा $Q$
(उपयुक्त विकल्प पर टिक करें)
आप एक महीने में कितना खर्च करते हैं किताबों पर?
(i) ₹200 से कम
(ii) ₹200-300
(iii) ₹300-400
(iv) ₹400 से अधिक
- प्रश्न में दोहरा नकारात्मक (double negative) नहीं होना चाहिए। “क्या आप नहीं सोचते…” या “क्या आप नहीं…” से शुरू होने वाले प्रश्नों से बचें, क्योंकि वे पूर्वाग्रही उत्तर दिला सकते हैं। उदाहरण:
खराब $Q$
क्या आप नहीं सोचते कि धूम्रपान पर प्रतिबंध होना चाहिए?
अच्छा $Q$
क्या आप सोचते हैं कि धूम्रपान पर प्रतिबंध होना चाहिए?
- प्रश्न मार्गदर्शक (leading) नहीं होना चाहिए, जो उत्तरदाता को यह संकेत दे कि उसे कैसे उत्तर देना है। उदाहरण:
खराब $Q$
आपको इस उच्च गुणवत्ता वाली चाय का स्वाद कैसा लगा?
अच्छा $Q$
आपको इस चाय का स्वाद कैसा लगा?
- प्रश्न में उत्तर के विकल्पों का संकेत नहीं होना चाहिए। उदाहरण:
खराब $Q$
कॉलेज के बाद आप नौकरी करना चाहेंगी या गृहिणी बनना चाहेंगी?
अच्छा $Q$
कॉलेज के बाद आप क्या करना चाहेंगी?
प्रश्नावली बंद-अंत वाले (closed-ended या संरचित) प्रश्नों या खुले-अंत वाले (open-ended या असंरचित) प्रश्नों से बन सकती है। उपरोक्त प्रश्न—जिसमें विद्यार्थी कॉलेज के बाद क्या करना चाहता है—एक खुला-अंत वाला प्रश्न है।
बंद-अंत या संरचित प्रश्न या तो दो-विकल्पीय (two-way) हो सकते हैं या बहुविकल्पीय (multiple choice)। जब केवल दो संभावित उत्तर हों—‘हाँ’ या ‘नहीं’—तो उसे दो-विकल्पीय प्रश्न कहते हैं।
जब दो से अधिक उत्तर विकल्प हों, तो बहुविकल्पीय प्रश्न उपयुक्त होते हैं। उदाहरण,
प्र. आपने अपनी ज़मीन क्यों बेची?
(i) कर्ज़ चुकाने के लिए।
(ii) बच्चों की शिक्षा के लिए।
(iii) किसी अन्य संपत्ति में निवेश करने के लिए।
(iv) कोई अन्य (कृपया स्पष्ट करें)।
बंद प्रश्नों का उपयोग करना, अंक देना और विश्लेषण के लिए कोड करना आसान होता है, क्योंकि सभी उत्तरदाता दिए गए विकल्पों में से चयन कर सकते हैं। लेकिन इन्हें लिखना कठिन होता है क्योंकि विकल्पों को स्पष्ट रूप से लिखा जाना चाहिए ताकि मुद्दे के दोनों पक्षों का प्रतिनिधित्व हो। यह भी संभावना होती है कि किसी व्यक्ति का वास्तविक उत्तर दिए गए विकल्पों में मौजूद न हो। इसके लिए ‘कोई अन्य’ का विकल्प दिया जाता है, जहाँ उत्तरदाता एक ऐसा उत्तर लिख सकता है जिसकी अनुसंधानकर्ता ने कल्पना नहीं की थी। इसके अतिरिक्त, बहुविकल्पी प्रश्नों की एक अन्य सीमितता यह है कि ये विकल्प प्रदान करके उत्तरों को सीमित कर देते हैं, जिनके बिना उत्तरदाता भिन्न रूप से उत्तर दे सकते थे।
खुले प्रश्न अधिक व्यक्तिगत उत्तरों की अनुमति देते हैं, लेकिन इनकी व्याख्या करना कठिन होता है और इनका मूल्यांकन करना भी कठिन होता है, क्योंकि उत्तरों में बहुत विविधता होती है। उदाहरण,
प्र. वैश्वीकरण के बारे में आपका क्या दृष्टिकोण है?
आंकड़ों संग्रह की विधि
क्या आपने कभी कोई टेलीविज़न शो देखा है जिसमें रिपोर्टर बच्चों, गृहिणियों या आम जनता से उनकी परीक्षा प्रदर्शन या साबुन की किसी ब्रांड या किसी राजनीतिक दल के बारे में प्रश्न पूछते हैं? प्रश्न पूछने का उद्देश्य सर्वेक्षण करके आंकड़े एकत्र करना होता है। आंकड़े एकत्र करने की तीन मूलभूत विधियाँ हैं: (i) व्यक्तिगत साक्षात्कार, (ii) मेल (प्रश्नावली) सर्वेक्षण, और (iii) टेलीफोन साक्षात्कार।
व्यक्तिगत साक्षात्कार
यह विधि तब प्रयोग की जाती है जब शोधकर्ता की सभी सदस्यों तक पहुँच होती है। शोधकर्ता (या अन्वेषक) उत्तरदाताओं के सा�ने-सामने साक्षात्कार करता है।

व्यक्तिगत साक्षात्कार विभिन्न कारणों से पसंद किए जाते हैं। उत्तरदाता और साक्षात्कारकर्ता के बीच व्यक्तिगत संपर्क स्थापित होता है। साक्षात्कारकर्ता को अध्ययन की व्याख्या करने और उत्तरदाताओं के प्रश्नों का उत्तर देने का अवसर मिलता है। साक्षात्कारकर्ता उत्तरदाता से विशेष रूप से महत्वपूर्ण उत्तरों का विस्तार करने का अनुरोध कर सकता है। गलत व्याख्या और गलतफहमी से बचा जा सकता है। उत्तरदाताओं की प्रतिक्रियाओं को देखने से अतिरिक्त जानकारी प्राप्त हो सकती है।
व्यक्तिगत साक्षात्कार के कुछ दोष भी हैं। यह महँगा होता है, क्योंकि इसके लिए प्रशिक्षित साक्षात्कारकर्ताओं की आवश्यकता होती है। सर्वेक्षण को पूरा करने में अधिक समय लगता है। शोधकर्ता की उपस्थिति उत्तरदाताओं को वह कहने से रोक सकती है जो वे वास्तव में सोचते हैं।
मेल द्वारा प्रश्नावली

जब किसी सर्वेक्षण में डेटा डाक द्वारा एकत्र किया जाता है, तो प्रत्येक व्यक्ति को प्रश्नावली डाक द्वारा भेजी जाती है और एक निश्चित तिथि तक उसे भरकर वापस भेजने का अनुरोध किया जाता है। इस विधि के लाभ यह हैं कि यह कम खर्चीली होती है। यह शोधकर्ता को दूर-दराज के क्षेत्रों के लोगों तक भी पहुंचने की अनुमति देती है, जिन तक व्यक्तिगत रूप से या टेलीफोन द्वारा पहुंचना कठिन हो सकता है। यह साक्षात्कारकर्ता द्वारा उत्तरदाताओं को प्रभावित करने की अनुमति नहीं देती। यह उत्तरदाताओं को प्रश्नों के बारे में विचारपूर्वक उत्तर देने के लिए पर्याप्त समय लेने की भी अनुमति देता है।
इन दिनों ऑनलाइन सर्वेक्षण या लघु संदेश सेवा, अर्थात् एसएमएस के माध्यम से सर्वेक्षण लोकप्रिय हैं। क्या आप जानते हैं कि ऑनलाइन सर्वेक्षण कैसे किया जाता है?
डाक सर्वेक्षण के नुकसान यह हैं कि निर्देशों को स्पष्ट करने में सहायता प्रदान करने के अवसर कम होते हैं, इसलिए प्रश्नों को गलत समझने की संभावना होती है। डाक द्वारा सर्वेक्षण कराने से कम प्रतिसाद दर मिलने की भी संभावना होती है कुछ कारकों के कारण, जैसे कि प्रश्नावली को भरे बिना वापस भेजना, प्रश्नावली को बिल्कुल वापस न भेजना, डाक में ही प्रश्नावली के खो जाने आदि।
टेलीफोन साक्षात्कार

टेलीफोन साक्षात्कार में, अन्वेषक टेलीफोन पर प्रश्न पूछता है।
टेलीफोन साक्षात्कारों के लाभ यह हैं कि ये व्यक्तिगत साक्षात्कारों की तुलना में सस्ते होते हैं और कम समय में आयोजित किए जा सकते हैं।
ये शोधकर्ता को प्रतिवादी को प्रश्नों को स्पष्ट करके सहायता करने की अनुमति देते हैं।
टेलीफोनिक साक्षात्कार उन मामलों में बेहतर होता है जहाँ प्रतिवादी व्यक्तिगत साक्षात्कारों में कुछ प्रश्नों का उत्तर देने में अनिच्छुक होते हैं।
इस विधि का नुकसान लोगों तक पहुँच है, क्योंकि कई लोगों के पास टेलीफोन नहीं हो सकते हैं।
पायलट सर्वे
एक बार प्रश्नावली तैयार हो जाने पर, इसे एक छोटे समूह के साथ आज़माना उचित होता है, जिसे पायलट सर्वे या प्रश्नावली का पूर्व-परीक्षण कहा जाता है।
पायलट सर्वे सर्वे के बारे में प्रारंभिक विचार प्रदान करने में मदद करता है।
यह प्रश्नावली के पूर्व-परीक्षण में मदद करता है, ताकि प्रश्नों की कमियों और खामियों को जाना जा सके।
पायलट सर्वे प्रश्नों की उपयुक्तता, निर्देशों की स्पष्टता, गणनाकर्ताओं के प्रदर्शन और वास्तविक सर्वे में लगने वाले लागत और समय का आकलन करने में भी मदद करता है।
गतिविधियाँ
- आपको एक ऐसे व्यक्ति से जानकारी एकत्र करनी है, जो भारत के एक दूरदराज़ गाँव में रहता है।
डेटा संग्रह का कौन-सा तरीका उपयुक्त होगा और क्यों? चर्चा करें।- आपको एक विद्यालय में शिक्षण की गुणवत्ता के बारे में अभिभावकों का साक्षात्कार करना है।
यदि विद्यालय का प्रधानाचार्य वहाँ मौजूद हो, तो किस प्रकार की समस्याएँ उत्पन्न हो सकती हैं?

4. जनगणना और प्रतिदर्श सर्वेक्षण
जनगणना या पूर्ण गणना
एक सर्वेक्षण, जिसमें जनसंख्या के प्रत्येक तत्व को शामिल किया जाता है, को जनगणना या पूर्ण गणना की विधि के रूप में जाना जाता है। यदि कुछ एजेंसियां भारत में कुल जनसंख्या का अध्ययन करने में रुचि रखती हैं, तो उन्हें ग्रामीण और शहरी भारत के सभी घरों से जानकारी प्राप्त करनी होगी। यह हर दस वर्ष में किया जाता है। घर-घर जाकर पूछताछ की जाती है, जिसमें भारत के सभी घरों को शामिल किया जाता है। जन्म और मृत्यु दर, साक्षरता, रोजगार, जीवन प्रत्याशा, जनसंख्या का आकार और संरचना आदि पर जनसांख्यिकीय आंकड़े भारत के रजिस्ट्रार जनरल द्वारा एकत्र किए जाते हैं और प्रकाशित किए जाते हैं। भारत की अंतिम जनगणना 2011 में आयोजित की गई थी।

जनगणना 2011 के अनुसार, भारत की जनसंख्या 121.09 करोड़ थी, जो 2001 में 102.87 करोड़ थी। जनगणना 1901 से संकेत मिलता है कि देश की जनसंख्या 23.83 करोड़ थी। तब से, 110 वर्षों की अवधि में, देश की जनसंख्या में 97 करोड़ से अधिक की वृद्धि हुई है। औसत वार्षिक वृद्धि दर जो 1971-81 के दशक में 2.2 प्रतिशत प्रति वर्ष थी, वह 1991-2001 में घटकर 1.97 प्रतिशत हो गई और 2001-2011 के दौरान 1.64 प्रतिशत रही।
जनसंख्या और प्रतिदर्श
सांख्यिकी में जनसंख्या या ब्रह्मांड का अर्थ है अध्ययन के अधीन आइटमों की कुलता। इस प्रकार, जनसंख्या या ब्रह्मांड एक समूह है जिस पर अध्ययन के परिणाम लागू होने हैं। एक जनसंख्या हमेशा वे सभी व्यक्ति/आइटम होते हैं जो किसी निश्चित विशेषता (या विशेषताओं के समूह) को रखते हैं, सर्वेक्षण के उद्देश्य के अनुसार। नमूना चयन का पहला कार्य जनसंख्या की पहचान करना है। एक बार जनसंख्या की पहचान हो जाने पर, शोधकर्ता इसका अध्ययन करने की विधि चुनता है। यदि शोधकर्ता पाता है कि पूरी जनसंख्या का सर्वेक्षण संभव नहीं है, तो वह एक प्रतिनिधि नमूना चुनने का निर्णय ले सकता है। एक नमूना जनसंख्या के उस समूह या खंड को संदर्भित करता है जिससे सूचना प्राप्त की जानी है। एक अच्छा नमूना (प्रतिनिधि नमूना) आमतौर पर जनसंख्या से छोटा होता है और बहुत कम लागत और कम समय में जनसंख्या के बारे में उचित रूप से सटीक सूचना प्रदान करने में सक्षम होता है।
मान लीजिए आप किसी क्षेत्र के लोगों की औसत आय का अध्ययन करना चाहते हैं। जनगणना विधि के अनुसार आपको उस क्षेत्र के प्रत्येक व्यक्ति की आय ज्ञात करनी होगी, उन्हें जोड़ना होगा और व्यक्तियों की संख्या से विभाजित करना होगा ताकि क्षेत्र के लोगों की औसत आय प्राप्त हो सके। इस विधि में भारी खर्च आएगा, क्योंकि बड़ी संख्या में गणनाकर्मियों को नियोजित करना पड़ेगा। वैकल्पिक रूप से, आप उस क्षेत्र से कुछ व्यक्तियों का एक प्रतिनिधि नमूना चुनते हैं और उनकी आय ज्ञात करते हैं। चयनित व्यक्तियों के समूह की औसत आय को पूरे क्षेत्र के व्यक्तियों की औसत आय के अनुमान के रूप में प्रयोग किया जाता है।
उदाहरण
- अनुसंधान समस्या: मणिपुर के चुराचंदपुर जिले में कृषि श्रमिकों की आर्थिक स्थिति का अध्ययन करना।
- जनसंख्या: चुराचंदपुर जिले के सभी कृषि श्रमिक।
- नमूना: चुराचंदपुर जिले के कृषि श्रमिकों का दस प्रतिशत।
अधिकांश सर्वेक्षण नमूना सर्वेक्षण होते हैं। ये सांख्यिकी में कई कारणों से पसंद किए जाते हैं। एक नमूना कम लागत और कम समय में उचित रूप से विश्वसनीय और सटीक जानकारी दे सकता है। चूंकि नमूने जनसंख्या से छोटे होते हैं, इसलिए गहन पूछताछ करके अधिक विस्तृत जानकारी एकत्र की जा सकती है। चूंकि हमें गणनाकर्मियों की छोटी टीम की आवश्यकता होती है, इसलिए उन्हें प्रशिक्षित करना और उनके कार्य पर प्रभावी ढंग से निगरानी रखना आसान होता है। अब प्रश्न यह है कि आप नमूना कैसे लेते हैं? नमूनाकरण के दो मुख्य प्रकार होते हैं, यादृच्छिक और अयादृच्छिक।
गतिविधियाँ
- भारत और चीन में अगली जनगणना किन वर्षों में होगी?
- यदि आपको कक्षा XI की नई अर्थशास्त्र पाठ्यपुस्तक के बारे में छात्रों की राय का अध्ययन करना है, तो आपकी जनसंख्या और नमूना क्या होंगे?
- यदि कोई शोधकर्ता पंजाब में गेहूं की औसत पैदावार का अनुमान लगाना चाहता है, तो उसकी/उसकी जनसंख्या और नमूना क्या होंगे?
निम्नलिखित विवरण उनके अंतर को स्पष्ट करेगा।
यादृच्छिक प्रतिदर्शन
जैसा कि नाम से स्पष्ट है, यादृच्छिक प्रतिदर्शन एक ऐसी विधि है जिसमें जनसंख्या से व्यक्तिगत इकाइयों (प्रतिदर्शों) को यादृच्छिक रूप से चुना जाता है। सरकार किसी विशेष क्षेत्र में पेट्रोल की कीमतों में वृद्धि के घरेलू बजट पर प्रभाव का आकलन करना चाहती है। इसके लिए, 30 घरों का एक प्रतिनिधि (यादृच्छिक) नमूना लेकर उसका अध्ययन करना होगा। उस क्षेत्र के सभी 300 घरों के नाम कागज पर लिखे जाते हैं और मिलाए जाते हैं, फिर 30 नामों को एक-एक करके साक्षात्कार के लिए चुना जाता है।
यादृच्छिक प्रतिदर्शन में, प्रत्येक व्यक्ति के चुने जाने की समान संभावना होती है। उपरोक्त उदाहरण में, जनसंख्या की सभी 300 प्रतिदर्श इकाइयों (जिन्हें प्रतिदर्श सूची भी कहा जाता है) को 30 इकाइयों के नमूने में शामिल होने की समान संभावना मिली और इस प्रकार चुना गया नमूना एक यादृच्छिक नमूना है। इसे लॉटरी विधि भी कहा जाता है। आजकल यादृच्छिक नमूने चुनने के लिए कंप्यूटर कार्यक्रमों का उपयोग किया जाता है।

एग्जिट पोल
आपने देखा होगा कि जब चुनाव होता है, तो टेलीविजन नेटवर्क चुनाव कवरेज प्रदान करते हैं। वे परिणामों की भविष्यवाणी करने की भी कोशिश करते हैं। यह एग्जिट पोल के माध्यम से किया जाता है, जिसमें मतदान केंद्र से बाहर आने वाले मतदाताओं के एक यादृच्छिक नमूने से पूछा जाता है कि उन्होंने किसे वोट दिया है। मतदाताओं के नमूने के आंकड़ों से भविष्यवाणी की जाती है। आपने देखा होगा कि एग्जिट पोल हमेशा सही भविष्यवाणी नहीं करते। क्यों?
गतिविधि
- आपको पिछले पचास वर्षों में भारत में अनाज उत्पादन के रुझान का विश्लेषण करना है। चूंकि सभी वर्षों के लिए आंकड़े इकट्ठा करना कठिन है, आपसे दस वर्षों के उत्पादन का नमूना चुनने को कहा गया है।
रैंडम नंबर टेबल का उपयोग करके आप अपने नमूने के वर्षों का चयन कैसे करेंगे?
गैर-यादृच्छिक नमूने
ऐसी स्थिति हो सकती है कि आपको एक क्षेत्र में 100 घरों में से 10 घरों का चयन करना है। आपको यह तय करना है कि कौन-सा घर चुनना है और कौन-से को छोड़ना है। आप सुविधाजनक रूप से स्थित घरों या उन घरों का चयन कर सकते हैं जो आपको या आपके मित्र को ज्ञात हैं। इस स्थिति में, आप 10 घरों के चयन में अपने विवेक (पक्षपात) का उपयोग कर रहे हैं। 100 में से 10 घरों का चयन इस तरह से यादृच्छिक चयन नहीं है। गैर-यादृच्छिक नमूने विधि में जनसंख्या की सभी इकाइयों के चयनित होने की समान संभावना नहीं होती है और चयन में जांचकर्ता की सुविधा या विवेक महत्वपूर्ण भूमिका निभाता है। वे मुख्यतः विवेक, उद्देश्य, सुविधा या कोटे के आधार पर चुने जाते हैं और गैर-यादृच्छिक नमूने होते हैं।
5. प्रतिचयन और गैर-प्रतिचयन त्रुटियाँ
प्रतिचयन त्रुटियाँ
संख्यात्मक मानों वाली एक जनसंख्या में दो महत्वपूर्ण विशेषताएँ होती हैं जो यहाँ प्रासंगिक हैं। पहली, केंद्रीय प्रवृत्ति जिसे माध्य, माध्यिका या बहुलक द्वारा मापा जा सकता है। दूसरी, विचरण, जिसे “मानक विचलन”, “माध्य विचलन”, “परास” आदि की गणना करके मापा जा सकता है।
प्रतिदर्श का उद्देश्य जनसंख्या प्राचलों के एक या अधिक अनुमान प्राप्त करना है। प्रतिचयन त्रुटि प्रतिदर्श अनुमान और संगत जनसंख्या प्राचल (उदाहरण के लिए औसत आय आदि जनसंख्या की विशेषता का वास्तविक मान) के बीच के अंतर को संदर्भित करती है। इस प्रकार, जनसंख्या के किसी प्राचल के वास्तविक मान और उसके अनुमान (प्रतिदर्श से) के बीच का अंतर प्रतिचयन त्रुटि है। बड़ा प्रतिदर्श लेकर प्रतिचयन त्रुटि की मात्रा को कम किया जा सकता है।
उदाहरण
मान लीजिए मणिपुर के 5 किसानों की आय का एक मामला है। चर $\mathrm{x}$ (किसानों की आय) में माप 500, 550, $600,650,700$ हैं। हम देखते हैं कि $(500+550+600+650+700)$ $\div 5=3000 \div 5=600$ जनसंख्या औसत है।
अब, मान लीजिए हम दो व्यक्तियों का एक प्रतिदर्श चुनते हैं जहाँ $x$ में 500 और 600 के माप हैं। प्रतिदर्श औसत $(500+600) \div 2$ $=1100 \div 2=550$ है।
यहाँ, अनुमान की प्रतिचयन त्रुटि $=600$ (सत्य मान) -550 (अनुमान) $=50$ है।
गैर-प्रतिचयन त्रुटियाँ
गैर-प्रतिदर्श त्रुटियाँ प्रतिदर्श त्रुटियों से अधिक गंभीर होती हैं क्योंकि प्रतिदर्श त्रुटि को बड़ा प्रतिदर्श लेकर कम किया जा सकता है। गैर-प्रतिदर्श त्रुटि को कम करना कठिन होता है, यहाँ तक कि बड़ा प्रतिदर्श लेने पर भी। एक जनगणना में भी गैर-प्रतिदर्श त्रुटियाँ हो सकती हैं। कुछ गैर-प्रतिदर्श त्रुटियाँ इस प्रकार हैं:
प्रतिदर्श पूर्वाग्रह
प्रतिदर्श पूर्वाग्रह तब होता है जब प्रतिदर्श योजना इस प्रकार होती है कि लक्षित जनसंख्या के कुछ सदस्यों का समावेश प्रतिदर्श में संभव ही नहीं होता।
अ-प्रतिक्रिया त्रुटियाँ
अ-प्रतिक्रिया तब होती है यदि एक साक्षात्कारकर्ता प्रतिदर्श में सूचीबद्ध व्यक्ति से संपर्क नहीं कर पाता या प्रतिदर्श से चुना व्यक्ति प्रतिक्रिया देने से इनकार कर देता है। इस स्थिति में, प्रतिदर्श प्रेक्षण प्रतिनिधि नहीं हो सकता।
आंकड़ा अर्जन में त्रुटियाँ
इस प्रकार की त्रुटि गलत प्रतिक्रियाओं के अभिलेखन से उत्पन्न होती है। मान लीजिए, शिक्षक छात्रों से कक्षा में शिक्षक की मेज की लंबाई मापने को कहता है। छात्रों द्वारा माप भिन्न हो सकती है। अंतर मापने वाली फीता में अंतर, छात्रों की लापरवाही आदि के कारण हो सकते हैं। इसी प्रकार, मान लीजिए हम संतरे की कीमतों पर आंकड़े इकट्ठा करना चाहते हैं। हम जानते हैं कि कीमतें दुकान से दुकान और बाजार से बाजार भिन्न होती हैं। कीमतें गुणवत्ता के अनुसार भी भिन्न होती हैं। इसलिए, हम केवल औसत कीमतों पर विचार कर सकते हैं। अभिलेखन की गलतियाँ भी हो सकती हैं क्योंकि गणनाकर्ता या उत्तरदाता आंकड़ों को अभिलेखित या ट्रांसक्राइब करते समय त्रुटियाँ कर सकते हैं, उदाहरण के लिए, वह 31 के बजाय 13 अभिलेखित कर सकता है।
6. भारत की जनगणना और NSSO
राष्ट्रीय और राज्य स्तर पर कुछ एजेंसियाँ हैं जो सांख्यिकीय आँकड़ों को एकत्र, प्रक्रमित और सारणीबद्ध करती हैं। राष्ट्रीय स्तर की कुछ एजेंसियाँ हैं भारत की जनगणना, राष्ट्रीय नमूना सर्वेक्षण (एनएसएस), केंद्रीय सांख्यिकी कार्यालय (सीएसओ), भारत के रजिस्ट्रार जनरल (आरजीआई), व्यापारिक खुफिया और सांख्यिकी महानिदेशालय (डीजीसीआईएस), श्रम ब्यूरो आदि।
भारत की जनगणना जनसंख्या का सबसे पूर्ण और निरंतर जनसांख्यिकीय अभिलेख प्रदान करती है। जनगणना 1881 से प्रत्येक दस वर्ष पर नियमित रूप से की जाती रही है। स्वतंत्रता के बाद पहली जनगणना 1951 में हुई। जनगणना अधिकारी जनसंख्या के विभिन्न पहलुओं जैसे आकार, घनत्व, लिंग अनुपात, साक्षरता, प्रवास, ग्रामीण-शहरी वितरण आदि की सूचना एकत्र करते हैं। जनगणना के आँकड़ों की व्याख्या और विश्लेषण भारत में कई आर्थिक और सामाजिक मुद्दों को समझने के लिए किया जाता है।
NSS की स्थापना भारत सरकार ने सामाजिक-आर्थिक मुद्दों पर देशव्यापी सर्वेक्षण करने के लिए की थी। NSS लगातार दौरों में निरंतर सर्वेक्षण करता है। NSS द्वारा एकत्रित आंकड़े रिपोर्टों और त्रैमासिक पत्रिका सर्वेक्षण के माध्यम से जारी किए जाते हैं। NSS साक्षरता, स्कूल नामांकन, शैक्षिक सेवाओं के उपयोग, रोजगार, बेरोजगारी, विनिर्माण और सेवा क्षेत्र के उद्यमों, रोगजनता, प्रसूति, बाल देखभाल, सार्वजनिक वितरण प्रणाली के उपयोग आदि के आवधिक अनुमान प्रदान करता है। NSS 60वें दौर का सर्वेक्षण (जनवरी-जून 2004) रोगजनता और स्वास्थ्य सेवा पर था। NSS 68वें दौर का सर्वेक्षण (2011-12) उपभोक्ता व्यय पर था। NSS विभिन्न वस्तुओं की औद्योगिक गतिविधियों और खुदरा कीमतों का विवरण भी एकत्र करता है। इनका उपयोग भारत सरकार योजना बनाने के उद्देश्य से करती है।
7. निष्कर्ष
आर्थिक तथ्य, जब संख्याओं के रूप में व्यक्त किए जाते हैं, तो उन्हें आंकड़े कहा जाता है। आंकड़े एकत्र करने का उद्देश्य किसी समस्या और उसके पीछे के कारणों को समझना, समझाना और विश्लेषण करना होता है। प्राथमिक आंकड़े किसी सर्वेक्षण करके प्राप्त किए जाते हैं। सर्वेक्षण में विभिन्न चरण होते हैं, जिनकी सावधानीपूर्वक योजना बनानी होती है। विभिन्न एजेंसियां हैं जो सांख्यिकीय आंकड़े एकत्र करती हैं, संसाधित करती हैं, सारणीबद्ध करती हैं और प्रकाशित करती हैं। इनका उपयोग द्वितीयक आंकड़ों के रूप में किया जाता है। हालांकि, आंकड़ों के स्रोत और आंकड़े एकत्र करने की विधि का चयन अध्ययन के उद्देश्य पर निर्भर करता है।
सारांश
- डेटा एक ऐसा उपकरण है जो किसी भी समस्या पर उचित निष्कर्ष तक पहुँचने में मदद करता है।
- प्राथमिक डेटा प्रथम-हस्त जानकारी पर आधारित होता है।
- सर्वेक्षण व्यक्तिगत साक्षात्कार, प्रश्नावली भेजने और टेलीफोन साक्षात्कार द्वारा किया जा सकता है।
- जनगणना जनसंख्या से संबंधित प्रत्येक व्यक्ति/इकाई को सम्मिलित करती है।
- नमूना जनसंख्या से चयनित एक छोटा समूह होता है जिससे संबंधित जानकारी प्राप्त की जाती है।
- यादृच्छिक प्रतिदर्शन में प्रत्येक व्यक्ति को सूचना देने के लिए चयनित होने का समान अवसर दिया जाता है।
- प्रतिदर्शन त्रुटि नमूना अनुमान के मान और संबंधित जनसंख्या प्राचल के मान के बीच अंतर के कारण होती है।
- गैर-प्रतिदर्शन त्रुटियाँ आँकड़ा अर्जन, अनुत्तरदायित्व या चयन में पूर्वाग्रह के कारण उत्पन्न हो सकती हैं।
- भारत की जनगणना और राष्ट्रीय नमूना सर्वेक्षण दो महत्वपूर्ण राष्ट्रीय स्तरीय एजेंसियाँ हैं जो कई महत्वपूर्ण आर्थिक और सामाजिक मुद्दों पर आँकड़े एकत्रित, संसाधित और सारणीबद्ध करती हैं।
अभ्यास
1. निम्नलिखित प्रश्नों के लिए कम-से-कम चार उपयुक्त बहुविकल्पीय विकल्प तैयार कीजिए:
(i) निम्नलिखित में से कौन-सी बात सबसे अधिक महत्वपूर्ण है जब आप नया पोशाक खरीदते हैं?
(ii) आप कितनी बार कंप्यूटर का उपयोग करते हैं?
(iii) आप नियमित रूप से कौन-से समाचार-पत्र पढ़ते हैं?
(iv) पेट्रोल की कीमत में वृद्धि उचित है।
(v) आपके परिवार की मासिक आय कितनी है?
2. पाँच द्वि-मार्गी प्रश्न (‘हाँ’ या ‘नहीं’) तैयार कीजिए।
3. निम्नलिखित कथन सत्य हैं या असत्य बताइए।
(i) आँकड़ों के कई स्रोत होते हैं।
(ii) जब जनसंख्या साक्षर हो और एक बड़े क्षेत्र में फैली हो, तो टेलीफोन सर्वेक्षण आंकड़े एकत्र करने की सबसे उपयुक्त विधि होती है।
(iii) जांचकर्ता द्वारा एकत्र किया गया आंकड़ा द्वितीयक आंकड़ा कहलाता है।
(iv) प्रतिदर्शों के यादृच्छिक चयन के अलावा चयन में एक निश्चित पूर्वाग्रह शामिल होता है।
(v) गैर-प्रतिदर्श त्रुटियों को बड़े प्रतिदर्श लेकर न्यूनतम किया जा सकता है।
4. आप निम्नलिखित प्रश्नों के बारे में क्या सोचते हैं? क्या आपको इन प्रश्नों में कोई समस्या दिखाई देती है? वर्णन कीजिए।
(i) आप निकटतम बाजार से कितनी दूर रहते हैं?
(ii) यदि प्लास्टिक थैले हमारे कूड़े-कचरे के केवल 5 प्रतिशत हैं, तो क्या उन्हें प्रतिबंधित किया जाना चाहिए?
(iii) क्या आप पेट्रोल की कीमत बढ़ने के विरुद्ध नहीं होंगे?
(iv) क्या आप रासायनिक उर्वरकों के उपयोग से सहमत हैं?
(v) क्या आप अपने खेतों में उर्वरकों का उपयोग करते हैं?
(vi) आपके खेत में प्रति हेक्टेयर उपज क्या है?
5. आप बच्चों के बीच वेजिटेबल आटा नूडल्स की लोकप्रियता पर शोध करना चाहते हैं। इस सूचना को एकत्र करने के लिए एक उपयुक्त प्रश्नावली तैयार कीजिए।
6. 200 खेतों वाले एक गाँव में फसल चक्र ज्ञात करने के लिए एक अध्ययन किया गया। सर्वेक्षण किए गए 50 खेतों में से $50 %$ ने केवल गेहूँ उगाया। जनसंख्या और प्रतिदर्श आकार क्या है?
7. प्रतिदर्श, जनसंख्या और चर के दो-दो उदाहरण दीजिए।
8. निम्नलिखित में से कौन-सी विधि बेहतर परिणाम देती है और क्यों?
(a) जनगणना
(b) प्रतिदर्श
9. निम्नलिखित में से कौन-सी त्रुटि अधिक गंभीर है और क्यों?
(a) प्रतिदर्श त्रुटि
(b) गैर-प्रतिदर्श त्रुटि
10. मान लीजिए आपकी कक्षा में 10 विद्यार्थी हैं। आप उनमें से तीन को चुनना चाहते हैं। कितने नमूने संभव हैं?
11. चर्चा कीजिए कि आप 10 में से 3 विद्यार्थियों को चुनने के लिए लॉटरी विधि का उपयोग कैसे करेंगे।
12. क्या लॉटरी विधि हमेशा आपको एक यादृच्छिक नमूना देती है? समझाइए।
13. यादृच्छिक संख्या सारणियों का उपयोग करके 10 में से 3 विद्यार्थियों के एक यादृच्छिक नमूने के चयन की प्रक्रिया समझाइए।
14. क्या नमूने सर्वेक्षणों की तुलना में बेहतर परिणाम देते हैं? अपने उत्तर के कारण दीजिए।