अध्याय 03 डेटा का संगठन

30 min read

1. परिचय पिछले अध्याय में आपने सीखा कि डेटा कैसे एकत्र किया जाता है। आपने यह भी जाना कि जनगणना और नमूने में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि...

1. परिचय

पिछले अध्याय में आपने सीखा कि डेटा कैसे एकत्र किया जाता है। आपने यह भी जाना कि जनगणना और नमूने में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्र किया गया डेटा कैसे वर्गीकृत किया जाएगा। कच्चे डेटा को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना है ताकि उन्हें आगे की सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।

क्या आपने कभी अपने स्थानीय कबाड़ वाले या कबाड़ीवाले को देखा है जिसे आप पुराने अखबार, टूटे-फूटे घरेलू सामान, खाली कांच की बोतलें, प्लास्टिक आदि बेचते हैं? वह ये चीजें आपसे खरीदता है और उन्हें उन लोगों को बेचता है जो इन्हें रीसायकल करते हैं। लेकिन उसकी दुकान में इतना सारा कबाड़ होने पर, यदि वह उन्हें ठीक से व्यवस्थित न करे तो उसके लिए अपना व्यापार चलाना बहुत मुश्किल हो जाएगा। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ों को उपयुक्त रूप से समूहों या “वर्गों” में बांटता है। वह पुराने अखबारों को एक साथ रखता है और उन्हें रस्सी से बांधता है। फिर सभी खाली कांच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाता है और उन्हें “लोहा”, “तांबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बांटता है। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों में — “अखबार”, “प्लास्टिक”, “कांच”, “धातु” आदि — बांटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो उसे कोई विशेष वस्तु खोजना आसान हो जाता है जो कोई खरीदार मांग सकता है।

इसी प्रकार जब आप अपनी स्कूल की किताबों को किसी निश्चित क्रम में व्यवस्थित करते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं, जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। तो, जब आपको इतिहास की कोई विशेष किताब चाहिए होती है, तो आपको बस “इतिहास” समूह में उस किताब की खोज करनी होती है। अन्यथा, आपको अपनी पूरी संग्रह में से उस विशेष किताब को खोजना पड़ता।

जबकि वस्तुओं या चीजों का वर्गीकरण हमारा बहुमूल्य समय और श्रम बचाता है, यह मनमाने ढंग से नहीं किया जाता है। कबडीवाला अपने कबाड़ को पुन: प्रयुक्त वस्तुओं के बाजारों के अनुसार समूहित करता है। उदाहरण के लिए, “काँच” समूह के अंतर्गत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखेगा। इसी प्रकार जब आप अपनी इतिहास की किताबों को “इतिहास” समूह के अंतर्गत वर्गीकृत करते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूहन का संपूर्ण उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीजों को समूहों या वर्गों में व्यवस्थित करना है।

गतिविधि

  • अपने स्थानीय डाक-घर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।

2. कच्चा आँकड़ा

कबड़ीवाले के कबाड़े की तरह, अवर्गीकृत डेटा या कच्चे डेटा अत्यधिक अव्यवस्थित होते हैं। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे कोई अर्थपूर्ण निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि ये सांख्यिकीय विधियों पर आसानी से काम नहीं करते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा का उचित संगठन और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला कदम उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए आप विद्यार्थियों की गणित में प्रदर्शन जानना चाहते हैं और आपने अपने विद्यालय के 100 विद्यार्थियों के गणित में प्राप्तांक एकत्र किए हैं। यदि आप उन्हें सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस प्रकार दिखाई देंगे जैसे सारणी 3.1।

सारणी 3.1 एक परीक्षा में 100 विद्यार्थियों द्वारा गणित में प्राप्त किए गए अंक

474510605156661004940
60595655624859555141
42696466505957656250
64303775175620145590
62515514253490495654
70474982408260856566
49446469704812285565
4940254171800561422
66534670436159123035
45445776823932149025

या आप अपने पड़ोस के 50 घरों के मासिक खाद्य व्यय का आंकड़ा यह जानने के लिए एकत्र कर सकते थे कि उनका औसत खाद्य व्यय कितना है। उस स्थिति में एकत्र किया गया आंकड़ा, यदि आप उसे सारणी के रूप में प्रस्तुत करते, तो वह सारणी 3.2 जैसा दिखता। सारणी 3.1 और 3.2 दोनों ही कच्चे या अवर्गीकृत आंकड़े हैं। दोनों सारणियों में आप देखते हैं कि संख्याएँ किसी क्रम में व्यवस्थित नहीं हैं। अब यदि आपसे सारणी 3.1 से गणित में सर्वाधिक अंक पूछे जाएँ तो आपको पहले 100 विद्यार्थियों के अंकों को या तो आरोही या अवरोही क्रम में व्यवस्थित करना होगा। यह एक थकाऊ कार्य है। यह और भी थकाऊ हो जाता है, यदि 100 के स्थान पर आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, सारणी 3.2 में आप देखेंगे कि आपके लिए 50 घरों का औसत मासिक व्यय ज्ञात करना कठिन है। और यह कठिनाई कई गुना बढ़ जाएगी यदि संख्या बड़ी हो—मान लीजिए, 5,000 घर। हमारे कबाड़ीवाले की तरह, जिसे अपना कबाड़ बड़ा और बेतरतीब हो जाने पर कोई विशेष वस्तु ढूँढ़ने में संकट होता है, आपको भी कच्चे और बड़े आंकड़ों से कोई सूचना निकालने में ऐसी ही स्थिति का सामना करना पड़ेगा। एक शब्द में, इसलिए, बड़े अवर्गीकृत आंकड़ों से सूचना निकालना एक थकाऊ कार्य है।

सारणी 3.2 50 घरों का खाद्य पर मासिक घरेलू व्यय (रुपयों में)

19041559347317352760
20411612175318554439
50901085182323461523
12111360111021521183
12181315110526282712
42481812126411831171
10071180195311372048
20251583132426213676
13971832196221772575
12931365114632221396

कच्चे आंकड़ों का सारांश बनाया जाता है और उन्हें वर्गीकरण द्वारा समझने योग्य बनाया जाता है। जब समान लक्षणों वाले तथ्यों को एक ही वर्ग में रखा जाता है, तो इससे उन्हें आसानी से खोजा जा सकता है, तुलना की जा सकती है और बिना किसी कठिनाई के निष्कर्ष निकाले जा सकते हैं। आपने अध्याय 2 में पढ़ा है कि भारत सरकार दस वर्षों में एक बार जनगणना करती है। जनगणना 2001 में लगभग 20 करोड़ व्यक्तियों से संपर्क किया गया था। जनगणना के कच्चे आंकड़े इतने विशाल और टुकड़ों में बंटे हुए हैं कि उनसे कोई सार्थक निष्कर्ष निकालना लगभग असंभव-सा प्रतीत होता है। लेकिन जब उन्हीं आंकड़ों को लिंग, शिक्षा, वैवाहिक स्थिति, व्यवसाय आदि के अनुसार वर्गीकृत किया जाता है, तब भारत की जनसंख्या की संरचना और प्रकृति को आसानी से समझा जा सकता है।

कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। सारणियाँ 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों को दर्शाते हैं। उदाहरण के लिए सारणी 3.1 देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक दिए गए हैं। हम इन अंकों का अर्थ कैसे निकाल सकते हैं? इन अंकों को देखते हुए गणित की शिक्षिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण हुए हैं? हम आंकड़ों को कैसे वर्गीकृत करते हैं यह इस उद्देश्य पर निर्भर करता है जो हमारे मन में है। इस स्थिति में शिक्षिका यह गहराई से समझना चाहती है कि इन विद्यार्थियों ने कैसा प्रदर्शन किया है। वह संभवतः बारंबारता बंटन बनाना चुनेगी। इसकी चर्चा अगले खंड में की गई है।

गतिविधि

  • एक वर्ष के लिए अपने परिवार के कुल साप्ताहिक व्यय का आंकड़ा एकत्र कीजिए और उसे एक सारणी में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक रूप से व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।

3. आंकड़ों का वर्गीकरण

वर्गीकरण के समूह या वर्ग विभिन्न तरीकों से बनाए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णानुक्रम में भी वर्गीकृत कर सकते हैं। या फिर आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते हैं। आप उन्हें जिस तरह वर्गीकृत करना चाहेंगे वह आपकी आवश्यकता पर निर्भर करेगा।

इसी प्रकार, कच्चे आंकड़ों को विभिन्न तरीकों से उद्देश्य के अनुसार वर्गीकृत किया जाता है। इन्हें समय के अनुसार भी समूहित किया जा सकता है। ऐसी वर्गीकरण को कालानुक्रमिक वर्गीकरण कहा जाता है। इस प्रकार की वर्गीकरण में, आंकड़ों को वर्ष, तिमाही, महीने, सप्ताह आदि के संदर्भ में या तो आरोही या अवरोही क्रम में वर्गीकृत किया जाता है। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के संदर्भ में वर्गीकृत करता है। चर ‘जनसंख्या’ एक समय श्रृंखला है क्योंकि यह विभिन्न वर्षों के लिए मूल्यों की एक श्रृंखला को दर्शाता है।

उदाहरण 1

भारत की जनसंख्या (करोड़ों में)

वर्षजनसंख्या (करोड़ों में)
195135.7
196143.8
197154.6
198168.4
199181.8
2001102.7
2011121.0

स्थानिक वर्गीकरण में, आंकड़ों को देश, राज्य, शहर, जिला आदि जैसी भौगोलिक स्थितियों के संदर्भ में वर्गीकृत किया जाता है।

उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार को दर्शाता है।

उदाहरण 2

विभिन्न देशों में गेहूं की पैदावार (2013)

देशगेहूं की पैदावार (किग्रा/हेक्टेयर)
कनाडा3594
चीन5055
फ्रांस7254
जर्मनी7998
भारत3154
पाकिस्तान2787

स्रोत: इंडियन एग्रीकल्चरल स्टैटिस्टिक्स एट अ ग्लांस, 2015

गतिविधियाँ

  • उदाहरण 1 में वे वर्ष ज्ञात कीजिए जिनमें भारत की जनसंख्या न्यूनतम और अधिकतम थी,
  • उदाहरण 2 में वह देश ज्ञात कीजिए जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। वह प्रतिशत के रूप में कितनी होगी?
  • उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित कीजिए। पैदावार के अवरोही क्रम के लिए भी वही अभ्यास कीजिए।

कभी-कभी आप ऐसे लक्षणों से टकराते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसे लक्षणों को गुण या विशेषताएँ कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन विशेषताओं को किसी गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। विशेषताओं पर आधारित ऐसे आँकड़ों के वर्गीकरण को गुणात्मक वर्गीकरण कहा जाता है। निम्नलिखित उदाहरण में हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो विशेषताओं को वैवाहिक स्थिति के आधार पर और भी वर्गीकृत किया जा सकता है जैसा नीचे दिया गया है:

उदाहरण 3

प्रथम चरण का वर्गीकरण किसी गुण की उपस्थिति और अनुपस्थिति पर आधारित होता है, अर्थात् पुरुष या पुरुष नहीं (महिला)। द्वितीय चरण में, प्रत्येक वर्ग - पुरुष और महिला - को एक अन्य गुण की उपस्थिति या अनुपस्थिति के आधार पर और उपविभाजित किया जाता है, अर्थात् विवाहित या अविवाहित। लक्षण, जैसे ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि, प्रकृति में मात्रात्मक होते हैं। जब ऐसे लक्षणों के संग्रहित आँकड़ों को वर्गों में समूहबद्ध किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।

गतिविधि

  • आसपास की वस्तुओं को जीवित या अजीवित के रूप में समूहबद्ध किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित में अंकों का बारंबारता बंटन

अंकबारंबारता
0-101
10-208
20-306
30-407
40-5021
50-6023
60-7019
70-806
80-905
90-1004
कुल100

उदाहरण 4 में तालिका 3.1 में दिए गए 100 छात्रों के गणित के अंकों का मात्रात्मक वर्गीकरण दिखाया गया है।

गतिविधि

  • उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।
  • उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सांद्रता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सांद्रता है?

4. चर: सतत और विच्छिन्न

एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि यह कैसे बदलता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:

(i) सतत और

(ii) विच्छिन्न।

एक सतत चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4, \ldots)$, भिन्नात्मक मान $(1 / 2,2 / 3,3 / 4, \ldots)$, और ऐसे मान जो ठीक-ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ ) ले सकता है। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे-जैसे वह बढ़ता है मान लीजिए $90 \mathrm{~cm}$ से $150 \mathrm{~cm}$ तक, इस बीच के सभी मान लेगी। यह पूर्ण संख्याओं जैसे $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$ के रूप में मान ले सकती है। यह भिन्नात्मक मान भी ले सकती है जैसे 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान प्रदर्शित करने में सक्षम है और इसके मानों को अनंत विभाजनों में भी तोड़ा जा सकता है। सतत चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।

एक सतत चर के विपरीत, एक विच्छिन्न चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” द्वारा बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन उनके बीच कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, एक चर जैसे “कक्षा में छात्रों की संख्या”, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के रूप में मान ग्रहण करेगा। यह कोई भिन्नात्मक मान जैसे 0.5 नहीं ले सकता क्योंकि “आधा छात्र” असंगत है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 या 26 हो सकता था। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, उनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विच्छिन्न चर कोई भिन्नात्मक मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ जैसे मान लेता है। क्या यह एक विच्छिन्न चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्नात्मक मान लेता है, यह दो आसन्न भिन्नात्मक मानों के बीच कोई मान नहीं ले सकता। यह $1 /$ 8 से $1 / 16$ और $1 / 16$ से $1 / 32$ पर बदलता या “छलांग” लगाता है। लेकिन यह $1 / 8$ और $1 / 16$ या $1 / 16$ और $1 / 32$ के बीच कोई मान नहीं ले सकता।

गतिविधि

  • निम्नलिखित चरों को सतत और विच्छिन्न के रूप में भेद कीजिए: क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

उदाहरण 4 दिखाता है कि 100 विद्यार्थियों के अंकों को वर्गों में कैसे समूहबद्ध किया गया है। आप सोच रहे होंगे कि हमने तालिका 3.1 के कच्चे आँकड़ों से यह कैसे प्राप्त किया। लेकिन इस प्रश्न पर जाने से पहले, आपको यह जानना होगा कि बारंबारता बंटन (frequency distribution) क्या होता है।

5. बारंबारता बंटन क्या है?

बारंबारता बंटन किसी मात्रात्मक चर के कच्चे आँकड़ों को वर्गीकृत करने का एक व्यापक तरीका है। यह दिखाता है कि चर के भिन्न-भिन्न मान (यहाँ, किसी विद्यार्थी द्वारा गणित में प्राप्त अंक) भिन्न-भिन्न वर्गों में किस प्रकार बँटे हैं और उनसे संबद्ध वर्ग बारंबारताएँ (class frequencies) क्या हैं। इस स्थिति में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20, \ldots$, 90-100। वर्ग बारंबारता (Class Frequency) शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में तालिका 3.1 के कच्चे आँकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग 30-40 की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि 40- जो कच्चे आँकड़ों में दो बार आ रहा है- वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल किया जाता तो वर्ग 30-40 की बारंबारता 7 के स्थान पर 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप धैर्यपूर्वक इस अध्याय को ध्यान से पढ़ें। इसलिए आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।

प्रत्येक वर्ग आवृत्ति बंटन सारणी में वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ किसी वर्ग के दो छोर होते हैं। सबसे छोटा मान निम्न वर्ग सीमा कहलाता है और सबसे बड़ा मान उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और उच्च वर्ग सीमा 70 है। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए वर्ग अंतराल 10 है (उच्च वर्ग सीमा घटा निम्न वर्ग सीमा)।

वर्ग मध्य-बिंदु या वर्ग चिह्न किसी वर्ग का मध्य मान होता है। यह वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के बीच आधे रास्ते पर स्थित होता है और निम्न प्रकार से ज्ञात किया जा सकता है:

वर्ग मध्य-बिंदु या वर्ग चिह्न

$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$

प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान उस वर्ग को प्रस्तुत करने के लिए प्रयोग किया जाता है। एक बार कच्चे आँकड़ों को वर्गों में समूहबद्ध करने के बाद, व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयोग नहीं किए जाते। इसके बजाय वर्ग चिह्न का उपयोग किया जाता है।

TABLE 3.3 The Lower Class Limits, the Upper Class Limits and the Class Mark

वर्गआवृत्तिनिम्न वर्ग सीमाउच्च वर्ग सीमावर्ग चिह्न
0-1010105
10-208102015
20-306203025
30-407304035
40-5021405045
50-6023506055
60-7019607065
70-806708075
80-905809085
90-10049010095

आवृत्ति वक्र एक आवृत्ति बंटन का आलेखीय प्रतिनिधित्व है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$ अक्ष पर लेखांकित करते हैं।

चित्र 3.1: आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।

आवृत्ति बंटन कैसे तैयार करें

आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों का समाधान करना आवश्यक होता है:

  1. क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
  2. हमें कितने वर्ग होने चाहिए?
  3. प्रत्येक वर्ग का आकार क्या होना चाहिए?
  4. वर्ग सीमाएँ कैसे निर्धारित करें?
  5. प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

ऐसी दो परिस्थितियाँ होती हैं जिनमें असमान आकार के अंतरालों का उपयोग किया जाता है। पहली, जब हमारे पास आय और अन्य इसी तरह के चर पर आँकड़े हों जहाँ परास बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर कई सौ करोड़ रुपये तक हो सकती है। ऐसी स्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों, तो बहुत सारे वर्ग बन जाएँगे। (ii) यदि वर्ग अंतराल बड़े हों, तो हम बहुत कम या बहुत अधिक स्तर की आय की सूचना को दबा देंगे।

दूसरी, यदि बहुत सारे मान परास के एक छोटे से भाग में केंद्रित हों, तो समान वर्ग अंतराल कई मानों की सूचना की कमी का कारण बनेंगे।

अन्य सभी मामलों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का उपयोग किया जाता है।

हमारे पास कितने वर्ग होने चाहिए?

वर्गों की संख्या आमतौर पर छह से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का उपयोग कर रहे हों, तो वर्गों की संख्या परास (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से विभाजित करके निकाली जा सकती है।

गतिविधियाँ

निम्नलिखित की परास ज्ञात कीजिए:

  • उदाहरण 1 में भारत की जनसंख्या,
  • उदाहरण 2 में गेहूँ की पैदावार।

प्रत्येक वर्ग का आकार कितना होना चाहिए?

इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई होने पर, एक बार जब हम वर्ग अंतराल तय कर लेते हैं, तो हम वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक को तय किए बिना दूसरे को तय नहीं कर सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया है, इसलिए वर्ग अंतराल स्वचालित रूप से 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालांकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई के होते।

हम वर्ग सीमाएँ कैसे निर्धारित करें?

वर्ग सीमाएँ निश्चित और स्पष्ट रूप से बताई जानी चाहिए। आमतौर पर, खुली सीमाओं वाले वर्ग जैसे “70 और अधिक” या “10 से कम” वांछनीय नहीं होते हैं।

निचली और ऊपरी वर्ग सीमाओं को इस प्रकार निर्धारित किया जाना चाहिए कि प्रत्येक वर्ग की आवृत्तियाँ वर्ग अंतराल के मध्य में केंद्रित होने की प्रवृत्ति रखें।

वर्ग अंतराल दो प्रकार के होते हैं:

(i) समावेशी वर्ग अंतराल: इस स्थिति में, किसी वर्ग की निचली और ऊपरी सीमा के बराबर मान उसी वर्ग की आवृत्ति में शामिल किए जाते हैं।

(ii) अपवर्जी वर्ग अंतराल: इस स्थिति में, कोई वस्तु जो निचली या ऊपरी वर्ग सीमा के बराबर हो, उस वर्ग की आवृत्ति से बाहर रखी जाती है।

विच्छिन्न चरों के मामले में, अपवर्जी और समावेशी दोनों प्रकार के वर्ग अंतराल प्रयुक्त किए जा सकते हैं।

निरंतर चरों के मामले में समावेशी वर्ग अंतराल बहुत बार प्रयोग किए जाते हैं।

उदाहरण

मान लीजिए हमारे पास एक परीक्षा में छात्रों द्वारा प्राप्त किए गए अंकों का आंकड़ा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए छात्रों द्वारा प्राप्त किए गए अंक 0 से 100 तक भिन्न-भिन्न हैं।

यह विच्छिन्न चर का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस मामले में, यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं तो वर्ग अंतराल निम्नलिखित में से किसी भी रूप में हो सकते हैं:

समावेशी रूप के वर्ग अंतराल:

$0-10$

$11-20$

$21-30$

$-$

$-$

$91-100$

अपवर्जी रूप के वर्ग अंतराल: $0-10$

$10-20$

$20-30$

$-$

$-$

$90-100$

अपवर्जी वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें कोई मान वर्ग सीमा के बराबर मिलता है तो उसे क्या करना है। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को वर्ग अंतरालों “0 से 10” और “20 से 30” में रखा जाए। इसे निचली सीमा अपवर्जित कहा जा सकता है।

अथवा हम 10, 30 आदि जैसे मानों को वर्ग अंतरालों “10 से 20” और “30 से 40” में रख सकते हैं। इसे ऊपरी सीमा अपवर्जित कहा जा सकता है।

निरंतर चर का उदाहरण

मान लीजिए हमारे पास किसी चर जैसे ऊंचाई (सेंटीमीटर) या वजन (किलोग्राम) पर आंकड़े हैं। यह आंकड़ा निरंतर प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित प्रकार से परिभाषित किए जा सकते हैं:

$30 \mathrm{Kg}-39.999 \ldots \mathrm{Kg}$

$40 \mathrm{Kg}-49.999 \ldots \mathrm{Kg}$

$50 \mathrm{Kg}-59.999 \ldots \mathrm{Kg}$ आदि।

इन वर्ग अंतरालों को निम्नलिढि प्रकार से समझा जाता है:

$30 \mathrm{Kg}$ और इससे ऊपर तथा $40 \mathrm{Kg}$ से कम

$40 \mathrm{Kg}$ और इससे ऊपर तथा $50 \mathrm{Kg}$ से कम

$50 \mathrm{Kg}$ और इससे ऊपर तथा $60 \mathrm{Kg}$ से कम, आदि।

TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय की बारंबारता बंटन

आय $(रु)$कर्मचारियों की संख्या
800-89950
900-999100
1000-1099200
1100-1199150
1200-129940
1300-139910
कुल550

वर्ग अंतराल में समायोजन

Table 3.4 में समावेशी विधि के सावधानीपूर्वक निरीक्षण से यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, फिर भी जब वर्ग बनाए जाते हैं तो ऐसी निरंतरता बनाए नहीं रखी जाती। हमें एक वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांततता दिखाई देती है। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा: 899 और दूसरे वर्ग की निचली सीमा: 900 के बीच हमें 1 का “अंतराल” मिलता है। तब हम वर्गीकरण के समय चर की निरंतरता कैसे सुनिश्चित करते हैं? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिढि प्रकार से किया जाता है:

  1. दूसरी वर्ग की निचली सीमा और पहली वर्ग की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, सारणी 3.4 में दूसरी वर्ग की निचली सीमा 900 है और पहली वर्ग की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899=1)$

  2. (1) में प्राप्त अंतर को दो से विभाजित करें अर्थात् $(1 / 2=0.5)$

  3. सभी वर्गों की निचली सीमाओं से (2) में प्राप्त मान घटाएँ (निचली वर्ग सीमा - 0.5)

  4. सभी वर्गों की ऊपरी सीमाओं में (2) में प्राप्त मान जोड़ें (ऊपरी वर्ग सीमा +0.5)$)$।

आवृत्ति बंटन में आंकड़ों की सततता को पुनः स्थापित करने वाले समायोजन के बाद, सारणी 3.4 को सारणी 3.5 में संशोधित किया गया है

वर्ग सीमाओं में समायोजन के बाद, समता (1) जो वर्ग-चिह्न के मान को निर्धारित करती है, निम्नलिखित के रूप में संशोधित की जाएगी:

समायोजित वर्ग चिह्न = (समायोजित ऊपरी वर्ग सीमा + समायोजित निचली वर्ग सीमा)/2.

सारणी 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय (रु)कर्मचारियों की संख्या
799.5-899.550
899.5-999.5100
999.5-1099.5200
1099.5-1199.5150
1199.5-1299.540
1299.5-1399.510
योग550

हमें प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करनी चाहिए?

सरल शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है वह प्रेक्षण कच्चे आंकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक-एक बार आते हैं; 49 पाँच बार आता है आदि। इस प्रकार 40 की बारंबारता 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है आदि। परंतु जब आंकड़ों को वर्गों में समूहबद्ध किया जाता है जैसे उदाहरण 3 में, वर्ग बारंबारता का तात्पर्य किसी विशेष वर्ग में आने वाले मानों की संख्या से है। वर्ग बारंबारता की गिनती संबंधित वर्ग के सामने टैली चिह्न लगाकर की जाती है।

टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना

प्रत्येक विद्यार्थी के लिए जिसके अंक उस वर्ग में आते हैं, संबंधित वर्ग के सामने एक टैली (/) लगाया जाता है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, हम वर्ग $50-60$ के सामने एक टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग 70-80 के सामने टैली लगाया जाता है। यदि किसी को 40 अंक मिले हैं, तो वर्ग 40-50 के सामने टैली लगाया जाता है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली चिह्नन दिखाती है।

तालिका 3.6 गणित में 100 विद्यार्थियों के अंकों की टैली चिह्नन

गिनती को आसान बनाने के लिए चार लकीरों को //// इस प्रकार लगाया जाता है और पाँचवीं लकीर को उन पर इस तरह से डाला जाता है: IN। इसके बाद लकीरों को पाँच-पाँच के समूह में गिना जाता है। इसलिए यदि किसी वर्ग में 16 लकीरें हैं, तो सुविधा के लिए हम उन्हें इस प्रकार लगाते हैं: $M N / T N$ IN/ /। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने बनी लकीरों की संख्या के बराबर होती है।

सूचना की हानि

आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक अंतर्निहित कमी होती है। यद्यपि यह कच्चे आंकड़ों को संक्षिप्त और समझने योग्य बनाता है, पर इसमें वे विवरण नहीं दिखते जो कच्चे आंकड़ों में मिलते हैं। कच्चे आंकड़ों को वर्गीकृत करने में सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़े के रूप में संक्षेपित करने से बहुत कुछ प्राप्त होता है। एक बार जब आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो कोई भी व्यक्तिगत प्रेक्षण आगे की सांख्यिकीय गणनाओं में कोई महत्व नहीं रखता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहबद्ध किया जाता है, तो बाद वाला केवल उस वर्ग में रिकॉर्डों की संख्या देता है (अर्थात् बारंबारता $=6$) पर उनके वास्तविक मान नहीं देता। इस वर्ग के सभी मानों को वर्ग अंतराल या वर्ग चिह्न के मध्य मान के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय गणनाएं केवल वर्ग चिह्न के मानों पर आधारित होती हैं न कि उस वर्ग में प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सच है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। तथापि, कच्चे आंकड़ों को अधिक समझदारी से प्रस्तुत करने की क्षमता इस कमी से कहीं अधिक लाभ देती है।

असमान वर्गों के साथ बारंबारता बंटन

अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि वे कच्चे आंकड़ों से कैसे बनाए जाते हैं। लेकिन कुछ मामलों में असमान वर्ग अंतरालों की बारंबारता बंटन अधिक उपयुक्त होती है। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 के रूप में देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संबंधित बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 छात्रों में से 63 $(21+23+19)$ छात्र इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 की मध्य सीमा में हैं। शेष 37 प्रतिशत आंकड़े वर्गों $0-10,10-20,20-30,30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। लेकिन यदि वर्ग इस प्रकार बनाए जाएं कि वर्ग चिह्न, जहाँ तक संभव हो, एक ऐसे मान से मेल खाएं जिसके आसपास वर्ग में प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त होता है।

तालिका 3.7 असमान वर्गों की बारंबारता बंटन

वर्गप्रेक्षणआवृत्तिवर्ग चिह्न
0-10015
10-2010,14,17,12,14,12,14,14815
20-3025,25,20,22,25,28625
30-4030,37,34,39,32,30,35735
40-4542,44,40,44,41,40,43,40,41942.5
45-5047,49,49,45,45,47,49,46,48,48,49,491247.5
50-5551,53,51,50,51,50,54752.5
55-6059,56,55,57,55,56,59,56,59,57,59,55,56,55,56,551657.5
60-6560,64,62,64,64,60,62,61,60,621062.5
65-7066,69,66,69,66,65,65,66,65967.5
70-8070,75,70,76,70,71675
80-9082,82,82,80,85585
90-10090,100,90,90495
योग100

तालिका 3.7 तालिका 3.6 की उसी बारंबारता बंटन को असमान वर्गों के संदर्भ में दिखाती है।
वर्ग 40-50, 50-60 और 60-70 में से प्रत्येक को दो-दो वर्गों में बाँटा गया है—वर्ग 40-50 को $40-45$ और 45-50 में विभाजित किया गया है।
वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है।
और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है।
नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 की वर्ग अंतराल 5 है।
अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपना पुराना 10 का वर्ग अंतराल बनाए रखते हैं।
इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है।
इन्हें तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से तुलना कीजिए।
ध्यान दीजिए कि इन वर्गों में प्रेक्षण अपने पुराने वर्ग चिह्न मानों की तुलना में नए वर्ग चिह्न मानों से अधिक विचलित होते हैं।
इस प्रकार नए वर्ग चिह्न मान इन वर्गों में आँकड़ों के लिए पुराने मानों की तुलना में अधिक प्रतिनिधिक हैं।

आकृति 3.2 तालिका 3.7 के बंटन की बारंबारता वक्र दिखाती है।

आकृति 3.2: बारंबारता वक्र

तालिका के वर्ग चिह्नों को X-अक्ष पर और बारंबारताओं को Y-अक्ष पर आलेखित किया गया है।

गतिविधि

  • यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या देखते हैं?
    क्या आप दोनों के बीच कोई अंतर पाते हैं?
    क्या आप उस अंतर की व्याख्या कर सकते हैं?

बारंबारता सरणी

अब तक हमने 100 विद्यार्थियों की गणित में प्रतिशत अंकों के उदाहरण का उपयोग करके एक सतत चर के लिए आँकड़ों के वर्गीकरण पर चर्चा की है। एक विच्छिन्न चर के लिए, उसके आँकड़ों का वर्गीकरण बारंबारता सरणी (Frequency Array) कहलाता है। चूँकि एक विच्छिन्न चर मान लेता है और दो पूर्णांक मानों के बीच कोई मध्यवर्ती भिन्न मान नहीं लेता, इसलिए प्रत्येक पूर्णांक मान के अनुरूप बारंबारताएँ होती हैं।

तालिका 3.8 में दिया गया उदाहरण एक बारंबारता सरणी को दर्शाता है।

तालिका 3.8 परिवारों के आकार की बारंबारता सरणी

परिवार का आकारपरिवारों की संख्या
15
215
325
435
510
65
73
82
योग100

चर “परिवार का आकार” एक विच्छिन्न चर है जो केवल पूर्णांक मान लेता है जैसा कि तालिका में दिखाया गया है।

6. द्विचर बारंबारता बंटन

बहुत बार जब हम किसी जनसंख्या से एक नमूना लेते हैं, तो हम नमूने के प्रत्येक तत्व से एक से अधिक प्रकार की सूचनाएँ एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का नमूना लिया है। मान लीजिए हमने प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र की है। इस स्थिति में, हमारे पास द्विचर नमूना आँकड़े हैं। ऐसे द्विचर आँकड़ों को एक द्विचर बारंबारता बंटन का उपयोग करके संक्षेप में प्रस्तुत किया जा सकता है।

द्विचर बारंबारता बंटन को दो चरों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।

तालिका 3.9 20 कंपनियों की दो चरों—बिक्री और विज्ञापन व्यय (रु. लाख में)—की आवृत्ति बंटन दिखाती है। बिक्री के मान विभिन्न स्तंभों में वर्गीकृत हैं और विज्ञापन व्यय के मान विभिन्न पंक्तियों में। प्रत्येक कोष्ठक संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाता है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन के उपयोग को अध्याय 8—सहसंबंध—में लिया जाएगा।

7. निष्कर्ष

प्राथमिक और द्वितीय स्रोतों से एकत्रित आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े एकत्र हो जाने पर, अगला कदम उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से समग्र रूप से कैसे वर्गीकृत किया जा सकता है। एक बार वर्गीकरण की तकनीकें जान लेने पर, आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना सरल हो जाएगा।

तालिका 3.9 20 फर्मों की बिक्री (लाख रु. में) और विज्ञापन व्यय (हजार रु. में) का द्विचर आवृत्ति बंटन

115–125125–135135–145145–155155–165165–175कुल
62-64213
64-66134
66-6811215
68-70224
70-7211114
कुल45631120

सारांश

  • वर्गीकरण कच्चे डेटा में व्यवस्था लाता है।
  • एक बारंबारता बंटन दिखाता है कि किसी चर के विभिन्न मान विभिन्न वर्गों में कैसे बंटे हैं, साथ ही उनके संगत वर्ग बारंबारताएँ।
  • विशिष्ट विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।
  • समावेशी विधि में ऊपरी और निचली दोनों वर्ग सीमाएँ शामिल की जाती हैं।
  • एक बारंबारता बंटन में, आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों के बजाय।
  • वर्गों को इस प्रकार बनाया जाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न उस मान के यथासंभव निकट आए, जिसके चारों ओर एक वर्ग में प्रेक्षण एकत्रित होते हैं।

अभ्यास

1. निम्नलिखित में से कौन-सा विकल्प सही है?

(i) वर्ग मध्य-बिंदु बराबर होता है:

(a) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के औसत के।

(b) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के गुणनफल के।

(c) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के अनुपात के।

(d) उपर्युक्त में से कोई नहीं।

(ii) दो चरों का बारंबारता बंटन कहलाता है

(a) एकचर बंटन

(b) द्विचर बंटन

(c) बहुचर बंटन

(d) उपर्युक्त में से कोई नहीं

(iii) वर्गीकृत आंकड़ों में सांख्यिकीय गणनाएँ आधारित होती हैं

(a) प्रेक्षणों के वास्तविक मानों पर

(b) उच्च वर्ग सीमाओं पर

(c) निम्न वर्ग सीमाओं पर

(d) वर्ग मध्य-बिंदुओं पर

(iv) परास है

(a) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर

(b) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर

(c) सबसे बड़े और सबसे छोटे प्रेक्षणों का औसत

(d) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात

2. क्या वस्तुओं को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के एक उदाहरण के साथ समझाइए।

3. चर क्या है? एक विवृत और एक संतत चर में अंतर कीजिए।

4. आंकड़ों के वर्गीकरण में प्रयुक्त ‘अपवर्जी’ और ‘समावेशी’ विधियों की व्याख्या कीजिए।

5. सारणी 3.2 में दिए गए उन आंकड़ों का प्रयोग कीजिए जो 50 परिवारों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित हैं और

(i) भोजन पर मासिक घरेलू व्यय की परास प्राप्त कीजिए।

(ii) परास को उपयुक्त संख्या में वर्ग अंतरालों में विभाजित कीजिए और व्यय की बारंबारता बंटन प्राप्त कीजिए।

(iii) उन परिवारों की संख्या ज्ञात कीजिए जिनका मासिक भोजन व्यय

(a) रु 2000 से कम है

(b) रु 3000 से अधिक है

(c) रु 1500 और रु 2500 के बीच है

6. एक शहर में 45 परिवारों का सर्वेक्षण उनके द्वारा प्रयुक्त सेल फोनों की संख्या के लिए किया गया। उनके उत्तरों के आधार पर एक बारंबारता सरणी तैयार कीजिए जैसा नीचे दर्ज है।

132222121223333
332322616215153
242742434203143

7. वर्गीकृत आंकड़ों में ‘सूचना की हानि’ क्या होती है?

8. क्या आप सहमत हैं कि वर्गीकृत आंकड़े कच्चे आंकड़ों से बेहतर होते हैं? क्यों?

9. एकचर और द्विचर बारंबारता बंटन के बीच अंतर स्पष्ट कीजिए।

10. निम्नलिखित आंकड़ों से 7 की वर्ग अंतराल लेते हुए समावेशी विधि द्वारा एक बारंबारता बंटन तैयार कीजिए।

281715222921232718127294
1831052016128433272115
33627189246323129181413
151197153732282624201925
192069

11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से देखें और प्रत्येक शब्द में अक्षरों की संख्या को नोट करें। अक्षरों की संख्या को चर मानते हुए इस आंकड़े के लिए एक बारंबारता सरणी तैयार कीजिए।

सुझाया गया गतिविधि

  • अपनी पुरानी अंकतालिकाओं से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित विषय में प्राप्त अंक खोजें। उन्हें वर्षवार व्यवस्थित करें। जाँच करें कि आपने जो अंक प्राप्त किए हैं, वह एक चर है या नहीं। यह भी देखें कि क्या वर्षों के दौरान आपने गणित में सुधार किया है।