अध्याय 04 आंकड़ों की प्रस्तुति

25 min read

1. परिचय आपने पिछले अध्यायों में सीखा है कि आँकड़े कैसे एकत्रित और संगठित किए जाते हैं। चूँकि आँकड़े प्रायः बड़ी मात्रा में होते हैं, उन्हें संक्षिप्त और...

1. परिचय

आपने पिछले अध्यायों में सीखा है कि आँकड़े कैसे एकत्रित और संगठित किए जाते हैं। चूँकि आँकड़े प्रायः बड़ी मात्रा में होते हैं, उन्हें संक्षिप्त और प्रस्तुत करने योग्य रूप में रखना आवश्यक होता है। यह अध्याय आँकड़ों की सटीक प्रस्तुति से संबंधित है ताकि एकत्रित विशाल आँकड़ों को तुरंत उपयोग योग्य और सरलता से समझे जाने वाले रूप में बनाया जा सके। आमतौर पर आँकड़ों की प्रस्तुति के तीन रूप होते हैं:

  • पाठात्मक या वर्णनात्मक प्रस्तुति
  • सारणीबद्ध प्रस्तुति
  • आरेखीय प्रस्तुति।

2. आँकड़ों की पाठात्मक प्रस्तुति

पाठात्मक प्रस्तुति में आँकड़ों को पाठ के भीतर वर्णित किया जाता है। जब आँकड़ों की मात्रा अधिक न हो तो यह प्रस्तुति रूप अधिक उपयुक्त होता है। निम्नलिखित उदाहरणों को देखें:

उदाहरण 1

08 सितम्बर 2005 को पेट्रोल और डीज़ल की कीमतों में वृद्धि के विरोध में दिए गए बंद आह्वान के दौरान, बिहार के एक कस्बे में 5 पेट्रोल पंप खुले पाए गए और 17 बंद थे, जबकि 2 विद्यालय बंद थे और शेष 9 विद्यालय खुले पाए गए।

उदाहरण 2

भारत की जनगणना 2001 ने बताया कि भारत की जनसंख्या बढ़कर 102 करोड़ हो गई, जिसमें केवल 49 करोड़ महिलाएँ थीं जबकि 53 करोड़ पुरुष थे। चौहत्तर करोड़ लोग ग्रामीण भारत में निवास करते थे और केवल 28 करोड़ लोग कस्बों या शहरों में रहते थे। जबकि पूरे देश में 62 करोड़ गैर-कार्यरत जनसंख्या थी जबकि 40 करोड़ कार्यरत थे। शहरी जनसंख्या में गैर-कार्यरतों (19 करोड़) की तुलना में कार्यरत (9 करोड़) की अपेक्षा गैर-कार्यरतों की हिस्सेदारी अधिक थी, जबकि ग्रामीण जनसंख्या में 74 करोड़ की कुल जनसंख्या में से 31 करोड़ कार्यरत थे…

दोनों ही मामलों में आँकड़ों को केवल पाठ में प्रस्तुत किया गया है। प्रस्तुति की इस विधि का एक गंभीर दोष यह है कि समझने के लिए किसी को प्रस्तुति के संपूर्ण पाठ को पढ़ना पड़ता है। परंतु यह भी सत्य है कि यह विधि प्रस्तुति के कुछ बिंदुओं पर जोर देने में सहायक होती है।

3. आँकड़ों की सारणीबद्ध प्रस्तुति

सारणीबद्ध प्रस्तुति में आँकड़े पंक्तियों (क्षैतिज रूप से पढ़ी जाती हैं) और स्तंभों (ऊध्र्वाधर रूप से पढ़े जाते हैं) में प्रस्तुत किए जाते हैं। उदाहरण के लिए सारणी 4.1 देखिए जो साक्षरता दरों की जानकारी को सारणीबद्ध करता है। इसमें तीन पंक्तियाँ (पुरुष, महिला और कुल के लिए) और तीन स्तंभ (शहरी, ग्रामीण और कुल के लिए) हैं। इसे $3 \times 3$ सारणी कहा जाता है जो 9 बॉक्सों में 9 जानकारियाँ देती है, जिन्हें सारणी की “कोशिकाएँ” कहा जाता है। प्रत्येक कोशिका ऐसी जानकारी देती है जो लिंग के एक गुण (“पुरुष”, “महिला” या कुल) को एक संख्या से (ग्रामीण लोगों, शहरी लोगों और कुल की साक्षरता प्रतिशतता) जोड़ती है। सारणीबद्ध करने का सबसे महत्वपूर्ण लाभ यह है कि यह आगे के सांख्यिकीय विश्लेषण और निर्णय लेने के लिए आँकड़ों को संगठित करता है। सारणीबद्ध करने में प्रयुक्त वर्गीकरण चार प्रकार के होते हैं:

  • गुणात्मक
  • परिमाणात्मक
  • कालिक और
  • स्थानिक

गुणात्मक वर्गीकरण

जब वर्गीकरण सामाजिक स्थिति, शारीरिक स्थिति, राष्ट्रीयता आदि जैसे गुणों के अनुसार किया जाता है, तो इसे गुणात्मक वर्गीकरण कहा जाता है। उदाहरण के लिए, तालिका 4.1 में वर्गीकरण के लिए गुण लिंग और स्थान हैं जो प्रकृति में गुणात्मक हैं।

तालिका 4.1 लिंग और स्थान के अनुसार भारत में साक्षरता (प्रतिशत)

स्थानकुल
लिंगग्रामीणशहरी
पुरुष799082
महिला598065
कुल688474

स्रोत: भारत की जनगणना 2011। (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

मात्रात्मक वर्गीकरण

मात्रात्मक वर्गीकरण में, आंकड़ों को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जो प्रकृति में मात्रात्मक होती हैं। दूसरे शब्दों में, इन विशेषताओं को मात्रात्मक रूप से मापा जा सकता है। उदाहरण के लिए, आयु, ऊंचाई, उत्पादन, आय आदि मात्रात्मक विशेषताएं हैं। वर्ग उन मानों के लिए सीमा निर्धारित करके बनाए जाते हैं जिन्हें वर्ग सीमा कहा जाता है। मात्रात्मक वर्गीकरण का एक उदाहरण तालिका 4.2 में दिया गया है। तालिका में लापता आंकड़ों की गणना कीजिए।

तालिका 4.2 बिहार में एक चुनाव अध्ययन में उनकी आयु के अनुसार 542 उत्तरदाताओं का वितरण

आयु समूह (वर्ष)उत्तरदाताओं की संख्याप्रतिशत
20-3030.55
30-406111.25
40-5013224.35
50-6015328.24
60-70$?$?
70-80519.41
80-9020.37
सभी?100.00

स्रोत: विधानसभा चुनाव पटना मध्य निर्वाचन क्षेत्र 2005, ए.एन. सिन्हा इंस्टीट्यूट ऑफ सोशल स्टडीज, पटना।

यहाँ वर्गीकरण की विशेषता आयु वर्षों में है और यह मात्रात्मक है।

गतिविधियाँ

  • चर्चा करें कि तालिका 4.1 में कुल मान कैसे आए हैं
  • एक तालिका बनाएँ जो आपकी कक्षा के छात्रों की स्टार न्यूज़, ज़ी न्यूज़, बीबीसी वर्ल्ड, सीएनएन, आज तक और डीडी न्यूज़ के लिए वरीयता संबंधी पसंद को प्रस्तुत करे।
  • एक तालिका तैयार करें

(i) ऊँचाइयों (सेमी में) और

(ii) वजन (किग्रा में) आपकी कक्षा के छात्रों की।

अस्थायी वर्गीकरण

इस वर्गीकरण में समय वर्गीकरण चर बन जाता है और समय के अनुसार आंकड़ों को श्रेणीबद्ध किया जाता है। समय घंटों, दिनों, सप्ताहों, महीनों, वर्षों आदि में हो सकता है। उदाहरण के लिए, तालिका 4.3 देखें।

तालिका 4.3 1995 से 2000 तक एक चाय की दुकान की वार्षिक बिक्री

वर्षबिक्री (रुपये लाख में)
199579.2
199681.3
19978.4
199880.5
1999100.2
200091.2

आंकड़ा स्रोत: अप्रकाशित आंकड़े।

इस तालिका में वर्गीकरण की विशेषता एक वर्ष में बिक्री है और यह समय की स्केल में मान लेती है।

गतिविधि

  • अपने स्कूल के कार्यालय जाएँ और पिछले दस वर्षों में प्रत्येक कक्षा में अध्ययन करने वाले छात्रों की संख्या के आंकड़े एकत्र करें और उन्हें एक तालिका में प्रस्तुत करें।

स्थानिक वर्गीकरण

जब वर्गीकरण स्थान के आधार पर किया जाता है, तो इसे स्थानिक वर्गीकरण कहा जाता है। स्थान एक गाँव/नगर, ब्लॉक, जिला, राज्य, देश आदि हो सकता है।

तालिका 4.4 स्थान वर्गीकरण का एक उदाहरण है।

तालिका 4.4 वर्ष 2013-14 में भारत से शेष विश्व को निर्यात की कुल निर्यात में हिस्सेदारी (प्रतिशत में)

गंतव्यनिर्यात हिस्सेदारी
यूएसए12.5
जर्मनी2.4
अन्य यूरोपीय संघ10.9
यूके3.1
जापान2.2
रूस0.7
चीन4.7
पश्चिम एशिया - खाड़ी सहयोग परिषद15.3
अन्य एशिया29.4
अन्य18.8
सभी100.0

(कुल निर्यात: अमेरिकी $\$$ 314.40 अरब)

गतिविधि

  • अपनी कक्षा के छात्रों से एकत्रित किए गए आंकड़ों को उनके मूल राज्य/आवासीय क्षेत्र के अनुसार प्रस्तुत करते हुए एक तालिका बनाएं।

4. आंकड़ों का सारणीयकरण और तालिका के भाग

एक तालिका बनाने के लिए यह सीखना महत्वपूर्ण है कि एक अच्छी सांख्यिकीय तालिका के कौन-कौन से भाग होते हैं। जब इन भागों को क्रमबद्ध रूप से एक साथ रखा जाता है तो वे एक तालिका बनाते हैं। तालिका की अवधारणा का सबसे सरल तरीका यह है कि आंकड़ों को कुछ व्याख्यात्मक नोटों के साथ पंक्तियों और स्तंभों में प्रस्तुत किया जाए। सारणीयकरण एकतरफा, द्वितरफा या त्रितरफा वर्गीकरण के अनुसार किया जा सकता है, यह इस बात पर निर्भर करता है कि कितनी विशेषताएं शामिल हैं। एक अच्छी तालिका में अनिवार्य रूप से निम्नलिखित होना चाहिए:

(i) तालिका संख्या

सारणी संख्या सारणी की पहचान के लिए निर्धारित की जाती है। यदि एक से अधिक सारणियाँ प्रस्तुत की जाती हैं, तो सारणी संख्या ही एक सारणी को दूसरी से अलग करती है। यह सारणी के शीर्षक के ऊपर या शुरुआत में दी जाती है। आमतौर पर, यदि किताब में कई सारणियाँ हों, तो सारणी संख्याएँ आरोही क्रम में पूर्ण संख्याएँ होती हैं। उपस्क्रिप्ट संख्याएँ, जैसे $1.2,3.1$, आदि, भी सारणी की स्थिति के अनुसार पहचान के लिए प्रयुक्त होती हैं। उदाहरण के लिए, सारणी 4.5 को चौथे अध्याय की पाँचवीं सारणी के रूप में पढ़ा जाना चाहिए, और इसी तरह (सारणी 4.5 देखें)।

(ii) शीर्षक

सारणी का शीर्षक सारणी की सामग्री के बारे में बताता है। इसे स्पष्ट, संक्षिप्त और सावधानीपूर्वक शब्दों में लिखा जाना चाहिए ताकि सारणी से की गई व्याख्याएँ स्पष्ट हों और अस्पष्टता से मुक्त हों। यह सारणी संख्या के बाद या उसके ठीक नीचे सारणी के शीर्ष पर स्थित होता है (सारणी 4.5 देखें)।

(iii) कैप्शन या स्तंभ शीर्षक

सारणी में प्रत्येक स्तंभ के शीर्ष पर स्तंभ का नाम दिया जाता है ताकि स्तंभ के आँकड़ों की व्याख्या हो सके। इसे कैप्शन या स्तंभ शीर्षक कहा जाता है (सारणी 4.5 देखें)।

(iv) स्टब या पंक्ति शीर्षक

कैप्शन या स्तंभ शीर्षक की तरह, सारणी की प्रत्येक पंक्ति को भी एक शीर्षक देना होता है। पंक्तियों के नामों को स्टब या स्टब आइटम भी कहा जाता है, और पूरी बाईं ओर की स्तंभ को स्टब स्तंभ कहा जाता है। पंक्ति शीर्षकों का संक्षिप्त विवरण सारणी के बाईं ओर ऊपर भी दिया जा सकता है (सारणी $4.5$ देखें)।

(v) सारणी का मुख्य भाग

सारणी का मुख्य भाग उसका धड़ होता है और इसमें वास्तविक आँकड़े होते हैं। सारणी में किसी एक आँकड़े/डेटा का स्थान निश्चित होता है और यह सारणी की पंक्ति तथा स्तंभ द्वारा निर्धारित होता है। उदाहरण के लिए, दूसरी पंक्ति और चौथे स्तंभ में दिया गया आँकड़ा बताता है कि सन् 2001 में ग्रामीण भारत में 25 करोड़ महिलाएँ गैर-कार्यरत थीं (देखिए सारणी 4.5)।

(vi) मापन की इकाई

सारणी में दिखाए गए आँकड़ों (वास्तविक डेटा) की मापन की इकाई को हमेशा शीर्षक के साथ देना चाहिए। यदि सारणी की पंक्तियों या स्तंभों के लिए भिन्न-भिन्न इकाइयाँ हैं, तो ये इकाइयाँ ‘स्टब्स’ या ‘कैप्शन’ के साथ अवश्य दी जानी चाहिए। यदि आँकड़े बड़े हों, तो उन्हें पूर्णांकित किया जाना चाहिए और पूर्णांकन की विधि भी बताई जानी चाहिए (देखिए सारणी 4.5)।

(नोट : सारणी 4.5 वही आँकड़े सारणीबद्ध रूप में प्रस्तुत करती है जिन्हें डेटा के पाठ्य प्रस्तुति के केस 2 के माध्यम से पहले ही दिखाया जा चुका है)

(vii) स्रोत

यह एक संक्षिप्त कथन या वाक्यांश होता है जो सारणी में प्रस्तुत आँकड़ों के स्रोत को दर्शाता है। यदि एक से अधिक स्रोत हों, तो सभी स्रोतों को स्रोत में लिखा जाता है। स्रोत आमतौर पर सारणी के नीचे लिखा जाता है (देखिए सारणी 4.5)।

(viii) नोट

नोट सारणी का अंतिम भाग होता है। यह सारणी के आँकड़ों की उस विशेष विशेषता को समझाता है जो स्वतः स्पष्ट नहीं होती और जिसे पहले समझाया नहीं गया है।

गतिविधियाँ

  • एक सारणी बनाने के लिए न्यूनतम कितनी पंक्तियाँ और स्तंभों की आवश्यकता होती है?
  • क्या सारणी के स्तंभ/पंक्ति शीर्षलेख मात्रात्मक हो सकते हैं?
  • क्या आप सारणियाँ 4.2 और 4.3 को आँकड़ों को उपयुक्त रूप से पूर्णांकित करके प्रस्तुत कर सकते हैं?
  • पृष्ठ 41 पर दिया गया केस 2 के पहले दो वाक्यों को सारणी के रूप में प्रस्तुत कीजिए। इसके लिए कुछ विवरण इस अध्याय के अन्य भागों में मिलेंगे।

5. आँकड़ों की चित्रात्मक प्रस्तुति

यह आँकड़ों को प्रस्तुत करने की तीसरी विधि है। यह विधि तालिका या पाठ्य प्रस्तुति की तुलना में आँकड़ों द्वारा समझाए जाने वाले वास्तविक परिदृश्य को सबसे तेज़ी से समझने में सहायक होती है। आँकड़ों की चित्रात्मक प्रस्तुति संख्याओं में निहित अत्यंत अमूर्त विचारों को अधिक ठोस और सरलतः समझ में आने वाले रूप में अनुवादित करती है।

चित्र सटीकता में कम हो सकते हैं, परंतु आँकड़ों को प्रस्तुत करने में सारणियों की तुलना में अधिक प्रभावी होते हैं।

सामान्य प्रयोग में विभिन्न प्रकार के चित्र आते हैं। उनमें से महत्वपूर्ण निम्नलिखित हैं:

(i) ज्यामितीय चित्र

(ii) बारंबारता चित्र

(iii) अंकगणितीय रेखा ग्राफ

ज्यामितीय चित्र

पट्ट चित्र (बार डायग्राम) और पाई चित्र ज्यामितीय चित्र की श्रेणी में आते हैं। पट्ट चित्र तीन प्रकार के होते हैं—सरल, संयुक्त और घटक पट्ट चित्र।

पट्ट चित्र

सरल पट्ट चित्र

दंड आरेख प्रत्येक वर्ग या श्रेणी के लिए समान अंतराल व समान चौड़ाई के आयताकार दंडों के एक समूह से बना होता है। दंड की ऊँचाई या लंबाई आँकड़े की परिमाण को दर्शाती है। दंड का निचला सिरा आधार रेखा को स्पर्श करता है ताकि दंड की ऊँचाई शून्य इकाई से प्रारंभ हो। दंड आरेख के दंडों को उनकी सापेक्ष ऊँचाई से दृष्टिगत रूप से तुलना किया जा सकता है और इस प्रकार आँकड़े शीघ्र समझे जाते हैं। इसके लिए आँकड़े बारंबारता या अ-बारंबारता प्रकार के हो सकते हैं। अ-बारंबारता प्रकार के आँकड़ों में किसी विशेष लक्षण, जैसे उत्पादन, उपज, जनसंख्या आदि को विभिन्न समय बिंदुओं पर या विभिन्न राज्यों पर नोट किया जाता है और संबंधित लक्षण के मानों के अनुसार संगत ऊँचाई के दंड बनाकर आरेख तैयार किया जाता है। लक्षणों के मान (मापे गए या गिने गए) प्रत्येक मान की पहचान बनाए रखते हैं। चित्र 4.1 एक दंड आरेख का उदाहरण है।

गतिविधि

  • अपने विद्यालय में वर्तमान वर्ष में अध्ययनरत प्रत्येक कक्षा में विद्यार्थियों की संख्या एकत्र करें। उसी सारणी के लिए एक दंड आरेख बनाएँ।

विभिन्न प्रकार के डेटा के लिए विभिन्न प्रकार की आरेखीय प्रस्तुति आवश्यक हो सकती है। बार आरेख आवृत्ति प्रकार और गैर-आवृत्ति प्रकार के चर और गुण दोनों के लिए उपयुक्त हैं। पारिवारिक आकार, पासे के बिंदु, परीक्षा में ग्रेड आदि जैसे विच्छिन्न चर और लिंग, धर्म, जाति, देश आदि जैसे गुण बार आरेखों द्वारा प्रस्तुत किए जा सकते हैं। बार आरेख गैर-आवृत्ति डेटा जैसे आय-व्यय प्रोफ़ाइल, वर्षों के दौरान निर्यात/आयात आदि के लिए अधिक सुविधाजनक हैं।

एक श्रेणी जिसकी बार (केरल की साक्षरता) दूसरी श्रेणी (पश्चिम बंगाल की साक्षरता) की तुलना में लंबी है, उसमें मापी गई (या गिनी गई) विशेषता अधिक है। बारों (जिन्हें कॉलम भी कहा जाता है) का उपयोग आमतौर पर समय श्रृंखला डेटा (1980 और 2000 के बीच खाद्यान्न उत्पादन, दशकीय कार्य भागीदारी दर में परिवर्तन, वर्षों के दौरान पंजीकृत बेरोजगार, साक्षरता दर आदि) के लिए किया जाता है (चित्र 4.2)।

TABLE 4.6 भारत के प्रमुख राज्यों की साक्षरता दरें

20012011
प्रमुख भारतीय राज्यपुरुषमहिलापुरुषमहिला
आंध्र प्रदेश (AP)70.350.475.659.7
असम (AS)71.354.678.867.3
बिहार (BR)59.733.173.453.3
झारखंड (JH)67.338.978.456.2
गुजरात (GJ)79.757.887.270.7
हरियाणा (HR)78.555.785.366.8
कर्नाटक (KA)76.156.982.968.1
केरल (KE)94.287.796.092.0
मध्य प्रदेश (MP)76.150.380.560.0
छत्तीसगढ़ (CH)77.451.981.560.6
महाराष्ट्र (MR)86.067.089.875.5
ओडिशा (OD)75.350.582.464.4
पंजाब (PB)75.263.481.571.3
राजस्थान (RJ)75.743.980.552.7
तमिलनाडु (TN)82.464.486.873.9
उत्तर प्रदेश (UP)68.842.279.259.3
उत्तराखंड (UK)83.359.688.370.7
पश्चिम बंगाल (WB)77.059.682.771.2
भारत75.353.782.165.5

आकृति 4.1: भारत के प्रमुख राज्यों के पुरुष साक्षरता दर को दर्शाता स्तंभ आरेख, 2011. (साक्षरता दर 7 वर्ष और उससे अधिक आयु की आबादी से संबंधित है)

स्तंभ आरेखों के विभिन्न रूप हो सकते हैं जैसे बहु-स्तंभ आरेख और घटक स्तंभ आरेख।

गतिविधियाँ

  • 2011 में भारत के प्रमुख राज्यों में से कितने राज्यों में महिला साक्षरता दर राष्ट्रीय औसत से अधिक थी?
  • क्या 2001 और 2011 की दो क्रमिक जनगणना वर्षों में राज्यों के बीच अधिकतम और न्यूनतम महिला साक्षरता दर के बीच का अंतर घटा है?

बहु-बार आरेख

बहु-बार आरेख (चित्र 4.2) का उपयोग दो या दो से अधिक डेटा समूहों की तुलना के लिए किया जाता है, उदाहरण के लिए विभिन्न वर्षों के लिए आय और व्यय या आयात और निर्यात, विभिन्न कक्षाओं में विभिन्न विषयों में प्राप्त अंक आदि।

घटक बार आरेख

घटक बार आरेख या चार्ट (चित्र 4.3), जिन्हें उप-आरेख भी कहा जाता है, विभिन्न घटक भागों (वे तत्व या भाग जिनसे कोई वस्तु बनी होती है) के आकारों की तुलना करने में बहुत उपयोगी होते हैं और साथ ही इन अभिन्न भागों के बीच संबंध को समझाने में भी सहायक होते हैं। उदाहरण के लिए, विभिन्न उत्पादों से बिक्री आय, एक विशिष्ट भारतीय परिवार में व्यय प्रतिरूप (घटक: भोजन, किराया, दवाई, शिक्षा, बिजली आदि), प्राप्तियों और व्ययों के लिए बजट आवंटन, श्रम बल के घटक, जनसंख्या आदि। घटक बार आरेखों को सामान्यतः उपयुक्त रूप से छायांकित या रंगा जाता है।

चित्र 4.2: भारत के प्रमुख राज्यों द्वारा 2001 और 2011 की दो जनगणना वर्षों में महिला साक्षरता दर दिखाता बहु-बार (स्तंभ) आरेख। (डेटा स्रोत: सारणी 4.6)

व्याख्या: आकृति 4.2 से यह बहुत आसानी से निकाला जा सकता है कि देश भर में वर्षों के दौरान महिला साक्षरता दर में वृद्धि हो रही थी। आकृति से इसी प्रकार की अन्य व्याख्याएँ भी की जा सकती हैं। उदाहरण के लिए, आकृति दर्शाती है कि बिहार, झारखंड और उत्तर प्रदेश राज्यों में महिला साक्षरता में सबसे तीव्र वृद्धि हुई है, आदि।

तालिका 4.7 बिहार के एक जिले में विद्यालयों में लिंग के अनुसार नामांकन (प्रतिशत) 6-14 वर्ष आयु वर्ग के बच्चों का

लिंगनामांकित (प्रतिशत)विद्यालय से बाहर (प्रतिशत)
लड़का91.58.5
लड़की58.641.4
सभी78.022.0

डेटा स्रोत: अप्रकाशित आँकड़े

एक घटक स्तंभ आरेख स्तंभ और उसके दो या अधिक घटकों में उपविभाजन को दर्शाता है। उदाहरण के लिए, स्तंभ 6-14 वर्ष आयु वर्ग के बच्चों की कुल जनसंख्या को दर्शा सकता है। घटक उन बच्चों के अनुपात को दर्शाते हैं जो नामांकित हैं और जो नहीं हैं। एक घटक स्तंभ आरेख में दिए गए आयु वर्ग सीमा के भीतर लड़कों, लड़कियों और कुल बच्चों के लिए भिन्न घटक स्तंभ भी हो सकते हैं, जैसा कि आकृति 4.3 में दिखाया गया है। घटक स्तंभ आरेख बनाने के लिए, सबसे पहले $\mathrm{x}$-अक्ष पर एक स्तंब बनाया जाता है जिसकी ऊँचाई स्तंभ के कुल मान के बराबर होती है [प्रतिशत आँकड़ों के लिए स्तंभ की ऊँचाई 100 इकाई होती है (आकृति 4.3)]। अन्यथा ऊँचाई स्तंभ के कुल मान के बराबर की जाती है और घटकों की समानुपातिक ऊँचाइयाँ यूनिटरी विधि का उपयोग करके निकाली जाती हैं। स्तंभ को विभाजित करने में छोटे घटकों को प्राथमिकता दी जाती है।

आकृति 4.3: बिहार के एक जिले में प्राथमिक स्तर पर नामांकन (घटक दंड आरेख)

पाई आरेख

पाई आरेख भी एक घटक आरेख है, लेकिन दंड आरेख के विपरीत, यहाँ यह एक वृत्त होता है जिसका क्षेत्रफल समानुपातिक रूप से उन घटकों के बीच बाँटा जाता है (आकृति 4.4) जिन्हें यह दर्शाता है। इसे पाई चार्ट भी कहा जाता है। वृत्त को केंद्र से परिधि तक सीधी रेखाएँ खींचकर उतने ही भागों में बाँटा जाता है जितने घटक होते हैं।

पाई चार्ट सामान्यतः किसी श्रेणी के निरपेक मानों के साथ नहीं बनाए जाते हैं। प्रत्येक श्रेणी के मानों को सबसे पहले सभी श्रेणियों के कुल मान का प्रतिशत व्यक्त किया जाता है। पाई चार्ट में एक वृत्त, अपनी त्रिज्या के मान की परवाह किए बिना, 100 समान भागों में सोचा जाता है जिनमें से प्रत्येक $3.6^{\circ}\left(360^{\circ} / 100\right)$ का होता है। यह ज्ञात करने के लिए कि कोई घटक वृत्त के केंद्र पर कितना कोण बनाएगा, प्रत्येक घटक के प्रतिशत आँकड़े को $3.6^{\circ}$ से गुणा किया जाता है। वृत्त के कोणीय घटकों में घटकों के प्रतिशत के इस रूपांतरण का एक उदाहरण सारणी 4.8 में दिखाया गया है।

यह जानना रोचक हो सकता है कि एक घटक पट्टिका आरेख द्वारा प्रस्तुत किए गए डेटा को पाई चार्ट द्वारा भी समान रूप से अच्छी तरह से प्रस्तुत किया जा सकता है, एकमात्र आवश्यकता यह है कि घटकों के निरपेक्ष मानों को प्रतिशत में परिवर्तित करना होता है ताकि उन्हें पाई आरेख के लिए प्रयोग किया जा सके।

सारणी 4.8 भारतीय जनसंख्या का (2011) उनकी कार्य स्थिति के अनुसार वितरण (करोड़ों में)

स्थितिजनसंख्याप्रतिशतकोणीय घटक
सीमांत श्रमिक129.9$36^{\circ}$
मुख्य श्रमिक3629.8$107^{\circ}$
गैर-श्रमिक7360.3$217^{\circ}$
सभी102100.0$360^{\circ}$

आकृति 4.4: कार्य स्थिति के अनुसार भारतीय जनसंख्या के विभिन्न वर्गों के लिए पाई आरेख 2011.


गतिविधियाँ

  • आकृति 4.4 द्वारा प्रस्तुत डेटा को एक घटक पट्टिका आरेख द्वारा प्रस्तुत करें।
  • क्या पाई का क्षेत्रफल डेटा के कुल मान पर कोई प्रभाव डालता है जिसे पाई आरेख द्वारा प्रस्तुत किया जाना है?

बारंबारता आरेख

समूहीकृत बारंबारता बंटन के रूप में डेटा को आमतौर पर हिस्टोग्राम, बारंबारता बहुभुज, बारंबारता वक्र और ओजाइव जैसे बारंबारता आरेखों द्वारा प्रस्तुत किया जाता है।

हिस्टोग्राम

एक हिस्टोग्राम एक द्वि-आयामी आरेख है। यह आयतों का एक समूह होता है जिसका आधार वर्ग सीमाओं के बीच के अंतराल (X-अक्ष के साथ) होता है और जिसका क्षेत्रफल वर्ग आवृत्ति के अनुपात में होता है (चित्र 4.5)। यदि वर्ग अंतराल समान चौड़ाई के हों, जैसा कि आमतौर पर होता है, तो आयतों का क्षेत्रफल उनकी संबंधित आवृत्तियों के अनुपात में होता है। हालांकि, कुछ प्रकार के आंकड़ों में, कभी-कभी वर्ग अंतरालों की भिन्न-भिन्न चौड़ाई का उपयोग करना सुविधाजनक और कभी-कभी आवश्यक भी होता है। उदाहरण के लिए, मृत्यु के समय आयु के अनुसार मृत्यु दरों को सारणीबद्ध करते समय, शुरुआत में बहुत छोटी आयु अंतरालों (0,1,2,… वर्ष/0,7,28,… दिन) का उपयोग करना बहुत अर्थपूर्ण और उपयोगी होगा, क्योंकि उस समय मृत्यु दर अन्य उच्च आयु वर्गों की तुलना में बहुत अधिक होती है। ऐसे आंकड़ों की आलेखीय प्रस्तुति के लिए, आयत की ऊंचाई (यहां आवृत्ति) और आधार (यहां वर्ग अंतराल की चौड़ाई) का भागफल लिया जाता है। जब अंतराल समान होते हैं, अर्थात् जब सभी आयतों का आधार समान होता है, तो तुलना के उद्देश्य से क्षेत्रफल को किसी भी अंतराल की आवृत्ति द्वारा सुविधाजनक रूप से दर्शाया जा सकता है।

जब आधार की चौड़ाई भिन्न-भिन्न होती है, तो आयतों की ऊंचाई को तुलनात्मक माप प्राप्त करने के लिए समायोजित किया जाना चाहिए। ऐसी स्थिति में उत्तर है आवृत्ति घनत्व (वर्ग आवृत्ति को वर्ग अंतराल की चौड़ाई से विभाजित करना) न कि निरपेक्ष आवृत्ति।

तालिका 4.9 एक कस्बे के एक क्षेत्र में दैनिक वेतन भोगियों का वितरण

दैनिक आय (रु)मजदूरों की संख्या (f)
45-492
50-543
55-595
60-643
65-696
70-747
75-7912
80-8413
85-899
90-947
95-996
100-1044
105-1092
110-1143
115-1193

स्रोत: अप्रकाशित आंकड़े

चूँकि हिस्टोग्राम आयत होते हैं, आधार रेखा के समानांतर और समान परिमाण की एक रेखा उस वर्ग अंतराल की आवृत्ति (या आवृत्ति घनत्व) के बराबर ऊर्ध्वाधर दूरी पर खींची जाती है। हिस्टोग्राम कभी नहीं खींचा जाता। चूँकि, सतत चर के लिए, किसी वर्ग अंतराल की निचली वर्ग सीमा पिछले अंतराल की ऊपरी वर्ग सीमा से मिल जाती है, समान या असमान, आयत सभी संलग्न होते हैं और दो क्रमागत आयतों के बीच कोई खुला स्थान नहीं होता। यदि वर्ग सतत नहीं हैं तो उन्हें पहले अध्याय 3 में चर्चा किए अनुसार सतत वर्गों में परिवर्तित किया जाता है। कभी-कभी दो संलग्न आयतों के बीच की सामान्य भाग (चित्र 4.6) को छोड़ दिया जाता है जिससे सततता का बेहतर प्रभाव दिखता है। परिणामी आकृति दोहरी सीढ़ी के समान प्रभाव देती है।

एक हिस्टोग्राम एक बार आरेख से मिलता-जुलता दिखता है। लेकिन पहली नज़र में लगने वाले से ज़्यादा, दोनों में समानताओं की अपेक्षा अंतर अधिक हैं। बारों के बीच की खाली जगह, चौड़ाई या क्षेत्रफल सभी मनमाने होते हैं। महत्वपूर्ण बार की चौड़ाई या क्षेत्रफल नहीं, बल्कि ऊँचाई है। एक ही चौड़ाई की बार के समान उद्देश्य की पूर्ति एक एकल ऊध्र्वरेखा भी कर सकती है। इसके अतिरिक्त, हिस्टोग्राम में दो आयतों के बीच कोई खाली जगह नहीं छोड़ी जाती, परंतु बार आरेख में लगातार बारों के बीच कुछ खाली जगह अवश्य छोड़नी होती है (बहु-बार या संघटित बार आरेख को छोड़कर)। यद्यपि बारों की चौड़ाई समान होती है, तुलना के उद्देश्य से बार की चौड़ाई महत्वहीन है। हिस्टोग्राम में चौड़ाई उतनी ही महत्वपूर्ण है जितनी ऊँचाई। हम बार आरेख离散 तथा सतत दोनों चरों के लिए बना सकते हैं, परंतु हिस्टोग्राम केवल सतत चर के लिए ही खींचा जाता है। हिस्टोग्राम आवृत्ति बंटन के बहुलक का मान आलेखीय रूप से भी देता है जैसा कि आकृति 4.5 में दिखाया गया है और बिंदित ऊध्र्वरेखा का $\mathrm{x}$-निर्देशांक बहुलक देता है।

आवृत्ति बहुभुज

एक बारंबारता बहुभुज एक समतल होता है जो सीधी रेखाओं से घिरा होता है, आमतौर पर चार या अधिक रेखाओं से। बारंबारता बहुभुज हिस्टोग्राम का एक विकल्प है और यह स्वयं हिस्टोग्राम से ही व्युत्पन्न भी किया जाता है। बारंबारता बहुभुज को किसी हिस्टोग्राम पर फिट किया जा सकता है ताकि वक्र के आकार का अध्ययन किया जा सके। बारंबारता बहुभुज खींचने की सबसे सरल विधि यह है कि हिस्टोग्राम के क्रमागत आयतों के ऊपरी सिरों के मध्य बिंदुओं को मिलाया जाए। इससे दोनों सिरे आधार रेखा से दूर रह जाते हैं, जिससे वक्र के नीचे के क्षेत्रफल की गणना नहीं हो पाती। समाधान यह है कि प्राप्त दोनों अंतिम बिंदुओं को वितरण के दोनों सिरों पर तुरंत बाद आने वाली शून्य बारंबारता वाली दोनों वर्गों के मध्य-मानों पर आधार रेखा से जोड़ा जाए। टूटी हुई रेखाएँ या बिंदु इन दोनों सिरों को आधार रेखा से जोड़ सकते हैं। अब वक्र के नीचे का कुल क्षेत्रफल, हिस्टोग्राम के क्षेत्रफल की तरह, कुल बारंबारता या नमूना आकार को दर्शाता है।

आकृति 4.5: एक कस्बे के क्षेत्र में 85 दैनिक वेतनभोगियों के वितरण के लिए हिस्टोग्राम।

आवृत्ति बहुभुज समूहीकृत आवृत्ति बंटन को प्रस्तुत करने की सबसे सामान्य विधि है। $\mathrm{X}$-अक्ष पर वर्ग सीमाएँ और वर्ग-चिह्न दोनों का उपयोग किया जा सकता है, दो क्रमागत वर्ग-चिह्नों के बीच की दूरी वर्ग अंतराल की चौड़ाई के समानुपातिक/बराबर होती है। यदि वर्ग-चिह्न ग्राफ पेपर की मोटी रेखाओं पर आ जाएँ तो आँकड़ों का आलेखन आसान हो जाता है। चाहे $\mathrm{X}$-अक्ष पर वर्ग सीमाएँ प्रयोग की जाएँ या मध्यबिंदु, आवृत्तियाँ (कोटियों के रूप में) सदैव वर्ग अंतराल के मध्यबिंदु के विरुद्ध आलेखित की जाती हैं। जब सभी बिंदु ग्राफ में आलेखित हो जाते हैं, उन्हें सावधानीपूर्वक छोटी-छोटी सीधी रेखाओं की श्रृंखला द्वारा जोड़ा जाता है। टूटी हुई रेखाएँ दो अंतरालों के मध्यबिंदुओं को जोड़ती हैं, एक प्रारंभ में और दूसरा अंत में, आलेखित वक्र के दोनों सिरों के साथ (चित्र 4.6)। जब एक ही अक्षों पर आलेखित दो या अधिक बंटनों की तुलना की जाती है, तो आवृत्ति बहुभुज अधिक उपयोगी हो सकता है क्योंकि दो या अधिक बंटनों की ऊर्ध्वाधर और क्षैतिज रेखाएँ हिस्टोग्राम में संपाती हो सकती हैं।

चित्र 4.6: सारणी 4.9 में दिए गए आँकड़ों के लिए खींचा गया आवृत्ति बहुभुज

चित्र 4.7: सारणी 4.9 के लिए आवृत्ति वक्र

आवृत्ति वक्र

बारंबारता वक्र को उन बिंदुओं से गुजरती हुई एक सहज हाथ से खींची गई मुलायम वक्र रेखा द्वारा प्राप्त किया जाता है जो बारंबारता बहुभुज के बिंदुओं के यथासंभव निकट होती है। यह आवश्यक नहीं कि यह बारंबारता बहुभुज के सभी बिंदुओं से होकर गुजरे, परंतु यह उनके यथासंभव निकट से गुजरती है (चित्र 4.7)।

ओजाइव

ओजाइव को संचयी बारंबारता वक्र भी कहा जाता है। चूँकि दो प्रकार की संचयी बारंबारताएँ होती हैं, उदाहरण के लिए “से कम” प्रकार और “से अधिक” प्रकार, इसलिए किसी भी समूहीकृत बारंबारता बंटन आँकड़ों के लिए दो ओजाइव होते हैं। यहाँ बारंबारता बहुभुज के मामले में सरल बारंबारताओं के स्थान पर, संचयी बारंबारताओं को बारंबारता बंटन की वर्ग सीमाओं के विरुद्ध $y$-अक्ष पर आलेखित किया जाता है। “से कम” ओजाइव के लिए संचयी बारंबारताओं को वर्ग अंतरालों की संबंधित ऊपरी सीमाओं के विरुद्ध आलेखित किया जाता है, जबकि “से अधिक” ओजाइवों के लिए संचयी बारंबारताओं को वर्ग अंतरालों की संबंधित निचली सीमाओं के विरुद्ध आलेखित किया जाता है। दोनों ओजाइवों की एक रोचक विशेषता यह है कि उनका प्रतिच्छेद बिंदु बारंबारता बंटन की माध्यिका चित्र 4.8 (b) देता है। जैसा कि दोनों ओजाइवों के आकार सुझाते हैं, “से कम” ओजाइव कभी घटता नहीं है और “से अधिक” ओजाइव कभी बढ़ता नहीं है।

अंकगणितीय रेखा ग्राफ

एक अंकगणितीय रेखा ग्राफ को समय श्रेणी ग्राफ भी कहा जाता है। इस ग्राफ में समय (घंटा, दिन/तिथि, सप्ताह, माह, वर्ष आदि) को $\mathrm{x}$-अक्ष पर और चर का मान (समय श्रेणी डेटा) को y-अक्ष पर प्लॉट किया जाता है। इन प्लॉट किए गए बिंदुओं को मिलाकर बनाई गई रेखा ग्राफ को अंकगणितीय रेखा ग्राफ (समय श्रेणी ग्राफ) कहा जाता है। यह दीर्घकालिक समय श्रेणी डेटा में प्रवृत्ति, आवर्तिता आदि को समझने में मदद करता है।

TABLE 4.10 गणित में प्राप्त अंकों की आवृत्ति बंटन

Fig. 4.8(a): टेबल 4.10 में दिए गए डेटा के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

Fig. 4.8(b): टेबल 4.10 में दिए गए डेटा के लिए ‘से कम’ और ‘से अधिक’ ओजाइव

यहाँ आप Fig. 4.9 से देख सकते हैं कि 1993-94 से 2013-14 की अवधि के दौरान, पूरे समय आयात निर्यात से अधिक थे। आप देख सकते हैं कि 2001-02 के बाद निर्यात और आयात दोनों के मान तेजी से बढ़ रहे हैं। साथ ही, आयात और निर्यात के बीच का अंतर 2001-02 के बाद और बढ़ गया है।

6. निष्कर्ष

अब तक आप यह सीख चुके होंगे कि डेटा को विभिन्न प्रस्तुति रूपों—पाठीय, सारणीबद्ध और आरेखीय—का उपयोग करके कैसे प्रस्तुत किया जा सकता है। अब आप डेटा प्रस्तुति के रूप और दिए गए डेटा समुच्चय के लिए प्रयोग किए जाने वाले आरेख के प्रकार की उपयुक्त पसंद भी कर सकते हैं। इस प्रकार आप डेटा की प्रस्तुति को सार्थक, व्यापक और उद्देश्यपूर्ण बना सकते हैं।

TABLE 4.11 भारत के निर्यात और आयात का मूल्य (100 करोड़ रुपये में)

वर्षनिर्यातआयात
1993-94698731
1994-95827900
1995-9610641227
1996-9711881389
1997-9813011542
1998-9913981783
1999-200015912155
2000-0120362309
2001-0220902452
2002-0325492964
2003-0429343591
2004-0537535011
2005-0645646604
2006-0757188815
2007-08655910123
2008-09840813744
2009-10845513637
2010-111137016835
2011-121466023455
2012-131634326692
2013-141905027154

स्रोत: DGCI&S, कोलकाता

Fig. 4.9: सारणी 4.11 में दिए गए समय श्रेणी डेटा के लिए अंकगणितीय रेखा आरेख

पुनरावलोकन

  • डेटा (भारी मात्रा में डेटा भी) प्रस्तुति के माध्यम से अर्थपूर्ण रूप से बोलता है।
  • छोटे डेटा (मात्रा) के लिए पाठात्मक प्रस्तुति उद्देश्य को बेहतर ढंग से पूरा करती है।
  • बड़ी मात्रा के डेटा के लिए सारणीबद्ध प्रस्तुति एक या अधिक चरों के लिए किसी भी मात्रा के डेटा को समायोजित करने में मदद करती है।
  • सारणीबद्ध डेटा को आरेखों के माध्यम से प्रस्तुत किया जा सकता है जो अन्यथा प्रस्तुत तथ्यों की तेज़ समझ को सक्षम बनाते हैं।

अभ्यास

निम्नलिखित प्रश्नों 1 से 10 के सही उत्तर चुनकर दीजिए

1. बार आरेख एक है

(i) एक-आयामी आरेख

(ii) दो-आयामी आरेख

(iii) बिना आयाम वाला आरेख

(iv) उपर्युक्त में से कोई नहीं

2. हिस्टोग्राम के माध्यम से प्रस्तुत डेटा ग्राफ़िक रूप से खोजने में मदद कर सकता है

(i) माध्य

(ii) बहुलक

(iii) माध्यिका

(iv) उपर्युक्त सभी

3. ओजाइव्स ग्राफ़िक रूप से खोजने में सहायक हो सकते हैं

(i) बहुलक

(ii) माध्य

(iii) माध्यिका

(iv) उपर्युक्त में से कोई नहीं

4. अंकगणितीय रेखा ग्राफ़ के माध्यम से प्रस्तुत डेटा समझने में मदद करता है

(i) दीर्घकालिक प्रवृत्ति

(ii) डेटा में चक्रीयता

(iii) डेटा में मौसमी लक्षण

(iv) उपर्युक्त सभी

5. बार आरेख में बारों की चौड़ाई बराबर होनी आवश्यक नहीं है (सत्य/असत्य)।

6. हिस्टोग्राम में आयतों की चौड़ाई अनिवार्यतः बराबर होनी चाहिए (सत्य/असत्य)।

7. हिस्टोग्राम केवल डेटा के सतत वर्गीकरण के साथ ही बनाया जा सकता है (सत्य/असत्य)।

8. हिस्टोग्राम और स्तंभ आरेख डेटा प्रस्तुति की एक ही विधि हैं। (सत्य/असत्य)

9. बारंबारता बंटन की विधिमान को आरेख (हिस्टोग्राम) की सहायता से आलेखीय रूप से जाना जा सकता है। (सत्य/असत्य)

10. बारंबारता बंटन की माध्यिका को ओजाइव्स से नहीं जाना जा सकता। (सत्य/असत्य)

11. निम्नलिखित को चित्रित करने के लिए किस प्रकार के आरेख अधिक प्रभावी हैं?

(i) एक वर्ष में मासिक वर्षा

(ii) धर्म के आधार पर दिल्ली की जनसंख्या की संरचना

(iii) एक कारखाने में लागत के घटक

12. मान लीजिए आप भारत में शहरी गैर-श्रमिकों के हिस्से में वृद्धि और शहरीकरण के निम्न स्तर को उदाहरण 4.2 में दिखाए गए अनुसार जोर देना चाहते हैं। आप इसे सारणीबद्ध रूप में कैसे करेंगे?

13. जब बारंबारता सारणी में वर्ग अंतराल असमान होते हैं तो हिस्टोग्राम बनाने की प्रक्रिया समान वर्ग अंतरालों की तुलना में किस प्रकार भिन्न होती है?

14. इंडियन शुगर मिल्स एसोसिएशन ने रिपोर्ट किया कि, ‘दिसंबर 2001 के पहले पखवाड़े में चीनी उत्पादन लगभग 3,87,000 टन था, जबकि पिछले वर्ष (2000) की इसी अवधि में यह 3,78,000 टन था। दिसंबर 2001 के पहले पखवाड़े में कारखानों से चीनी की ऑफ-टेक 2,83,000 टन आंतरिक उपभोग के लिए और 41,000 टन निर्यात के लिए थी, जबकि पिछले सीजन की इसी अवधि में यह $1,54,000$ टन आंतरिक उपभोग के लिए और निर्यात के लिए शून्य थी।’

(i) आंकड़ों को सारणीबद्ध रूप में प्रस्तुत कीजिए।

(ii) मान लीजिए आपको इन आंकड़ों को आलेखीय रूप में प्रस्तुत करना है तो आप किस आरेख का उपयोग करेंगे और क्यों?

(iii) इन आंकड़ों को आलेखीय रूप में प्रस्तुत कीजिए।

15. निम्न तालिका में GDP के कारक लागत पर क्षेत्रीय वास्तविक वृद्धि दरों (पिछले वर्ष की तुलना में प्रतिशत परिवर्तन) का अनुमान दिया गया है।

वर्षकृषि और संबद्ध क्षेत्रउद्योगसेवाएँ
1994-955.09.27.0
1995-96-0.911.810.3
1996-979.66.07.1
1997-98-1.95.99.0
1998-997.24.08.3
1999-20000.86.98.2

इस डेटा को एकाधिक समय श्रेणी ग्राफ़ के रूप में प्रस्तुत करें।