अध्याय 02 डेटा प्रोसेसिंग
आपने पिछले अध्याय में सीखा है कि डेटा को संगठित और प्रस्तुत करने से वे समझ में आने योग्य बन जाते हैं। यह डेटा प्रोसेसिंग को सुविधाजनक बनाता है। डेटा का विश्लेषण करने के लिए कई सांख्यिकीय तकनीकें प्रयोग की जाती हैं, जैसे:
- केंद्रीय प्रवृत्ति की माप
- विचरण की माप
- संबंध की माप
जहाँ केंद्रीय प्रवृत्ति की माप उस मान को प्रदान करती है जो प्रेक्षणों के समूह का एक आदर्श प्रतिनिधि होता है, वहीं विचरण की माप डेटा के आंतरिक विचरणों को ध्यान में रखती है, प्रायः किसी केंद्रीय प्रवृत्ति के चारों ओर। संबंध की माप, दूसरी ओर, किन्हीं दो या अधिक संबंधित घटनाओं—जैसे वर्षा और बाढ़ की घटना या उर्वरक के उपयोग और फसल उत्पादन—के बीच संबंध की डिग्री प्रदान करती है। इस अध्याय में आप केंद्रीय प्रवृत्ति की माप सीखेंगे।
केंद्रीय प्रवृत्ति की माप
मापने योग्य विशेषताएँ—जैसे वर्षा, ऊँचाई, जनसंख्या घनत्व, शैक्षिक उपलब्धि का स्तर या आयु वर्ग—भिन्न होते हैं। यदि हम इन्हें समझना चाहें तो हम ऐसा कैसे करेंगे? शायद हमें एक ऐसे एकल मान या संख्या की आवश्यकता होगी जो सभी प्रेक्षणों का सर्वोत्तम प्रतिनिधित्व करे। यह एकल मान प्रायः किसी बंटन के केंद्र के निकट होता है, न कि किसी चरम पर। वे सांख्यिकीय तकनीकें जिनका उपयोग बंटन के केंद्र को ज्ञात करने के लिए किया जाता है, केंद्रीय प्रवृत्ति की माप कहलाती हैं। केंद्रीय प्रवृत्ति को दर्शाने वाली संख्या संपूर्ण डेटा समूह की प्रतिनिधि संख्या होती है क्योंकि यह वह बिंदु है जिसके चारों ओर मदों के समूहित होने की प्रवृत्ति होती है।
केन्द्रीय प्रवृत्ति के माप को सांख्यिकीय औसत भी कहा जाता है। केन्द्रीय प्रवृत्ति के मापों की संख्या कई होती है, जैसे माध्य, माध्यिका और बहुलक।
माध्य
माध्य वह मान है जो सभी मानों को योग करके और उसे प्रेक्षणों की संख्या से विभाजित करके प्राप्त किया जाता है।
माध्यिका
माध्यिका वह रैंक का मान है जो व्यवस्थित श्रेणी को दो समान संख्याओं में विभाजित करता है। यह वास्तविक मान से स्वतंत्र होता है। आरोही या अवरोही क्रम में डेटा को व्यवस्थित करना और फिर मध्य रैंकिंग संख्या के मान को खोजना माध्यिका की गणना में सबसे महत्वपूर्ण है। सम संख्याओं के मामले में दो मध्य रैंकिंग मानों का औसत माध्यिका होगा।
बहुलक
बहुलक किसी विशेष बिंदु या मान पर अधिकतम आवृत्ति या बारंबारता है। आप देख सकते हैं कि इनमें से प्रत्येक माप विभिन्न प्रकार के डेटा सेटों के लिए उपयुक्त एकल प्रतिनिधि संख्या निर्धारित करने की एक भिन्न विधि है।
माध्य
माध्य किसी चर के विभिन्न मानों का सरल अंकगणितीय औसत है। अग्रुपित और समूहीकृत डेटा के लिए माध्य की गणना करने की विधियां आवश्यक रूप से भिन्न होती हैं। माध्य को समूहीकृत और अग्रुपित दोनों डेटा के लिए प्रत्यक्ष या अप्रत्यक्ष विधियों से गणना किया जा सकता है।
अग्रुपित डेटा से माध्य की गणना
प्रत्यक्ष विधि
अवर्गीकृत आँकड़ों से प्रत्यक्ष विधि द्वारा माध्य निकालते समय प्रत्येक प्रेक्षण के मानों को जोड़ा जाता है और कुल प्रेक्षणों के योग को घटनाओं की कुल संख्या से विभाजित किया जाता है। माध्य निम्न सूत्र द्वारा निकाला जाता है:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
जहाँ,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य } \ \sum \quad & \text { मापों की श्रृंखला का } \ & \text { योग } \end{aligned} $$
$x \quad=$ मापों की श्रृंखला में एक कच्चा अंक
$\sum \mathrm{x}=$ सभी मापों का योग
$\mathrm{N} \quad$ = मापों की संख्या
उदाहरण 2.1 : मध्य प्रदेश के मालवा पठार के लिए जिलों में वर्षा के आँकड़ों से माध्य वर्षा निकालें जो सारणी 2.1 में दी गई है:
$\hspace{1cm}$ सारणी 2.1 : माध्य वर्षा की गणना
| मालवा पठार के जिले | सामान्य वर्षा मिमी में | अप्रत्यक्ष विधि |
|---|---|---|
| x प्रत्यक्ष विधि | $d=x-800^{*}$ | |
| इंदौर | 979 | 179 |
| देवास | 1083 | 283 |
| धार | 833 | 33 |
| रतलाम | 896 | 96 |
| उज्जैन | 891 | 91 |
| मंदसौर | 825 | 25 |
| शाजापुर | 977 | 177 |
| $\sum x$ और $\sum d$ | 6484 | 884 |
| $\frac{\sum x}{N}$ और $\frac{\sum d}{N}$ | 926.29 | 126.29 |
- जहाँ 800 माना गया माध्य है।
$\mathrm{d}$ माना गया माध्य से विचलन है।
सारणी 2.1 में दिए गए आँकड़ों का माध्य इस प्रकार निकाला गया है:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N} \ & =\frac{6,484}{7} \ & =926.29 \end{aligned} $$
यह ध्यान दिया जा सकता है कि माध्य की गणना में कच्चे वर्षा आँकड़ों को सीधे जोड़ा गया है और योग को प्रेक्षणों की संख्या अर्थात् जिलों की संख्या से विभाजित किया गया है। इसलिए इसे प्रत्यक्ष विधि कहा जाता है।
अप्रत्यक्ष विधि
बड़ी संख्या में प्रेक्षणों के लिए माध्य की गणना सामान्यतः अप्रत्यक्ष विधि द्वारा की जाती है। यह प्रेक्षणों के मानों को उनसे एक नियत संख्या घटाकर छोटे मानों तक सीमित करने में सहायक होती है। उदाहरण के लिए, जैसा कि तालिका 2.1 में दिखाया गया है, वर्षा मान 800 और $1100 \mathrm{~mm}$ के बीच हैं। हम इन मानों को ‘अनुमानित माध्य’ चुनकर और प्रत्येक मान से चयनित संख्या घटाकर कम कर सकते हैं। वर्तमान उदाहरण में हमने 800 को अनुमानित माध्य लिया है। इस प्रकार की प्रक्रिया को कोडिंग कहा जाता है। माध्य इन घटे हुए मानों (तालिका 2.1 का स्तंभ 3) से निकाला जाता है।
अप्रत्यक्ष विधि से माध्य की गणना निम्नलिखित सूत्र द्वारा की जाती है:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
जहाँ,
$$ \begin{aligned} A & =\text { घटाई गई नियत संख्या } \ \sum d & =\text { कोडित स्कोरों का योग } \ N & =\text { श्रेणी में व्यक्तिगत प्रेक्षणों की संख्या } \end{aligned} $$
तालिका 2.1 में दिखाए गए आँकड़ों का माध्य अप्रत्यक्ष विधि से निम्न प्रकार से निकाला जा सकता है:
$$ \begin{aligned} \overline{\mathrm{X}} & =800+\frac{884}{7} \ & =800+\frac{884}{7} \ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
ध्यान दें कि माध्य मान दोनों में से किसी भी विधि से गणना करने पर समान आता है।
गुप्त डेटा से माध्य की गणना
माध्य को गुप्त डेटा के लिए भी प्रत्यक्ष या अप्रत्यक्ष विधि से गणना किया जाता है।
प्रत्यक्ष विधि
जब अंकों को बारंबारता बंटन में गुप्त किया जाता है, तो व्यक्तिगत मान अपनी पहचान खो देते हैं। ये मान उस वर्ग ${ }^{\circ}$ अंतराल के मध्यबिंदु द्वारा दर्शाए जाते हैं जिसमें वे स्थित होते हैं। प्रत्यक्ष विधि से गुप्त डेटा से माध्य गणना करते समय प्रत्येक वर्ग अंतराल के मध्यबिंदु को उसकी संगत बारंबारता $(f)$ से गुणा किया जाता है; सभी $f x$ के मान (यहाँ $\mathrm{X}$ मध्यबिंदु हैं) को जोड़कर $\sum f x$ प्राप्त किया जाता है जिसे अंततः प्रेक्षणों की संख्या अर्थात् $\mathrm{N}$ से विभाजित किया जाता है। इसलिए, निम्न सूत्र का उपयोग कर माध्य गणना किया जाता है :
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
जहाँ :
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { माध्य } \ f & =\text { बारंबारताएँ } \ x & =\text { वर्ग अंतरालों के मध्यबिंदु } \ N & \left.=\text { प्रेक्षणों की संख्या (इसे } \sum f \text{ भी कहा जा सकता है }\right) \end{aligned} $$
उदाहरण 2.2 : टेबल 2.2 में दिए गए डेटा का उपयोग कर फैक्ट्री श्रमिकों की औसत मजदूरी दर की गणना करें:
टेबल 2.2 : फैक्ट्री श्रमिकों की मजदूरी दर
| मजदूरी दर (रु./दिन) | श्रमिकों की संख्या () |
|---|---|
| वर्ग | $\boldsymbol{f}$ |
| $50-70$ | 10 |
| $70-90$ | 20 |
| $90-110$ | 25 |
| $110-130$ | 35 |
| $130-150$ | 9 |
टेबल 2.3 : माध्य की गणना
| वर्ग | आवृत्ति (f) | मध्य- बिंदु $(x)$ | $f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ 20 | $f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
| $70-90$ | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
| $\mathbf{9 0 - 1 1 0}$ | $\mathbf{2 5}$ | $\mathbf{1 0 0}$ | 2,500 | $\mathbf{0}$ | 0 | 0 | 0 |
| $110-130$ | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
| $130-150$ | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
| $\sum f x$ | |||||||
| और | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | 10,160 | 260 | 13 |
जहाँ $\mathrm{N}=\sum f=99$
तालिका 2.3 समूहीकृत आंकड़ों के लिए माध्य की गणना की प्रक्रिया प्रदान करती है। दी गई आवृत्ति बंटन में, निन्यानवे श्रमिकों को मजदूरी दरों के पाँच वर्गों में समूहीकृत किया गया है। इन समूहों के मध्य-बिंदु तीसरे स्तंभ में सूचीबद्ध हैं। माध्य ज्ञात करने के लिए, प्रत्येक मध्य-बिंदु $(\mathrm{X})$ को आवृत्ति $(f)$ से गुणा किया गया है और उनका योग ( $\sum f_{x}$ ) को $N$ से विभाजित किया गया है।
माध्य को दिए गए सूत्र का उपयोग करके इस प्रकार गणना की जा सकती है :
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N} \ & =\frac{10,160}{99} \ & =102.6 \end{aligned} $$
अप्रत्यक्ष विधि
समूहीकृत आंकड़ों के लिए अप्रत्यक्ष विधि के लिए निम्नलिखित सूत्र का उपयोग किया जा सकता है। इस सूत्र के सिद्धांत असमूहीकृत आंकड़ों के लिए दी गई अप्रत्यक्ष विधि के समान हैं। इसे इस प्रकार व्यक्त किया गया है
$$ \bar{x}=A \pm \frac{\sum f d}{N} $$
जहाँ,
= अनुमानित माध्य वर्ग का मध्यबिंदु
(तालिका 2.3 में अनुमानित माध्य वर्ग 90 – 110 है जिसका मध्यबिंदु 100 है।)
f = बारंबारता
d = अनुमानित माध्य वर्ग (A) से विचलन
N = प्रकरणों का योग या ∑ f
i = अंतराल चौड़ाई (इस स्थिति में यह 20 है)
तालिका 2.3 से प्रत्यक्ष विधि द्वारा माध्य निकालने में शामिल निम्नलिखित चरणों का अनुमान लगाया जा सकता है :
(i) माध्य को 90 - 110 वर्ग में अनुमानित किया गया है। इसे श्रृंखला के मध्य के निकटतम वर्ग से अनुमानित करना अनुपयुक्त होता है। यह प्रक्रिया गणना की मात्रा को न्यूनतम करती है। तालिका 2.3 में, A (अनुमानित माध्य) 100 है, वर्ग $90-110$ का मध्यबिंदु।
(ii) पाँचवाँ स्तंभ (u) प्रत्येक वर्ग के मध्यबिंदु का अनुमानित माध्य वर्ग $(90-110)$ के मध्यबिंदु से विचलन सूचीबद्ध करता है।
(iii) छठा स्तंभ प्रत्येक $f$ को उसके संगत $d$ से गुणा करके $f d$ देने वाले गुणित मान दिखाता है। फिर, $f d$ के धनात्मक और ऋणात्मक मानों को अलग-अलग जोड़ा जाता है और उनका निरपेक अंतर निकाला जाता है ( $\sum f d$ )। ध्यान दें कि $\sum f d$ से जुड़ा चिह्न सूत्र में A के बाद दिए गए $\pm$ में प्रतिस्थापित किया जाता है।
अप्रत्यक्ष विधि द्वारा माध्य इस प्रकार निकाला जाता है :
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A} \pm \frac{\sum \boldsymbol{f} \boldsymbol{d}}{\boldsymbol{N}} \ & =100+\frac{260}{99} \ & =100+2.6 \ & =102.6 \end{aligned} $$
नोट : अप्रत्यक्ष माध्य विधि समान और असमान वर्ग अंतराल दोनों के लिए कार्य करेगी।
माध्यिका
माध्यिका एक स्थितीय औसत है। इसे इस प्रकार परिभाषित किया जा सकता है “एक ऐसा बिंदु जिस वितरण में इसके दोनों ओर समान संख्या में प्रेक्षण हों”। माध्यिका को प्रतीक $\mathrm{M}$ द्वारा व्यक्त किया जाता है।
असमूहीकृत आँकड़ों के लिए माध्यिका की गणना
जब अंक असमूहीकृत होते हैं, तो इन्हें आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। माध्यिका को व्यवस्थित श्रृंखला में केंद्रीय प्रेक्षण या मान को ढूँढकर निकाला जा सकता है। केंद्रीय मान को आरोही या अवरोही क्रम में व्यवस्थित श्रृंखला के किसी भी सिरे से खोजा जा सकता है। माध्यिका की गणना के लिए निम्नलिखित समीकरण का प्रयोग किया जाता है:
$\left(\frac{\mathrm{N}+1}{2}\right)$वाँ पद
उदाहरण 2.3: निम्नलिखित का प्रयोग कर हिमालय के कुछ भागों में पर्वत शिखरों की माध्यिका ऊँचाई की गणना करें:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.
गणना : माध्यिका (M) को निम्नलिखित चरणों में गणना किया जा सकता है :
(i) दिए गए आँकड़ों को आरोही या अवरोही क्रम में व्यवस्थित करें।
(ii) श्रृंखला में केंद्रीय मान को खोजने के लिए सूत्र लगाएँ। इस प्रकार :
( $\frac{\mathrm{N}+1}{2}$ )वाँ पद
$=\left(\frac{7+1}{2}\right)$वाँ पद
$=\left(\frac{8}{2}\right)$वाँ पद
व्यवस्थित श्रृंखला में 4वाँ पद माध्यिका होगा।
आँकड़ों को आरोही क्रम में व्यवस्थित करने पर -
7,$817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848$
अतः,
4वाँ पद
$$ \mathrm{M}=8,172 \mathrm{~m} $$
समूहीकृत आँकड़ों के लिए माध्यिका की गणना
जब अंक समूहबद्ध होते हैं, तो हमें उस बिंदु का मान निकालना होता है जहाँ एक व्यक्ति या प्रेक्षण समूह में केंद्रतः स्थित होता है। इसे निम्न सूत्र का प्रयोग करके परिकलित किया जा सकता है :
$$ M=\boldsymbol{l}+\frac{\boldsymbol{i}}{\boldsymbol{f}}\left(\frac{\boldsymbol{N}}{2}-\boldsymbol{c}\right) $$
जहाँ,
M = समूहबद्ध आँकड़ों की माध्यिका
l = माध्यिका वर्ग की निचली सीमा
i = अंतराल
f = माध्यिका वर्ग की बारंबारता
N = कुल बारंबारताओं या प्रेक्षणों की संख्या
c = माध्यिका-पूर्व वर्ग की संचयी बारंबारता।
उदाहरण 2.4 : निम्न बंटन के लिए माध्यिका की गणना कीजिए :
| class | $50-60$ | $60-70$ | $70-80$ | $80-90$ | $90-100$ | $100-110$ |
|---|---|---|---|---|---|---|
| $\boldsymbol{f}$ | 3 | 7 | 11 | 16 | 8 | 5 |
तालिका 2.4 : माध्यिका की गणना
| वर्ग | बारंबारता (f) | संचयी बारंबारता (iv) | माध्यिका वर्ग की गणना |
|---|---|---|---|
| $50-60$ $60-70$ $70-80$ $\mathbf{8 0 - 9 0}$ (माध्यिका समूह) $90-100$ $100-110$ | 3 7 11 $16 \boldsymbol{f}$ 8 5 5 | 3 10 $21 c$ $\mathbf{3 7}$ 45 50 | $M=\frac{N}{2}$ $=\frac{50}{4}$ |
| $\sum_{\mathbf{N}=\mathbf{5 0}} f$ या |
माध्यिका को नीचे दिए गए चरणों में परिकलित किया जाता है :
(i) बारंबारता तालिका तालिका 2.4 के अनुसार तैयार की जाती है।
(ii) संचयी बारंबारताएँ (F) प्राप्त की जाती हैं क्रमागत अंतराल समूहों की प्रत्येक सामान्य बारंबारता को जोड़कर, जैसा कि तालिका 2.4 के स्तंभ 3 में दिया गया है।
(iii) माध्यिका संख्या $\frac{N}{2}$ द्वारा प्राप्त की जाती है, अर्थात् इस स्थिति में $\frac{50}{2}=\mathbf{2 5}$, जैसा कि तालिका 2.4 के स्तंभ 4 में दिखाया गया है।
(iv) संचयी बारंबारता बंटन (F) में ऊपर से नीचे की ओर तब तक गिनती करें जब तक $\frac{N}{2}$ से अगली बड़ी मान वाली संख्या न मिल जाए। इस उदाहरण में, $\frac{N}{2}$ का मान 25 है, जो 40-44 के वर्ग अंतराल में आता है जिसकी संचयी बारंबारता 37 है, इस प्रकार प्री-माध्यिका वर्ग की संचयी बारंबारता 21 है और माध्यिका वर्ग की वास्तविक बारंबारता 16 है।
(v) फिर माध्यिका की गणना चरण 4 में निर्धारित सभी मानों को निम्न समीकरण में प्रतिस्थापित करके की जाती है :
$$ M=l+\frac{i}{f}(m-c) $$
$$ \begin{aligned} & =80+\frac{10}{16}(25-21) \ & =80+\frac{5}{8} \times 4 \ & =80+\frac{5}{2} \ & =80+2.5 \ M & =82.5 \end{aligned} $$
बहुलक
वह मान जो किसी बंटन में सबसे अधिक बार आता है, बहुलक कहलाता है। इसे $\mathbf{Z}$ या $\mathbf{M}_{\mathbf{0}}$ से प्रदर्शित किया जाता है। बहुलक एक ऐसा माप है जिसकी तुलना में माध्य और माध्यिका अधिक व्यापक रूप से प्रयुक्त होते हैं। किसी दिए गए आँकड़ा समुच्चय में एक से अधिक प्रकार के बहुलक हो सकते हैं।
असमूहीकृत आँकड़ों के लिए बहुलक की गणना
जब दिए गए आँकड़ा समुच्चय से बहुलक की गणना की जाती है, तो सभी मापों को पहले आरोही या अवरोही क्रम में व्यवस्थित किया जाता है। यह सबसे अधिक बार आने वाले माप की पहचान करने में सहायक होता है।
उदाहरण 2.5 : दस विद्यार्थियों की भूगोल की निम्नलिखित परीक्षा अंकों के लिए बहुलक (मोड) की गणना कीजिए :
$$ 61,10,88,37,61,72,55,61,46,22 $$
गणना : बहुलक ज्ञात करने के लिए मापों को आरोही क्रम में इस प्रकार व्यवस्थित किया जाता है:
$10,22,37,46,55, \mathbf{6 1}, \mathbf{6 1}, \mathbf{6 1}, 72,88$.
श्रेणी में तीन बार आने वाला माप 61 दिए गए डेटासेट का बहुलक है। चूँकि डेटासेट में कोई अन्य संख्या इस तरह नहीं आती, इसलिए यह एकल-बहुलक (unimodal) होने का गुण रखता है।
उदाहरण 2.6 : दस अन्य विद्यार्थियों के एक भिन्न नमूने के लिए बहुलक की गणना कीजिए, जिनके अंक हैं:
$82,11,57,82,08,11,82,95,41,11$.
गणना : दिए गए मापों को आरोही क्रम में इस प्रकार व्यवस्थित कीजिए :
$$ 08,11,11,11,41,57,82,82,82,95 $$
इसमें सरलता से देखा जा सकता है कि 11 और 82 दोनों माप वितरण में तीन-तीन बार आ रहे हैं। अतः डेटासेट द्वि-बहुलक (bimodal) प्रतीत होता है। यदि तीन मान समान और सर्वाधिक बार आएँ तो श्रेणी त्रि-बहुलक (trimodal) होती है। इसी प्रकार, श्रेणी में अनेक मापों की बार-बार आवृत्ति उसे बहु-बहुलक (multimodal) बनाती है। यद्यपि, जब श्रेणी में कोई भी माप दोहराया न जाए तो उसे बिना बहुलक (without mode) कहा जाता है।
माध्य, माध्यिका और बहुलक की तुलना
तीनों केंद्रीय प्रवृत्ति के मापों की तुलना सामान्य बंटन वक्र की सहायता से आसानी से की जा सकती है। सामान्य वक्र एक आवृत्ति बंटन को दर्शाता है जिसमें अंकों का ग्राफ अक्सर घंटाकार वक्र कहलाता है। अनेक मानवीय लक्षण जैसे बुद्धि, व्यक्तित्व अंक और विद्यार्थियों की उपलब्धियाँ सामान्य बंटन रखती हैं। घंटाकार वक्र इस रूप में दिखता है क्योंकि यह सममित होता है। दूसरे शब्दों में, अधिकांश प्रेक्षण मध्य मान के आसपास होते हैं। जैसे-जैसे चरम मानों की ओर बढ़ा जाता है, प्रेक्षणों की संख्या सममित रूप से घटती है। एक सामान्य वक्र में डेटा की विचरणशीलता अधिक या कम हो सकती है। सामान्य बंटन वक्र का एक उदाहरण चित्र 2.3 में दिया गया है।

चित्र 2.3 : सामान्य बंटन वक्र
सामान्य बंटन का एक महत्वपूर्ण लक्षण है। माध्य, माध्यिका और बहुलक एक ही अंक होते हैं (चित्र 2.3 में 100 अंक) क्योंकि सामान्य बंटन सममित होता है। सबसे अधिक आवृत्ति वाला अंक बंटन के मध्य में आता है और ठीक आधे अंक मध्य से ऊपर तथा आधे अंक मध्य से नीचे आते हैं। अधिकांश अंक बंटन के मध्य या माध्य के आसपास आते हैं। बहुत अधिक और बहुत कम अंक बार-बार नहीं आते और इसलिए इन्हें दुर्लभ माना जाता है।
यदि डेटा किसी प्रकार से विषम या विकृत है, तो माध्य, माध्यिका और बहुलक संपातित नहीं होंगे और विषम डेटा के प्रभाव पर विचार करने की आवश्यकता है (चित्र 2.4 और 2.5)।

चित्र 2.4 : धनात्मक विषमता

चित्र 2.5 : ऋणात्मक विषमता
अभ्यास
1. नीचे दिए गए चार विकल्पों में से सही उत्तर चुनें:
(i) केंद्रीय प्रवृत्ति का वह माप जो चरम मानों से प्रभावित नहीं होता:
(a) माध्य
(b) माध्य और बहुलक
(c) बहुलक
(d) माध्यिका
(ii) केंद्रीय प्रवृत्ति का वह माप जो किसी भी बंटन के उभार के साथ सदैव संपातित होता है:
(a) माध्यिका
(b) माध्यिका और बहुलक
(c) माध्य
(d) बहुलक
2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दें:
(i) माध्य को परिभाषित कीजिए।
(ii) बहुलक के प्रयोग के क्या लाभ हैं?
3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दें:
(i) सामान्य बंटन और विषम बंटन में माध्य, माध्यिका और बहुलक के सापेक्ष स्थानों की व्याख्या चित्रों की सहायता से कीजिए।
(ii) माध्य, माध्यिका और बहुलक की प्रयोज्यता पर टिप्पणी कीजिए (संकेत: उनके गुणों और दोषों से)।
गतिविधि
1. भौगोलिक विश्लेषण पर लागू एक काल्पनिक उदाहरण लीजिए और असमूहीकृत आंकड़ों से माध्य निकालने की प्रत्यक्ष और अप्रत्यक्ष विधियों की व्याख्या कीजिए।