अध्याय 06 सहसंबंध

24 min read

1. परिचय पिछले अध्यायों में आपने सीखा है कि भारी मात्रा में आँकड़ों और समान चरों में होने वाले परिवर्तनों से सारांश माप कैसे बनाए जाते हैं। अब आप सीखेंगे...

1. परिचय

पिछले अध्यायों में आपने सीखा है कि भारी मात्रा में आँकड़ों और समान चरों में होने वाले परिवर्तनों से सारांश माप कैसे बनाए जाते हैं। अब आप सीखेंगे कि दो चरों के बीच संबंध की जाँच कैसे की जाती है।
जैसे-जैसे गर्मी बढ़ती है, पहाड़ी स्थलों पर अधिक से अधिक पर्यटक आते हैं। आइसक्रीम की बिक्री तेज हो जाती है। इस प्रकार तापमान का संबंध पर्यटकों की संख्या और आइसक्रीम की बिक्री से है। इसी तरह, जब आपके स्थानीय मंडी में टमाटर की आपूर्ति बढ़ती है, तो उसका मूल्य गिर जाता है। जब स्थानीय फसल बाजार में आने लगती है, टमाटर का मूल्य ₹40 प्रति किग्रा से ₹4 प्रति किग्रा या उससे भी कम हो जाता है। इस प्रकार आपूर्ति का संबंध मूल्य से है। सहसंबंध विश्लेषण (correlation analysis) ऐसे संबंधों को व्यवस्थित रूप से जाँचने का एक साधन है। यह ऐसे प्रश्नों से संबंधित है:

  • क्या दो चरों के बीच कोई संबंध है?
  • क्या एक चर का मान बदलने पर दूसरे का मान भी बदलता है?
  • क्या दोनों चर एक ही दिशा में चलते हैं?
  • संबंध कितना मजबूत है?

2. संबंध के प्रकार

आइए विभिन्न प्रकार के संबंधों को देखें। किसी वस्तु की मांग में आंदोलन और उस वस्तु की कीमत के बीच का संबंध मांग के सिद्धांत का एक अभिन्न हिस्सा है, जिसे आप कक्षा बारहवीं में पढ़ेंगे। कृषि उत्पादकता का कम होना कम वर्षा से संबंधित है। संबंध के ऐसे उदाहरणों को कारण और प्रभाव की व्याख्या दी जा सकती है। अन्य केवल संयोग हो सकते हैं। किसी अभयारण्य में प्रवासी पक्षियों के आगमन और स्थानीय क्षेत्र में जन्म दर के बीच के संबंध को कोई कारण और प्रभाव की व्याख्या नहीं दी जा सकती। संबंध केवल संयोग हैं। जूते के आकार और आपकी जेब में पैसों के बीच का संबंध एक और ऐसा ही उदाहरण है। यदि संबंध मौजूद भी हैं, तो उन्हें समझाना कठिन है।

एक अन्य उदाहरण में, दो चरों पर किसी तीसरे चर का प्रभाव उन दोनों चरों के बीच संबंध उत्पन्न कर सकता है। आइसक्रीम की तेज बिक्री डूबने से होने वाली मौतों की अधिक संख्या से संबंधित हो सकती है। पीड़ित आइसक्रीम खाने से नहीं डूबते। तापमान बढ़ने से आइसक्रीम की तेज बिक्री होती है। इसके अतिरिक्त, बड़ी संख्या में लोग गर्मी से बचने के लिए तैराकी पूल जाने लगते हैं। इससे डूबने से होने वाली मौतों की संख्या बढ़ सकती है। इस प्रकार, आइसक्रीम की बिक्री और डूबने से होने वाली मौतों के बीच उच्च सहसंबंध के पीछे तापमान है।

सहसंबंध क्या मापता है?

सहसंबंध अध्ययन करता है और चरों के बीच संबंध की दिशा और तीव्रता को मापता है। सहसंबंध सह-परिवर्तन को मापता है, कारण-कार्य संबंध नहीं। सहसंबंध को कभी भी कारण और प्रभाव संबंध का तात्पर्य मानकर व्याख्यायित नहीं करना चाहिए। दो चरों $\mathrm{X}$ और Y के बीच सहसंबंध की उपस्थिति का सरल अर्थ यह है कि जब एक चर का मान एक दिशा में बदलता है, तो दूसरे चर का मान या तो उसी दिशा में (अर्थात् धनात्मक परिवर्तन) या विपरीत दिशा में (अर्थात् ऋणात्मक परिवर्तन) परिवर्तित होता है, परंतु एक निश्चित तरीके से। सरलता के लिए हम यहाँ यह मान लेते हैं कि सहसंबंध, यदि विद्यमान है, तो रैखिक है, अर्थात् दोनों चरों की सापेक्ष गति को ग्राफ पेपर पर एक सीधी रेखा खींचकर दर्शाया जा सकता है।

सहसंबंध के प्रकार

सहसंबंध को आमतौर पर ऋणात्मक और धनात्मक सहसंबंध में वर्गीकृत किया जाता है। सहसंबंध को धनात्मक कहा जाता है जब चर एक ही दिशा में साथ-साथ चलते हैं। जब आय बढ़ती है, खपत भी बढ़ती है। जब आय घटती है, खपत भी घटती है। आइसक्रीम की बिक्री और तापमान एक ही दिशा में चलते हैं। सहसंबंध ऋणात्मक होता है जब वे विपरीत दिशाओं में चलते हैं। जब सेब की कीमतें गिरती हैं तो इसकी मांग बढ़ती है। जब कीमतें बढ़ती हैं तो इसकी मांग घटती है। जब आप अध्ययन में अधिक समय बिताते हैं, तो आपके फेल होने की संभावना घटती है। जब आप अपनी पढ़ाई में कम घंटे बिताते हैं, तो कम अंक/ग्रेड प्राप्त करने की संभावना बढ़ती है। ये ऋणात्मक सहसंबंध के उदाहरण हैं। चर विपरीत दिशा में चलते हैं।

3. सहसंबंध को मापने की तकनीकें

सहसंबंध का अध्ययन करने के लिए प्रयुक्त तीन महत्वपूर्ण उपकरण हैं: बिखरा आरेख, कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन का क्रम सहसंबंध।
बिखरा आरेख दृष्टिगत रूप से संबंध की प्रकृति को प्रस्तुत करता है बिना किसी विशिष्ट संख्यात्मक मान के। दो चरों के बीच रैखिक संबंध का संख्यात्मक माप कार्ल पियर्सन का सहसंबंध गुणांक देता है। एक संबंध को रैखिक कहा जाता है यदि उसे सीधी रेखा द्वारा दर्शाया जा सके। स्पीयरमैन का सहसंबंध गुणांक व्यक्तिगत वस्तुओं को उनके गुणों के अनुसार दिए गए क्रमों के बीच रैखिक संबंध को मापता है। गुण वे चर होते हैं जिन्हें संख्यात्मक रूप से मापा नहीं जा सकता, जैसे लोगों की बुद्धिमत्ता, शारीरिक सौंदर्य, ईमानदारी आदि।

बिखरा आरेख

बिखरा आरेख संबंध के स्वरूप की दृष्टिगत जांच के लिए एक उपयोगी तकनीक है, बिना किसी संख्यात्मक मान की गणना किए। इस तकनीक में दो चरों के मानों को ग्राफ पेपर पर बिंदुओं के रूप में प्लॉट किया जाता है। बिखरे आरेख से संबंध की प्रकृति का काफी अच्छा अनुमान लगाया जा सकता है। बिखरे आरेख में बिखरे बिंदुओं की निकटता की डिग्री और उनकी समग्र दिशा हमें संबंध की जांच करने में सक्षम बनाती है। यदि सभी बिंदु एक रेखा पर स्थित हों, तो सहसंबंध पूर्ण होता है और इसे एकता में कहा जाता है। यदि बिखरे बिंदु रेखा के चारों ओर व्यापक रूप से फैले हों, तो सहसंबंध कम होता है। यदि बिखरे बिंदु किसी रेखा के निकट या रेखा पर स्थित हों, तो सहसंबंध को रैखिक कहा जाता है।

आकृति 6.1 से आकृति 6.5 तक फैले बिखरे आरेख हमें दो चरों के बीच संबंध की एक झलक देते हैं। आकृति 6.1 एक ऊपर की ओर उठती रेखा के आसपास बिखरे बिंदु दिखाती है, जिससे यह संकेत मिलता है कि चर एक ही दिशा में गतिशील हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ भी बढ़ता है। यह धनात्मक सहसंबंध है। आकृति 6.2 में बिंदु एक नीचे की ओर झुकती रेखा के आसपास बिखरे पाए जाते हैं। इस बार चर विपरीत दिशा में चलते हैं। जब $\mathrm{X}$ बढ़ता है तो $\mathrm{Y}$ घटता है और इसका विपरीत भी सच है। यह ऋणात्मक सहसंबंध है। आकृति 6.3 में न तो ऊपर उठती और न ही नीचे झुकती रेखा है जिसके आसपास बिंदु बिखरे हों। यह सहसंबंध के अभाव का उदाहरण है। आकृति 6.4 और आकृति 6.5 में बिंदु अब ऊपर उठती या नीचे गिरती रेखा के आसपास नहीं बिखरे हैं, बल्कि बिंदु स्वयं रेखाओं पर स्थित हैं। इन्हें क्रमशः पूर्ण धनात्मक सहसंबंध और पूर्ण ऋणात्मक सहसंबंध कहा जाता है।

गतिविधि

  • कक्षा $X$ के अपने कक्ष के विद्यार्थियों की ऊँचाई, वजन और किन्हीं दो विषयों में प्राप्त अंकों का आँकड़ा एकत्र करें। इन चरों में से दो-दो को लेकर बिखरा आरेख बनाइए। आपको किस प्रकार का संबंध दिखाई देता है?

बिखरे आरेख का सावधानीपूर्वक अवलोकन संबंध की प्रकृति और तीव्रता का अनुमान देता है।

कार्ल पियर्सन का सहसंबंध गुणांक

इसे उत्पाद आघूर्ण सहसंबंध गुणांक या सरल सहसंबंध गुणांक भी कहा जाता है। यह दो चरों $\mathrm{X}$ और $Y$ के बीच रैखिक संबंध की डिग्री का एक सटीक संख्यात्मक मान देता है।

यह ध्यान देना महत्वपूर्ण है कि कार्ल पियर्सन का सहसंबंध गुणांक तभी प्रयोग किया जाना चाहिए जब चरों के बीच एक रैखिक संबंध हो। जब $\mathrm{X}$ और $\mathrm{Y}$ के बीच एक अरैखिक संबंध होता है, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना करना भ्रामक हो सकता है। इस प्रकार, यदि सच्चा संबंध रैखिक प्रकार का है जैसा कि आकृतियों 6.1, $6.2,6.4$ और 6.5 में दिखाए गए बिखर आरेखों द्वारा प्रदर्शित किया गया है, तो कार्ल पियर्सन का सहसंबंध गुणांक गणना किया जाना चाहिए और यह हमें चरों के बीच संबंध की दिशा और तीव्रता बताएगा। लेकिन यदि सच्चा संबंध आकृतियों 6.6 या 6.7 में दिखाए गए बिखर आरेखों के प्रकार का है, तो इसका अर्थ है कि $\mathrm{X}$ और $\mathrm{Y}$ के बीच एक अरैखिक संबंध है और हमें कार्ल पियर्सन का सहसंबंध गुणांक प्रयोग करने का प्रयास नहीं करना चाहिए।

इसलिए, कार्ल पियर्सन का सहसंबंध गुणांक गणना करने से पहले चरों के बीच संबंध के बिखर आरेख की जांच करना उचित है।

मान लीजिए $X _{1}, X _{2}, \ldots, X _{N}$ क्रमशः $X$ के $N$ मान हैं और $\mathrm{Y} _{1}, \mathrm{Y} _{2}, \ldots, \mathrm{Y} _{\mathrm{N}}$ क्रमशः Y के संगत मान हैं। आगे की प्रस्तुतियों में सरलता के लिए इकाई को दर्शाने वाले उपसर्ग हटा दिए गए हैं। $\mathrm{X}$ और $\mathrm{Y}$ के समांतर माध्य इस प्रकार परिभाषित हैं

$$ \overline{\mathrm{X}}=\frac{\sum \mathrm{X}}{\mathrm{N}} ; \quad \overline{\mathrm{Y}}=\frac{\sum \mathrm{Y}}{\mathrm{N}} $$

और उनके प्रसरण इस प्रकार हैं

$$ \sigma^{2} x=\frac{\sum(X-\bar{X})^{2}}{N}=\frac{\sum X^{2}}{N}-\bar{X}^{2} $$

और $$\quad \sigma^{2} \mathrm{y}=\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}=\frac{\sum \mathrm{Y}^{2}}{\mathrm{~N}}-\overline{\mathrm{Y}}^{2}$$

$\mathrm{X}$ और $\mathrm{Y}$ के मानक विचलन, क्रमशः, उनके प्रसरण के धनात्मक वर्गमूल होते हैं। $\mathrm{X}$ और $\mathrm{Y}$ का सहप्रसरण इस प्रकार परिभाषित है

$\operatorname{Cov}(\mathrm{X}, \mathrm{Y})=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\mathrm{N}}=\frac{\sum \mathrm{xy}}{\mathrm{N}}$

जहाँ $\mathrm{x}=\mathrm{X}-\overline{\mathrm{X}}$ और $\mathrm{y}=\mathrm{Y}-\overline{\mathrm{Y}}$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के $i^{\text {th }}$ मानों के उनके माध्य मानों से विचलन हैं।

$\mathrm{X}$ और $\mathrm{Y}$ के बीच सहप्रसरण का चिह्न सहसंबंध गुणांक के चिह्न को निर्धारित करता है। मानक विचलन सदैव धनात्मक होते हैं। यदि सहप्रसरण शून्य हो, तो सहसंबंध गुणांक सदैव शून्य होता है। गुणन क्षण सहसंबंध या कार्ल पियर्सन का सहसंबंध माप इस प्रकार दिया गया है

$$ \begin{equation*} \mathrm{r}={ }^{\Sigma \mathrm{xy}} / N \sigma _{\mathrm{x}} \sigma _{\mathrm{y}} \tag{1} \end{equation*} $$

या: $$ \begin{equation*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\Sigma(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\Sigma(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2} \end{equation*} $$

या:
$$ \begin{equation*} r=\frac{\frac{\sum X Y-\left(\sum X\right)\left(\sum Y\right)}{N}}{\sqrt{\sum X^{2}-\frac{\left(\sum X\right)^{2}}{N}} \sqrt{\sum Y^{2}-\frac{\left(\sum Y\right)^{2}}{N}}}\tag{3} \end{equation*} $$

या:
$$ \begin{equation*} r=\frac{N \sum XY-(\sum X)(\sum Y)}{\sqrt{N \sum X^2-(\sum X)^2} \cdot \sqrt{N \sum Y^2-(\sum Y)^2}}\tag{4} \end{equation*} $$

सहसंबंध गुणांक के गुण

आइए अब सहसंबंध गुणांक के गुणों पर चर्चा करें

  • $r$ की कोई इकाई नहीं होती। यह एक शुद्ध संख्या है। इसका अर्थ है कि मापन की इकाइयाँ $r$ का हिस्सा नहीं होतीं। उदाहरण के लिए, फुट में ऊँचाई और किलोग्राम में वजन के बीच $r$ मान लीजिए 0.7 हो सकता है।
  • $r$ का ऋणात्मक मान एक व्युत्क्रम संबंध को दर्शाता है। एक चर में परिवर्तन दूसरे चर में विपरीत दिशा में परिवर्तन के साथ जुड़ा होता है। जब किसी वस्तु की कीमत बढ़ती है, तो उसकी मांग घट जाती है। जब ब्याज दर बढ़ती है, तो फंड की मांग भी घट जाती है। ऐसा इसलिए है क्योंकि अब फंड महँगे हो गए हैं।
  • यदि $r$ धनात्मक है तो दोनों चर एक ही दिशा में चलते हैं। जब चाय के विकल्प कॉफी की कीमत बढ़ती है, तो चाय की मांग भी बढ़ जाती है। सिंचाई की सुविधाओं में सुधार अधिक उपज के साथ जुड़ा होता है। जब तापमान बढ़ता है, तो आइसक्रीम की बिक्री तेज हो जाती है।
  • सहसंबंध गुणांक का मान ऋण एक और धन एक के बीच होता है, $-1 \leq r \leq 1$। यदि किसी व्यायाम में $r$ का मान इस सीमा से बाहर हो तो यह गणना में त्रुटि का संकेत है।

  • $r$ का परिमाण मूल बदलाव और स्केल बदलाव से अप्रभावित रहता है। दो चर $\mathrm{X}$ और $\mathrm{Y}$ लेते हुए दो नए चर परिभाषित करते हैं।

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $C$ क्रमशः $\mathrm{X}$ और $\mathrm{Y}$ के मानित माध्य हैं। $\mathrm{B}$ और $\mathrm{D}$ सामान्य गुणक हैं और समान चिह्न वाले हैं। तब

$r _{x y}=r _{u v}$

यह गुणधर्म सहसंबंध गुणांक को अत्यंत सरलीकृत तरीके से गणना करने में प्रयुक्त होता है, जैसे कि पद विचलन विधि में।

  • यदि $r=0$ हो तो दो चर असहसंबद्ध हैं। उनके बीच कोई रैखिक संबंध नहीं है। हालाँकि अन्य प्रकार के संबंध हो सकते हैं।

  • यदि $r=1$ या $r=-1$ हो तो सहसंबंध पूर्ण होता है और सटीक रैखिक संबंध होता है।

  • $r$ का उच्च मान प्रबल रैखिक संबंध को दर्शाता है। इसका मान उच्च कहा जाता है जब यह +1 या -1 के निकट होता है।

  • $r$ का निम्न मान (शून्य के निकट) दुर्बल रैखिक संबंध को दर्शाता है। परंतु कोई अरैखिक संबंध हो सकता है।

जैसा कि आपने अध्याय 1 में पढ़ा है, सांख्यिकीय विधियां सामान्य बुद्धि का विकल्प नहीं हैं। यहाँ एक और उदाहरण है, जो सहसंबंध की गणना और व्याख्या करने से पहले डेटा को ठीक से समझने की आवश्यकता को रेखांकित करता है। कुछ गाँवों में एक महामारी फैलती है और सरकार प्रभावित गाँवों में डॉक्टरों की एक टीम भेजती है। गाँवों में भेजे गए डॉक्टरों की संख्या और मौतों की संख्या के बीच सहसंबंध सकारात्मक पाया गया है। सामान्यतः, डॉक्टरों द्वारा दी जाने वाली स्वास्थ्य सेवाओं से मौतों की संख्या में कमी आने की अपेक्षा होती है, जो एक ऋणात्मक सहसंबंध दिखाती है। यह अन्य कारणों से हुआ। डेटा एक विशिष्ट समय अवधि से संबंधित है। रिपोर्ट की गई कई मौतें टर्मिनल केस हो सकती हैं जहाँ डॉक्टर कुछ नहीं कर सकते थे। इसके अतिरिक्त, डॉक्टरों की उपस्थिति का लाभ कुछ समय बाद ही दिखाई देता है। यह भी संभव है कि रिपोर्ट की गई मौतें महामारी के कारण न हों। एक सुनामी अचानक राज्य में आती है और मृत्यु दर बढ़ जाती है।

आइए $r$ की गणना को किसानों की स्कूली शिक्षा के वर्षों और प्रति एकड़ वार्षिक उपज के बीच संबंध की जाँच करके दिखाएं।

उदाहरण 1

किसानों की स्कूली शिक्षा के वर्षों की संख्यावार्षिक उपज प्रति एकड़ ‘Ooo (रु) में
04
24
46
610
810
108
127

सूत्र 1 को $\sum \mathrm{Xy}, \sigma _{\mathrm{x}}, \sigma _{\mathrm{y}}$ का मान चाहिए

तालिका 6.1 से हमें मिलता है,

$$ \begin{aligned} & \sum \mathrm{xy}=42, \\ & \sigma _{\mathrm{x}}=\sqrt{\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{112}{7}}, \\ & \sigma _{\mathrm{y}}=\sqrt{\frac{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}{\mathrm{~N}}}=\sqrt{\frac{38}{7}} \end{aligned} $$

इन मानों को सूत्र (1) में रखने पर

$$ \mathrm{r}=\frac{42}{7 \sqrt{\frac{112}{7}} \sqrt{\frac{38}{7}}}=0.644 $$

इसी मान को सूत्र (2) से भी प्राप्त किया जा सकता है।

$$ \begin{gather*} \mathrm{r}=\frac{\sum(\mathrm{X}-\overline{\mathrm{X}})(\mathrm{Y}-\overline{\mathrm{Y}})}{\sqrt{\sum(\mathrm{X}-\overline{\mathrm{X}})^{2}} \sqrt{\sum(\mathrm{Y}-\overline{\mathrm{Y}})^{2}}} \tag{2}\\ \mathrm{r}=\frac{42}{\sqrt{112} \sqrt{38}}=0.644 \end{gather*} $$

इस प्रकार, किसानों की शिक्षा के वर्ष और प्रति एकड़ वार्षिक उपज सकारात्मक रूप से सहसंबद्ध हैं। $r$ का मान भी बड़ा है। इसका तात्पर्य है कि जितने अधिक वर्ष किसान शिक्षा में लगाते हैं, उपज प्रति एकड़ उतनी ही अधिक होगी। यह किसानों की शिक्षा के महत्व को रेखांकित करता है।

सूत्र (3) का उपयोग करने के लिए

TABLE 6.1 किसानों की स्कूली शिक्षा के वर्षों और वार्षिक उपज के बीच r की गणना

शिक्षा के वर्ष (X)$(X-\bar{X})$$(X-\bar{X})^{2}$प्रति एकड़ वार्षिक उपज ‘000 रु में (Y)$(Y-\bar{Y})$$(Y-\bar{Y})^{2}$$(X-\bar{X})(Y-\bar{Y})$
0-6364-3918
2-4164-3912
4-246-112
60010390
82410396
104168114
126367000
$\Sigma X=42$$\sum (X-\overline{\mathrm{X}})^{2}=112$$\Sigma Y=49$$\Sigma(Y-\bar{Y})^{2}=38$$\Sigma(X-\bar{X})(Y-\bar{Y})=42$

$$ \begin{equation*} r=\frac{\sum X Y-\frac{(\Sigma X)\left(\sum Y\right)}{N}}{\sqrt{\Sigma X^{2}-\frac{(\Sigma X)^{2}}{N}} \sqrt{\Sigma \mathrm{Y}^{2}-\frac{(\Sigma Y)^{2}}{N}}}\tag{3} \end{equation*} $$

निम्नलिखित व्यंजकों के मानों की गणना करनी होगी अर्थात्

$\Sigma \mathrm{XY}, \Sigma \mathrm{X}^{2}, \Sigma \mathrm{Y}^{2}$.

अब $r$ का मान प्राप्त करने के लिए सूत्र (3) लागू करें।

आइए $r$ के विभिन्न मानों की व्याख्या जानें। अंग्रेज़ी और सांख्यिकी में प्राप्त अंकों के बीच सहसंबंध गुणांक मान लीजिए 0.1 है। इसका अर्थ है कि यद्यपि दोनों विषयों में प्राप्त अंक सकारात्मक रूप से सहसंबद्ध हैं, संबंध की ताकत कमजोर है। अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी सांख्यिकी में अपेक्षाकृत कम अंक प्राप्त कर सकते हैं। यदि $r$ का मान मान लीजिए 0.9 होता, तो अंग्रेज़ी में अधिक अंक प्राप्त करने वाले विद्यार्थी अनिवार्य रूप से सांख्यिकी में भी अधिक अंक प्राप्त करते।

एक नकारात्मक सहसंबंध का उदाहरण स्थानीय मंडी में सब्जियों के आगमन और सब्जियों की कीमत के बीच का संबंध है। यदि $r$ -0.9 है, तो स्थानीय मंडी में सब्जी की आपूर्ति के साथ सब्जियों की कीमत कम होगी। यदि यह -0.1 होता, तो बड़ी मात्रा में सब्जी की आपूर्ति के साथ कीमत कम होती, लेकिन उतनी नहीं जितनी कम तब होती जब $r$ -0.9 होता। कीमत में गिरावट की मात्रा $r$ के निरपेक्ष मान पर निर्भर करती है। यदि यह शून्य होता, तो बाजार में बड़ी आपूर्ति के बाद भी कीमत में कोई गिरावट नहीं आती। यह भी एक संभावना है यदि आपूर्ति में वृद्धि को अन्य बाजारों में स्थानांतरित करने वाले एक अच्छे परिवहन नेटवर्क द्वारा संभाल लिया जाता है।

गतिविधि

  • निम्नलिखित सारणी को देखें। वर्तमान मूल्य पर राष्ट्रीय आय की वार्षिक वृद्धि और सकल घरेलू बचत को जीडीपी के प्रतिशत के रूप में के बीच $r$ की गणना करें।

सहसंबंध गुणांक की गणना करने की चरण विचलन विधि।

जब चरों के मान बड़े होते हैं, तो गणना के बोझ को $r$ के एक गुणधर्म का उपयोग करके काफी कम किया जा सकता है। यह है कि $r$ मूल और पैमाने में परिवर्तन से स्वतंत्र होता है। इसे चरण विचलन विधि भी कहा जाता है। इसमें चरों $\mathrm{X}$ और $\mathrm{Y}$ का निम्नलिखित रूप में रूपांतरण शामिल होता है:

TABLE 6.2

वर्षराष्ट्रीय आय की
वार्षिक वृद्धि
GDP के प्रतिशत के
रूप में सकल घरेलू
बचत
1992-931424
1993-941723
1994-951826
1995-961727
1996-971625
1997-981225
1998-991623
1999-001125
2000-01824
2001-021023

स्रोत: आर्थिक सर्वेक्षण, (2004-05) पृ. 8,9

$\mathrm{U}=\frac{\mathrm{X}-\mathrm{A}}{\mathrm{B}} ; \mathrm{V}=\frac{\mathrm{Y}-\mathrm{C}}{\mathrm{D}}$

जहाँ $A$ और $B$ माना गया माध्य हैं, $h$ और $\mathrm{k}$ सामान्य गुणक हैं और समान चिन्ह रखते हैं।

तब $\mathrm{r} _{\mathrm{uv}}=\mathrm{r} _{\mathrm{XY}}$

इसे मूल्य सूचकांक और मुद्रा आपूर्ति के बीच सहसंबंध के विश्लेषण के अभ्यास से चित्रित किया जा सकता है।

उदाहरण 2

मूल्य सूचकांक $(\mathrm{X})$ $ 120 \quad 150 \quad 190 \quad 220 \quad 230$

मुद्रा आपूर्ति रुपये करोड़ में $(\mathrm{Y})$ $\quad 1800 \quad 2000 \quad 2500 \quad 2700 \quad 3000$

सरलीकरण, चरण विचलन विधि का उपयोग करके नीचे चित्रित किया गया है। मान लीजिए $\mathrm{A}=100 ; \mathrm{h}=10 ; \mathrm{B}=1700$ और $\mathrm{k}=100$

रूपांतरित चरों की सारणी इस प्रकार है:

चरण विचलन विधि का उपयोग करके मूल्य सूचकांक और मुद्रा आपूर्ति के बीच $r$ की गणना

सारणी 6.3

$U$$V$
$\left(\frac{\mathrm{x}-100}{10}\right)$$\left(\frac{\mathrm{y}-1700}{100}\right)$$U^{2}$$V^{2}$$U V$
21412
5325915
98816472
1210144100120
1313169169169

$\Sigma \mathrm{U}=41 ; \Sigma \mathrm{U}=35 ; \Sigma \mathrm{U}^{2}=423 ;$ $\Sigma \mathrm{V}^{2}=343 ; \Sigma \mathrm{UV}=378$

इन मानों को सूत्र (3) में प्रतिस्थापित करने पर

$$ \begin{aligned} & \mathrm{r}=\frac{\Sigma \mathrm{UV}-\frac{(\Sigma \mathrm{U})(\Sigma \mathrm{U})}{\mathrm{N}}}{\sqrt{\Sigma \mathrm{U}^{2}-\frac{(\Sigma \mathrm{U})^{2}}{\mathrm{~N}}} \sqrt{\Sigma \mathrm{V}^{2}-\frac{(\Sigma \mathrm{V})^{2}}{\mathrm{~N}}}} …(3) \end{aligned} $$

$$=\frac{378-\frac{41 \times 35}{5}}{\sqrt{423-\frac{(41)^2}{5}}\sqrt{343-\frac{(35)^2}{5}}}$$

$$ \begin{aligned} & =0.98 \end{aligned} $$

मूल्य सूचकांक और मुद्रा आपूर्ति के बीच प्रबल धनात्मक सहसंबंध मौद्रिक नीति की एक महत्वपूर्ण आधारशिला है। जब मुद्रा आपूर्ति बढ़ती है तो मूल्य सूचकांक भी बढ़ता है।

गतिविधि

  • भारत की जनसंख्या और राष्ट्रीय आय से संबंधित आंकड़ों का उपयोग करते हुए, पद विचलन विधि से उनके बीच सहसंबंध की गणना करें।

स्पीयरमैन का रैंक सहसंबंध

स्पीयरमैन का रैंक सहसंबंध ब्रिटिश मनोवैज्ञानिक सी.ई. स्पीयरमैन द्वारा विकसित किया गया था। इसका उपयोग निम्नलिखित परिस्थितियों में किया जाता है:

  1. मान लीजिए हम किसी दूरदराज के गाँव के विद्यार्थियों की लम्बाई और वज़न के बीच सहसंबंध का अनुमान लगाने का प्रयास कर रहे हैं, जहाँ न तो मापने वाली छड़ें हैं और न ही तौलने वाली मशीनें। ऐसी स्थिति में हम लम्बाई या वज़न को माप नहीं सकते, पर हम निश्चित रूप से विद्यार्थियों को वज़न और लम्बाई के अनुसार क्रमांकित कर सकते हैं। इन क्रमांकों का उपयोग करके स्पीयरमैन का क्रम सहसंबंध गुणांक परिकलित किया जा सकता है।

  2. मान लीजिए हम ऐसी चीज़ों से निपट रहे हैं जैसे निष्पक्षता, ईमानदारी या सौंदर्य। इन्हें उसी तरह से मापा नहीं जा सकता जैसे हम आय, वज़न या लम्बाई को मापते हैं। अधिकतम इन चीज़ों को सापेक्ष रूप से मापा जा सकता है, उदाहरण के लिए हम लोगों को सौंदर्य के अनुसार क्रमांकित कर सकते हैं (कुछ लोग तर्क देंगे कि यह भी संभव नहीं है क्योंकि सौंदर्य के मानदंड और मापदंड व्यक्ति से व्यक्ति और संस्कृति से संस्कृति भिन्न हो सकते हैं)। यदि हम चरों के बीच संबंध ज्ञात करना चाहते हैं, जिनमें से कम से कम एक इस प्रकार का है, तो स्पीयरमैन का क्रम सहसंबंध गुणांक प्रयुक्त किया जाता है।

  3. स्पीयरमैन का क्रम सहसंबंध गुणांक कुछ ऐसे मामलों में प्रयोग किया जा सकता है जहाँ संबंध की दिशा स्पष्ट है पर वह रैखिक नहीं है, जैसा कि आकृति 6.6 और 6.7 में दिखाए गए प्रकार के बिखर आरेखों में दिखाई देता है।

  4. स्पीयरमैन का सहसंबंध गुणांक चरम मानों से प्रभावित नहीं होता। इस दृष्टि से यह कार्ल पियर्सन के सहसंबंध गुणांक से बेहतर है। इस प्रकार यदि आँकड़ों में कुछ चरम मान हों, तो स्पीयरमैन का सहसंबंध गुणांक अत्यंत उपयोगी हो सकता है।

रैंक सहसंबंध गुणांक और सरल सहसंबंध गुणांक की व्याख्या समान होती है। इसका सूत्र सरल सहसंबंध गुणांक से व्युत्पन्न किया गया है जहाँ व्यक्तिगत मानों को रैंकों से प्रतिस्थापित किया गया है। ये रैंक सहसंबंध की गणना के लिए प्रयोग किए जाते हैं। यह गुणांक इन इकाइयों को दी गई रैंकों के बीच रैखिक संबंध का माप प्रदान करता है, न कि उनके मानों का। स्पीयरमैन का रैंक सहसंबंध सूत्र है

$$ \begin{equation*} r _{a}=1-\frac{6 \sum D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$

जहाँ $n$ प्रेक्षणों की संख्या है और $\mathrm{D}$ एक चर को दी गई रैंकों से दूसरे चर को दी गई रैंकों का विचलन है।

सरल सहसंबंध गुणांक के सभी गुण यहाँ लागू होते हैं। पीयरसन सहसंबंध गुणांक की तरह यह 1 और -1 के बीच होता है। हालांकि, आमतौर पर यह साधारण विधि जितना सटीक नहीं होता है। यह इस तथ्य के कारण है कि डेटा से संबंधित सभी जानकारी का उपयोग नहीं किया जाता है।

प्रथम अंतर क्रमागत मानों का अंतर होता है। परिमाण के क्रम में व्यवस्थित श्रृंखला में वस्तुओं के मानों के प्रथम अंतर लगभग कभी स्थिर नहीं होते हैं। आमतौर पर डेटा केंद्रीय मानों के आसपास समूहित होते हैं जहाँ अनुक्रम के मध्य में छोटे अंतर होते हैं।

यदि प्रथम अंतर स्थिर होते, तो $r$ और $r _{\mathrm{k}}$ समान परिणाम देते। सामान्यतः $r _{\mathrm{k}$ छोटा होता है या $r$ के बराबर होता है।

रैंक सहसंबंध गुणांक की गणना

रैंक सहसंबंध की गणना को तीन परिस्थितियों में दिखाया जाएगा।

  1. रैंक दी गई हैं।
  2. रैंक नहीं दी गई हैं। उन्हें आंकड़ों से निकालना होगा।
  3. रैंक दोहराई गई हैं।

स्थिति 1: जब रैंक दी गई हों

उदाहरण 3

एक सौंदर्य प्रतियोगिता में तीन न्यायाधीश पाँच व्यक्तियों का मूल्यांकन करते हैं। हमें यह पता लगाना है कि न्यायाधीशों का कौन-सा युग्म सौंदर्य की सामान्य धारणा के सर्वाधिक निकट है।

प्रतियोगी:

न्यायाधीश12345
A12345
B24153
C13524

न्यायाधीशों के तीन युग्म हैं, जिनके लिए रैंक सहसंबंध तीन बार गिनना होगा। सूत्र (4) का प्रयोग किया जाएगा।

$$ \begin{equation*} \mathrm{r} _{\mathrm{s}}=1-\frac{6 \Sigma \mathrm{D}^{2}}{\mathrm{n}^{3}-\mathrm{n}} \tag{4} \end{equation*} $$

A और B के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:

$A$$B$$D$$D^{2}$
12-11
24-24
3124
45-11
5324
योग14

इन मानों को सूत्र (4) में रखने पर

$$ \begin{equation*} r _{s}=1-\frac{6 \Sigma D^{2}}{n^{3}-n} \tag{4} \end{equation*} $$

$=1-\frac{6 \times 14}{5^{3}-5}=1-\frac{84}{120}=1-0.7=0.3$

A और $\mathrm{C}$ के बीच रैंक सहसंबंध इस प्रकार गिना जाता है:

$A$$C$$D$$D^{2}$
1100
23-11
35-24
4224
5411
कुल10

इन मानों को सूत्र (4) में रखने पर रैंक सहसंबंध 0.5 है। इसी प्रकार, न्यायाधीशों $\mathrm{B}$ और $\mathrm{C}$ की रैंकिंग के बीच रैंक सहसंबंध 0.9 है। इस प्रकार, न्यायाधीशों $A$ और $C$ की धारणाएं सबसे अधिक निकट हैं। न्यायाधीशों B और C के स्वाद बहुत भिन्न हैं।

स्थिति 2: जब रैंक नहीं दी गई हों

उदाहरण 4

हमें 5 विद्यार्थियों द्वारा अर्थशास्त्र और सांख्यिकी में प्राप्त किए गए अंकों का प्रतिशत दिया गया है। फिर रैंकिंग निकालनी होगी और रैंक सहसंबंध की गणना करनी होगी।

विद्यार्थीसांख्यिकी में
अंक
(X)
अर्थशास्त्र में
अंक
(Y)
A8560
B6048
C5549
D6550
E7555

विद्यार्थीसांख्यिकी में
रैंकिंग
$\left(R _{x}\right)$
अर्थशास्त्र में
रैंकिंग
$\left(R _{\gamma}\right)$
A11
B45
C54
D33
E22

एक बार रैंकिंग पूरी हो जाने पर सूत्र (4) का उपयोग कर रैंक सहसंबंध की गणना की जाती है।

स्थिति 3: जब रैंक दोहराई गई हों और रैंक न दी गई हों

उदाहरण 5

मान $\mathrm{X}$ और $\mathrm{Y}$ निम्न प्रकार से दिए गए हैं

$X$$Y$
120075
115065
100050
990100
80090
78085
76090
75040
73050
70060
62050
60075

रैंक सहसंबंध निकालने के लिए, मानों की रैंक निकाली जाती हैं। दोहराए गए मदों को सामान्य रैंक दी जाती हैं। सामान्य रैंक वह औसत रैंक होता है जो उन मदों को मिलता अगर वे थोड़े-से एक-दूसरे से भिन्न होते। अगली मद को वह रैंक दिया जाएगा जो पहले से निर्धारित रैंक के ठीक बाद आता है।

यहाँ $Y$ का मान 50 है 9वें, 10वें और 11वें स्थान पर। इसलिए तीनों को औसत रैंक यानी 10 दी गई है,

Rank of $X$Rank of $Y$Deviation
in Ranks
$D^{2}$
15.5-4.520.25
27-525.00
310-749.00
4139.00
52.52.56.25
6424.00
72.54.520.25
812-416.00
910-11.00
10824.00
111011.00
125.56.542.25
198.00

जब रैंक दोहराई जाती हैं तो स्पीयरमैन के रैंक सहसंबंध गुणांक का सूत्र इस प्रकार है

$$ \begin{aligned} & \mathrm{r} _{\mathrm{s}}=1- \ \frac{6\left[\Sigma \mathrm{D}^{2}+\frac{\left(\mathrm{m} _{1}^{3}-\mathrm{m} _{1}\right)}{12}+\frac{\left(\mathrm{m} _{2}^{3}-\mathrm{m} _{2}\right)}{12}+\ldots\right]}{n\left(\mathrm{n}^{2}-1\right)} \end{aligned} $$

जहाँ $\mathrm{m} _{1}, \mathrm{~m} _{2}, \ldots$, रैंकों की पुनरावृत्तियों की संख्या हैं और $\frac{\mathrm{m}^{3}{ } _{1}-\mathrm{m} _{1}}{12} \ldots$, उनके संगत संशोधन गुणांक। इस आँकड़े के लिए आवश्यक संशोधन इस प्रकार है

$\frac{3^{3}-3}{12}+\frac{2^{3}-2}{12}=\frac{30}{12}=2.5$

इन अभिव्यक्तियों के मान प्रतिस्थापित करने पर

$r _{s}=1-\frac{6(198+2.5)}{12^{3}-12}=(1-0.70)=0.30$

इस प्रकार, $\mathrm{X}$ और $\mathrm{Y}$ के बीच धनात्मक रैंक सहसंबंध है। $\mathrm{X}$ और $\mathrm{Y}$ दोनों एक ही दिशा में गतिशील हैं। हालाँकि, इस संबंध को प्रबल नहीं कहा जा सकता।

गतिविधि

  • कक्षा IX और X की परीक्षाओं में अपने 10 सहपाठियों द्वारा प्राप्त अंकों के आँकड़े इकट्ठा करें। उनके बीच रैंक सहसंबंध गुणांक की गणना करें। यदि आपके आँकड़ों में कोई पुनरावृत्ति नहीं है, तो पुनरावृत्त रैंक वाले आँकड़े सेट लेकर अभ्यास दोहराएँ। ऐसी क्या परिस्थितियाँ हैं जिनमें रैंक सहसंबंध गुणांक को सरल सहसंबंध गुणांक पर प्राथमिकता दी जाती है? यदि आँकड़े सटीक रूप से मापे गए हैं, तो क्या आप अभी भी रैंक सहसंबंध गुणांक को सरल सहसंबंध गुणांक पर प्राथमिकता देंगे? आप कब इस चयन के प्रति उदासीन हो सकते हैं? कक्षा में चर्चा करें।

4. निष्कर्ष

हमने दो चरों के बीच संबंध का अध्ययन करने की कुछ तकनीकों पर चर्चा की है, विशेष रूप से रैखिक संबंध को। बिखरा हुआ आरेख संबंध की दृश्य प्रस्तुति देता है और यह केवल रैखिक संबंधों तक सीमित नहीं है। कार्ल पियर्सन का सहसंबंध गुणांक और स्पीयरमैन की रैंक सहसंबंध चरों के बीच रैखिक संबंध को मापते हैं। जब चरों को सटीक रूप से मापा नहीं जा सकता, तब रैंक सहसंबंध का उपयोग किया जा सकता है। ये माप कारण-प्रभाव को नहीं दर्शाते। सहसंबंध का ज्ञान हमें इस बात का अंदाजा देता है कि जब सहसंबंधित चर बदलता है तो दूसरे चर में परिवर्तन की दिशा और तीव्रता क्या होगी।

सारांश

  • सहसंबंध विश्लेषण दो चरों के बीच संबंध का अध्ययन करता है।
  • बिखरा हुआ आरेख दो चरों के बीच संबंध की प्रकृति की दृश्य प्रस्तुति देता है।
  • कार्ल पियर्सन का सहसंबंध गुणांक $r$ केवल दो चरों के बीच रैखिक संबंध को संख्यात्मक रूप से मापता है। r का मान -1 और 1 के बीच होता है।
  • जब चरों को सटीक रूप से मापा नहीं जा सकता तब स्पीयरमैन की रैंक सहसंबंध का उपयोग करके रैखिक संबंध को संख्यात्मक रूप से मापा जा सकता है।
  • दोहरी रैंकों के लिए सुधार गुणांक की आवश्यकता होती है।
  • सहसंबंध का अर्थ कारण-प्रभाव नहीं होता। इसका अर्थ केवल सह-परिवर्तन होता है।

अभ्यास

1. ऊंचाई (फीट में) और वजन (किलोग्राम में) के बीच सहसंबंध गुणांक की इकाई है

(i) $\mathrm{kg} /$ feet

(ii) प्रतिशत

(iii) अस्तित्वहीन

2. सरल सहसंबंध गुणांक की सीमा है

(i) 0 से अनंत

(ii) ऋण एक से धन एक

(iii) ऋण अनंत से धन अनंत

3. यदि $r _{x y}$ धनात्मक है तो X और Y के बीच संबंध इस प्रकार का होता है

(i) जब Y बढ़ता है X बढ़ता है

(ii) जब Y घटता है X बढ़ता है

(iii) जब Y बढ़ता है X नहीं बदलता

4. यदि $r _{x y}=0$ है तो चर X और Y

(i) रैखिक रूप से संबद्ध हैं

(ii) रैखिक रूप से संबद्ध नहीं हैं

(iii) स्वतंत्र हैं

5. निम्नलिखित तीन मापों में से कौन-सा किसी भी प्रकार के संबंध को माप सकता है

(i) कार्ल पियर्सन का सहसंबंध गुणांक

(ii) स्पीयरमैन का क्रम सहसंबंध

(iii) बिखरा हुआ आरेख

6. यदि सटीक मापे गए आँकड़े उपलब्ध हों तो सरल सहसंबंध गुणांक

(i) क्रम सहसंबंध गुणांक से अधिक सटीक होता है

(ii) क्रम सहसंबंध गुणांक से कम सटीक होता है

(iii) क्रम सहसंबंध गुणांक जितना ही सटीक होता है

7. संघात को मापने के लिए r को सहप्रसरण से क्यों प्राथमिकता दी जाती है?

8. क्या डेटा के प्रकार के आधार पर r, -1 और 1 की सीमा के बाहर हो सकता है?

9. क्या सहसंबंध कारण-कार्य संबंध को दर्शाता है?

10. कब क्रम सहसंबंध सरल सहसंबंध गुणांक से अधिक सटीक होता है?

11. क्या शून्य सहसंबंध स्वतंत्रता का अर्थ है?

12. क्या सरल सहसंबंध गुणांक किसी भी प्रकार के संबंध को माप सकता है?

13. एक सप्ताह तक हर दिन अपने स्थानीय बाज़ार से पाँच सब्ज़ियों के दाम इकट्ठा करें। उनके सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

14. अपने सहपाठियों की ऊँचाई मापें। उनसे उनके बेंचमेट की ऊँचाई पूछें। इन दो चरों के बीच सहसंबंध गुणांक की गणना करें। परिणाम की व्याख्या करें।

15. कुछ ऐसे चरों की सूची बनाएँ जिनका सटीक मापन कठिन होता है।

16. $r$ के मानों 1, -1 और 0 की व्याख्या करें।

17. रैंक सहसंबंध गुणांक पीरसोनीयन सहसंबंध गुणांक से क्यों भिन्न होता है?

18. पिताओं की ऊँचाई इंच में $(\mathrm{X})$ और उनके पुत्रों की ऊँचाई $(\mathrm{Y})$ के बीच सहसंबंध गुणांक की गणना करें

$\begin{array}{lllllllll}\mathrm{X} & 65 & 66 & 57 & 67 & 68 & 69 & 70 & 72\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 67 & 56 & 65 & 68 & 72 & 72 & 69 & 71 &\end{array}$

(उत्तर: $\mathrm{r}=0.603$ )

19. $X$ और $Y$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें:

$\begin{array}{lllllllll}\mathrm{X} & -3 & -2 & -1 & 1 & 2 & 3\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 9 & 4 & 1 & 1 & 4 & 9\end{array}$

(उत्तर: $\mathrm{r}=0$ )

20. $\mathrm{X}$ और $\mathrm{Y}$ के बीच सहसंबंध गुणांक की गणना करें और उनके संबंध पर टिप्पणी करें

$\begin{array}{lllllllll}\mathrm{X} & 1 & 3 & 4 & 5 & 7 & 8\end{array}$

$\begin{array}{lllllllll}\mathrm{Y} & 2 & 6 & 8 & 10 & 14 & 16\end{array}$

(उत्तर: $\mathrm{r}=1$ )

गतिविधि

  • यहाँ चर्चा किए गए सभी सूत्रों का प्रयोग करके भारत की राष्ट्रीय आय और निर्यात के बीच $\mathrm{r}$ की गणना करें, कम से कम दस प्रेक्षण लेकर।