सहसंबंध गुणांक दो चरों के बीच संबंध की डिग्री है। इसकी गणना से यह पता चलता है कि दो डेटा सेट के बीच कोई संबंध है या नहीं। प्रतिगमन के विपरीत, सहसंबंध मात्राओं के मूल्यों की भविष्यवाणी नहीं करता है। हालाँकि, गुणांक की गणना प्रारंभिक सांख्यिकीय विश्लेषण में एक महत्वपूर्ण कदम है। उदाहरण के लिए, हमने पाया कि प्रत्यक्ष विदेशी निवेश के स्तर और सकल घरेलू उत्पाद की वृद्धि दर के बीच सहसंबंध गुणांक उच्च है। इससे हमें यह विचार मिलता है कि समृद्धि सुनिश्चित करने के लिए विशेष रूप से विदेशी उद्यमियों के लिए अनुकूल माहौल बनाना आवश्यक है। पहली नज़र में इतना स्पष्ट निष्कर्ष नहीं!
सहसंबंध और कारणता
शायद आँकड़ों का एक भी क्षेत्र ऐसा नहीं है जो हमारे जीवन में इतनी मजबूती से स्थापित हो गया हो। सहसंबंध गुणांक का उपयोग सामाजिक ज्ञान के सभी क्षेत्रों में किया जाता है। इसका मुख्य खतरा यह है कि लोगों को समझाने और उन्हें कुछ निष्कर्षों पर विश्वास दिलाने के लिए अक्सर इसके उच्च मूल्यों पर अटकलें लगाई जाती हैं। हालाँकि, वास्तव में, एक मजबूत सहसंबंध मात्राओं के बीच कारण-और-प्रभाव संबंध का बिल्कुल भी संकेत नहीं देता है।
सहसंबंध गुणांक: पियर्सन और स्पीयरमैन सूत्र
ऐसे कई बुनियादी संकेतक हैं जो दो चरों के बीच संबंध को दर्शाते हैं। ऐतिहासिक रूप से, पहला पियर्सन रैखिक सहसंबंध गुणांक है। यह स्कूल में पढ़ाया जाता है. इसे फादर के काम के आधार पर के. पियर्सन और जे. यूल द्वारा विकसित किया गया था। गैल्टन। यह गुणांक आपको तर्कसंगत संख्याओं के बीच संबंध देखने की अनुमति देता है जो तर्कसंगत रूप से बदलते हैं। यह हमेशा -1 से अधिक और 1 से कम होता है। एक ऋणात्मक संख्या व्युत्क्रमानुपाती संबंध को इंगित करती है। यदि गुणांक शून्य है, तो चरों के बीच कोई संबंध नहीं है। एक धनात्मक संख्या के बराबर - अध्ययनाधीन मात्राओं के बीच सीधा आनुपातिक संबंध होता है। स्पीयरमैन का रैंक सहसंबंध गुणांक आपको परिवर्तनीय मानों का पदानुक्रम बनाकर गणना को सरल बनाने की अनुमति देता है।
चरों के बीच संबंध
सहसंबंध दो प्रश्नों के उत्तर देने में मदद करता है। पहला, चरों के बीच संबंध सकारात्मक है या नकारात्मक। दूसरा, लत कितनी प्रबल है. सहसंबंध विश्लेषण एक शक्तिशाली उपकरण है जो यह महत्वपूर्ण जानकारी प्रदान कर सकता है। यह देखना आसान है कि पारिवारिक आय और व्यय आनुपातिक रूप से गिरते और बढ़ते हैं। यह रिश्ता सकारात्मक माना जाता है. इसके विपरीत, जब किसी उत्पाद की कीमत बढ़ती है, तो उसकी मांग कम हो जाती है। इस रिश्ते को नकारात्मक कहा जाता है. सहसंबंध गुणांक का मान -1 और 1 के बीच होता है। शून्य का मतलब है कि अध्ययन के तहत मूल्यों के बीच कोई संबंध नहीं है। प्राप्त संकेतक चरम मूल्यों के जितना करीब होगा, संबंध उतना ही मजबूत होगा (नकारात्मक या सकारात्मक)। निर्भरता की अनुपस्थिति -0.1 से 0.1 तक के गुणांक द्वारा इंगित की जाती है। आपको यह समझने की आवश्यकता है कि ऐसा मान केवल एक रैखिक संबंध की अनुपस्थिति को इंगित करता है।
आवेदन की विशेषताएं
दोनों संकेतकों के उपयोग में कुछ धारणाएँ शामिल हैं। सबसे पहले, एक मजबूत संबंध की उपस्थिति इस तथ्य को निर्धारित नहीं करती है कि एक मात्रा दूसरे को निर्धारित करती है। एक तीसरी मात्रा भी हो सकती है जो उनमें से प्रत्येक को परिभाषित करती है। दूसरे, उच्च पियर्सन सहसंबंध गुणांक अध्ययन किए गए चर के बीच कारण-और-प्रभाव संबंध को इंगित नहीं करता है। तीसरा, यह एक विशेष रूप से रैखिक संबंध दर्शाता है। लिंग या पसंदीदा रंग जैसी श्रेणियों के बजाय सार्थक मात्रात्मक डेटा (उदाहरण के लिए, बैरोमीटर का दबाव, वायु तापमान) का मूल्यांकन करने के लिए सहसंबंध का उपयोग किया जा सकता है।
एकाधिक सहसंबंध गुणांक
पियर्सन और स्पीयरमैन ने दो चरों के बीच संबंध की जांच की। लेकिन अगर उनमें से तीन या उससे भी अधिक हों तो क्या करें। यहीं पर एकाधिक सहसंबंध गुणांक बचाव के लिए आता है। उदाहरण के लिए, सकल राष्ट्रीय उत्पाद न केवल प्रत्यक्ष विदेशी निवेश से प्रभावित होता है, बल्कि सरकार की मौद्रिक और राजकोषीय नीतियों के साथ-साथ निर्यात के स्तर से भी प्रभावित होता है। सकल घरेलू उत्पाद की वृद्धि दर और मात्रा कई कारकों की परस्पर क्रिया का परिणाम है। हालाँकि, यह समझा जाना चाहिए कि एकाधिक सहसंबंध मॉडल कई सरलीकरणों और मान्यताओं पर आधारित है। सबसे पहले, मूल्यों के बीच बहुसंरेखता को बाहर रखा गया है। दूसरे, आश्रित और उसे प्रभावित करने वाले चर के बीच का संबंध रैखिक माना जाता है।
सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के क्षेत्र
मात्राओं के बीच संबंध खोजने की यह विधि सांख्यिकी में व्यापक रूप से उपयोग की जाती है। इसका सहारा अक्सर तीन मुख्य मामलों में लिया जाता है:
- दो चरों के मानों के बीच कारण-और-प्रभाव संबंधों का परीक्षण करना। परिणामस्वरूप, शोधकर्ता एक रैखिक संबंध की खोज करने और एक सूत्र प्राप्त करने की उम्मीद करता है जो मात्राओं के बीच इन संबंधों का वर्णन करता है। उनकी माप की इकाइयाँ भिन्न हो सकती हैं।
- मात्राओं के बीच संबंध की जाँच करना। इस मामले में, कोई भी यह निर्धारित नहीं करता है कि कौन सा चर आश्रित चर है। ऐसा हो सकता है कि कोई अन्य कारक दोनों मात्राओं का मूल्य निर्धारित करता हो।
- समीकरण प्राप्त करने के लिए इस मामले में, आप बस इसमें संख्याओं को प्रतिस्थापित कर सकते हैं और अज्ञात चर के मूल्यों का पता लगा सकते हैं।
एक व्यक्ति कारण-और-प्रभाव संबंध की तलाश में है
चेतना को इस तरह से डिज़ाइन किया गया है कि हमें निश्चित रूप से हमारे आस-पास होने वाली घटनाओं की व्याख्या करने की आवश्यकता है। एक व्यक्ति हमेशा उस दुनिया की तस्वीर जिसमें वह रहता है और उसे प्राप्त होने वाली जानकारी के बीच संबंध की तलाश में रहता है। मस्तिष्क अक्सर अव्यवस्था से व्यवस्था बनाता है। वह आसानी से एक कारण-और-प्रभाव संबंध देख सकता है जहां कोई नहीं है। वैज्ञानिकों को विशेष रूप से इस प्रवृत्ति पर काबू पाना सीखना होगा। अकादमिक करियर में डेटा के बीच संबंधों का निष्पक्ष मूल्यांकन करने की क्षमता आवश्यक है।
मीडिया पूर्वाग्रह
आइए विचार करें कि सहसंबंध की उपस्थिति की गलत व्याख्या कैसे की जा सकती है। बुरे व्यवहार वाले ब्रिटिश छात्रों के एक समूह से पूछा गया कि क्या उनके माता-पिता धूम्रपान करते हैं। फिर यह परीक्षण अखबार में छपा. परिणाम में माता-पिता के धूम्रपान और उनके बच्चों के अपराध के बीच एक मजबूत संबंध दिखाया गया। इस अध्ययन को करने वाले प्रोफेसर ने सिगरेट पैक पर इस बारे में चेतावनी लिखने का भी सुझाव दिया। हालाँकि, इस निष्कर्ष के साथ कई समस्याएं हैं। सबसे पहले, सहसंबंध यह नहीं दर्शाता है कि कौन सी मात्रा स्वतंत्र है। इसलिए, यह मान लेना काफी संभव है कि माता-पिता की हानिकारक आदत बच्चों की अवज्ञा के कारण होती है। दूसरे, यह निश्चित रूप से नहीं कहा जा सकता कि दोनों समस्याएँ किसी तीसरे कारक के कारण उत्पन्न नहीं हुईं। उदाहरण के लिए, कम आय वाले परिवार। यह अध्ययन आयोजित करने वाले प्रोफेसर के प्रारंभिक निष्कर्षों के भावनात्मक पहलू पर ध्यान देने योग्य है। वह धूम्रपान के प्रबल विरोधी थे। इसलिए, यह आश्चर्य की बात नहीं है कि उन्होंने अपने शोध के परिणामों की इस तरह से व्याख्या की।
निष्कर्ष
दो चरों के बीच कारण-और-प्रभाव संबंध के रूप में सहसंबंध की गलत व्याख्या करने से अपमानजनक शोध त्रुटियां हो सकती हैं। समस्या यह है कि यह मानवीय चेतना के मूल में है। कई मार्केटिंग युक्तियाँ इस सुविधा पर आधारित हैं। कारण और प्रभाव और सहसंबंध के बीच अंतर को समझने से आप अपने दैनिक जीवन और अपने पेशेवर करियर दोनों में जानकारी का तर्कसंगत विश्लेषण कर सकते हैं।
सहसंबंध गुणांक दो चरों के बीच संबंध की डिग्री है। इसकी गणना से यह पता चलता है कि दो डेटा सेट के बीच कोई संबंध है या नहीं। प्रतिगमन के विपरीत, सहसंबंध मात्राओं के मूल्यों की भविष्यवाणी नहीं करता है। हालाँकि, गुणांक की गणना प्रारंभिक सांख्यिकीय विश्लेषण में एक महत्वपूर्ण कदम है। उदाहरण के लिए, हमने पाया कि प्रत्यक्ष विदेशी निवेश के स्तर और सकल घरेलू उत्पाद की वृद्धि दर के बीच सहसंबंध गुणांक उच्च है। इससे हमें यह विचार मिलता है कि समृद्धि सुनिश्चित करने के लिए विशेष रूप से विदेशी उद्यमियों के लिए अनुकूल माहौल बनाना आवश्यक है। पहली नज़र में इतना स्पष्ट निष्कर्ष नहीं!
सहसंबंध और कारणता
शायद आँकड़ों का एक भी क्षेत्र ऐसा नहीं है जो हमारे जीवन में इतनी मजबूती से स्थापित हो गया हो। सहसंबंध गुणांक का उपयोग सामाजिक ज्ञान के सभी क्षेत्रों में किया जाता है। इसका मुख्य खतरा यह है कि लोगों को समझाने और उन्हें कुछ निष्कर्षों पर विश्वास दिलाने के लिए अक्सर इसके उच्च मूल्यों पर अटकलें लगाई जाती हैं। हालाँकि, वास्तव में, एक मजबूत सहसंबंध मात्राओं के बीच कारण-और-प्रभाव संबंध का बिल्कुल भी संकेत नहीं देता है।
सहसंबंध गुणांक: पियर्सन और स्पीयरमैन सूत्र
ऐसे कई बुनियादी संकेतक हैं जो दो चरों के बीच संबंध को दर्शाते हैं। ऐतिहासिक रूप से, पहला पियर्सन रैखिक सहसंबंध गुणांक है। यह स्कूल में पढ़ाया जाता है. इसे फादर के काम के आधार पर के. पियर्सन और जे. यूल द्वारा विकसित किया गया था। गैल्टन। यह गुणांक आपको तर्कसंगत संख्याओं के बीच संबंध देखने की अनुमति देता है जो तर्कसंगत रूप से बदलते हैं। यह हमेशा -1 से अधिक और 1 से कम होता है। एक ऋणात्मक संख्या व्युत्क्रमानुपाती संबंध को इंगित करती है। यदि गुणांक शून्य है, तो चरों के बीच कोई संबंध नहीं है। एक धनात्मक संख्या के बराबर - अध्ययनाधीन मात्राओं के बीच सीधा आनुपातिक संबंध होता है। स्पीयरमैन का रैंक सहसंबंध गुणांक आपको परिवर्तनीय मानों का पदानुक्रम बनाकर गणना को सरल बनाने की अनुमति देता है।
चरों के बीच संबंध
सहसंबंध दो प्रश्नों के उत्तर देने में मदद करता है। पहला, चरों के बीच संबंध सकारात्मक है या नकारात्मक। दूसरा, लत कितनी प्रबल है. सहसंबंध विश्लेषण एक शक्तिशाली उपकरण है जो यह महत्वपूर्ण जानकारी प्रदान कर सकता है। यह देखना आसान है कि पारिवारिक आय और व्यय आनुपातिक रूप से गिरते और बढ़ते हैं। यह रिश्ता सकारात्मक माना जाता है. इसके विपरीत, जब किसी उत्पाद की कीमत बढ़ती है, तो उसकी मांग कम हो जाती है। इस रिश्ते को नकारात्मक कहा जाता है. सहसंबंध गुणांक का मान -1 और 1 के बीच होता है। शून्य का मतलब है कि अध्ययन के तहत मूल्यों के बीच कोई संबंध नहीं है। प्राप्त संकेतक चरम मूल्यों के जितना करीब होगा, संबंध उतना ही मजबूत होगा (नकारात्मक या सकारात्मक)। निर्भरता की अनुपस्थिति -0.1 से 0.1 तक के गुणांक द्वारा इंगित की जाती है। आपको यह समझने की आवश्यकता है कि ऐसा मान केवल एक रैखिक संबंध की अनुपस्थिति को इंगित करता है।
आवेदन की विशेषताएं
दोनों संकेतकों के उपयोग में कुछ धारणाएँ शामिल हैं। सबसे पहले, एक मजबूत संबंध की उपस्थिति इस तथ्य को निर्धारित नहीं करती है कि एक मात्रा दूसरे को निर्धारित करती है। एक तीसरी मात्रा भी हो सकती है जो उनमें से प्रत्येक को परिभाषित करती है। दूसरे, उच्च पियर्सन सहसंबंध गुणांक अध्ययन किए गए चर के बीच कारण-और-प्रभाव संबंध को इंगित नहीं करता है। तीसरा, यह एक विशेष रूप से रैखिक संबंध दर्शाता है। लिंग या पसंदीदा रंग जैसी श्रेणियों के बजाय सार्थक मात्रात्मक डेटा (उदाहरण के लिए, बैरोमीटर का दबाव, वायु तापमान) का मूल्यांकन करने के लिए सहसंबंध का उपयोग किया जा सकता है।
एकाधिक सहसंबंध गुणांक
पियर्सन और स्पीयरमैन ने दो चरों के बीच संबंध की जांच की। लेकिन अगर उनमें से तीन या उससे भी अधिक हों तो क्या करें। यहीं पर एकाधिक सहसंबंध गुणांक बचाव के लिए आता है। उदाहरण के लिए, सकल राष्ट्रीय उत्पाद न केवल प्रत्यक्ष विदेशी निवेश से प्रभावित होता है, बल्कि सरकार की मौद्रिक और राजकोषीय नीतियों के साथ-साथ निर्यात के स्तर से भी प्रभावित होता है। सकल घरेलू उत्पाद की वृद्धि दर और मात्रा कई कारकों की परस्पर क्रिया का परिणाम है। हालाँकि, यह समझा जाना चाहिए कि एकाधिक सहसंबंध मॉडल कई सरलीकरणों और मान्यताओं पर आधारित है। सबसे पहले, मूल्यों के बीच बहुसंरेखता को बाहर रखा गया है। दूसरे, आश्रित और उसे प्रभावित करने वाले चर के बीच का संबंध रैखिक माना जाता है।
सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के क्षेत्र
मात्राओं के बीच संबंध खोजने की यह विधि सांख्यिकी में व्यापक रूप से उपयोग की जाती है। इसका सहारा अक्सर तीन मुख्य मामलों में लिया जाता है:
- दो चरों के मानों के बीच कारण-और-प्रभाव संबंधों का परीक्षण करना। परिणामस्वरूप, शोधकर्ता एक रैखिक संबंध की खोज करने और एक सूत्र प्राप्त करने की उम्मीद करता है जो मात्राओं के बीच इन संबंधों का वर्णन करता है। उनकी माप की इकाइयाँ भिन्न हो सकती हैं।
- मात्राओं के बीच संबंध की जाँच करना। इस मामले में, कोई भी यह निर्धारित नहीं करता है कि कौन सा चर आश्रित चर है। ऐसा हो सकता है कि कोई अन्य कारक दोनों मात्राओं का मूल्य निर्धारित करता हो।
- समीकरण प्राप्त करने के लिए इस मामले में, आप बस इसमें संख्याओं को प्रतिस्थापित कर सकते हैं और अज्ञात चर के मूल्यों का पता लगा सकते हैं।
एक व्यक्ति कारण-और-प्रभाव संबंध की तलाश में है
चेतना को इस तरह से डिज़ाइन किया गया है कि हमें निश्चित रूप से हमारे आस-पास होने वाली घटनाओं की व्याख्या करने की आवश्यकता है। एक व्यक्ति हमेशा उस दुनिया की तस्वीर जिसमें वह रहता है और उसे प्राप्त होने वाली जानकारी के बीच संबंध की तलाश में रहता है। मस्तिष्क अक्सर अव्यवस्था से व्यवस्था बनाता है। वह आसानी से एक कारण-और-प्रभाव संबंध देख सकता है जहां कोई नहीं है। वैज्ञानिकों को विशेष रूप से इस प्रवृत्ति पर काबू पाना सीखना होगा। अकादमिक करियर में डेटा के बीच संबंधों का निष्पक्ष मूल्यांकन करने की क्षमता आवश्यक है।
मीडिया पूर्वाग्रह
आइए विचार करें कि सहसंबंध की उपस्थिति की गलत व्याख्या कैसे की जा सकती है। बुरे व्यवहार वाले ब्रिटिश छात्रों के एक समूह से पूछा गया कि क्या उनके माता-पिता धूम्रपान करते हैं। फिर यह परीक्षण अखबार में छपा. परिणाम में माता-पिता के धूम्रपान और उनके बच्चों के अपराध के बीच एक मजबूत संबंध दिखाया गया। इस अध्ययन को करने वाले प्रोफेसर ने सिगरेट पैक पर इस बारे में चेतावनी लिखने का भी सुझाव दिया। हालाँकि, इस निष्कर्ष के साथ कई समस्याएं हैं। सबसे पहले, सहसंबंध यह नहीं दर्शाता है कि कौन सी मात्रा स्वतंत्र है। इसलिए, यह मान लेना काफी संभव है कि माता-पिता की हानिकारक आदत बच्चों की अवज्ञा के कारण होती है। दूसरे, यह निश्चित रूप से नहीं कहा जा सकता कि दोनों समस्याएँ किसी तीसरे कारक के कारण उत्पन्न नहीं हुईं। उदाहरण के लिए, कम आय वाले परिवार। यह अध्ययन आयोजित करने वाले प्रोफेसर के प्रारंभिक निष्कर्षों के भावनात्मक पहलू पर ध्यान देने योग्य है। वह धूम्रपान के प्रबल विरोधी थे। इसलिए, यह आश्चर्य की बात नहीं है कि उन्होंने अपने शोध के परिणामों की इस तरह से व्याख्या की।
निष्कर्ष
दो चरों के बीच कारण-और-प्रभाव संबंध के रूप में सहसंबंध की गलत व्याख्या करने से अपमानजनक शोध त्रुटियां हो सकती हैं। समस्या यह है कि यह मानवीय चेतना के मूल में है। कई मार्केटिंग युक्तियाँ इस सुविधा पर आधारित हैं। कारण और प्रभाव और सहसंबंध के बीच अंतर को समझने से आप अपने दैनिक जीवन और अपने पेशेवर करियर दोनों में जानकारी का तर्कसंगत विश्लेषण कर सकते हैं।
वैज्ञानिक और व्यावहारिक उद्देश्यों के लिए सार्वजनिक स्वास्थ्य और स्वास्थ्य सेवा का अध्ययन करते समय, शोधकर्ता को अक्सर सांख्यिकीय आबादी के कारक और प्रदर्शन विशेषताओं (कारण संबंध) के बीच संबंधों का सांख्यिकीय विश्लेषण करना पड़ता है या इस आबादी की कई विशेषताओं में समानांतर परिवर्तनों की निर्भरता निर्धारित करनी होती है। किसी तीसरे मान पर (उनके सामान्य कारण पर)। इस कनेक्शन की विशेषताओं का अध्ययन करने, इसका आकार और दिशा निर्धारित करने और इसकी विश्वसनीयता का मूल्यांकन करने में सक्षम होना आवश्यक है। इस प्रयोजन के लिए, सहसंबंध विधियों का उपयोग किया जाता है।
- विशेषताओं के बीच मात्रात्मक संबंधों की अभिव्यक्ति के प्रकार
- कार्यात्मक कनेक्शन
- सहसंबंध संबंध
- कार्यात्मक और सहसंबद्ध संबंध की परिभाषाएँ
कार्यात्मक संबंध- दो विशेषताओं के बीच इस प्रकार का संबंध जब उनमें से एक का प्रत्येक मान दूसरे के कड़ाई से परिभाषित मूल्य से मेल खाता है (एक वृत्त का क्षेत्रफल वृत्त की त्रिज्या पर निर्भर करता है, आदि)। कार्यात्मक संबंध भौतिक और गणितीय प्रक्रियाओं की विशेषता है।
सह - संबंध- ऐसा संबंध जिसमें एक विशेषता का प्रत्येक विशिष्ट मान उससे संबंधित किसी अन्य विशेषता के कई मूल्यों से मेल खाता है (किसी व्यक्ति की ऊंचाई और वजन के बीच संबंध; शरीर के तापमान और नाड़ी दर के बीच संबंध, आदि)। सहसंबंध चिकित्सा और जैविक प्रक्रियाओं के लिए विशिष्ट है।
- सहसंबंध संबंध स्थापित करने का व्यावहारिक महत्व. कारक और परिणामी संकेतों के बीच कारण और प्रभाव की पहचान (शारीरिक विकास का आकलन करते समय, काम करने की स्थिति, रहने की स्थिति और स्वास्थ्य की स्थिति के बीच संबंध निर्धारित करने के लिए, उम्र, सेवा की लंबाई, व्यावसायिक की उपस्थिति पर बीमारियों की आवृत्ति की निर्भरता का निर्धारण करते समय) खतरे, आदि)
किसी तीसरे मान पर कई विशेषताओं में समानांतर परिवर्तन की निर्भरता। उदाहरण के लिए, कार्यशाला में उच्च तापमान के प्रभाव में रक्तचाप, रक्त की चिपचिपाहट, नाड़ी की दर आदि में परिवर्तन होता है।
- विशेषताओं के बीच संबंधों की दिशा और मजबूती को दर्शाने वाला एक मूल्य. सहसंबंध गुणांक, जो एक संख्या में संकेतों (घटना) के बीच संबंध की दिशा और ताकत का अंदाजा देता है, इसके उतार-चढ़ाव की सीमा 0 से ± 1 तक होती है
- सहसंबंध प्रस्तुत करने की विधियाँ
- ग्राफ़ (स्कैटर प्लॉट)
- सहसंबंध गुणांक
- सहसंबंध की दिशा
- सीधा
- रिवर्स
- सहसंबंध की ताकत
- मजबूत: ±0.7 से ±1
- औसत: ±0.3 से ±0.699
- कमजोर: 0 से ±0.299
- सहसंबंध गुणांक और सूत्र निर्धारित करने की विधियाँ
- वर्गों की विधि (पियर्सन विधि)
- रैंक विधि (स्पीयरमैन विधि)
- सहसंबंध गुणांक का उपयोग करने के लिए पद्धति संबंधी आवश्यकताएँ
- संबंध को मापना केवल गुणात्मक रूप से सजातीय आबादी में संभव है (उदाहरण के लिए, लिंग और उम्र के आधार पर सजातीय आबादी में ऊंचाई और वजन के बीच संबंध को मापना)
- गणना निरपेक्ष या व्युत्पन्न मूल्यों का उपयोग करके की जा सकती है
- सहसंबंध गुणांक की गणना करने के लिए, अवर्गीकृत भिन्नता श्रृंखला का उपयोग किया जाता है (यह आवश्यकता केवल वर्गों की विधि का उपयोग करके सहसंबंध गुणांक की गणना करते समय लागू होती है)
- प्रेक्षणों की संख्या कम से कम 30
- रैंक सहसंबंध विधि (स्पीयरमैन की विधि) का उपयोग करने के लिए सिफारिशें
- जब कनेक्शन की मजबूती को सटीक रूप से स्थापित करने की कोई आवश्यकता नहीं है, लेकिन अनुमानित डेटा पर्याप्त है
- जब विशेषताओं को न केवल मात्रात्मक, बल्कि गुणात्मक मूल्यों द्वारा भी दर्शाया जाता है
- जब विशेषताओं की वितरण श्रृंखला में खुले विकल्प हों (उदाहरण के लिए, 1 वर्ष तक का कार्य अनुभव, आदि)
- वर्गों की विधि का उपयोग करने के लिए सिफ़ारिशें (पियर्सन की विधि)
- जब विशेषताओं के बीच संबंध की ताकत का सटीक निर्धारण आवश्यक हो
- जब संकेतों में केवल मात्रात्मक अभिव्यक्ति होती है
- सहसंबंध गुणांक की गणना के लिए पद्धति और प्रक्रिया
1) वर्गों की विधि
2) रैंक विधि
- सहसंबंध गुणांक का उपयोग करके सहसंबंध संबंध का आकलन करने की योजना
- सहसंबंध गुणांक त्रुटि की गणना
- रैंक सहसंबंध विधि और वर्गों की विधि द्वारा प्राप्त सहसंबंध गुणांक की विश्वसनीयता का अनुमान
विधि 1
विश्वसनीयता सूत्र द्वारा निर्धारित की जाती है:टी मानदंड का मूल्यांकन टी मानों की एक तालिका का उपयोग करके किया जाता है, जिसमें स्वतंत्रता की डिग्री (एन - 2) की संख्या को ध्यान में रखा जाता है, जहां एन युग्मित विकल्पों की संख्या है। टी मानदंड, संभाव्यता पी ≥99% के अनुरूप, तालिका एक के बराबर या उससे अधिक होना चाहिए।
विधि 2
मानक सहसंबंध गुणांक की एक विशेष तालिका का उपयोग करके विश्वसनीयता का आकलन किया जाता है। इस मामले में, एक सहसंबंध गुणांक को विश्वसनीय माना जाता है, जब एक निश्चित संख्या में स्वतंत्रता की डिग्री (एन - 2) के साथ, यह तालिका के बराबर या उससे अधिक होता है, जो त्रुटि-मुक्त भविष्यवाणी की डिग्री पी ≥95% के अनुरूप होता है। .
व्यायाम:सहसंबंध गुणांक की गणना करें, पानी में कैल्शियम की मात्रा और पानी की कठोरता के बीच संबंध की दिशा और ताकत निर्धारित करें, यदि निम्नलिखित डेटा ज्ञात हो (तालिका 1)। रिश्ते की विश्वसनीयता का आकलन करें. एक निष्कर्ष निकालो।
तालिका नंबर एक
विधि के चुनाव का औचित्य.समस्या को हल करने के लिए वर्गों की विधि (पियर्सन) को चुना गया, क्योंकि प्रत्येक चिह्न (पानी की कठोरता और कैल्शियम की मात्रा) की एक संख्यात्मक अभिव्यक्ति होती है; कोई खुला विकल्प नहीं.
समाधान.
गणना का क्रम पाठ में वर्णित है, परिणाम तालिका में प्रस्तुत किए गए हैं। युग्मित तुलनीय विशेषताओं की श्रृंखला बनाने के बाद, उन्हें x (पानी की कठोरता डिग्री में) और y (पानी में कैल्शियम की मात्रा mg/l में) से निरूपित करें।
पानी की कठोरता (डिग्री में) |
पानी में कैल्शियम की मात्रा (मिलीग्राम/लीटर में) |
डी एक्स | डी वाई | डी एक्स एक्स डी वाई | डी एक्स 2 | डी वाई 2 |
4 8 11 27 34 37 |
28 56 77 191 241 262 |
-16 -12 -9 +7 +14 +16 |
-114 -86 -66 +48 +98 +120 |
1824 1032 594 336 1372 1920 |
256 144 81 49 196 256 |
12996 7396 4356 2304 9604 14400 |
एम एक्स =Σ एक्स / एन | एम वाई =Σ वाई / एन | Σ डी एक्स एक्स डी वाई =7078 | Σ डी एक्स 2 =982 | Σ डी वाई 2 =51056 | ||
एम एक्स =120/6=20 | एम वाई =852/6=142 |
- सूत्रों का उपयोग करके पंक्ति विकल्प "x" में M x और पंक्ति विकल्प "y" में M y का औसत मान निर्धारित करें:
एम एक्स = Σх/एन (कॉलम 1) और
एम वाई = Σу/एन (कॉलम 2) - श्रृंखला "x" और श्रृंखला "y" में परिकलित औसत से प्रत्येक विकल्प का विचलन (d x और d y) ज्ञात करें।
d x = x - M x (कॉलम 3) और d y = y - M y (कॉलम 4)। - विचलनों का गुणनफल खोजें d x x d y और उनका योग करें: Σ d x x d y (कॉलम 5)
- प्रत्येक विचलन d
- उत्पाद Σ d x 2 x Σ d y 2 निर्धारित करें और इस उत्पाद से वर्गमूल निकालें
- परिणामी मान Σ (d x x d y) और √ (Σd x 2 x Σd y 2)सहसंबंध गुणांक की गणना के लिए सूत्र में स्थानापन्न करें:
- सहसंबंध गुणांक की विश्वसनीयता निर्धारित करें:
पहली विधि. सूत्रों का उपयोग करके सहसंबंध गुणांक (एमआर एक्सवाई) और टी मानदंड की त्रुटि पाएं:मानदंड t = 14.1, जो त्रुटि रहित पूर्वानुमान p > 99.9% की संभावना से मेल खाता है।
दूसरी विधि. सहसंबंध गुणांक की विश्वसनीयता का आकलन "मानक सहसंबंध गुणांक" तालिका (परिशिष्ट 1 देखें) का उपयोग करके किया जाता है। स्वतंत्रता की डिग्री की संख्या (एन - 2) = 6 - 2 = 4 के साथ, हमारा परिकलित सहसंबंध गुणांक आर xу = + 0.99 सारणीबद्ध (आर तालिका = + 0.917 पी = 99%) से अधिक है।
निष्कर्ष।पानी में जितना अधिक कैल्शियम होगा, वह उतना ही कठोर होगा (कनेक्शन प्रत्यक्ष, सशक्त और प्रामाणिक: आर xy = + 0.99, पी > 99.9%)।
रैंकिंग पद्धति का उपयोग करने के लिएव्यायाम:रैंक विधि का उपयोग करते हुए, निम्नलिखित डेटा प्राप्त होने पर वर्षों के कार्य अनुभव और चोटों की आवृत्ति के बीच संबंध की दिशा और ताकत स्थापित करें:
विधि चुनने का औचित्य:समस्या को हल करने के लिए, केवल रैंक सहसंबंध विधि को चुना जा सकता है, क्योंकि विशेषता की पहली पंक्ति "वर्षों में कार्य अनुभव" में खुले विकल्प हैं (1 वर्ष और 7 या अधिक वर्षों तक कार्य अनुभव), जो कनेक्शन स्थापित करने के लिए अधिक सटीक विधि - वर्गों की विधि - के उपयोग की अनुमति नहीं देता है तुलना की गई विशेषताओं के बीच.
समाधान. गणनाओं का क्रम पाठ में प्रस्तुत किया गया है, परिणाम तालिका में प्रस्तुत किए गए हैं। 2.
तालिका 2
वर्षों में कार्य अनुभव चोटों की संख्या क्रमवाचक संख्या (रैंक) रैंक का अंतर रैंकों का वर्ग अंतर एक्स वाई d(x-y) घ 2 1 वर्ष तक 24 1 5 -4 16 1-2 16 2 4 -2 4 3-4 12 3 2,5 +0,5 0,25 5-6 12 4 2,5 +1,5 2,25 7 या अधिक 6 5 1 +4 16 Σ डी 2 = 38.5 मानक सहसंबंध गुणांक जिन्हें विश्वसनीय माना जाता है (एल.एस. कामिंस्की के अनुसार)
स्वतंत्रता की कोटि की संख्या - 2 संभाव्यता स्तर पी (%) 95% 98% 99% 1 0,997 0,999 0,999 2 0,950 0,980 0,990 3 0,878 0,934 0,959 4 0,811 0,882 0,917 5 0,754 0,833 0,874 6 0,707 0,789 0,834 7 0,666 0,750 0,798 8 0,632 0,716 0,765 9 0,602 0,885 0,735 10 0,576 0,858 0,708 11 0,553 0,634 0,684 12 0,532 0,612 0,661 13 0,514 0,592 0,641 14 0,497 0,574 0,623 15 0,482 0,558 0,606 16 0,468 0,542 0,590 17 0,456 0,528 0,575 18 0,444 0,516 0,561 19 0,433 0,503 0,549 20 0,423 0,492 0,537 25 0,381 0,445 0,487 30 0,349 0,409 0,449 - व्लासोव वी.वी. महामारी विज्ञान। - एम.: जियोटार-मेड, 2004. - 464 पी।
- लिसित्सिन यू.पी. सार्वजनिक स्वास्थ्य और स्वास्थ्य सेवा. विश्वविद्यालयों के लिए पाठ्यपुस्तक. - एम.: जियोटार-मेड, 2007. - 512 पी।
- चिकित्सक वी.ए., यूरीव वी.के. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल पर व्याख्यान का कोर्स: भाग 1. सार्वजनिक स्वास्थ्य। - एम.: मेडिसिन, 2003. - 368 पी।
- मिन्येव वी.ए., विष्णकोव एन.आई. और अन्य। सामाजिक चिकित्सा और स्वास्थ्य देखभाल संगठन (2 खंडों में मैनुअल)। - सेंट पीटर्सबर्ग, 1998. -528 पी।
- कुचेरेंको वी.जेड., अगरकोव एन.एम. और अन्य। सामाजिक स्वच्छता और स्वास्थ्य देखभाल संगठन (ट्यूटोरियल) - मॉस्को, 2000. - 432 पी।
- एस ग्लैंज़। चिकित्सा और जैविक आँकड़े। अंग्रेजी से अनुवाद - एम., प्रकृति, 1998. - 459 पी।
काम:
मानों के 26 जोड़े का एक संबंधित नमूना है (x k,y k):
क | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
एक्स क | 25.20000 | 26.40000 | 26.00000 | 25.80000 | 24.90000 | 25.70000 | 25.70000 | 25.70000 | 26.10000 | 25.80000 |
वाई के | 30.80000 | 29.40000 | 30.20000 | 30.50000 | 31.40000 | 30.30000 | 30.40000 | 30.50000 | 29.90000 | 30.40000 |
क | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
एक्स क | 25.90000 | 26.20000 | 25.60000 | 25.40000 | 26.60000 | 26.20000 | 26.00000 | 22.10000 | 25.90000 | 25.80000 |
वाई के | 30.30000 | 30.50000 | 30.60000 | 31.00000 | 29.60000 | 30.40000 | 30.70000 | 31.60000 | 30.50000 | 30.60000 |
क | 21 | 22 | 23 | 24 | 25 | 26 |
एक्स क | 25.90000 | 26.30000 | 26.10000 | 26.00000 | 26.40000 | 25.80000 |
वाई के | 30.70000 | 30.10000 | 30.60000 | 30.50000 | 30.70000 | 30.80000 |
गणना/प्लॉट के लिए आवश्यक:
- सहसंबंध गुणांक;
- α = 0.05 के महत्व स्तर पर यादृच्छिक चर एक्स और वाई की निर्भरता की परिकल्पना का परीक्षण करें;
- रेखीय प्रतिगमन समीकरण गुणांक;
- स्कैटर आरेख (सहसंबंध क्षेत्र) और प्रतिगमन रेखा ग्राफ;
समाधान:
1. सहसंबंध गुणांक की गणना करें.
सहसंबंध गुणांक दो यादृच्छिक चर के पारस्परिक संभाव्य प्रभाव का एक संकेतक है। सहसंबंध गुणांक आरसे मान ले सकते हैं -1 पहले +1 . यदि निरपेक्ष मान करीब है 1 , तो यह मात्राओं के बीच एक मजबूत संबंध का प्रमाण है, और यदि निकट है 0 - तो यह एक कमजोर कनेक्शन या उसकी अनुपस्थिति को इंगित करता है। यदि निरपेक्ष मान आरएक के बराबर है, तो हम मात्राओं के बीच कार्यात्मक संबंध के बारे में बात कर सकते हैं, यानी, गणितीय फ़ंक्शन का उपयोग करके एक मात्रा को दूसरे के माध्यम से व्यक्त किया जा सकता है।
सहसंबंध गुणांक की गणना निम्नलिखित सूत्रों का उपयोग करके की जा सकती है:
एन |
Σ |
के = 1 |
एम एक्स | = |
|
| एक्सके, | मेरा | = | या सूत्र द्वारा
व्यवहार में, सहसंबंध गुणांक की गणना के लिए सूत्र (1.4) का अधिक बार उपयोग किया जाता है क्योंकि इसमें कम गणना की आवश्यकता होती है। हालाँकि, यदि सहप्रसरण की गणना पहले की गई थी कोव(एक्स,वाई), तो सूत्र (1.1) का उपयोग करना अधिक लाभदायक है, क्योंकि सहप्रसरण मान के अलावा, आप मध्यवर्ती गणनाओं के परिणामों का भी उपयोग कर सकते हैं। 1.1 आइए सूत्र (1.4) का उपयोग करके सहसंबंध गुणांक की गणना करें, ऐसा करने के लिए, हम x k 2, y k 2 और x k y k के मानों की गणना करते हैं और उन्हें तालिका 1 में दर्ज करते हैं। तालिका नंबर एक
1.2. आइए सूत्र (1.5) का उपयोग करके एम एक्स की गणना करें. 1.2.1. एक्स क x 1 + x 2 + … + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000 1.2.2. 669.50000 / 26 = 25.75000 एम एक्स = 25.750000 1.3. आइए इसी तरह से M y की गणना करें. 1.3.1. आइए सभी तत्वों को क्रमानुसार जोड़ें वाई के y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000 1.3.2. परिणामी योग को नमूना तत्वों की संख्या से विभाजित करें 793.00000 / 26 = 30.50000 एम वाई = 30.5000000 1.4. इसी प्रकार हम M xy की गणना करते हैं. 1.4.1. आइए तालिका 1 के छठे कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें 776.16000 + 776.16000 + ... + 794.64000 = 20412.830000 1.4.2. परिणामी योग को तत्वों की संख्या से विभाजित करें 20412.83000 / 26 = 785.10885 एम एक्सवाई = 785.108846 1.5. आइए सूत्र (1.6.) का उपयोग करके S x 2 के मान की गणना करें. 1.5.1. आइए तालिका 1 के चौथे कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें 635.04000 + 696.96000 + ... + 665.64000 = 17256.910000 1.5.2. परिणामी योग को तत्वों की संख्या से विभाजित करें 17256.91000 / 26 = 663.72731 1.5.3. S x 2 का मान प्राप्त करने के लिए अंतिम संख्या से M x का वर्ग घटाएँ एस एक्स 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481 1.6. आइए सूत्र (1.6.) का उपयोग करके S y 2 के मान की गणना करें. 1.6.1. आइए तालिका 1 के 5वें कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें 948.64000 + 864.36000 + ... + 948.64000 = 24191.840000 1.6.2. परिणामी योग को तत्वों की संख्या से विभाजित करें 24191.84000 / 26 = 930.45538 1.6.3. S y 2 का मान प्राप्त करने के लिए अंतिम संख्या में से M y का वर्ग घटाएँ एस वाई 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538 1.7. आइए S x 2 और S y 2 की मात्राओं के गुणनफल की गणना करें. एस एक्स 2 एस वाई 2 = 0.66481 0.20538 = 0.136541 1.8. आइए अंतिम संख्या का वर्गमूल लें और मान S x S y प्राप्त करें. एस एक्स एस वाई = 0.36951 1.9. आइए सूत्र (1.4.) का उपयोग करके सहसंबंध गुणांक के मान की गणना करें. आर = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028 उत्तर: आर एक्स, वाई = -0.720279 2. हम सहसंबंध गुणांक के महत्व की जांच करते हैं (हम निर्भरता की परिकल्पना की जांच करते हैं)।चूँकि सहसंबंध गुणांक अनुमान की गणना एक सीमित नमूने पर की जाती है, और इसलिए इसके जनसंख्या मूल्य से विचलन हो सकता है, इसलिए सहसंबंध गुणांक के महत्व का परीक्षण करना आवश्यक है। जाँच टी-टेस्ट का उपयोग करके की जाती है:
यादृच्छिक मूल्य टीविद्यार्थी के t-वितरण का अनुसरण करता है और t-वितरण तालिका का उपयोग करके किसी दिए गए महत्व स्तर α पर मानदंड (t cr.α) का महत्वपूर्ण मान ज्ञात करना आवश्यक है। यदि सूत्र (2.1) द्वारा निरपेक्ष मान में गणना की गई t, t cr.α से कम निकलती है, तो यादृच्छिक चर X और Y के बीच कोई निर्भरता नहीं है। अन्यथा, प्रयोगात्मक डेटा यादृच्छिक चर की निर्भरता के बारे में परिकल्पना का खंडन नहीं करता है। 2.1. आइए हम सूत्र (2.1) का उपयोग करके टी-मानदंड के मूल्य की गणना करें और प्राप्त करें:
2.2. टी-वितरण तालिका का उपयोग करके, हम पैरामीटर t cr.α का महत्वपूर्ण मान निर्धारित करते हैं Tcr.α का वांछित मान स्वतंत्रता की डिग्री की संख्या और दिए गए महत्व स्तर α के अनुरूप कॉलम के अनुरूप पंक्ति के चौराहे पर स्थित है। तालिका 2 टी वितरण
2.2. आइए t-मानदंड और t cr.α के निरपेक्ष मान की तुलना करें टी-मानदंड का पूर्ण मान महत्वपूर्ण मान t = 5.08680, t cr.α = 2.064 से कम नहीं है, इसलिए प्रयोगात्मक डेटा, संभावना 0.95 के साथ(1 - α), परिकल्पना का खंडन न करेंयादृच्छिक चर X और Y की निर्भरता के बारे में। 3. रैखिक समाश्रयण समीकरण के गुणांकों की गणना करें।एक रेखीय प्रतिगमन समीकरण एक सीधी रेखा का समीकरण है जो यादृच्छिक चर X और Y के बीच संबंध का अनुमान लगाता है (लगभग वर्णन करता है)। यदि हम मानते हैं कि मान इस प्रकार वाई = ए + बी एक्स (3.1), जहां:
सूत्र (3.2) का उपयोग करके गुणांक की गणना की गई बीरैखिक प्रतिगमन गुणांक कहा जाता है। कुछ स्रोतों में एस्थिर प्रतिगमन गुणांक कहा जाता है और बीचर के अनुसार. किसी दिए गए मान X के लिए Y की भविष्यवाणी करने में त्रुटियों की गणना सूत्रों का उपयोग करके की जाती है: मात्रा σ y/x (सूत्र 3.4) भी कहा जाता है अवशिष्ट मानक विचलन, यह X के एक निश्चित (दिए गए) मान के लिए समीकरण (3.1) द्वारा वर्णित प्रतिगमन रेखा से मान Y के प्रस्थान को दर्शाता है। | . |
एस वाई / एस एक्स = 0.55582
3.3 आइए गुणांक बी की गणना करेंसूत्र के अनुसार (3.2)
बी = -0.72028 0.55582 = -0.40035
3.4 आइए गुणांक की गणना करेंसूत्र के अनुसार (3.3)
ए = 30.50000 - (-0.40035 25.75000) = 40.80894
3.5 आइए प्रतिगमन समीकरण की त्रुटियों का अनुमान लगाएं.
3.5.1 S y 2 का वर्गमूल निकालने पर हमें प्राप्त होता है:
3.5.4 आइए सूत्र (3.5) का उपयोग करके सापेक्ष त्रुटि की गणना करें
δ y/x = (0.31437 / 30.50000)100% = 1.03073%
4. हम एक स्कैटर आरेख (सहसंबंध क्षेत्र) और एक प्रतिगमन रेखा ग्राफ बनाते हैं।
एक स्कैटरप्लॉट एक्स और वाई अक्षों के साथ आयताकार निर्देशांक में एक विमान पर बिंदुओं के रूप में संबंधित जोड़े (एक्स के, वाई के) का एक ग्राफिकल प्रतिनिधित्व है। सहसंबंध क्षेत्र संबंधित (युग्मित) नमूने के ग्राफिकल प्रतिनिधित्व में से एक है। प्रतिगमन रेखा ग्राफ़ भी उसी समन्वय प्रणाली में प्लॉट किया गया है। यह सुनिश्चित करने के लिए कि आरेख यथासंभव स्पष्ट हो, अक्षों पर स्केल और शुरुआती बिंदुओं को सावधानीपूर्वक चुना जाना चाहिए।4.1. नमूने का न्यूनतम और अधिकतम तत्व ज्ञात करें X क्रमशः 18वां और 15वां तत्व है, x न्यूनतम = 22.10000 और x अधिकतम = 26.60000।
4.2. हम पाते हैं कि नमूने का न्यूनतम और अधिकतम तत्व Y क्रमशः दूसरा और 18वां तत्व है, y न्यूनतम = 29.40000 और y अधिकतम = 31.60000।
4.3. x-अक्ष पर, बिंदु x 18 = 22.10000 के थोड़ा बाईं ओर एक प्रारंभिक बिंदु चुनें, और ऐसा पैमाना चुनें कि बिंदु x 15 = 26.60000 अक्ष पर फिट हो जाए और शेष बिंदु स्पष्ट रूप से दिखाई दें।
4.4. कोटि अक्ष पर, बिंदु y 2 = 29.40000 के थोड़ा बाईं ओर एक प्रारंभिक बिंदु चुनें, और ऐसा पैमाना चुनें कि बिंदु y 18 = 31.60000 अक्ष पर फिट हो और शेष बिंदु स्पष्ट रूप से अलग हों।
4.5. हम x k मान को भुज अक्ष पर और y k मान को कोटि अक्ष पर रखते हैं।
4.6. हम निर्देशांक तल पर बिंदु (x 1, y 1), (x 2, y 2),…, (x 26, y 26) आलेखित करते हैं। हमें नीचे दिए गए चित्र में दिखाया गया स्कैटर आरेख (सहसंबंध क्षेत्र) मिलता है।
4.7. आइए एक प्रतिगमन रेखा खींचें।
ऐसा करने के लिए, हम समीकरण (3.6) को संतुष्ट करने वाले निर्देशांक (x r1, y r1) और (x r2, y r2) वाले दो अलग-अलग बिंदु पाएंगे, उन्हें निर्देशांक तल पर आलेखित करेंगे और उनके माध्यम से एक सीधी रेखा खींचेंगे। पहले बिंदु के भुज के रूप में, हम मान x मिनट = 22.10000 लेते हैं। मान x मिनट को समीकरण (3.6) में प्रतिस्थापित करने पर, हम पहले बिंदु की कोटि प्राप्त करते हैं। इस प्रकार, हमारे पास निर्देशांक (22.10000, 31.96127) वाला एक बिंदु है। इसी तरह, हम दूसरे बिंदु के निर्देशांक प्राप्त करते हैं, मान x अधिकतम = 26.60000 को भुज के रूप में रखते हैं। दूसरा बिंदु होगा: (26.60000, 30.15970)।
प्रतिगमन रेखा नीचे दिए गए चित्र में लाल रंग में दिखाई गई है
कृपया ध्यान दें कि प्रतिगमन रेखा हमेशा X और Y के औसत मानों के बिंदु से होकर गुजरती है, अर्थात। निर्देशांक के साथ (एम एक्स, एम वाई)।
06.06.2018 16 235 0 इगोर
मनोविज्ञान और समाज
दुनिया में हर चीज़ आपस में जुड़ी हुई है। प्रत्येक व्यक्ति, अंतर्ज्ञान के स्तर पर, घटनाओं को प्रभावित करने और नियंत्रित करने में सक्षम होने के लिए उनके बीच संबंध खोजने की कोशिश करता है। वह अवधारणा जो इस संबंध को दर्शाती है सहसंबंध कहलाती है। सरल शब्दों में इसका क्या मतलब है?
सामग्री:
सहसंबंध की अवधारणा
सहसंबंध (लैटिन "सहसंबंध" से - अनुपात, संबंध)- एक गणितीय शब्द जिसका अर्थ है यादृच्छिक मात्राओं (चर) के बीच सांख्यिकीय संभाव्य निर्भरता का माप।
उदाहरण:आइए दो प्रकार के रिश्तों को लें:
- पहला- एक व्यक्ति के हाथ में कलम. जिस दिशा में हाथ चलता है, उस दिशा में कलम चलती है। अगर हाथ आराम पर है तो कलम नहीं लिखेगी. यदि कोई व्यक्ति इसे थोड़ा जोर से दबाएगा तो कागज पर निशान अधिक गहरा होगा। इस प्रकार का संबंध सख्त निर्भरता को दर्शाता है और सहसंबद्ध नहीं है। यह रिश्ता कार्यात्मक है.
- दूसरा प्रकार- किसी व्यक्ति की शिक्षा के स्तर और साहित्य पढ़ने के बीच संबंध। यह पहले से ज्ञात नहीं है कि कौन से लोग अधिक पढ़ते हैं: उच्च शिक्षा वाले या बिना उच्च शिक्षा वाले। यह संबंध यादृच्छिक या स्टोकेस्टिक है; इसका अध्ययन सांख्यिकीय विज्ञान द्वारा किया जाता है, जो विशेष रूप से सामूहिक घटनाओं से संबंधित है। यदि एक सांख्यिकीय गणना शिक्षा के स्तर और साहित्य पढ़ने के बीच संबंध को साबित करना संभव बनाती है, तो इससे कोई भी पूर्वानुमान लगाना और घटनाओं की संभावित घटना की भविष्यवाणी करना संभव हो जाएगा। इस उदाहरण में, उच्च संभावना के साथ, यह तर्क दिया जा सकता है कि उच्च शिक्षा वाले लोग, जो अधिक शिक्षित हैं, अधिक किताबें पढ़ते हैं। लेकिन चूंकि इन मापदंडों के बीच संबंध कार्यात्मक नहीं है, इसलिए हमसे गलती हो सकती है। आप हमेशा ऐसी त्रुटि की संभावना की गणना कर सकते हैं, जो स्पष्ट रूप से छोटी होगी और इसे सांख्यिकीय महत्व का स्तर (पी) कहा जाता है।
प्राकृतिक घटनाओं के बीच संबंधों के उदाहरण हैं:प्रकृति में खाद्य श्रृंखला, मानव शरीर, जिसमें अंग प्रणालियाँ शामिल हैं जो आपस में जुड़ी हुई हैं और एक पूरे के रूप में कार्य करती हैं।
हर दिन हम रोजमर्रा की जिंदगी में सहसंबंधों का सामना करते हैं: मौसम और अच्छे मूड के बीच, लक्ष्यों का सही निर्धारण और उनकी उपलब्धि, सकारात्मक दृष्टिकोण और भाग्य, खुशी की भावना और वित्तीय कल्याण। लेकिन हम गणितीय गणनाओं पर नहीं, बल्कि मिथकों, अंतर्ज्ञान, अंधविश्वासों और निष्क्रिय अटकलों पर भरोसा करते हुए कनेक्शन की तलाश कर रहे हैं। इन घटनाओं को गणितीय भाषा में अनुवाद करना, संख्याओं में व्यक्त करना और मापना बहुत कठिन है। यह दूसरी बात है जब हम उन घटनाओं का विश्लेषण करते हैं जिनकी गणना की जा सकती है और संख्याओं के रूप में प्रस्तुत की जा सकती है। इस मामले में, हम सहसंबंध गुणांक (आर) का उपयोग करके सहसंबंध को परिभाषित कर सकते हैं, जो यादृच्छिक चर के बीच सहसंबंध की ताकत, डिग्री, निकटता और दिशा को दर्शाता है।
यादृच्छिक चरों के बीच मजबूत सहसंबंध- इन घटनाओं के बीच विशेष रूप से कुछ सांख्यिकीय संबंध की उपस्थिति का प्रमाण, लेकिन इस संबंध को एक ही घटना में स्थानांतरित नहीं किया जा सकता है, लेकिन एक अलग स्थिति के लिए। अक्सर, शोधकर्ता, अपनी गणना में दो चरों के बीच एक महत्वपूर्ण सहसंबंध प्राप्त करने के बाद, सहसंबंध विश्लेषण की सादगी के आधार पर, विशेषताओं के बीच कारण-और-प्रभाव संबंधों के अस्तित्व के बारे में गलत सहज धारणाएं बनाते हैं, यह भूल जाते हैं कि सहसंबंध गुणांक प्रकृति में संभाव्य है। .
उदाहरण:बर्फीले हालात के दौरान घायल हुए लोगों की संख्या और मोटर वाहनों के बीच सड़क दुर्घटनाओं की संख्या। ये मात्राएँ एक-दूसरे के साथ सहसंबद्ध होंगी, हालाँकि वे बिल्कुल भी आपस में जुड़ी हुई नहीं हैं, लेकिन केवल इन यादृच्छिक घटनाओं के सामान्य कारण - काली बर्फ के साथ संबंध रखती हैं। यदि विश्लेषण से घटनाओं के बीच कोई सहसंबंध प्रकट नहीं होता है, तो यह अभी तक उनके बीच निर्भरता की अनुपस्थिति का प्रमाण नहीं है, जो जटिल गैर-रेखीय हो सकता है और सहसंबंध गणनाओं द्वारा प्रकट नहीं किया जा सकता है।
सहसंबंध की अवधारणा को वैज्ञानिक उपयोग में लाने वाले पहले फ्रांसीसी थे जीवाश्म विज्ञानी जॉर्जेस क्यूवियर. 18वीं शताब्दी में, उन्होंने जीवित जीवों के अंगों और अंगों के सहसंबंध का नियम निकाला, जिसकी बदौलत शरीर के पाए गए हिस्सों (अवशेषों) से एक संपूर्ण जीवाश्म प्राणी, जानवर की उपस्थिति को बहाल करना संभव हो गया। सांख्यिकी में सहसंबंध शब्द का प्रयोग पहली बार 1886 में एक अंग्रेजी वैज्ञानिक द्वारा किया गया था फ्रांसिस गैल्टन. लेकिन वह सहसंबंध गुणांक की गणना के लिए सटीक सूत्र प्राप्त नहीं कर सके, लेकिन उनके छात्र ने यह कर दिखाया - प्रसिद्ध गणितज्ञ और जीवविज्ञानी कार्ल पियर्सन।
सहसंबंध के प्रकार
महत्व से- अत्यधिक महत्वपूर्ण, महत्वपूर्ण और महत्वहीन।
प्रकार |
आर किसके बराबर है |
अत्यधिक महत्वपूर्ण |
आर सांख्यिकीय महत्व पी के स्तर से मेल खाता है<=0,01 |
महत्वपूर्ण |
r, p से मेल खाता है<=0,05 |
तुच्छ |
r p>0.1 तक नहीं पहुंचता है |
नकारात्मक(एक चर के मूल्य में कमी से दूसरे के स्तर में वृद्धि होती है: एक व्यक्ति को जितना अधिक फोबिया होता है, उसके नेतृत्व की स्थिति पर कब्जा करने की संभावना उतनी ही कम होती है) और सकारात्मक (यदि एक चर में वृद्धि से वृद्धि होती है) दूसरे के स्तर पर: आप जितना अधिक घबराएंगे, आपके बीमार होने की संभावना उतनी ही अधिक होगी)। यदि चरों के बीच कोई संबंध नहीं है, तो ऐसे सहसंबंध को शून्य कहा जाता है।
रेखीय(जब एक मान बढ़ता या घटता है, तो दूसरा भी बढ़ता या घटता है) और अरैखिक (जब एक मान बदलता है, तो दूसरे में परिवर्तन की प्रकृति को रैखिक संबंध का उपयोग करके वर्णित नहीं किया जा सकता है, तब अन्य गणितीय नियम लागू होते हैं - बहुपद, अतिपरवलयिक) रिश्तों)।
ताकत से.
कठिनाइयाँ
अध्ययन के तहत चर किस पैमाने से संबंधित हैं, इसके आधार पर विभिन्न प्रकार के सहसंबंध गुणांक की गणना की जाती है:
- पियर्सन सहसंबंध गुणांक, जोड़ीदार रैखिक सहसंबंध गुणांक, या उत्पाद क्षण सहसंबंध की गणना अंतराल और पैमाने माप पैमानों वाले चर के लिए की जाती है।
- स्पीयरमैन या केंडल रैंक सहसंबंध गुणांक - जब कम से कम एक मात्रा में क्रमिक पैमाना होता है या सामान्य रूप से वितरित नहीं होता है।
- बिंदु द्विक्रमिक सहसंबंध गुणांक (फेचनर साइन सहसंबंध गुणांक) - यदि दो मात्राओं में से एक द्विभाजित है।
- चार-क्षेत्र सहसंबंध गुणांक (एकाधिक रैंक सहसंबंध (समन्वय) गुणांक - यदि दो चर द्विभाजित हैं।
पियर्सन गुणांक पैरामीट्रिक सहसंबंध संकेतकों को संदर्भित करता है, अन्य सभी गैर-पैरामीट्रिक हैं।
सहसंबंध गुणांक मान -1 से +1 तक होता है। पूर्ण सकारात्मक सहसंबंध के साथ, r = +1, पूर्ण नकारात्मक सहसंबंध के साथ, r = -1।
सूत्र और गणना
उदाहरण
दो चर के बीच संबंध निर्धारित करना आवश्यक है: स्कूली बच्चों के बीच बौद्धिक विकास का स्तर (परीक्षण के अनुसार) और प्रति माह देरी की संख्या (शैक्षणिक पत्रिका में प्रविष्टियों के अनुसार)।
प्रारंभिक डेटा तालिका में प्रस्तुत किया गया है:
№ |
आईक्यू डेटा (x) |
देरी की संख्या पर डेटा (y) |
जोड़ |
1122 |
|
औसत |
112,2 |
प्राप्त संकेतक की सही व्याख्या देने के लिए, सहसंबंध गुणांक (+ या -) के संकेत और उसके निरपेक्ष मान (मॉड्यूलो) का विश्लेषण करना आवश्यक है।
ताकत के आधार पर सहसंबंध गुणांक के वर्गीकरण की तालिका के अनुसार, हम यह निष्कर्ष निकालते हैं कि rxy = -0.827 एक मजबूत नकारात्मक सहसंबंध है। इस प्रकार, देर से आने वाले स्कूली बच्चों की संख्या उनके बौद्धिक विकास के स्तर पर बहुत अधिक निर्भर करती है। यह कहा जा सकता है कि उच्च IQ स्तर वाले छात्र निम्न IQ स्तर वाले छात्रों की तुलना में कक्षाओं के लिए कम देर से आते हैं।
सहसंबंध गुणांक का उपयोग वैज्ञानिकों द्वारा दो मात्राओं या घटनाओं की निर्भरता की धारणा की पुष्टि या खंडन करने और इसकी ताकत और महत्व को मापने के लिए और छात्रों द्वारा विभिन्न विषयों में अनुभवजन्य और सांख्यिकीय अनुसंधान करने के लिए किया जा सकता है। यह याद रखना चाहिए कि यह सूचक एक आदर्श उपकरण नहीं है; इसकी गणना केवल एक रैखिक संबंध की ताकत को मापने के लिए की जाती है और यह हमेशा एक संभाव्य मान होगा जिसमें एक निश्चित त्रुटि होती है।
सहसंबंध विश्लेषण का उपयोग निम्नलिखित क्षेत्रों में किया जाता है:
- आर्थिक विज्ञान;
- खगोल भौतिकी;
- सामाजिक विज्ञान (समाजशास्त्र, मनोविज्ञान, शिक्षाशास्त्र);
- कृषिरसायन;
- धातुकर्म;
- उद्योग (गुणवत्ता नियंत्रण के लिए);
- हाइड्रोबायोलॉजी;
- बॉयोमीट्रिक्स, आदि
सहसंबंध विश्लेषण पद्धति की लोकप्रियता के कारण:
- सहसंबंध गुणांक की गणना की सापेक्ष सरलता के लिए विशेष गणितीय शिक्षा की आवश्यकता नहीं होती है।
- आपको बड़े पैमाने पर यादृच्छिक चर के बीच संबंधों की गणना करने की अनुमति देता है, जो सांख्यिकीय विज्ञान में विश्लेषण का विषय हैं। इस संबंध में, यह पद्धति सांख्यिकीय अनुसंधान के क्षेत्र में व्यापक हो गई है।
मुझे आशा है कि अब आप कार्यात्मक संबंध को सहसंबंधी संबंध से अलग करने में सक्षम होंगे और जानेंगे कि जब आप टेलीविज़न पर सुनते हैं या प्रेस में सहसंबंध के बारे में पढ़ते हैं, तो इसका मतलब दो घटनाओं के बीच एक सकारात्मक और काफी महत्वपूर्ण अन्योन्याश्रयता है।