तब सहसंबंध गुणांक 0 है। सहसंबंध गुणांक का महत्व. सहसंबंध विश्लेषण है

सहसंबंध गुणांक दो चरों के बीच संबंध की डिग्री है। इसकी गणना से यह पता चलता है कि दो डेटा सेट के बीच कोई संबंध है या नहीं। प्रतिगमन के विपरीत, सहसंबंध मात्राओं के मूल्यों की भविष्यवाणी नहीं करता है। हालाँकि, गुणांक की गणना प्रारंभिक सांख्यिकीय विश्लेषण में एक महत्वपूर्ण कदम है। उदाहरण के लिए, हमने पाया कि प्रत्यक्ष विदेशी निवेश के स्तर और सकल घरेलू उत्पाद की वृद्धि दर के बीच सहसंबंध गुणांक उच्च है। इससे हमें यह विचार मिलता है कि समृद्धि सुनिश्चित करने के लिए विशेष रूप से विदेशी उद्यमियों के लिए अनुकूल माहौल बनाना आवश्यक है। पहली नज़र में इतना स्पष्ट निष्कर्ष नहीं!

सहसंबंध और कारणता

शायद आँकड़ों का एक भी क्षेत्र ऐसा नहीं है जो हमारे जीवन में इतनी मजबूती से स्थापित हो गया हो। सहसंबंध गुणांक का उपयोग सामाजिक ज्ञान के सभी क्षेत्रों में किया जाता है। इसका मुख्य खतरा यह है कि लोगों को समझाने और उन्हें कुछ निष्कर्षों पर विश्वास दिलाने के लिए अक्सर इसके उच्च मूल्यों पर अटकलें लगाई जाती हैं। हालाँकि, वास्तव में, एक मजबूत सहसंबंध मात्राओं के बीच कारण-और-प्रभाव संबंध का बिल्कुल भी संकेत नहीं देता है।

सहसंबंध गुणांक: पियर्सन और स्पीयरमैन सूत्र

ऐसे कई बुनियादी संकेतक हैं जो दो चरों के बीच संबंध को दर्शाते हैं। ऐतिहासिक रूप से, पहला पियर्सन रैखिक सहसंबंध गुणांक है। यह स्कूल में पढ़ाया जाता है. इसे फादर के काम के आधार पर के. पियर्सन और जे. यूल द्वारा विकसित किया गया था। गैल्टन। यह गुणांक आपको तर्कसंगत संख्याओं के बीच संबंध देखने की अनुमति देता है जो तर्कसंगत रूप से बदलते हैं। यह हमेशा -1 से अधिक और 1 से कम होता है। एक ऋणात्मक संख्या व्युत्क्रमानुपाती संबंध को इंगित करती है। यदि गुणांक शून्य है, तो चरों के बीच कोई संबंध नहीं है। एक धनात्मक संख्या के बराबर - अध्ययनाधीन मात्राओं के बीच सीधा आनुपातिक संबंध होता है। स्पीयरमैन का रैंक सहसंबंध गुणांक आपको परिवर्तनीय मानों का पदानुक्रम बनाकर गणना को सरल बनाने की अनुमति देता है।

चरों के बीच संबंध

सहसंबंध दो प्रश्नों के उत्तर देने में मदद करता है। पहला, चरों के बीच संबंध सकारात्मक है या नकारात्मक। दूसरा, लत कितनी प्रबल है. सहसंबंध विश्लेषण एक शक्तिशाली उपकरण है जो यह महत्वपूर्ण जानकारी प्रदान कर सकता है। यह देखना आसान है कि पारिवारिक आय और व्यय आनुपातिक रूप से गिरते और बढ़ते हैं। यह रिश्ता सकारात्मक माना जाता है. इसके विपरीत, जब किसी उत्पाद की कीमत बढ़ती है, तो उसकी मांग कम हो जाती है। इस रिश्ते को नकारात्मक कहा जाता है. सहसंबंध गुणांक का मान -1 और 1 के बीच होता है। शून्य का मतलब है कि अध्ययन के तहत मूल्यों के बीच कोई संबंध नहीं है। प्राप्त संकेतक चरम मूल्यों के जितना करीब होगा, संबंध उतना ही मजबूत होगा (नकारात्मक या सकारात्मक)। निर्भरता की अनुपस्थिति -0.1 से 0.1 तक के गुणांक द्वारा इंगित की जाती है। आपको यह समझने की आवश्यकता है कि ऐसा मान केवल एक रैखिक संबंध की अनुपस्थिति को इंगित करता है।

आवेदन की विशेषताएं

दोनों संकेतकों के उपयोग में कुछ धारणाएँ शामिल हैं। सबसे पहले, एक मजबूत संबंध की उपस्थिति इस तथ्य को निर्धारित नहीं करती है कि एक मात्रा दूसरे को निर्धारित करती है। एक तीसरी मात्रा भी हो सकती है जो उनमें से प्रत्येक को परिभाषित करती है। दूसरे, उच्च पियर्सन सहसंबंध गुणांक अध्ययन किए गए चर के बीच कारण-और-प्रभाव संबंध को इंगित नहीं करता है। तीसरा, यह एक विशेष रूप से रैखिक संबंध दर्शाता है। लिंग या पसंदीदा रंग जैसी श्रेणियों के बजाय सार्थक मात्रात्मक डेटा (उदाहरण के लिए, बैरोमीटर का दबाव, वायु तापमान) का मूल्यांकन करने के लिए सहसंबंध का उपयोग किया जा सकता है।

एकाधिक सहसंबंध गुणांक

पियर्सन और स्पीयरमैन ने दो चरों के बीच संबंध की जांच की। लेकिन अगर उनमें से तीन या उससे भी अधिक हों तो क्या करें। यहीं पर एकाधिक सहसंबंध गुणांक बचाव के लिए आता है। उदाहरण के लिए, सकल राष्ट्रीय उत्पाद न केवल प्रत्यक्ष विदेशी निवेश से प्रभावित होता है, बल्कि सरकार की मौद्रिक और राजकोषीय नीतियों के साथ-साथ निर्यात के स्तर से भी प्रभावित होता है। सकल घरेलू उत्पाद की वृद्धि दर और मात्रा कई कारकों की परस्पर क्रिया का परिणाम है। हालाँकि, यह समझा जाना चाहिए कि एकाधिक सहसंबंध मॉडल कई सरलीकरणों और मान्यताओं पर आधारित है। सबसे पहले, मूल्यों के बीच बहुसंरेखता को बाहर रखा गया है। दूसरे, आश्रित और उसे प्रभावित करने वाले चर के बीच का संबंध रैखिक माना जाता है।

सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के क्षेत्र

मात्राओं के बीच संबंध खोजने की यह विधि सांख्यिकी में व्यापक रूप से उपयोग की जाती है। इसका सहारा अक्सर तीन मुख्य मामलों में लिया जाता है:

  1. दो चरों के मानों के बीच कारण-और-प्रभाव संबंधों का परीक्षण करना। परिणामस्वरूप, शोधकर्ता एक रैखिक संबंध की खोज करने और एक सूत्र प्राप्त करने की उम्मीद करता है जो मात्राओं के बीच इन संबंधों का वर्णन करता है। उनकी माप की इकाइयाँ भिन्न हो सकती हैं।
  2. मात्राओं के बीच संबंध की जाँच करना। इस मामले में, कोई भी यह निर्धारित नहीं करता है कि कौन सा चर आश्रित चर है। ऐसा हो सकता है कि कोई अन्य कारक दोनों मात्राओं का मूल्य निर्धारित करता हो।
  3. समीकरण प्राप्त करने के लिए इस मामले में, आप बस इसमें संख्याओं को प्रतिस्थापित कर सकते हैं और अज्ञात चर के मूल्यों का पता लगा सकते हैं।

एक व्यक्ति कारण-और-प्रभाव संबंध की तलाश में है

चेतना को इस तरह से डिज़ाइन किया गया है कि हमें निश्चित रूप से हमारे आस-पास होने वाली घटनाओं की व्याख्या करने की आवश्यकता है। एक व्यक्ति हमेशा उस दुनिया की तस्वीर जिसमें वह रहता है और उसे प्राप्त होने वाली जानकारी के बीच संबंध की तलाश में रहता है। मस्तिष्क अक्सर अव्यवस्था से व्यवस्था बनाता है। वह आसानी से एक कारण-और-प्रभाव संबंध देख सकता है जहां कोई नहीं है। वैज्ञानिकों को विशेष रूप से इस प्रवृत्ति पर काबू पाना सीखना होगा। अकादमिक करियर में डेटा के बीच संबंधों का निष्पक्ष मूल्यांकन करने की क्षमता आवश्यक है।

मीडिया पूर्वाग्रह

आइए विचार करें कि सहसंबंध की उपस्थिति की गलत व्याख्या कैसे की जा सकती है। बुरे व्यवहार वाले ब्रिटिश छात्रों के एक समूह से पूछा गया कि क्या उनके माता-पिता धूम्रपान करते हैं। फिर यह परीक्षण अखबार में छपा. परिणाम में माता-पिता के धूम्रपान और उनके बच्चों के अपराध के बीच एक मजबूत संबंध दिखाया गया। इस अध्ययन को करने वाले प्रोफेसर ने सिगरेट पैक पर इस बारे में चेतावनी लिखने का भी सुझाव दिया। हालाँकि, इस निष्कर्ष के साथ कई समस्याएं हैं। सबसे पहले, सहसंबंध यह नहीं दर्शाता है कि कौन सी मात्रा स्वतंत्र है। इसलिए, यह मान लेना काफी संभव है कि माता-पिता की हानिकारक आदत बच्चों की अवज्ञा के कारण होती है। दूसरे, यह निश्चित रूप से नहीं कहा जा सकता कि दोनों समस्याएँ किसी तीसरे कारक के कारण उत्पन्न नहीं हुईं। उदाहरण के लिए, कम आय वाले परिवार। यह अध्ययन आयोजित करने वाले प्रोफेसर के प्रारंभिक निष्कर्षों के भावनात्मक पहलू पर ध्यान देने योग्य है। वह धूम्रपान के प्रबल विरोधी थे। इसलिए, यह आश्चर्य की बात नहीं है कि उन्होंने अपने शोध के परिणामों की इस तरह से व्याख्या की।

निष्कर्ष

दो चरों के बीच कारण-और-प्रभाव संबंध के रूप में सहसंबंध की गलत व्याख्या करने से अपमानजनक शोध त्रुटियां हो सकती हैं। समस्या यह है कि यह मानवीय चेतना के मूल में है। कई मार्केटिंग युक्तियाँ इस सुविधा पर आधारित हैं। कारण और प्रभाव और सहसंबंध के बीच अंतर को समझने से आप अपने दैनिक जीवन और अपने पेशेवर करियर दोनों में जानकारी का तर्कसंगत विश्लेषण कर सकते हैं।

सहसंबंध गुणांक दो चरों के बीच संबंध की डिग्री है। इसकी गणना से यह पता चलता है कि दो डेटा सेट के बीच कोई संबंध है या नहीं। प्रतिगमन के विपरीत, सहसंबंध मात्राओं के मूल्यों की भविष्यवाणी नहीं करता है। हालाँकि, गुणांक की गणना प्रारंभिक सांख्यिकीय विश्लेषण में एक महत्वपूर्ण कदम है। उदाहरण के लिए, हमने पाया कि प्रत्यक्ष विदेशी निवेश के स्तर और सकल घरेलू उत्पाद की वृद्धि दर के बीच सहसंबंध गुणांक उच्च है। इससे हमें यह विचार मिलता है कि समृद्धि सुनिश्चित करने के लिए विशेष रूप से विदेशी उद्यमियों के लिए अनुकूल माहौल बनाना आवश्यक है। पहली नज़र में इतना स्पष्ट निष्कर्ष नहीं!

सहसंबंध और कारणता

शायद आँकड़ों का एक भी क्षेत्र ऐसा नहीं है जो हमारे जीवन में इतनी मजबूती से स्थापित हो गया हो। सहसंबंध गुणांक का उपयोग सामाजिक ज्ञान के सभी क्षेत्रों में किया जाता है। इसका मुख्य खतरा यह है कि लोगों को समझाने और उन्हें कुछ निष्कर्षों पर विश्वास दिलाने के लिए अक्सर इसके उच्च मूल्यों पर अटकलें लगाई जाती हैं। हालाँकि, वास्तव में, एक मजबूत सहसंबंध मात्राओं के बीच कारण-और-प्रभाव संबंध का बिल्कुल भी संकेत नहीं देता है।

सहसंबंध गुणांक: पियर्सन और स्पीयरमैन सूत्र

ऐसे कई बुनियादी संकेतक हैं जो दो चरों के बीच संबंध को दर्शाते हैं। ऐतिहासिक रूप से, पहला पियर्सन रैखिक सहसंबंध गुणांक है। यह स्कूल में पढ़ाया जाता है. इसे फादर के काम के आधार पर के. पियर्सन और जे. यूल द्वारा विकसित किया गया था। गैल्टन। यह गुणांक आपको तर्कसंगत संख्याओं के बीच संबंध देखने की अनुमति देता है जो तर्कसंगत रूप से बदलते हैं। यह हमेशा -1 से अधिक और 1 से कम होता है। एक ऋणात्मक संख्या व्युत्क्रमानुपाती संबंध को इंगित करती है। यदि गुणांक शून्य है, तो चरों के बीच कोई संबंध नहीं है। एक धनात्मक संख्या के बराबर - अध्ययनाधीन मात्राओं के बीच सीधा आनुपातिक संबंध होता है। स्पीयरमैन का रैंक सहसंबंध गुणांक आपको परिवर्तनीय मानों का पदानुक्रम बनाकर गणना को सरल बनाने की अनुमति देता है।

चरों के बीच संबंध

सहसंबंध दो प्रश्नों के उत्तर देने में मदद करता है। पहला, चरों के बीच संबंध सकारात्मक है या नकारात्मक। दूसरा, लत कितनी प्रबल है. सहसंबंध विश्लेषण एक शक्तिशाली उपकरण है जो यह महत्वपूर्ण जानकारी प्रदान कर सकता है। यह देखना आसान है कि पारिवारिक आय और व्यय आनुपातिक रूप से गिरते और बढ़ते हैं। यह रिश्ता सकारात्मक माना जाता है. इसके विपरीत, जब किसी उत्पाद की कीमत बढ़ती है, तो उसकी मांग कम हो जाती है। इस रिश्ते को नकारात्मक कहा जाता है. सहसंबंध गुणांक का मान -1 और 1 के बीच होता है। शून्य का मतलब है कि अध्ययन के तहत मूल्यों के बीच कोई संबंध नहीं है। प्राप्त संकेतक चरम मूल्यों के जितना करीब होगा, संबंध उतना ही मजबूत होगा (नकारात्मक या सकारात्मक)। निर्भरता की अनुपस्थिति -0.1 से 0.1 तक के गुणांक द्वारा इंगित की जाती है। आपको यह समझने की आवश्यकता है कि ऐसा मान केवल एक रैखिक संबंध की अनुपस्थिति को इंगित करता है।

आवेदन की विशेषताएं

दोनों संकेतकों के उपयोग में कुछ धारणाएँ शामिल हैं। सबसे पहले, एक मजबूत संबंध की उपस्थिति इस तथ्य को निर्धारित नहीं करती है कि एक मात्रा दूसरे को निर्धारित करती है। एक तीसरी मात्रा भी हो सकती है जो उनमें से प्रत्येक को परिभाषित करती है। दूसरे, उच्च पियर्सन सहसंबंध गुणांक अध्ययन किए गए चर के बीच कारण-और-प्रभाव संबंध को इंगित नहीं करता है। तीसरा, यह एक विशेष रूप से रैखिक संबंध दर्शाता है। लिंग या पसंदीदा रंग जैसी श्रेणियों के बजाय सार्थक मात्रात्मक डेटा (उदाहरण के लिए, बैरोमीटर का दबाव, वायु तापमान) का मूल्यांकन करने के लिए सहसंबंध का उपयोग किया जा सकता है।

एकाधिक सहसंबंध गुणांक

पियर्सन और स्पीयरमैन ने दो चरों के बीच संबंध की जांच की। लेकिन अगर उनमें से तीन या उससे भी अधिक हों तो क्या करें। यहीं पर एकाधिक सहसंबंध गुणांक बचाव के लिए आता है। उदाहरण के लिए, सकल राष्ट्रीय उत्पाद न केवल प्रत्यक्ष विदेशी निवेश से प्रभावित होता है, बल्कि सरकार की मौद्रिक और राजकोषीय नीतियों के साथ-साथ निर्यात के स्तर से भी प्रभावित होता है। सकल घरेलू उत्पाद की वृद्धि दर और मात्रा कई कारकों की परस्पर क्रिया का परिणाम है। हालाँकि, यह समझा जाना चाहिए कि एकाधिक सहसंबंध मॉडल कई सरलीकरणों और मान्यताओं पर आधारित है। सबसे पहले, मूल्यों के बीच बहुसंरेखता को बाहर रखा गया है। दूसरे, आश्रित और उसे प्रभावित करने वाले चर के बीच का संबंध रैखिक माना जाता है।

सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के क्षेत्र

मात्राओं के बीच संबंध खोजने की यह विधि सांख्यिकी में व्यापक रूप से उपयोग की जाती है। इसका सहारा अक्सर तीन मुख्य मामलों में लिया जाता है:

  1. दो चरों के मानों के बीच कारण-और-प्रभाव संबंधों का परीक्षण करना। परिणामस्वरूप, शोधकर्ता एक रैखिक संबंध की खोज करने और एक सूत्र प्राप्त करने की उम्मीद करता है जो मात्राओं के बीच इन संबंधों का वर्णन करता है। उनकी माप की इकाइयाँ भिन्न हो सकती हैं।
  2. मात्राओं के बीच संबंध की जाँच करना। इस मामले में, कोई भी यह निर्धारित नहीं करता है कि कौन सा चर आश्रित चर है। ऐसा हो सकता है कि कोई अन्य कारक दोनों मात्राओं का मूल्य निर्धारित करता हो।
  3. समीकरण प्राप्त करने के लिए इस मामले में, आप बस इसमें संख्याओं को प्रतिस्थापित कर सकते हैं और अज्ञात चर के मूल्यों का पता लगा सकते हैं।

एक व्यक्ति कारण-और-प्रभाव संबंध की तलाश में है

चेतना को इस तरह से डिज़ाइन किया गया है कि हमें निश्चित रूप से हमारे आस-पास होने वाली घटनाओं की व्याख्या करने की आवश्यकता है। एक व्यक्ति हमेशा उस दुनिया की तस्वीर जिसमें वह रहता है और उसे प्राप्त होने वाली जानकारी के बीच संबंध की तलाश में रहता है। मस्तिष्क अक्सर अव्यवस्था से व्यवस्था बनाता है। वह आसानी से एक कारण-और-प्रभाव संबंध देख सकता है जहां कोई नहीं है। वैज्ञानिकों को विशेष रूप से इस प्रवृत्ति पर काबू पाना सीखना होगा। अकादमिक करियर में डेटा के बीच संबंधों का निष्पक्ष मूल्यांकन करने की क्षमता आवश्यक है।

मीडिया पूर्वाग्रह

आइए विचार करें कि सहसंबंध की उपस्थिति की गलत व्याख्या कैसे की जा सकती है। बुरे व्यवहार वाले ब्रिटिश छात्रों के एक समूह से पूछा गया कि क्या उनके माता-पिता धूम्रपान करते हैं। फिर यह परीक्षण अखबार में छपा. परिणाम में माता-पिता के धूम्रपान और उनके बच्चों के अपराध के बीच एक मजबूत संबंध दिखाया गया। इस अध्ययन को करने वाले प्रोफेसर ने सिगरेट पैक पर इस बारे में चेतावनी लिखने का भी सुझाव दिया। हालाँकि, इस निष्कर्ष के साथ कई समस्याएं हैं। सबसे पहले, सहसंबंध यह नहीं दर्शाता है कि कौन सी मात्रा स्वतंत्र है। इसलिए, यह मान लेना काफी संभव है कि माता-पिता की हानिकारक आदत बच्चों की अवज्ञा के कारण होती है। दूसरे, यह निश्चित रूप से नहीं कहा जा सकता कि दोनों समस्याएँ किसी तीसरे कारक के कारण उत्पन्न नहीं हुईं। उदाहरण के लिए, कम आय वाले परिवार। यह अध्ययन आयोजित करने वाले प्रोफेसर के प्रारंभिक निष्कर्षों के भावनात्मक पहलू पर ध्यान देने योग्य है। वह धूम्रपान के प्रबल विरोधी थे। इसलिए, यह आश्चर्य की बात नहीं है कि उन्होंने अपने शोध के परिणामों की इस तरह से व्याख्या की।

निष्कर्ष

दो चरों के बीच कारण-और-प्रभाव संबंध के रूप में सहसंबंध की गलत व्याख्या करने से अपमानजनक शोध त्रुटियां हो सकती हैं। समस्या यह है कि यह मानवीय चेतना के मूल में है। कई मार्केटिंग युक्तियाँ इस सुविधा पर आधारित हैं। कारण और प्रभाव और सहसंबंध के बीच अंतर को समझने से आप अपने दैनिक जीवन और अपने पेशेवर करियर दोनों में जानकारी का तर्कसंगत विश्लेषण कर सकते हैं।

वैज्ञानिक और व्यावहारिक उद्देश्यों के लिए सार्वजनिक स्वास्थ्य और स्वास्थ्य सेवा का अध्ययन करते समय, शोधकर्ता को अक्सर सांख्यिकीय आबादी के कारक और प्रदर्शन विशेषताओं (कारण संबंध) के बीच संबंधों का सांख्यिकीय विश्लेषण करना पड़ता है या इस आबादी की कई विशेषताओं में समानांतर परिवर्तनों की निर्भरता निर्धारित करनी होती है। किसी तीसरे मान पर (उनके सामान्य कारण पर)। इस कनेक्शन की विशेषताओं का अध्ययन करने, इसका आकार और दिशा निर्धारित करने और इसकी विश्वसनीयता का मूल्यांकन करने में सक्षम होना आवश्यक है। इस प्रयोजन के लिए, सहसंबंध विधियों का उपयोग किया जाता है।

  1. विशेषताओं के बीच मात्रात्मक संबंधों की अभिव्यक्ति के प्रकार
    • कार्यात्मक कनेक्शन
    • सहसंबंध संबंध
  2. कार्यात्मक और सहसंबद्ध संबंध की परिभाषाएँ

    कार्यात्मक संबंध- दो विशेषताओं के बीच इस प्रकार का संबंध जब उनमें से एक का प्रत्येक मान दूसरे के कड़ाई से परिभाषित मूल्य से मेल खाता है (एक वृत्त का क्षेत्रफल वृत्त की त्रिज्या पर निर्भर करता है, आदि)। कार्यात्मक संबंध भौतिक और गणितीय प्रक्रियाओं की विशेषता है।

    सह - संबंध- ऐसा संबंध जिसमें एक विशेषता का प्रत्येक विशिष्ट मान उससे संबंधित किसी अन्य विशेषता के कई मूल्यों से मेल खाता है (किसी व्यक्ति की ऊंचाई और वजन के बीच संबंध; शरीर के तापमान और नाड़ी दर के बीच संबंध, आदि)। सहसंबंध चिकित्सा और जैविक प्रक्रियाओं के लिए विशिष्ट है।

  3. सहसंबंध संबंध स्थापित करने का व्यावहारिक महत्व. कारक और परिणामी संकेतों के बीच कारण और प्रभाव की पहचान (शारीरिक विकास का आकलन करते समय, काम करने की स्थिति, रहने की स्थिति और स्वास्थ्य की स्थिति के बीच संबंध निर्धारित करने के लिए, उम्र, सेवा की लंबाई, व्यावसायिक की उपस्थिति पर बीमारियों की आवृत्ति की निर्भरता का निर्धारण करते समय) खतरे, आदि)

    किसी तीसरे मान पर कई विशेषताओं में समानांतर परिवर्तन की निर्भरता। उदाहरण के लिए, कार्यशाला में उच्च तापमान के प्रभाव में रक्तचाप, रक्त की चिपचिपाहट, नाड़ी की दर आदि में परिवर्तन होता है।

  4. विशेषताओं के बीच संबंधों की दिशा और मजबूती को दर्शाने वाला एक मूल्य. सहसंबंध गुणांक, जो एक संख्या में संकेतों (घटना) के बीच संबंध की दिशा और ताकत का अंदाजा देता है, इसके उतार-चढ़ाव की सीमा 0 से ± 1 तक होती है
  5. सहसंबंध प्रस्तुत करने की विधियाँ
    • ग्राफ़ (स्कैटर प्लॉट)
    • सहसंबंध गुणांक
  6. सहसंबंध की दिशा
    • सीधा
    • रिवर्स
  7. सहसंबंध की ताकत
    • मजबूत: ±0.7 से ±1
    • औसत: ±0.3 से ±0.699
    • कमजोर: 0 से ±0.299
  8. सहसंबंध गुणांक और सूत्र निर्धारित करने की विधियाँ
    • वर्गों की विधि (पियर्सन विधि)
    • रैंक विधि (स्पीयरमैन विधि)
  9. सहसंबंध गुणांक का उपयोग करने के लिए पद्धति संबंधी आवश्यकताएँ
    • संबंध को मापना केवल गुणात्मक रूप से सजातीय आबादी में संभव है (उदाहरण के लिए, लिंग और उम्र के आधार पर सजातीय आबादी में ऊंचाई और वजन के बीच संबंध को मापना)
    • गणना निरपेक्ष या व्युत्पन्न मूल्यों का उपयोग करके की जा सकती है
    • सहसंबंध गुणांक की गणना करने के लिए, अवर्गीकृत भिन्नता श्रृंखला का उपयोग किया जाता है (यह आवश्यकता केवल वर्गों की विधि का उपयोग करके सहसंबंध गुणांक की गणना करते समय लागू होती है)
    • प्रेक्षणों की संख्या कम से कम 30
  10. रैंक सहसंबंध विधि (स्पीयरमैन की विधि) का उपयोग करने के लिए सिफारिशें
    • जब कनेक्शन की मजबूती को सटीक रूप से स्थापित करने की कोई आवश्यकता नहीं है, लेकिन अनुमानित डेटा पर्याप्त है
    • जब विशेषताओं को न केवल मात्रात्मक, बल्कि गुणात्मक मूल्यों द्वारा भी दर्शाया जाता है
    • जब विशेषताओं की वितरण श्रृंखला में खुले विकल्प हों (उदाहरण के लिए, 1 वर्ष तक का कार्य अनुभव, आदि)
  11. वर्गों की विधि का उपयोग करने के लिए सिफ़ारिशें (पियर्सन की विधि)
    • जब विशेषताओं के बीच संबंध की ताकत का सटीक निर्धारण आवश्यक हो
    • जब संकेतों में केवल मात्रात्मक अभिव्यक्ति होती है
  12. सहसंबंध गुणांक की गणना के लिए पद्धति और प्रक्रिया

    1) वर्गों की विधि

    2) रैंक विधि

  13. सहसंबंध गुणांक का उपयोग करके सहसंबंध संबंध का आकलन करने की योजना
  14. सहसंबंध गुणांक त्रुटि की गणना
  15. रैंक सहसंबंध विधि और वर्गों की विधि द्वारा प्राप्त सहसंबंध गुणांक की विश्वसनीयता का अनुमान

    विधि 1
    विश्वसनीयता सूत्र द्वारा निर्धारित की जाती है:

    टी मानदंड का मूल्यांकन टी मानों की एक तालिका का उपयोग करके किया जाता है, जिसमें स्वतंत्रता की डिग्री (एन - 2) की संख्या को ध्यान में रखा जाता है, जहां एन युग्मित विकल्पों की संख्या है। टी मानदंड, संभाव्यता पी ≥99% के अनुरूप, तालिका एक के बराबर या उससे अधिक होना चाहिए।

    विधि 2
    मानक सहसंबंध गुणांक की एक विशेष तालिका का उपयोग करके विश्वसनीयता का आकलन किया जाता है। इस मामले में, एक सहसंबंध गुणांक को विश्वसनीय माना जाता है, जब एक निश्चित संख्या में स्वतंत्रता की डिग्री (एन - 2) के साथ, यह तालिका के बराबर या उससे अधिक होता है, जो त्रुटि-मुक्त भविष्यवाणी की डिग्री पी ≥95% के अनुरूप होता है। .

वर्गों की विधि का उपयोग करने के लिए

व्यायाम:सहसंबंध गुणांक की गणना करें, पानी में कैल्शियम की मात्रा और पानी की कठोरता के बीच संबंध की दिशा और ताकत निर्धारित करें, यदि निम्नलिखित डेटा ज्ञात हो (तालिका 1)। रिश्ते की विश्वसनीयता का आकलन करें. एक निष्कर्ष निकालो।

तालिका नंबर एक

विधि के चुनाव का औचित्य.समस्या को हल करने के लिए वर्गों की विधि (पियर्सन) को चुना गया, क्योंकि प्रत्येक चिह्न (पानी की कठोरता और कैल्शियम की मात्रा) की एक संख्यात्मक अभिव्यक्ति होती है; कोई खुला विकल्प नहीं.

समाधान.
गणना का क्रम पाठ में वर्णित है, परिणाम तालिका में प्रस्तुत किए गए हैं। युग्मित तुलनीय विशेषताओं की श्रृंखला बनाने के बाद, उन्हें x (पानी की कठोरता डिग्री में) और y (पानी में कैल्शियम की मात्रा mg/l में) से निरूपित करें।

पानी की कठोरता
(डिग्री में)
पानी में कैल्शियम की मात्रा
(मिलीग्राम/लीटर में)
डी एक्स डी वाई डी एक्स एक्स डी वाई डी एक्स 2 डी वाई 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
एम एक्स =Σ एक्स / एन एम वाई =Σ वाई / एन Σ डी एक्स एक्स डी वाई =7078 Σ डी एक्स 2 =982 Σ डी वाई 2 =51056
एम एक्स =120/6=20 एम वाई =852/6=142
  1. सूत्रों का उपयोग करके पंक्ति विकल्प "x" में M x और पंक्ति विकल्प "y" में M y का औसत मान निर्धारित करें:
    एम एक्स = Σх/एन (कॉलम 1) और
    एम वाई = Σу/एन (कॉलम 2)
  2. श्रृंखला "x" और श्रृंखला "y" में परिकलित औसत से प्रत्येक विकल्प का विचलन (d x और d y) ज्ञात करें।
    d x = x - M x (कॉलम 3) और d y = y - M y (कॉलम 4)।
  3. विचलनों का गुणनफल खोजें d x x d y और उनका योग करें: Σ d x x d y (कॉलम 5)
  4. प्रत्येक विचलन d
  5. उत्पाद Σ d x 2 x Σ d y 2 निर्धारित करें और इस उत्पाद से वर्गमूल निकालें
  6. परिणामी मान Σ (d x x d y) और √ (Σd x 2 x Σd y 2)सहसंबंध गुणांक की गणना के लिए सूत्र में स्थानापन्न करें:
  7. सहसंबंध गुणांक की विश्वसनीयता निर्धारित करें:
    पहली विधि. सूत्रों का उपयोग करके सहसंबंध गुणांक (एमआर एक्सवाई) और टी मानदंड की त्रुटि पाएं:

    मानदंड t = 14.1, जो त्रुटि रहित पूर्वानुमान p > 99.9% की संभावना से मेल खाता है।

    दूसरी विधि. सहसंबंध गुणांक की विश्वसनीयता का आकलन "मानक सहसंबंध गुणांक" तालिका (परिशिष्ट 1 देखें) का उपयोग करके किया जाता है। स्वतंत्रता की डिग्री की संख्या (एन - 2) = 6 - 2 = 4 के साथ, हमारा परिकलित सहसंबंध गुणांक आर xу = + 0.99 सारणीबद्ध (आर तालिका = + 0.917 पी = 99%) से अधिक है।

    निष्कर्ष।पानी में जितना अधिक कैल्शियम होगा, वह उतना ही कठोर होगा (कनेक्शन प्रत्यक्ष, सशक्त और प्रामाणिक: आर xy = + 0.99, पी > 99.9%)।

    रैंकिंग पद्धति का उपयोग करने के लिए

    व्यायाम:रैंक विधि का उपयोग करते हुए, निम्नलिखित डेटा प्राप्त होने पर वर्षों के कार्य अनुभव और चोटों की आवृत्ति के बीच संबंध की दिशा और ताकत स्थापित करें:

    विधि चुनने का औचित्य:समस्या को हल करने के लिए, केवल रैंक सहसंबंध विधि को चुना जा सकता है, क्योंकि विशेषता की पहली पंक्ति "वर्षों में कार्य अनुभव" में खुले विकल्प हैं (1 वर्ष और 7 या अधिक वर्षों तक कार्य अनुभव), जो कनेक्शन स्थापित करने के लिए अधिक सटीक विधि - वर्गों की विधि - के उपयोग की अनुमति नहीं देता है तुलना की गई विशेषताओं के बीच.

    समाधान. गणनाओं का क्रम पाठ में प्रस्तुत किया गया है, परिणाम तालिका में प्रस्तुत किए गए हैं। 2.

    तालिका 2

    वर्षों में कार्य अनुभव चोटों की संख्या क्रमवाचक संख्या (रैंक) रैंक का अंतर रैंकों का वर्ग अंतर
    एक्स वाई d(x-y) घ 2
    1 वर्ष तक 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 या अधिक 6 5 1 +4 16
    Σ डी 2 = 38.5

    मानक सहसंबंध गुणांक जिन्हें विश्वसनीय माना जाता है (एल.एस. कामिंस्की के अनुसार)

    स्वतंत्रता की कोटि की संख्या - 2 संभाव्यता स्तर पी (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. व्लासोव वी.वी. महामारी विज्ञान। - एम.: जियोटार-मेड, 2004. - 464 पी।
    2. लिसित्सिन यू.पी. सार्वजनिक स्वास्थ्य और स्वास्थ्य सेवा. विश्वविद्यालयों के लिए पाठ्यपुस्तक. - एम.: जियोटार-मेड, 2007. - 512 पी।
    3. चिकित्सक वी.ए., यूरीव वी.के. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल पर व्याख्यान का कोर्स: भाग 1. सार्वजनिक स्वास्थ्य। - एम.: मेडिसिन, 2003. - 368 पी।
    4. मिन्येव वी.ए., विष्णकोव एन.आई. और अन्य। सामाजिक चिकित्सा और स्वास्थ्य देखभाल संगठन (2 खंडों में मैनुअल)। - सेंट पीटर्सबर्ग, 1998. -528 पी।
    5. कुचेरेंको वी.जेड., अगरकोव एन.एम. और अन्य। सामाजिक स्वच्छता और स्वास्थ्य देखभाल संगठन (ट्यूटोरियल) - मॉस्को, 2000. - 432 पी।
    6. एस ग्लैंज़। चिकित्सा और जैविक आँकड़े। अंग्रेजी से अनुवाद - एम., प्रकृति, 1998. - 459 पी।
सूचना!आपकी विशिष्ट समस्या का समाधान इस उदाहरण के समान दिखेगा, जिसमें नीचे दी गई सभी तालिकाएँ और व्याख्यात्मक पाठ शामिल हैं, लेकिन आपके प्रारंभिक डेटा को ध्यान में रखते हुए...

काम:
मानों के 26 जोड़े का एक संबंधित नमूना है (x k,y k):

1 2 3 4 5 6 7 8 9 10
एक्स क 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
वाई के 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

11 12 13 14 15 16 17 18 19 20
एक्स क 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
वाई के 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

21 22 23 24 25 26
एक्स क 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
वाई के 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

गणना/प्लॉट के लिए आवश्यक:
- सहसंबंध गुणांक;
- α = 0.05 के महत्व स्तर पर यादृच्छिक चर एक्स और वाई की निर्भरता की परिकल्पना का परीक्षण करें;
- रेखीय प्रतिगमन समीकरण गुणांक;
- स्कैटर आरेख (सहसंबंध क्षेत्र) और प्रतिगमन रेखा ग्राफ;

समाधान:

1. सहसंबंध गुणांक की गणना करें.

सहसंबंध गुणांक दो यादृच्छिक चर के पारस्परिक संभाव्य प्रभाव का एक संकेतक है। सहसंबंध गुणांक आरसे मान ले सकते हैं -1 पहले +1 . यदि निरपेक्ष मान करीब है 1 , तो यह मात्राओं के बीच एक मजबूत संबंध का प्रमाण है, और यदि निकट है 0 - तो यह एक कमजोर कनेक्शन या उसकी अनुपस्थिति को इंगित करता है। यदि निरपेक्ष मान आरएक के बराबर है, तो हम मात्राओं के बीच कार्यात्मक संबंध के बारे में बात कर सकते हैं, यानी, गणितीय फ़ंक्शन का उपयोग करके एक मात्रा को दूसरे के माध्यम से व्यक्त किया जा सकता है।


सहसंबंध गुणांक की गणना निम्नलिखित सूत्रों का उपयोग करके की जा सकती है:
एन
Σ
के = 1
(एक्स के -एम एक्स) 2 , σ य 2 =
एम एक्स =
1
एन
एन
Σ
के = 1
एक्सके, मेरा =

या सूत्र द्वारा

आरएक्स,वाई =
एम एक्सवाई - एम एक्स एम वाई
एस एक्स एस वाई
(1.4), कहां:
एम एक्स =
1
एन
एन
Σ
के = 1
एक्सके, मेरा =
1
एन
एन
Σ
के = 1
वाई के , Mxy =
1
एन
एन
Σ
के = 1
एक्स के वाई के (1.5)
एस एक्स 2 =
1
एन
एन
Σ
के = 1
एक्स के 2 - एम एक्स 2, एस वाई 2 =
1
एन
एन
Σ
के = 1
वाई के 2 - एम वाई 2 (1.6)

व्यवहार में, सहसंबंध गुणांक की गणना के लिए सूत्र (1.4) का अधिक बार उपयोग किया जाता है क्योंकि इसमें कम गणना की आवश्यकता होती है। हालाँकि, यदि सहप्रसरण की गणना पहले की गई थी कोव(एक्स,वाई), तो सूत्र (1.1) का उपयोग करना अधिक लाभदायक है, क्योंकि सहप्रसरण मान के अलावा, आप मध्यवर्ती गणनाओं के परिणामों का भी उपयोग कर सकते हैं।

1.1 आइए सूत्र (1.4) का उपयोग करके सहसंबंध गुणांक की गणना करें, ऐसा करने के लिए, हम x k 2, y k 2 और x k y k के मानों की गणना करते हैं और उन्हें तालिका 1 में दर्ज करते हैं।

तालिका नंबर एक


एक्स क वाई के एक्स क 2 वाई के 2 एक्स कवाई के
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. आइए सूत्र (1.5) का उपयोग करके एम एक्स की गणना करें.

1.2.1. एक्स क

x 1 + x 2 + … + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000

1.2.2.

669.50000 / 26 = 25.75000

एम एक्स = 25.750000

1.3. आइए इसी तरह से M y की गणना करें.

1.3.1. आइए सभी तत्वों को क्रमानुसार जोड़ें वाई के

y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000

1.3.2. परिणामी योग को नमूना तत्वों की संख्या से विभाजित करें

793.00000 / 26 = 30.50000

एम वाई = 30.5000000

1.4. इसी प्रकार हम M xy की गणना करते हैं.

1.4.1. आइए तालिका 1 के छठे कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. परिणामी योग को तत्वों की संख्या से विभाजित करें

20412.83000 / 26 = 785.10885

एम एक्सवाई = 785.108846

1.5. आइए सूत्र (1.6.) का उपयोग करके S x 2 के मान की गणना करें.

1.5.1. आइए तालिका 1 के चौथे कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. परिणामी योग को तत्वों की संख्या से विभाजित करें

17256.91000 / 26 = 663.72731

1.5.3. S x 2 का मान प्राप्त करने के लिए अंतिम संख्या से M x का वर्ग घटाएँ

एस एक्स 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. आइए सूत्र (1.6.) का उपयोग करके S y 2 के मान की गणना करें.

1.6.1. आइए तालिका 1 के 5वें कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. परिणामी योग को तत्वों की संख्या से विभाजित करें

24191.84000 / 26 = 930.45538

1.6.3. S y 2 का मान प्राप्त करने के लिए अंतिम संख्या में से M y का वर्ग घटाएँ

एस वाई 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. आइए S x 2 और S y 2 की मात्राओं के गुणनफल की गणना करें.

एस एक्स 2 एस वाई 2 = 0.66481 0.20538 = 0.136541

1.8. आइए अंतिम संख्या का वर्गमूल लें और मान S x S y प्राप्त करें.

एस एक्स एस वाई = 0.36951

1.9. आइए सूत्र (1.4.) का उपयोग करके सहसंबंध गुणांक के मान की गणना करें.

आर = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028

उत्तर: आर एक्स, वाई = -0.720279

2. हम सहसंबंध गुणांक के महत्व की जांच करते हैं (हम निर्भरता की परिकल्पना की जांच करते हैं)।

चूँकि सहसंबंध गुणांक अनुमान की गणना एक सीमित नमूने पर की जाती है, और इसलिए इसके जनसंख्या मूल्य से विचलन हो सकता है, इसलिए सहसंबंध गुणांक के महत्व का परीक्षण करना आवश्यक है। जाँच टी-टेस्ट का उपयोग करके की जाती है:

टी =
आरएक्स,वाई
एन - 2
1 - आर 2 एक्स,वाई
(2.1)

यादृच्छिक मूल्य टीविद्यार्थी के t-वितरण का अनुसरण करता है और t-वितरण तालिका का उपयोग करके किसी दिए गए महत्व स्तर α पर मानदंड (t cr.α) का महत्वपूर्ण मान ज्ञात करना आवश्यक है। यदि सूत्र (2.1) द्वारा निरपेक्ष मान में गणना की गई t, t cr.α से कम निकलती है, तो यादृच्छिक चर X और Y के बीच कोई निर्भरता नहीं है। अन्यथा, प्रयोगात्मक डेटा यादृच्छिक चर की निर्भरता के बारे में परिकल्पना का खंडन नहीं करता है।


2.1. आइए हम सूत्र (2.1) का उपयोग करके टी-मानदंड के मूल्य की गणना करें और प्राप्त करें:
टी =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. टी-वितरण तालिका का उपयोग करके, हम पैरामीटर t cr.α का महत्वपूर्ण मान निर्धारित करते हैं

Tcr.α का वांछित मान स्वतंत्रता की डिग्री की संख्या और दिए गए महत्व स्तर α के अनुरूप कॉलम के अनुरूप पंक्ति के चौराहे पर स्थित है।
हमारे मामले में, स्वतंत्रता की डिग्री की संख्या n - 2 = 26 - 2 = है 24 और α = 0.05 , जो मानदंड t cr.α = के महत्वपूर्ण मान से मेल खाता है 2.064 (तालिका 2 देखें)

तालिका 2 टी वितरण

स्वतंत्रता की कोटियों की संख्या
(एन - 2)
α = 0.1 α = 0.05 α = 0.02 α = 0.01 α = 0.002 α = 0.001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. आइए t-मानदंड और t cr.α के निरपेक्ष मान की तुलना करें

टी-मानदंड का पूर्ण मान महत्वपूर्ण मान t = 5.08680, t cr.α = 2.064 से कम नहीं है, इसलिए प्रयोगात्मक डेटा, संभावना 0.95 के साथ(1 - α), परिकल्पना का खंडन न करेंयादृच्छिक चर X और Y की निर्भरता के बारे में।

3. रैखिक समाश्रयण समीकरण के गुणांकों की गणना करें।

एक रेखीय प्रतिगमन समीकरण एक सीधी रेखा का समीकरण है जो यादृच्छिक चर X और Y के बीच संबंध का अनुमान लगाता है (लगभग वर्णन करता है)। यदि हम मानते हैं कि मान इस प्रकार


वाई = ए + बी एक्स (3.1), जहां:

बी =आरएक्स,वाई
σय
σx
= आरएक्स,वाई
एस वाई
एसएक्स
(3.2),
ए = एम वाई - बी एम एक्स (3.3)

सूत्र (3.2) का उपयोग करके गुणांक की गणना की गई बीरैखिक प्रतिगमन गुणांक कहा जाता है। कुछ स्रोतों में स्थिर प्रतिगमन गुणांक कहा जाता है और बीचर के अनुसार.

किसी दिए गए मान X के लिए Y की भविष्यवाणी करने में त्रुटियों की गणना सूत्रों का उपयोग करके की जाती है:

मात्रा σ y/x (सूत्र 3.4) भी कहा जाता है अवशिष्ट मानक विचलन, यह X के एक निश्चित (दिए गए) मान के लिए समीकरण (3.1) द्वारा वर्णित प्रतिगमन रेखा से मान Y के प्रस्थान को दर्शाता है।

.
एस वाई 2 / एस एक्स 2 = 0.20538 / 0.66481 = 0.30894. आइए अंतिम संख्या का वर्गमूल लें और प्राप्त करें:
एस वाई / एस एक्स = 0.55582

3.3 आइए गुणांक बी की गणना करेंसूत्र के अनुसार (3.2)

बी = -0.72028 0.55582 = -0.40035

3.4 आइए गुणांक की गणना करेंसूत्र के अनुसार (3.3)

= 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 आइए प्रतिगमन समीकरण की त्रुटियों का अनुमान लगाएं.

3.5.1 S y 2 का वर्गमूल निकालने पर हमें प्राप्त होता है:

= 0.31437
3.5.4 आइए सूत्र (3.5) का उपयोग करके सापेक्ष त्रुटि की गणना करें

δ y/x = (0.31437 / 30.50000)100% = 1.03073%

4. हम एक स्कैटर आरेख (सहसंबंध क्षेत्र) और एक प्रतिगमन रेखा ग्राफ बनाते हैं।

एक स्कैटरप्लॉट एक्स और वाई अक्षों के साथ आयताकार निर्देशांक में एक विमान पर बिंदुओं के रूप में संबंधित जोड़े (एक्स के, वाई के) का एक ग्राफिकल प्रतिनिधित्व है। सहसंबंध क्षेत्र संबंधित (युग्मित) नमूने के ग्राफिकल प्रतिनिधित्व में से एक है। प्रतिगमन रेखा ग्राफ़ भी उसी समन्वय प्रणाली में प्लॉट किया गया है। यह सुनिश्चित करने के लिए कि आरेख यथासंभव स्पष्ट हो, अक्षों पर स्केल और शुरुआती बिंदुओं को सावधानीपूर्वक चुना जाना चाहिए।

4.1. नमूने का न्यूनतम और अधिकतम तत्व ज्ञात करें X क्रमशः 18वां और 15वां तत्व है, x न्यूनतम = 22.10000 और x अधिकतम = 26.60000।

4.2. हम पाते हैं कि नमूने का न्यूनतम और अधिकतम तत्व Y क्रमशः दूसरा और 18वां तत्व है, y न्यूनतम = 29.40000 और y अधिकतम = 31.60000।

4.3. x-अक्ष पर, बिंदु x 18 = 22.10000 के थोड़ा बाईं ओर एक प्रारंभिक बिंदु चुनें, और ऐसा पैमाना चुनें कि बिंदु x 15 = 26.60000 अक्ष पर फिट हो जाए और शेष बिंदु स्पष्ट रूप से दिखाई दें।

4.4. कोटि अक्ष पर, बिंदु y 2 = 29.40000 के थोड़ा बाईं ओर एक प्रारंभिक बिंदु चुनें, और ऐसा पैमाना चुनें कि बिंदु y 18 = 31.60000 अक्ष पर फिट हो और शेष बिंदु स्पष्ट रूप से अलग हों।

4.5. हम x k मान को भुज अक्ष पर और y k मान को कोटि अक्ष पर रखते हैं।

4.6. हम निर्देशांक तल पर बिंदु (x 1, y 1), (x 2, y 2),…, (x 26, y 26) आलेखित करते हैं। हमें नीचे दिए गए चित्र में दिखाया गया स्कैटर आरेख (सहसंबंध क्षेत्र) मिलता है।

4.7. आइए एक प्रतिगमन रेखा खींचें।

ऐसा करने के लिए, हम समीकरण (3.6) को संतुष्ट करने वाले निर्देशांक (x r1, y r1) और (x r2, y r2) वाले दो अलग-अलग बिंदु पाएंगे, उन्हें निर्देशांक तल पर आलेखित करेंगे और उनके माध्यम से एक सीधी रेखा खींचेंगे। पहले बिंदु के भुज के रूप में, हम मान x मिनट = 22.10000 लेते हैं। मान x मिनट को समीकरण (3.6) में प्रतिस्थापित करने पर, हम पहले बिंदु की कोटि प्राप्त करते हैं। इस प्रकार, हमारे पास निर्देशांक (22.10000, 31.96127) वाला एक बिंदु है। इसी तरह, हम दूसरे बिंदु के निर्देशांक प्राप्त करते हैं, मान x अधिकतम = 26.60000 को भुज के रूप में रखते हैं। दूसरा बिंदु होगा: (26.60000, 30.15970)।

प्रतिगमन रेखा नीचे दिए गए चित्र में लाल रंग में दिखाई गई है

कृपया ध्यान दें कि प्रतिगमन रेखा हमेशा X और Y के औसत मानों के बिंदु से होकर गुजरती है, अर्थात। निर्देशांक के साथ (एम एक्स, एम वाई)।

06.06.2018 16 235 0 इगोर

मनोविज्ञान और समाज

दुनिया में हर चीज़ आपस में जुड़ी हुई है। प्रत्येक व्यक्ति, अंतर्ज्ञान के स्तर पर, घटनाओं को प्रभावित करने और नियंत्रित करने में सक्षम होने के लिए उनके बीच संबंध खोजने की कोशिश करता है। वह अवधारणा जो इस संबंध को दर्शाती है सहसंबंध कहलाती है। सरल शब्दों में इसका क्या मतलब है?

सामग्री:

सहसंबंध की अवधारणा

सहसंबंध (लैटिन "सहसंबंध" से - अनुपात, संबंध)- एक गणितीय शब्द जिसका अर्थ है यादृच्छिक मात्राओं (चर) के बीच सांख्यिकीय संभाव्य निर्भरता का माप।



उदाहरण:आइए दो प्रकार के रिश्तों को लें:

  1. पहला- एक व्यक्ति के हाथ में कलम. जिस दिशा में हाथ चलता है, उस दिशा में कलम चलती है। अगर हाथ आराम पर है तो कलम नहीं लिखेगी. यदि कोई व्यक्ति इसे थोड़ा जोर से दबाएगा तो कागज पर निशान अधिक गहरा होगा। इस प्रकार का संबंध सख्त निर्भरता को दर्शाता है और सहसंबद्ध नहीं है। यह रिश्ता कार्यात्मक है.
  2. दूसरा प्रकार- किसी व्यक्ति की शिक्षा के स्तर और साहित्य पढ़ने के बीच संबंध। यह पहले से ज्ञात नहीं है कि कौन से लोग अधिक पढ़ते हैं: उच्च शिक्षा वाले या बिना उच्च शिक्षा वाले। यह संबंध यादृच्छिक या स्टोकेस्टिक है; इसका अध्ययन सांख्यिकीय विज्ञान द्वारा किया जाता है, जो विशेष रूप से सामूहिक घटनाओं से संबंधित है। यदि एक सांख्यिकीय गणना शिक्षा के स्तर और साहित्य पढ़ने के बीच संबंध को साबित करना संभव बनाती है, तो इससे कोई भी पूर्वानुमान लगाना और घटनाओं की संभावित घटना की भविष्यवाणी करना संभव हो जाएगा। इस उदाहरण में, उच्च संभावना के साथ, यह तर्क दिया जा सकता है कि उच्च शिक्षा वाले लोग, जो अधिक शिक्षित हैं, अधिक किताबें पढ़ते हैं। लेकिन चूंकि इन मापदंडों के बीच संबंध कार्यात्मक नहीं है, इसलिए हमसे गलती हो सकती है। आप हमेशा ऐसी त्रुटि की संभावना की गणना कर सकते हैं, जो स्पष्ट रूप से छोटी होगी और इसे सांख्यिकीय महत्व का स्तर (पी) कहा जाता है।

प्राकृतिक घटनाओं के बीच संबंधों के उदाहरण हैं:प्रकृति में खाद्य श्रृंखला, मानव शरीर, जिसमें अंग प्रणालियाँ शामिल हैं जो आपस में जुड़ी हुई हैं और एक पूरे के रूप में कार्य करती हैं।

हर दिन हम रोजमर्रा की जिंदगी में सहसंबंधों का सामना करते हैं: मौसम और अच्छे मूड के बीच, लक्ष्यों का सही निर्धारण और उनकी उपलब्धि, सकारात्मक दृष्टिकोण और भाग्य, खुशी की भावना और वित्तीय कल्याण। लेकिन हम गणितीय गणनाओं पर नहीं, बल्कि मिथकों, अंतर्ज्ञान, अंधविश्वासों और निष्क्रिय अटकलों पर भरोसा करते हुए कनेक्शन की तलाश कर रहे हैं। इन घटनाओं को गणितीय भाषा में अनुवाद करना, संख्याओं में व्यक्त करना और मापना बहुत कठिन है। यह दूसरी बात है जब हम उन घटनाओं का विश्लेषण करते हैं जिनकी गणना की जा सकती है और संख्याओं के रूप में प्रस्तुत की जा सकती है। इस मामले में, हम सहसंबंध गुणांक (आर) का उपयोग करके सहसंबंध को परिभाषित कर सकते हैं, जो यादृच्छिक चर के बीच सहसंबंध की ताकत, डिग्री, निकटता और दिशा को दर्शाता है।

यादृच्छिक चरों के बीच मजबूत सहसंबंध- इन घटनाओं के बीच विशेष रूप से कुछ सांख्यिकीय संबंध की उपस्थिति का प्रमाण, लेकिन इस संबंध को एक ही घटना में स्थानांतरित नहीं किया जा सकता है, लेकिन एक अलग स्थिति के लिए। अक्सर, शोधकर्ता, अपनी गणना में दो चरों के बीच एक महत्वपूर्ण सहसंबंध प्राप्त करने के बाद, सहसंबंध विश्लेषण की सादगी के आधार पर, विशेषताओं के बीच कारण-और-प्रभाव संबंधों के अस्तित्व के बारे में गलत सहज धारणाएं बनाते हैं, यह भूल जाते हैं कि सहसंबंध गुणांक प्रकृति में संभाव्य है। .

उदाहरण:बर्फीले हालात के दौरान घायल हुए लोगों की संख्या और मोटर वाहनों के बीच सड़क दुर्घटनाओं की संख्या। ये मात्राएँ एक-दूसरे के साथ सहसंबद्ध होंगी, हालाँकि वे बिल्कुल भी आपस में जुड़ी हुई नहीं हैं, लेकिन केवल इन यादृच्छिक घटनाओं के सामान्य कारण - काली बर्फ के साथ संबंध रखती हैं। यदि विश्लेषण से घटनाओं के बीच कोई सहसंबंध प्रकट नहीं होता है, तो यह अभी तक उनके बीच निर्भरता की अनुपस्थिति का प्रमाण नहीं है, जो जटिल गैर-रेखीय हो सकता है और सहसंबंध गणनाओं द्वारा प्रकट नहीं किया जा सकता है।




सहसंबंध की अवधारणा को वैज्ञानिक उपयोग में लाने वाले पहले फ्रांसीसी थे जीवाश्म विज्ञानी जॉर्जेस क्यूवियर. 18वीं शताब्दी में, उन्होंने जीवित जीवों के अंगों और अंगों के सहसंबंध का नियम निकाला, जिसकी बदौलत शरीर के पाए गए हिस्सों (अवशेषों) से एक संपूर्ण जीवाश्म प्राणी, जानवर की उपस्थिति को बहाल करना संभव हो गया। सांख्यिकी में सहसंबंध शब्द का प्रयोग पहली बार 1886 में एक अंग्रेजी वैज्ञानिक द्वारा किया गया था फ्रांसिस गैल्टन. लेकिन वह सहसंबंध गुणांक की गणना के लिए सटीक सूत्र प्राप्त नहीं कर सके, लेकिन उनके छात्र ने यह कर दिखाया - प्रसिद्ध गणितज्ञ और जीवविज्ञानी कार्ल पियर्सन।

सहसंबंध के प्रकार

महत्व से- अत्यधिक महत्वपूर्ण, महत्वपूर्ण और महत्वहीन।

प्रकार

आर किसके बराबर है

अत्यधिक महत्वपूर्ण

आर सांख्यिकीय महत्व पी के स्तर से मेल खाता है<=0,01

महत्वपूर्ण

r, p से मेल खाता है<=0,05

तुच्छ

r p>0.1 तक नहीं पहुंचता है

नकारात्मक(एक चर के मूल्य में कमी से दूसरे के स्तर में वृद्धि होती है: एक व्यक्ति को जितना अधिक फोबिया होता है, उसके नेतृत्व की स्थिति पर कब्जा करने की संभावना उतनी ही कम होती है) और सकारात्मक (यदि एक चर में वृद्धि से वृद्धि होती है) दूसरे के स्तर पर: आप जितना अधिक घबराएंगे, आपके बीमार होने की संभावना उतनी ही अधिक होगी)। यदि चरों के बीच कोई संबंध नहीं है, तो ऐसे सहसंबंध को शून्य कहा जाता है।

रेखीय(जब एक मान बढ़ता या घटता है, तो दूसरा भी बढ़ता या घटता है) और अरैखिक (जब एक मान बदलता है, तो दूसरे में परिवर्तन की प्रकृति को रैखिक संबंध का उपयोग करके वर्णित नहीं किया जा सकता है, तब अन्य गणितीय नियम लागू होते हैं - बहुपद, अतिपरवलयिक) रिश्तों)।

ताकत से.

कठिनाइयाँ




अध्ययन के तहत चर किस पैमाने से संबंधित हैं, इसके आधार पर विभिन्न प्रकार के सहसंबंध गुणांक की गणना की जाती है:

  1. पियर्सन सहसंबंध गुणांक, जोड़ीदार रैखिक सहसंबंध गुणांक, या उत्पाद क्षण सहसंबंध की गणना अंतराल और पैमाने माप पैमानों वाले चर के लिए की जाती है।
  2. स्पीयरमैन या केंडल रैंक सहसंबंध गुणांक - जब कम से कम एक मात्रा में क्रमिक पैमाना होता है या सामान्य रूप से वितरित नहीं होता है।
  3. बिंदु द्विक्रमिक सहसंबंध गुणांक (फेचनर साइन सहसंबंध गुणांक) - यदि दो मात्राओं में से एक द्विभाजित है।
  4. चार-क्षेत्र सहसंबंध गुणांक (एकाधिक रैंक सहसंबंध (समन्वय) गुणांक - यदि दो चर द्विभाजित हैं।

पियर्सन गुणांक पैरामीट्रिक सहसंबंध संकेतकों को संदर्भित करता है, अन्य सभी गैर-पैरामीट्रिक हैं।

सहसंबंध गुणांक मान -1 से +1 तक होता है। पूर्ण सकारात्मक सहसंबंध के साथ, r = +1, पूर्ण नकारात्मक सहसंबंध के साथ, r = -1।

सूत्र और गणना





उदाहरण

दो चर के बीच संबंध निर्धारित करना आवश्यक है: स्कूली बच्चों के बीच बौद्धिक विकास का स्तर (परीक्षण के अनुसार) और प्रति माह देरी की संख्या (शैक्षणिक पत्रिका में प्रविष्टियों के अनुसार)।

प्रारंभिक डेटा तालिका में प्रस्तुत किया गया है:

आईक्यू डेटा (x)

देरी की संख्या पर डेटा (y)

जोड़

1122

औसत

112,2


प्राप्त संकेतक की सही व्याख्या देने के लिए, सहसंबंध गुणांक (+ या -) के संकेत और उसके निरपेक्ष मान (मॉड्यूलो) का विश्लेषण करना आवश्यक है।

ताकत के आधार पर सहसंबंध गुणांक के वर्गीकरण की तालिका के अनुसार, हम यह निष्कर्ष निकालते हैं कि rxy = -0.827 एक मजबूत नकारात्मक सहसंबंध है। इस प्रकार, देर से आने वाले स्कूली बच्चों की संख्या उनके बौद्धिक विकास के स्तर पर बहुत अधिक निर्भर करती है। यह कहा जा सकता है कि उच्च IQ स्तर वाले छात्र निम्न IQ स्तर वाले छात्रों की तुलना में कक्षाओं के लिए कम देर से आते हैं।



सहसंबंध गुणांक का उपयोग वैज्ञानिकों द्वारा दो मात्राओं या घटनाओं की निर्भरता की धारणा की पुष्टि या खंडन करने और इसकी ताकत और महत्व को मापने के लिए और छात्रों द्वारा विभिन्न विषयों में अनुभवजन्य और सांख्यिकीय अनुसंधान करने के लिए किया जा सकता है। यह याद रखना चाहिए कि यह सूचक एक आदर्श उपकरण नहीं है; इसकी गणना केवल एक रैखिक संबंध की ताकत को मापने के लिए की जाती है और यह हमेशा एक संभाव्य मान होगा जिसमें एक निश्चित त्रुटि होती है।

सहसंबंध विश्लेषण का उपयोग निम्नलिखित क्षेत्रों में किया जाता है:

  • आर्थिक विज्ञान;
  • खगोल भौतिकी;
  • सामाजिक विज्ञान (समाजशास्त्र, मनोविज्ञान, शिक्षाशास्त्र);
  • कृषिरसायन;
  • धातुकर्म;
  • उद्योग (गुणवत्ता नियंत्रण के लिए);
  • हाइड्रोबायोलॉजी;
  • बॉयोमीट्रिक्स, आदि

सहसंबंध विश्लेषण पद्धति की लोकप्रियता के कारण:

  1. सहसंबंध गुणांक की गणना की सापेक्ष सरलता के लिए विशेष गणितीय शिक्षा की आवश्यकता नहीं होती है।
  2. आपको बड़े पैमाने पर यादृच्छिक चर के बीच संबंधों की गणना करने की अनुमति देता है, जो सांख्यिकीय विज्ञान में विश्लेषण का विषय हैं। इस संबंध में, यह पद्धति सांख्यिकीय अनुसंधान के क्षेत्र में व्यापक हो गई है।

मुझे आशा है कि अब आप कार्यात्मक संबंध को सहसंबंधी संबंध से अलग करने में सक्षम होंगे और जानेंगे कि जब आप टेलीविज़न पर सुनते हैं या प्रेस में सहसंबंध के बारे में पढ़ते हैं, तो इसका मतलब दो घटनाओं के बीच एक सकारात्मक और काफी महत्वपूर्ण अन्योन्याश्रयता है।