तब सहसंबंध गुणांक 0 है। सहसंबंध गुणांक का महत्व. सहसंबंध विश्लेषण है

सहसंबंध गुणांक दो चरों के बीच संबंध की डिग्री है। इसकी गणना से यह पता चलता है कि दो डेटा सेट के बीच कोई संबंध है या नहीं। प्रतिगमन के विपरीत, सहसंबंध मात्राओं के मूल्यों की भविष्यवाणी नहीं करता है। हालाँकि, गुणांक की गणना प्रारंभिक सांख्यिकीय विश्लेषण में एक महत्वपूर्ण कदम है। उदाहरण के लिए, हमने पाया कि प्रत्यक्ष विदेशी निवेश के स्तर और सकल घरेलू उत्पाद की वृद्धि दर के बीच सहसंबंध गुणांक उच्च है। इससे हमें यह विचार मिलता है कि समृद्धि सुनिश्चित करने के लिए विशेष रूप से विदेशी उद्यमियों के लिए अनुकूल माहौल बनाना आवश्यक है। पहली नज़र में इतना स्पष्ट निष्कर्ष नहीं!

सहसंबंध और कारणता

शायद आँकड़ों का एक भी क्षेत्र ऐसा नहीं है जो हमारे जीवन में इतनी मजबूती से स्थापित हो गया हो। सहसंबंध गुणांक का उपयोग सामाजिक ज्ञान के सभी क्षेत्रों में किया जाता है। इसका मुख्य खतरा यह है कि लोगों को समझाने और उन्हें कुछ निष्कर्षों पर विश्वास दिलाने के लिए अक्सर इसके उच्च मूल्यों पर अटकलें लगाई जाती हैं। हालाँकि, वास्तव में, एक मजबूत सहसंबंध मात्राओं के बीच कारण-और-प्रभाव संबंध का बिल्कुल भी संकेत नहीं देता है।

सहसंबंध गुणांक: पियर्सन और स्पीयरमैन सूत्र

ऐसे कई बुनियादी संकेतक हैं जो दो चरों के बीच संबंध को दर्शाते हैं। ऐतिहासिक रूप से, पहला पियर्सन रैखिक सहसंबंध गुणांक है। यह स्कूल में पढ़ाया जाता है. इसे फादर के काम के आधार पर के. पियर्सन और जे. यूल द्वारा विकसित किया गया था। गैल्टन। यह गुणांक आपको तर्कसंगत संख्याओं के बीच संबंध देखने की अनुमति देता है जो तर्कसंगत रूप से बदलते हैं। यह हमेशा -1 से अधिक और 1 से कम होता है। एक ऋणात्मक संख्या व्युत्क्रमानुपाती संबंध को इंगित करती है। यदि गुणांक शून्य है, तो चरों के बीच कोई संबंध नहीं है। एक धनात्मक संख्या के बराबर - अध्ययनाधीन मात्राओं के बीच सीधा आनुपातिक संबंध होता है। स्पीयरमैन का रैंक सहसंबंध गुणांक आपको परिवर्तनीय मानों का पदानुक्रम बनाकर गणना को सरल बनाने की अनुमति देता है।

चरों के बीच संबंध

सहसंबंध दो प्रश्नों के उत्तर देने में मदद करता है। पहला, चरों के बीच संबंध सकारात्मक है या नकारात्मक। दूसरा, लत कितनी प्रबल है. सहसंबंध विश्लेषण एक शक्तिशाली उपकरण है जो यह महत्वपूर्ण जानकारी प्रदान कर सकता है। यह देखना आसान है कि पारिवारिक आय और व्यय आनुपातिक रूप से गिरते और बढ़ते हैं। यह रिश्ता सकारात्मक माना जाता है. इसके विपरीत, जब किसी उत्पाद की कीमत बढ़ती है, तो उसकी मांग कम हो जाती है। इस रिश्ते को नकारात्मक कहा जाता है. सहसंबंध गुणांक का मान -1 और 1 के बीच होता है। शून्य का मतलब है कि अध्ययन के तहत मूल्यों के बीच कोई संबंध नहीं है। प्राप्त संकेतक चरम मूल्यों के जितना करीब होगा, संबंध उतना ही मजबूत होगा (नकारात्मक या सकारात्मक)। निर्भरता की अनुपस्थिति -0.1 से 0.1 तक के गुणांक द्वारा इंगित की जाती है। आपको यह समझने की आवश्यकता है कि ऐसा मान केवल एक रैखिक संबंध की अनुपस्थिति को इंगित करता है।

आवेदन की विशेषताएं

दोनों संकेतकों के उपयोग में कुछ धारणाएँ शामिल हैं। सबसे पहले, एक मजबूत संबंध की उपस्थिति इस तथ्य को निर्धारित नहीं करती है कि एक मात्रा दूसरे को निर्धारित करती है। एक तीसरी मात्रा भी हो सकती है जो उनमें से प्रत्येक को परिभाषित करती है। दूसरे, उच्च पियर्सन सहसंबंध गुणांक अध्ययन किए गए चर के बीच कारण-और-प्रभाव संबंध को इंगित नहीं करता है। तीसरा, यह एक विशेष रूप से रैखिक संबंध दर्शाता है। लिंग या पसंदीदा रंग जैसी श्रेणियों के बजाय सार्थक मात्रात्मक डेटा (उदाहरण के लिए, बैरोमीटर का दबाव, वायु तापमान) का मूल्यांकन करने के लिए सहसंबंध का उपयोग किया जा सकता है।

एकाधिक सहसंबंध गुणांक

पियर्सन और स्पीयरमैन ने दो चरों के बीच संबंध की जांच की। लेकिन अगर उनमें से तीन या उससे भी अधिक हों तो क्या करें। यहीं पर एकाधिक सहसंबंध गुणांक बचाव के लिए आता है। उदाहरण के लिए, सकल राष्ट्रीय उत्पाद न केवल प्रत्यक्ष विदेशी निवेश से प्रभावित होता है, बल्कि सरकार की मौद्रिक और राजकोषीय नीतियों के साथ-साथ निर्यात के स्तर से भी प्रभावित होता है। सकल घरेलू उत्पाद की वृद्धि दर और मात्रा कई कारकों की परस्पर क्रिया का परिणाम है। हालाँकि, यह समझा जाना चाहिए कि एकाधिक सहसंबंध मॉडल कई सरलीकरणों और मान्यताओं पर आधारित है। सबसे पहले, मूल्यों के बीच बहुसंरेखता को बाहर रखा गया है। दूसरे, आश्रित और उसे प्रभावित करने वाले चर के बीच का संबंध रैखिक माना जाता है।

सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के क्षेत्र

मात्राओं के बीच संबंध खोजने की यह विधि सांख्यिकी में व्यापक रूप से उपयोग की जाती है। इसका सहारा अक्सर तीन मुख्य मामलों में लिया जाता है:

दो चरों के मानों के बीच कारण-और-प्रभाव संबंधों का परीक्षण करना। परिणामस्वरूप, शोधकर्ता एक रैखिक संबंध की खोज करने और एक सूत्र प्राप्त करने की उम्मीद करता है जो मात्राओं के बीच इन संबंधों का वर्णन करता है। उनकी माप की इकाइयाँ भिन्न हो सकती हैं।
मात्राओं के बीच संबंध की जाँच करना। इस मामले में, कोई भी यह निर्धारित नहीं करता है कि कौन सा चर आश्रित चर है। ऐसा हो सकता है कि कोई अन्य कारक दोनों मात्राओं का मूल्य निर्धारित करता हो।
समीकरण प्राप्त करने के लिए इस मामले में, आप बस इसमें संख्याओं को प्रतिस्थापित कर सकते हैं और अज्ञात चर के मूल्यों का पता लगा सकते हैं।

एक व्यक्ति कारण-और-प्रभाव संबंध की तलाश में है

चेतना को इस तरह से डिज़ाइन किया गया है कि हमें निश्चित रूप से हमारे आस-पास होने वाली घटनाओं की व्याख्या करने की आवश्यकता है। एक व्यक्ति हमेशा उस दुनिया की तस्वीर जिसमें वह रहता है और उसे प्राप्त होने वाली जानकारी के बीच संबंध की तलाश में रहता है। मस्तिष्क अक्सर अव्यवस्था से व्यवस्था बनाता है। वह आसानी से एक कारण-और-प्रभाव संबंध देख सकता है जहां कोई नहीं है। वैज्ञानिकों को विशेष रूप से इस प्रवृत्ति पर काबू पाना सीखना होगा। अकादमिक करियर में डेटा के बीच संबंधों का निष्पक्ष मूल्यांकन करने की क्षमता आवश्यक है।

मीडिया पूर्वाग्रह

आइए विचार करें कि सहसंबंध की उपस्थिति की गलत व्याख्या कैसे की जा सकती है। बुरे व्यवहार वाले ब्रिटिश छात्रों के एक समूह से पूछा गया कि क्या उनके माता-पिता धूम्रपान करते हैं। फिर यह परीक्षण अखबार में छपा. परिणाम में माता-पिता के धूम्रपान और उनके बच्चों के अपराध के बीच एक मजबूत संबंध दिखाया गया। इस अध्ययन को करने वाले प्रोफेसर ने सिगरेट पैक पर इस बारे में चेतावनी लिखने का भी सुझाव दिया। हालाँकि, इस निष्कर्ष के साथ कई समस्याएं हैं। सबसे पहले, सहसंबंध यह नहीं दर्शाता है कि कौन सी मात्रा स्वतंत्र है। इसलिए, यह मान लेना काफी संभव है कि माता-पिता की हानिकारक आदत बच्चों की अवज्ञा के कारण होती है। दूसरे, यह निश्चित रूप से नहीं कहा जा सकता कि दोनों समस्याएँ किसी तीसरे कारक के कारण उत्पन्न नहीं हुईं। उदाहरण के लिए, कम आय वाले परिवार। यह अध्ययन आयोजित करने वाले प्रोफेसर के प्रारंभिक निष्कर्षों के भावनात्मक पहलू पर ध्यान देने योग्य है। वह धूम्रपान के प्रबल विरोधी थे। इसलिए, यह आश्चर्य की बात नहीं है कि उन्होंने अपने शोध के परिणामों की इस तरह से व्याख्या की।

निष्कर्ष

दो चरों के बीच कारण-और-प्रभाव संबंध के रूप में सहसंबंध की गलत व्याख्या करने से अपमानजनक शोध त्रुटियां हो सकती हैं। समस्या यह है कि यह मानवीय चेतना के मूल में है। कई मार्केटिंग युक्तियाँ इस सुविधा पर आधारित हैं। कारण और प्रभाव और सहसंबंध के बीच अंतर को समझने से आप अपने दैनिक जीवन और अपने पेशेवर करियर दोनों में जानकारी का तर्कसंगत विश्लेषण कर सकते हैं।

सहसंबंध और कारणता

सहसंबंध गुणांक: पियर्सन और स्पीयरमैन सूत्र

चरों के बीच संबंध

आवेदन की विशेषताएं

एकाधिक सहसंबंध गुणांक

सहसंबंध और प्रतिगमन विश्लेषण के उपयोग के क्षेत्र

दो चरों के मानों के बीच कारण-और-प्रभाव संबंधों का परीक्षण करना। परिणामस्वरूप, शोधकर्ता एक रैखिक संबंध की खोज करने और एक सूत्र प्राप्त करने की उम्मीद करता है जो मात्राओं के बीच इन संबंधों का वर्णन करता है। उनकी माप की इकाइयाँ भिन्न हो सकती हैं।
मात्राओं के बीच संबंध की जाँच करना। इस मामले में, कोई भी यह निर्धारित नहीं करता है कि कौन सा चर आश्रित चर है। ऐसा हो सकता है कि कोई अन्य कारक दोनों मात्राओं का मूल्य निर्धारित करता हो।
समीकरण प्राप्त करने के लिए इस मामले में, आप बस इसमें संख्याओं को प्रतिस्थापित कर सकते हैं और अज्ञात चर के मूल्यों का पता लगा सकते हैं।

एक व्यक्ति कारण-और-प्रभाव संबंध की तलाश में है

मीडिया पूर्वाग्रह

निष्कर्ष

वैज्ञानिक और व्यावहारिक उद्देश्यों के लिए सार्वजनिक स्वास्थ्य और स्वास्थ्य सेवा का अध्ययन करते समय, शोधकर्ता को अक्सर सांख्यिकीय आबादी के कारक और प्रदर्शन विशेषताओं (कारण संबंध) के बीच संबंधों का सांख्यिकीय विश्लेषण करना पड़ता है या इस आबादी की कई विशेषताओं में समानांतर परिवर्तनों की निर्भरता निर्धारित करनी होती है। किसी तीसरे मान पर (उनके सामान्य कारण पर)। इस कनेक्शन की विशेषताओं का अध्ययन करने, इसका आकार और दिशा निर्धारित करने और इसकी विश्वसनीयता का मूल्यांकन करने में सक्षम होना आवश्यक है। इस प्रयोजन के लिए, सहसंबंध विधियों का उपयोग किया जाता है।

विशेषताओं के बीच मात्रात्मक संबंधों की अभिव्यक्ति के प्रकार
- कार्यात्मक कनेक्शन
- सहसंबंध संबंध
कार्यात्मक और सहसंबद्ध संबंध की परिभाषाएँ
कार्यात्मक संबंध- दो विशेषताओं के बीच इस प्रकार का संबंध जब उनमें से एक का प्रत्येक मान दूसरे के कड़ाई से परिभाषित मूल्य से मेल खाता है (एक वृत्त का क्षेत्रफल वृत्त की त्रिज्या पर निर्भर करता है, आदि)। कार्यात्मक संबंध भौतिक और गणितीय प्रक्रियाओं की विशेषता है।
सह - संबंध- ऐसा संबंध जिसमें एक विशेषता का प्रत्येक विशिष्ट मान उससे संबंधित किसी अन्य विशेषता के कई मूल्यों से मेल खाता है (किसी व्यक्ति की ऊंचाई और वजन के बीच संबंध; शरीर के तापमान और नाड़ी दर के बीच संबंध, आदि)। सहसंबंध चिकित्सा और जैविक प्रक्रियाओं के लिए विशिष्ट है।
सहसंबंध संबंध स्थापित करने का व्यावहारिक महत्व. कारक और परिणामी संकेतों के बीच कारण और प्रभाव की पहचान (शारीरिक विकास का आकलन करते समय, काम करने की स्थिति, रहने की स्थिति और स्वास्थ्य की स्थिति के बीच संबंध निर्धारित करने के लिए, उम्र, सेवा की लंबाई, व्यावसायिक की उपस्थिति पर बीमारियों की आवृत्ति की निर्भरता का निर्धारण करते समय) खतरे, आदि)
किसी तीसरे मान पर कई विशेषताओं में समानांतर परिवर्तन की निर्भरता। उदाहरण के लिए, कार्यशाला में उच्च तापमान के प्रभाव में रक्तचाप, रक्त की चिपचिपाहट, नाड़ी की दर आदि में परिवर्तन होता है।
विशेषताओं के बीच संबंधों की दिशा और मजबूती को दर्शाने वाला एक मूल्य. सहसंबंध गुणांक, जो एक संख्या में संकेतों (घटना) के बीच संबंध की दिशा और ताकत का अंदाजा देता है, इसके उतार-चढ़ाव की सीमा 0 से ± 1 तक होती है
सहसंबंध प्रस्तुत करने की विधियाँ
- ग्राफ़ (स्कैटर प्लॉट)
- सहसंबंध गुणांक
सहसंबंध की दिशा
- सीधा
- रिवर्स
सहसंबंध की ताकत
- मजबूत: ±0.7 से ±1
- औसत: ±0.3 से ±0.699
- कमजोर: 0 से ±0.299
सहसंबंध गुणांक और सूत्र निर्धारित करने की विधियाँ
- वर्गों की विधि (पियर्सन विधि)
- रैंक विधि (स्पीयरमैन विधि)
सहसंबंध गुणांक का उपयोग करने के लिए पद्धति संबंधी आवश्यकताएँ
- संबंध को मापना केवल गुणात्मक रूप से सजातीय आबादी में संभव है (उदाहरण के लिए, लिंग और उम्र के आधार पर सजातीय आबादी में ऊंचाई और वजन के बीच संबंध को मापना)
- गणना निरपेक्ष या व्युत्पन्न मूल्यों का उपयोग करके की जा सकती है
- सहसंबंध गुणांक की गणना करने के लिए, अवर्गीकृत भिन्नता श्रृंखला का उपयोग किया जाता है (यह आवश्यकता केवल वर्गों की विधि का उपयोग करके सहसंबंध गुणांक की गणना करते समय लागू होती है)
- प्रेक्षणों की संख्या कम से कम 30
रैंक सहसंबंध विधि (स्पीयरमैन की विधि) का उपयोग करने के लिए सिफारिशें
- जब कनेक्शन की मजबूती को सटीक रूप से स्थापित करने की कोई आवश्यकता नहीं है, लेकिन अनुमानित डेटा पर्याप्त है
- जब विशेषताओं को न केवल मात्रात्मक, बल्कि गुणात्मक मूल्यों द्वारा भी दर्शाया जाता है
- जब विशेषताओं की वितरण श्रृंखला में खुले विकल्प हों (उदाहरण के लिए, 1 वर्ष तक का कार्य अनुभव, आदि)
वर्गों की विधि का उपयोग करने के लिए सिफ़ारिशें (पियर्सन की विधि)
- जब विशेषताओं के बीच संबंध की ताकत का सटीक निर्धारण आवश्यक हो
- जब संकेतों में केवल मात्रात्मक अभिव्यक्ति होती है
सहसंबंध गुणांक की गणना के लिए पद्धति और प्रक्रिया
1) वर्गों की विधि
2) रैंक विधि
सहसंबंध गुणांक का उपयोग करके सहसंबंध संबंध का आकलन करने की योजना
सहसंबंध गुणांक त्रुटि की गणना
रैंक सहसंबंध विधि और वर्गों की विधि द्वारा प्राप्त सहसंबंध गुणांक की विश्वसनीयता का अनुमान
विधि 1
विश्वसनीयता सूत्र द्वारा निर्धारित की जाती है:
टी मानदंड का मूल्यांकन टी मानों की एक तालिका का उपयोग करके किया जाता है, जिसमें स्वतंत्रता की डिग्री (एन - 2) की संख्या को ध्यान में रखा जाता है, जहां एन युग्मित विकल्पों की संख्या है। टी मानदंड, संभाव्यता पी ≥99% के अनुरूप, तालिका एक के बराबर या उससे अधिक होना चाहिए।
विधि 2
मानक सहसंबंध गुणांक की एक विशेष तालिका का उपयोग करके विश्वसनीयता का आकलन किया जाता है। इस मामले में, एक सहसंबंध गुणांक को विश्वसनीय माना जाता है, जब एक निश्चित संख्या में स्वतंत्रता की डिग्री (एन - 2) के साथ, यह तालिका के बराबर या उससे अधिक होता है, जो त्रुटि-मुक्त भविष्यवाणी की डिग्री पी ≥95% के अनुरूप होता है। .

वर्गों की विधि का उपयोग करने के लिए

व्यायाम:सहसंबंध गुणांक की गणना करें, पानी में कैल्शियम की मात्रा और पानी की कठोरता के बीच संबंध की दिशा और ताकत निर्धारित करें, यदि निम्नलिखित डेटा ज्ञात हो (तालिका 1)। रिश्ते की विश्वसनीयता का आकलन करें. एक निष्कर्ष निकालो।

तालिका नंबर एक

विधि के चुनाव का औचित्य.समस्या को हल करने के लिए वर्गों की विधि (पियर्सन) को चुना गया, क्योंकि प्रत्येक चिह्न (पानी की कठोरता और कैल्शियम की मात्रा) की एक संख्यात्मक अभिव्यक्ति होती है; कोई खुला विकल्प नहीं.

समाधान.
गणना का क्रम पाठ में वर्णित है, परिणाम तालिका में प्रस्तुत किए गए हैं। युग्मित तुलनीय विशेषताओं की श्रृंखला बनाने के बाद, उन्हें x (पानी की कठोरता डिग्री में) और y (पानी में कैल्शियम की मात्रा mg/l में) से निरूपित करें।

पानी की कठोरता (डिग्री में)	पानी में कैल्शियम की मात्रा (मिलीग्राम/लीटर में)	डी एक्स	डी वाई	डी एक्स एक्स डी वाई	डी एक्स 2	डी वाई 2
4 8 11 27 34 37	28 56 77 191 241 262	-16 -12 -9 +7 +14 +16	-114 -86 -66 +48 +98 +120	1824 1032 594 336 1372 1920	256 144 81 49 196 256	12996 7396 4356 2304 9604 14400
एम एक्स =Σ एक्स / एन	एम वाई =Σ वाई / एन			Σ डी एक्स एक्स डी वाई =7078	Σ डी एक्स 2 =982	Σ डी वाई 2 =51056
एम एक्स =120/6=20	एम वाई =852/6=142

सूत्रों का उपयोग करके पंक्ति विकल्प "x" में M x और पंक्ति विकल्प "y" में M y का औसत मान निर्धारित करें:
एम एक्स = Σх/एन (कॉलम 1) और
एम वाई = Σу/एन (कॉलम 2)
श्रृंखला "x" और श्रृंखला "y" में परिकलित औसत से प्रत्येक विकल्प का विचलन (d x और d y) ज्ञात करें।
d x = x - M x (कॉलम 3) और d y = y - M y (कॉलम 4)।
विचलनों का गुणनफल खोजें d x x d y और उनका योग करें: Σ d x x d y (कॉलम 5)
प्रत्येक विचलन d
उत्पाद Σ d x 2 x Σ d y 2 निर्धारित करें और इस उत्पाद से वर्गमूल निकालें
परिणामी मान Σ (d x x d y) और √ (Σd x 2 x Σd y 2)सहसंबंध गुणांक की गणना के लिए सूत्र में स्थानापन्न करें:

सहसंबंध गुणांक की विश्वसनीयता निर्धारित करें:
पहली विधि. सूत्रों का उपयोग करके सहसंबंध गुणांक (एमआर एक्सवाई) और टी मानदंड की त्रुटि पाएं:

मानदंड t = 14.1, जो त्रुटि रहित पूर्वानुमान p > 99.9% की संभावना से मेल खाता है।

दूसरी विधि. सहसंबंध गुणांक की विश्वसनीयता का आकलन "मानक सहसंबंध गुणांक" तालिका (परिशिष्ट 1 देखें) का उपयोग करके किया जाता है। स्वतंत्रता की डिग्री की संख्या (एन - 2) = 6 - 2 = 4 के साथ, हमारा परिकलित सहसंबंध गुणांक आर xу = + 0.99 सारणीबद्ध (आर तालिका = + 0.917 पी = 99%) से अधिक है।

निष्कर्ष।पानी में जितना अधिक कैल्शियम होगा, वह उतना ही कठोर होगा (कनेक्शन प्रत्यक्ष, सशक्त और प्रामाणिक: आर xy = + 0.99, पी > 99.9%)।

रैंकिंग पद्धति का उपयोग करने के लिए

व्यायाम:रैंक विधि का उपयोग करते हुए, निम्नलिखित डेटा प्राप्त होने पर वर्षों के कार्य अनुभव और चोटों की आवृत्ति के बीच संबंध की दिशा और ताकत स्थापित करें:

विधि चुनने का औचित्य:समस्या को हल करने के लिए, केवल रैंक सहसंबंध विधि को चुना जा सकता है, क्योंकि विशेषता की पहली पंक्ति "वर्षों में कार्य अनुभव" में खुले विकल्प हैं (1 वर्ष और 7 या अधिक वर्षों तक कार्य अनुभव), जो कनेक्शन स्थापित करने के लिए अधिक सटीक विधि - वर्गों की विधि - के उपयोग की अनुमति नहीं देता है तुलना की गई विशेषताओं के बीच.

समाधान. गणनाओं का क्रम पाठ में प्रस्तुत किया गया है, परिणाम तालिका में प्रस्तुत किए गए हैं। 2.

तालिका 2

वर्षों में कार्य अनुभव	चोटों की संख्या	क्रमवाचक संख्या (रैंक)		रैंक का अंतर	रैंकों का वर्ग अंतर
वर्षों में कार्य अनुभव	चोटों की संख्या	एक्स	वाई	d(x-y)	घ 2
1 वर्ष तक	24	1	5	-4	16
1-2	16	2	4	-2	4
3-4	12	3	2,5	+0,5	0,25
5-6	12	4	2,5	+1,5	2,25
7 या अधिक	6	5	1	+4	16
					Σ डी 2 = 38.5

मानक सहसंबंध गुणांक जिन्हें विश्वसनीय माना जाता है (एल.एस. कामिंस्की के अनुसार)

स्वतंत्रता की कोटि की संख्या - 2	संभाव्यता स्तर पी (%)
स्वतंत्रता की कोटि की संख्या - 2	95%	98%	99%
1	0,997	0,999	0,999
2	0,950	0,980	0,990
3	0,878	0,934	0,959
4	0,811	0,882	0,917
5	0,754	0,833	0,874
6	0,707	0,789	0,834
7	0,666	0,750	0,798
8	0,632	0,716	0,765
9	0,602	0,885	0,735
10	0,576	0,858	0,708
11	0,553	0,634	0,684
12	0,532	0,612	0,661
13	0,514	0,592	0,641
14	0,497	0,574	0,623
15	0,482	0,558	0,606
16	0,468	0,542	0,590
17	0,456	0,528	0,575
18	0,444	0,516	0,561
19	0,433	0,503	0,549
20	0,423	0,492	0,537
25	0,381	0,445	0,487
30	0,349	0,409	0,449

व्लासोव वी.वी. महामारी विज्ञान। - एम.: जियोटार-मेड, 2004. - 464 पी।
लिसित्सिन यू.पी. सार्वजनिक स्वास्थ्य और स्वास्थ्य सेवा. विश्वविद्यालयों के लिए पाठ्यपुस्तक. - एम.: जियोटार-मेड, 2007. - 512 पी।
चिकित्सक वी.ए., यूरीव वी.के. सार्वजनिक स्वास्थ्य और स्वास्थ्य देखभाल पर व्याख्यान का कोर्स: भाग 1. सार्वजनिक स्वास्थ्य। - एम.: मेडिसिन, 2003. - 368 पी।
मिन्येव वी.ए., विष्णकोव एन.आई. और अन्य। सामाजिक चिकित्सा और स्वास्थ्य देखभाल संगठन (2 खंडों में मैनुअल)। - सेंट पीटर्सबर्ग, 1998. -528 पी।
कुचेरेंको वी.जेड., अगरकोव एन.एम. और अन्य। सामाजिक स्वच्छता और स्वास्थ्य देखभाल संगठन (ट्यूटोरियल) - मॉस्को, 2000. - 432 पी।
एस ग्लैंज़। चिकित्सा और जैविक आँकड़े। अंग्रेजी से अनुवाद - एम., प्रकृति, 1998. - 459 पी।

सूचना!आपकी विशिष्ट समस्या का समाधान इस उदाहरण के समान दिखेगा, जिसमें नीचे दी गई सभी तालिकाएँ और व्याख्यात्मक पाठ शामिल हैं, लेकिन आपके प्रारंभिक डेटा को ध्यान में रखते हुए...

काम:
मानों के 26 जोड़े का एक संबंधित नमूना है (x k,y k):

क	1	2	3	4	5	6	7	8	9	10
*एक्स क*	25.20000	26.40000	26.00000	25.80000	24.90000	25.70000	25.70000	25.70000	26.10000	25.80000
*वाई के*	30.80000	29.40000	30.20000	30.50000	31.40000	30.30000	30.40000	30.50000	29.90000	30.40000

क	11	12	13	14	15	16	17	18	19	20
*एक्स क*	25.90000	26.20000	25.60000	25.40000	26.60000	26.20000	26.00000	22.10000	25.90000	25.80000
*वाई के*	30.30000	30.50000	30.60000	31.00000	29.60000	30.40000	30.70000	31.60000	30.50000	30.60000

क	21	22	23	24	25	26
*एक्स क*	25.90000	26.30000	26.10000	26.00000	26.40000	25.80000
*वाई के*	30.70000	30.10000	30.60000	30.50000	30.70000	30.80000

गणना/प्लॉट के लिए आवश्यक:
- सहसंबंध गुणांक;
- α = 0.05 के महत्व स्तर पर यादृच्छिक चर एक्स और वाई की निर्भरता की परिकल्पना का परीक्षण करें;
- रेखीय प्रतिगमन समीकरण गुणांक;
- स्कैटर आरेख (सहसंबंध क्षेत्र) और प्रतिगमन रेखा ग्राफ;

समाधान:

1. सहसंबंध गुणांक की गणना करें.

सहसंबंध गुणांक दो यादृच्छिक चर के पारस्परिक संभाव्य प्रभाव का एक संकेतक है। सहसंबंध गुणांक आरसे मान ले सकते हैं -1 पहले +1 . यदि निरपेक्ष मान करीब है 1 , तो यह मात्राओं के बीच एक मजबूत संबंध का प्रमाण है, और यदि निकट है 0 - तो यह एक कमजोर कनेक्शन या उसकी अनुपस्थिति को इंगित करता है। यदि निरपेक्ष मान आरएक के बराबर है, तो हम मात्राओं के बीच कार्यात्मक संबंध के बारे में बात कर सकते हैं, यानी, गणितीय फ़ंक्शन का उपयोग करके एक मात्रा को दूसरे के माध्यम से व्यक्त किया जा सकता है।

सहसंबंध गुणांक की गणना निम्नलिखित सूत्रों का उपयोग करके की जा सकती है:

एन

के = 1

(एक्स के -एम एक्स) 2 , σ य 2 =

एम एक्स

एन

के = 1

एक्सके,

मेरा

या सूत्र द्वारा

आरएक्स,वाई

एम एक्सवाई - एम एक्स एम वाई

एस एक्स एस वाई

(1.4), कहां:

एम एक्स

एन

के = 1

एक्सके,

मेरा

एन

के = 1

वाई के ,

Mxy

एन

के = 1

एक्स के वाई के (1.5)

एस एक्स 2

एन

के = 1

एक्स के 2 - एम एक्स 2,

एस वाई 2

एन

के = 1

वाई के 2 - एम वाई 2 (1.6)

व्यवहार में, सहसंबंध गुणांक की गणना के लिए सूत्र (1.4) का अधिक बार उपयोग किया जाता है क्योंकि इसमें कम गणना की आवश्यकता होती है। हालाँकि, यदि सहप्रसरण की गणना पहले की गई थी कोव(एक्स,वाई), तो सूत्र (1.1) का उपयोग करना अधिक लाभदायक है, क्योंकि सहप्रसरण मान के अलावा, आप मध्यवर्ती गणनाओं के परिणामों का भी उपयोग कर सकते हैं।

1.1 आइए सूत्र (1.4) का उपयोग करके सहसंबंध गुणांक की गणना करें, ऐसा करने के लिए, हम x k 2, y k 2 और x k y k के मानों की गणना करते हैं और उन्हें तालिका 1 में दर्ज करते हैं।

तालिका नंबर एक

क	*एक्स क*	*वाई के*	एक्स क 2	वाई के 2	*एक्स कवाई के*
1	2	3	4	5	6
1	25.2	30.8	635.04000	948.64000	776.16000
2	26.4	29.4	696.96000	864.36000	776.16000
3	26.0	30.2	676.00000	912.04000	785.20000
4	25.8	30.5	665.64000	930.25000	786.90000
5	24.9	31.4	620.01000	985.96000	781.86000
6	25.7	30.3	660.49000	918.09000	778.71000
7	25.7	30.4	660.49000	924.16000	781.28000
8	25.7	30.5	660.49000	930.25000	783.85000
9	26.1	29.9	681.21000	894.01000	780.39000
10	25.8	30.4	665.64000	924.16000	784.32000
11	25.9	30.3	670.81000	918.09000	784.77000
12	26.2	30.5	686.44000	930.25000	799.10000
13	25.6	30.6	655.36000	936.36000	783.36000
14	25.4	31	645.16000	961.00000	787.40000
15	26.6	29.6	707.56000	876.16000	787.36000
16	26.2	30.4	686.44000	924.16000	796.48000
17	26	30.7	676.00000	942.49000	798.20000
18	22.1	31.6	488.41000	998.56000	698.36000
19	25.9	30.5	670.81000	930.25000	789.95000
20	25.8	30.6	665.64000	936.36000	789.48000
21	25.9	30.7	670.81000	942.49000	795.13000
22	26.3	30.1	691.69000	906.01000	791.63000
23	26.1	30.6	681.21000	936.36000	798.66000
24	26	30.5	676.00000	930.25000	793.00000
25	26.4	30.7	696.96000	942.49000	810.48000
26	25.8	30.8	665.64000	948.64000	794.64000

1.2. आइए सूत्र (1.5) का उपयोग करके एम एक्स की गणना करें.

1.2.1. एक्स क

x 1 + x 2 + … + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000

1.2.2.

669.50000 / 26 = 25.75000

एम एक्स = 25.750000

1.3. आइए इसी तरह से M y की गणना करें.

1.3.1. आइए सभी तत्वों को क्रमानुसार जोड़ें वाई के

y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000

1.3.2. परिणामी योग को नमूना तत्वों की संख्या से विभाजित करें

793.00000 / 26 = 30.50000

एम वाई = 30.5000000

1.4. इसी प्रकार हम M xy की गणना करते हैं.

1.4.1. आइए तालिका 1 के छठे कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. परिणामी योग को तत्वों की संख्या से विभाजित करें

20412.83000 / 26 = 785.10885

एम एक्सवाई = 785.108846

1.5. आइए सूत्र (1.6.) का उपयोग करके S x 2 के मान की गणना करें.

1.5.1. आइए तालिका 1 के चौथे कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. परिणामी योग को तत्वों की संख्या से विभाजित करें

17256.91000 / 26 = 663.72731

1.5.3. S x 2 का मान प्राप्त करने के लिए अंतिम संख्या से M x का वर्ग घटाएँ

एस एक्स 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. आइए सूत्र (1.6.) का उपयोग करके S y 2 के मान की गणना करें.

1.6.1. आइए तालिका 1 के 5वें कॉलम के सभी तत्वों को क्रमिक रूप से जोड़ें

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. परिणामी योग को तत्वों की संख्या से विभाजित करें

24191.84000 / 26 = 930.45538

1.6.3. S y 2 का मान प्राप्त करने के लिए अंतिम संख्या में से M y का वर्ग घटाएँ

एस वाई 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. आइए S x 2 और S y 2 की मात्राओं के गुणनफल की गणना करें.

एस एक्स 2 एस वाई 2 = 0.66481 0.20538 = 0.136541

1.8. आइए अंतिम संख्या का वर्गमूल लें और मान S x S y प्राप्त करें.

एस एक्स एस वाई = 0.36951

1.9. आइए सूत्र (1.4.) का उपयोग करके सहसंबंध गुणांक के मान की गणना करें.

आर = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028

उत्तर: आर एक्स, वाई = -0.720279

2. हम सहसंबंध गुणांक के महत्व की जांच करते हैं (हम निर्भरता की परिकल्पना की जांच करते हैं)।

चूँकि सहसंबंध गुणांक अनुमान की गणना एक सीमित नमूने पर की जाती है, और इसलिए इसके जनसंख्या मूल्य से विचलन हो सकता है, इसलिए सहसंबंध गुणांक के महत्व का परीक्षण करना आवश्यक है। जाँच टी-टेस्ट का उपयोग करके की जाती है:

टी =

आरएक्स,वाई


√	एन - 2


√	1 - आर 2 एक्स,वाई

(2.1)

यादृच्छिक मूल्य टीविद्यार्थी के t-वितरण का अनुसरण करता है और t-वितरण तालिका का उपयोग करके किसी दिए गए महत्व स्तर α पर मानदंड (t cr.α) का महत्वपूर्ण मान ज्ञात करना आवश्यक है। यदि सूत्र (2.1) द्वारा निरपेक्ष मान में गणना की गई t, t cr.α से कम निकलती है, तो यादृच्छिक चर X और Y के बीच कोई निर्भरता नहीं है। अन्यथा, प्रयोगात्मक डेटा यादृच्छिक चर की निर्भरता के बारे में परिकल्पना का खंडन नहीं करता है।

2.1. आइए हम सूत्र (2.1) का उपयोग करके टी-मानदंड के मूल्य की गणना करें और प्राप्त करें:

टी =

-0.72028


√	26 - 2


√	1 - (-0.72028) 2

= -5.08680

2.2. टी-वितरण तालिका का उपयोग करके, हम पैरामीटर t cr.α का महत्वपूर्ण मान निर्धारित करते हैं

Tcr.α का वांछित मान स्वतंत्रता की डिग्री की संख्या और दिए गए महत्व स्तर α के अनुरूप कॉलम के अनुरूप पंक्ति के चौराहे पर स्थित है।
हमारे मामले में, स्वतंत्रता की डिग्री की संख्या n - 2 = 26 - 2 = है 24 और α = 0.05 , जो मानदंड t cr.α = के महत्वपूर्ण मान से मेल खाता है 2.064 (तालिका 2 देखें)

तालिका 2 टी वितरण

स्वतंत्रता की कोटियों की संख्या (एन - 2)	α = 0.1	α = 0.05	α = 0.02	α = 0.01	α = 0.002	α = 0.001
1	6.314	12.706	31.821	63.657	318.31	636.62
2	2.920	4.303	6.965	9.925	22.327	31.598
3	2.353	3.182	4.541	5.841	10.214	12.924
4	2.132	2.776	3.747	4.604	7.173	8.610
5	2.015	2.571	3.365	4.032	5.893	6.869
6	1.943	2.447	3.143	3.707	5.208	5.959
7	1.895	2.365	2.998	3.499	4.785	5.408
8	1.860	2.306	2.896	3.355	4.501	5.041
9	1.833	2.262	2.821	3.250	4.297	4.781
10	1.812	2.228	2.764	3.169	4.144	4.587
11	1.796	2.201	2.718	3.106	4.025	4.437
12	1.782	2.179	2.681	3.055	3.930	4.318
13	1.771	2.160	2.650	3.012	3.852	4.221
14	1.761	2.145	2.624	2.977	3.787	4.140
15	1.753	2.131	2.602	2.947	3.733	4.073
16	1.746	2.120	2.583	2.921	3.686	4.015
17	1.740	2.110	2.567	2.898	3.646	3.965
18	1.734	2.101	2.552	2.878	3.610	3.922
19	1.729	2.093	2.539	2.861	3.579	3.883
20	1.725	2.086	2.528	2.845	3.552	3.850
21	1.721	2.080	2.518	2.831	3.527	3.819
22	1.717	2.074	2.508	2.819	3.505	3.792
23	1.714	2.069	2.500	2.807	3.485	3.767
24	1.711	2.064	2.492	2.797	3.467	3.745
25	1.708	2.060	2.485	2.787	3.450	3.725
26	1.706	2.056	2.479	2.779	3.435	3.707
27	1.703	2.052	2.473	2.771	3.421	3.690
28	1.701	2.048	2.467	2.763	3.408	3.674
29	1.699	2.045	2.462	2.756	3.396	3.659
30	1.697	2.042	2.457	2.750	3.385	3.646
40	1.684	2.021	2.423	2.704	3.307	3.551
60	1.671	2.000	2.390	2.660	3.232	3.460
120	1.658	1.980	2.358	2.617	3.160	3.373
∞	1.645	1.960	2.326	2.576	3.090	3.291

2.2. आइए t-मानदंड और t cr.α के निरपेक्ष मान की तुलना करें

टी-मानदंड का पूर्ण मान महत्वपूर्ण मान t = 5.08680, t cr.α = 2.064 से कम नहीं है, इसलिए प्रयोगात्मक डेटा, संभावना 0.95 के साथ(1 - α), परिकल्पना का खंडन न करेंयादृच्छिक चर X और Y की निर्भरता के बारे में।

3. रैखिक समाश्रयण समीकरण के गुणांकों की गणना करें।

एक रेखीय प्रतिगमन समीकरण एक सीधी रेखा का समीकरण है जो यादृच्छिक चर X और Y के बीच संबंध का अनुमान लगाता है (लगभग वर्णन करता है)। यदि हम मानते हैं कि मान इस प्रकार

वाई = ए + बी एक्स (3.1), जहां:

बी =

आरएक्स,वाई

σय

σx

आरएक्स,वाई

एस वाई

एसएक्स

(3.2),

ए = एम वाई - बी एम एक्स (3.3)

सूत्र (3.2) का उपयोग करके गुणांक की गणना की गई बीरैखिक प्रतिगमन गुणांक कहा जाता है। कुछ स्रोतों में एस्थिर प्रतिगमन गुणांक कहा जाता है और बीचर के अनुसार.

किसी दिए गए मान X के लिए Y की भविष्यवाणी करने में त्रुटियों की गणना सूत्रों का उपयोग करके की जाती है:

मात्रा σ y/x (सूत्र 3.4) भी कहा जाता है अवशिष्ट मानक विचलन, यह X के एक निश्चित (दिए गए) मान के लिए समीकरण (3.1) द्वारा वर्णित प्रतिगमन रेखा से मान Y के प्रस्थान को दर्शाता है।

एस वाई 2 / एस एक्स 2 = 0.20538 / 0.66481 = 0.30894. आइए अंतिम संख्या का वर्गमूल लें और प्राप्त करें:
एस वाई / एस एक्स = 0.55582

3.3 आइए गुणांक बी की गणना करेंसूत्र के अनुसार (3.2)

बी = -0.72028 0.55582 = -0.40035

3.4 आइए गुणांक की गणना करेंसूत्र के अनुसार (3.3)

ए = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 आइए प्रतिगमन समीकरण की त्रुटियों का अनुमान लगाएं.

3.5.1 S y 2 का वर्गमूल निकालने पर हमें प्राप्त होता है:

= 0.31437
3.5.4 आइए सूत्र (3.5) का उपयोग करके सापेक्ष त्रुटि की गणना करें

δ y/x = (0.31437 / 30.50000)100% = 1.03073%

4. हम एक स्कैटर आरेख (सहसंबंध क्षेत्र) और एक प्रतिगमन रेखा ग्राफ बनाते हैं।

एक स्कैटरप्लॉट एक्स और वाई अक्षों के साथ आयताकार निर्देशांक में एक विमान पर बिंदुओं के रूप में संबंधित जोड़े (एक्स के, वाई के) का एक ग्राफिकल प्रतिनिधित्व है। सहसंबंध क्षेत्र संबंधित (युग्मित) नमूने के ग्राफिकल प्रतिनिधित्व में से एक है। प्रतिगमन रेखा ग्राफ़ भी उसी समन्वय प्रणाली में प्लॉट किया गया है। यह सुनिश्चित करने के लिए कि आरेख यथासंभव स्पष्ट हो, अक्षों पर स्केल और शुरुआती बिंदुओं को सावधानीपूर्वक चुना जाना चाहिए।

4.1. नमूने का न्यूनतम और अधिकतम तत्व ज्ञात करें X क्रमशः 18वां और 15वां तत्व है, x न्यूनतम = 22.10000 और x अधिकतम = 26.60000।

4.2. हम पाते हैं कि नमूने का न्यूनतम और अधिकतम तत्व Y क्रमशः दूसरा और 18वां तत्व है, y न्यूनतम = 29.40000 और y अधिकतम = 31.60000।

4.3. x-अक्ष पर, बिंदु x 18 = 22.10000 के थोड़ा बाईं ओर एक प्रारंभिक बिंदु चुनें, और ऐसा पैमाना चुनें कि बिंदु x 15 = 26.60000 अक्ष पर फिट हो जाए और शेष बिंदु स्पष्ट रूप से दिखाई दें।

4.4. कोटि अक्ष पर, बिंदु y 2 = 29.40000 के थोड़ा बाईं ओर एक प्रारंभिक बिंदु चुनें, और ऐसा पैमाना चुनें कि बिंदु y 18 = 31.60000 अक्ष पर फिट हो और शेष बिंदु स्पष्ट रूप से अलग हों।

4.5. हम x k मान को भुज अक्ष पर और y k मान को कोटि अक्ष पर रखते हैं।

4.6. हम निर्देशांक तल पर बिंदु (x 1, y 1), (x 2, y 2),…, (x 26, y 26) आलेखित करते हैं। हमें नीचे दिए गए चित्र में दिखाया गया स्कैटर आरेख (सहसंबंध क्षेत्र) मिलता है।

4.7. आइए एक प्रतिगमन रेखा खींचें।

ऐसा करने के लिए, हम समीकरण (3.6) को संतुष्ट करने वाले निर्देशांक (x r1, y r1) और (x r2, y r2) वाले दो अलग-अलग बिंदु पाएंगे, उन्हें निर्देशांक तल पर आलेखित करेंगे और उनके माध्यम से एक सीधी रेखा खींचेंगे। पहले बिंदु के भुज के रूप में, हम मान x मिनट = 22.10000 लेते हैं। मान x मिनट को समीकरण (3.6) में प्रतिस्थापित करने पर, हम पहले बिंदु की कोटि प्राप्त करते हैं। इस प्रकार, हमारे पास निर्देशांक (22.10000, 31.96127) वाला एक बिंदु है। इसी तरह, हम दूसरे बिंदु के निर्देशांक प्राप्त करते हैं, मान x अधिकतम = 26.60000 को भुज के रूप में रखते हैं। दूसरा बिंदु होगा: (26.60000, 30.15970)।

प्रतिगमन रेखा नीचे दिए गए चित्र में लाल रंग में दिखाई गई है

कृपया ध्यान दें कि प्रतिगमन रेखा हमेशा X और Y के औसत मानों के बिंदु से होकर गुजरती है, अर्थात। निर्देशांक के साथ (एम एक्स, एम वाई)।

06.06.2018 16 235 0 इगोर

मनोविज्ञान और समाज

दुनिया में हर चीज़ आपस में जुड़ी हुई है। प्रत्येक व्यक्ति, अंतर्ज्ञान के स्तर पर, घटनाओं को प्रभावित करने और नियंत्रित करने में सक्षम होने के लिए उनके बीच संबंध खोजने की कोशिश करता है। वह अवधारणा जो इस संबंध को दर्शाती है सहसंबंध कहलाती है। सरल शब्दों में इसका क्या मतलब है?

सामग्री:

सहसंबंध की अवधारणा

सहसंबंध (लैटिन "सहसंबंध" से - अनुपात, संबंध)- एक गणितीय शब्द जिसका अर्थ है यादृच्छिक मात्राओं (चर) के बीच सांख्यिकीय संभाव्य निर्भरता का माप।

उदाहरण:आइए दो प्रकार के रिश्तों को लें:

पहला- एक व्यक्ति के हाथ में कलम. जिस दिशा में हाथ चलता है, उस दिशा में कलम चलती है। अगर हाथ आराम पर है तो कलम नहीं लिखेगी. यदि कोई व्यक्ति इसे थोड़ा जोर से दबाएगा तो कागज पर निशान अधिक गहरा होगा। इस प्रकार का संबंध सख्त निर्भरता को दर्शाता है और सहसंबद्ध नहीं है। यह रिश्ता कार्यात्मक है.
दूसरा प्रकार- किसी व्यक्ति की शिक्षा के स्तर और साहित्य पढ़ने के बीच संबंध। यह पहले से ज्ञात नहीं है कि कौन से लोग अधिक पढ़ते हैं: उच्च शिक्षा वाले या बिना उच्च शिक्षा वाले। यह संबंध यादृच्छिक या स्टोकेस्टिक है; इसका अध्ययन सांख्यिकीय विज्ञान द्वारा किया जाता है, जो विशेष रूप से सामूहिक घटनाओं से संबंधित है। यदि एक सांख्यिकीय गणना शिक्षा के स्तर और साहित्य पढ़ने के बीच संबंध को साबित करना संभव बनाती है, तो इससे कोई भी पूर्वानुमान लगाना और घटनाओं की संभावित घटना की भविष्यवाणी करना संभव हो जाएगा। इस उदाहरण में, उच्च संभावना के साथ, यह तर्क दिया जा सकता है कि उच्च शिक्षा वाले लोग, जो अधिक शिक्षित हैं, अधिक किताबें पढ़ते हैं। लेकिन चूंकि इन मापदंडों के बीच संबंध कार्यात्मक नहीं है, इसलिए हमसे गलती हो सकती है। आप हमेशा ऐसी त्रुटि की संभावना की गणना कर सकते हैं, जो स्पष्ट रूप से छोटी होगी और इसे सांख्यिकीय महत्व का स्तर (पी) कहा जाता है।

प्राकृतिक घटनाओं के बीच संबंधों के उदाहरण हैं:प्रकृति में खाद्य श्रृंखला, मानव शरीर, जिसमें अंग प्रणालियाँ शामिल हैं जो आपस में जुड़ी हुई हैं और एक पूरे के रूप में कार्य करती हैं।

हर दिन हम रोजमर्रा की जिंदगी में सहसंबंधों का सामना करते हैं: मौसम और अच्छे मूड के बीच, लक्ष्यों का सही निर्धारण और उनकी उपलब्धि, सकारात्मक दृष्टिकोण और भाग्य, खुशी की भावना और वित्तीय कल्याण। लेकिन हम गणितीय गणनाओं पर नहीं, बल्कि मिथकों, अंतर्ज्ञान, अंधविश्वासों और निष्क्रिय अटकलों पर भरोसा करते हुए कनेक्शन की तलाश कर रहे हैं। इन घटनाओं को गणितीय भाषा में अनुवाद करना, संख्याओं में व्यक्त करना और मापना बहुत कठिन है। यह दूसरी बात है जब हम उन घटनाओं का विश्लेषण करते हैं जिनकी गणना की जा सकती है और संख्याओं के रूप में प्रस्तुत की जा सकती है। इस मामले में, हम सहसंबंध गुणांक (आर) का उपयोग करके सहसंबंध को परिभाषित कर सकते हैं, जो यादृच्छिक चर के बीच सहसंबंध की ताकत, डिग्री, निकटता और दिशा को दर्शाता है।

यादृच्छिक चरों के बीच मजबूत सहसंबंध- इन घटनाओं के बीच विशेष रूप से कुछ सांख्यिकीय संबंध की उपस्थिति का प्रमाण, लेकिन इस संबंध को एक ही घटना में स्थानांतरित नहीं किया जा सकता है, लेकिन एक अलग स्थिति के लिए। अक्सर, शोधकर्ता, अपनी गणना में दो चरों के बीच एक महत्वपूर्ण सहसंबंध प्राप्त करने के बाद, सहसंबंध विश्लेषण की सादगी के आधार पर, विशेषताओं के बीच कारण-और-प्रभाव संबंधों के अस्तित्व के बारे में गलत सहज धारणाएं बनाते हैं, यह भूल जाते हैं कि सहसंबंध गुणांक प्रकृति में संभाव्य है। .

उदाहरण:बर्फीले हालात के दौरान घायल हुए लोगों की संख्या और मोटर वाहनों के बीच सड़क दुर्घटनाओं की संख्या। ये मात्राएँ एक-दूसरे के साथ सहसंबद्ध होंगी, हालाँकि वे बिल्कुल भी आपस में जुड़ी हुई नहीं हैं, लेकिन केवल इन यादृच्छिक घटनाओं के सामान्य कारण - काली बर्फ के साथ संबंध रखती हैं। यदि विश्लेषण से घटनाओं के बीच कोई सहसंबंध प्रकट नहीं होता है, तो यह अभी तक उनके बीच निर्भरता की अनुपस्थिति का प्रमाण नहीं है, जो जटिल गैर-रेखीय हो सकता है और सहसंबंध गणनाओं द्वारा प्रकट नहीं किया जा सकता है।

सहसंबंध की अवधारणा को वैज्ञानिक उपयोग में लाने वाले पहले फ्रांसीसी थे जीवाश्म विज्ञानी जॉर्जेस क्यूवियर. 18वीं शताब्दी में, उन्होंने जीवित जीवों के अंगों और अंगों के सहसंबंध का नियम निकाला, जिसकी बदौलत शरीर के पाए गए हिस्सों (अवशेषों) से एक संपूर्ण जीवाश्म प्राणी, जानवर की उपस्थिति को बहाल करना संभव हो गया। सांख्यिकी में सहसंबंध शब्द का प्रयोग पहली बार 1886 में एक अंग्रेजी वैज्ञानिक द्वारा किया गया था फ्रांसिस गैल्टन. लेकिन वह सहसंबंध गुणांक की गणना के लिए सटीक सूत्र प्राप्त नहीं कर सके, लेकिन उनके छात्र ने यह कर दिखाया - प्रसिद्ध गणितज्ञ और जीवविज्ञानी कार्ल पियर्सन।

सहसंबंध के प्रकार

महत्व से- अत्यधिक महत्वपूर्ण, महत्वपूर्ण और महत्वहीन।

प्रकार	आर किसके बराबर है
अत्यधिक महत्वपूर्ण	आर सांख्यिकीय महत्व पी के स्तर से मेल खाता है<=0,01
महत्वपूर्ण	r, p से मेल खाता है<=0,05
तुच्छ	r p>0.1 तक नहीं पहुंचता है

नकारात्मक(एक चर के मूल्य में कमी से दूसरे के स्तर में वृद्धि होती है: एक व्यक्ति को जितना अधिक फोबिया होता है, उसके नेतृत्व की स्थिति पर कब्जा करने की संभावना उतनी ही कम होती है) और सकारात्मक (यदि एक चर में वृद्धि से वृद्धि होती है) दूसरे के स्तर पर: आप जितना अधिक घबराएंगे, आपके बीमार होने की संभावना उतनी ही अधिक होगी)। यदि चरों के बीच कोई संबंध नहीं है, तो ऐसे सहसंबंध को शून्य कहा जाता है।

रेखीय(जब एक मान बढ़ता या घटता है, तो दूसरा भी बढ़ता या घटता है) और अरैखिक (जब एक मान बदलता है, तो दूसरे में परिवर्तन की प्रकृति को रैखिक संबंध का उपयोग करके वर्णित नहीं किया जा सकता है, तब अन्य गणितीय नियम लागू होते हैं - बहुपद, अतिपरवलयिक) रिश्तों)।

ताकत से.

कठिनाइयाँ

अध्ययन के तहत चर किस पैमाने से संबंधित हैं, इसके आधार पर विभिन्न प्रकार के सहसंबंध गुणांक की गणना की जाती है:

पियर्सन सहसंबंध गुणांक, जोड़ीदार रैखिक सहसंबंध गुणांक, या उत्पाद क्षण सहसंबंध की गणना अंतराल और पैमाने माप पैमानों वाले चर के लिए की जाती है।
स्पीयरमैन या केंडल रैंक सहसंबंध गुणांक - जब कम से कम एक मात्रा में क्रमिक पैमाना होता है या सामान्य रूप से वितरित नहीं होता है।
बिंदु द्विक्रमिक सहसंबंध गुणांक (फेचनर साइन सहसंबंध गुणांक) - यदि दो मात्राओं में से एक द्विभाजित है।
चार-क्षेत्र सहसंबंध गुणांक (एकाधिक रैंक सहसंबंध (समन्वय) गुणांक - यदि दो चर द्विभाजित हैं।

पियर्सन गुणांक पैरामीट्रिक सहसंबंध संकेतकों को संदर्भित करता है, अन्य सभी गैर-पैरामीट्रिक हैं।

सहसंबंध गुणांक मान -1 से +1 तक होता है। पूर्ण सकारात्मक सहसंबंध के साथ, r = +1, पूर्ण नकारात्मक सहसंबंध के साथ, r = -1।

सूत्र और गणना

उदाहरण

दो चर के बीच संबंध निर्धारित करना आवश्यक है: स्कूली बच्चों के बीच बौद्धिक विकास का स्तर (परीक्षण के अनुसार) और प्रति माह देरी की संख्या (शैक्षणिक पत्रिका में प्रविष्टियों के अनुसार)।

प्रारंभिक डेटा तालिका में प्रस्तुत किया गया है:

№	आईक्यू डेटा (x)	देरी की संख्या पर डेटा (y)










जोड़	1122
औसत	112,2

प्राप्त संकेतक की सही व्याख्या देने के लिए, सहसंबंध गुणांक (+ या -) के संकेत और उसके निरपेक्ष मान (मॉड्यूलो) का विश्लेषण करना आवश्यक है।

ताकत के आधार पर सहसंबंध गुणांक के वर्गीकरण की तालिका के अनुसार, हम यह निष्कर्ष निकालते हैं कि rxy = -0.827 एक मजबूत नकारात्मक सहसंबंध है। इस प्रकार, देर से आने वाले स्कूली बच्चों की संख्या उनके बौद्धिक विकास के स्तर पर बहुत अधिक निर्भर करती है। यह कहा जा सकता है कि उच्च IQ स्तर वाले छात्र निम्न IQ स्तर वाले छात्रों की तुलना में कक्षाओं के लिए कम देर से आते हैं।

सहसंबंध गुणांक का उपयोग वैज्ञानिकों द्वारा दो मात्राओं या घटनाओं की निर्भरता की धारणा की पुष्टि या खंडन करने और इसकी ताकत और महत्व को मापने के लिए और छात्रों द्वारा विभिन्न विषयों में अनुभवजन्य और सांख्यिकीय अनुसंधान करने के लिए किया जा सकता है। यह याद रखना चाहिए कि यह सूचक एक आदर्श उपकरण नहीं है; इसकी गणना केवल एक रैखिक संबंध की ताकत को मापने के लिए की जाती है और यह हमेशा एक संभाव्य मान होगा जिसमें एक निश्चित त्रुटि होती है।

सहसंबंध विश्लेषण का उपयोग निम्नलिखित क्षेत्रों में किया जाता है:

आर्थिक विज्ञान;
खगोल भौतिकी;
सामाजिक विज्ञान (समाजशास्त्र, मनोविज्ञान, शिक्षाशास्त्र);
कृषिरसायन;
धातुकर्म;
उद्योग (गुणवत्ता नियंत्रण के लिए);
हाइड्रोबायोलॉजी;
बॉयोमीट्रिक्स, आदि

सहसंबंध विश्लेषण पद्धति की लोकप्रियता के कारण:

सहसंबंध गुणांक की गणना की सापेक्ष सरलता के लिए विशेष गणितीय शिक्षा की आवश्यकता नहीं होती है।
आपको बड़े पैमाने पर यादृच्छिक चर के बीच संबंधों की गणना करने की अनुमति देता है, जो सांख्यिकीय विज्ञान में विश्लेषण का विषय हैं। इस संबंध में, यह पद्धति सांख्यिकीय अनुसंधान के क्षेत्र में व्यापक हो गई है।

मुझे आशा है कि अब आप कार्यात्मक संबंध को सहसंबंधी संबंध से अलग करने में सक्षम होंगे और जानेंगे कि जब आप टेलीविज़न पर सुनते हैं या प्रेस में सहसंबंध के बारे में पढ़ते हैं, तो इसका मतलब दो घटनाओं के बीच एक सकारात्मक और काफी महत्वपूर्ण अन्योन्याश्रयता है।