रैखिक सहसंबंध गुणांक शो। सहसंबंध विश्लेषण

सहसंबंध गुणांक - यह एक परिमाण है जो +1 से -1 से भिन्न हो सकती है। एक पूर्ण सकारात्मक सहसंबंध के मामले में, यह गुणांक प्लस 1 है (वे सुझाव देते हैं कि एक चर के मूल्य में वृद्धि के साथ, किसी अन्य चर का मूल्य), और पूर्ण नकारात्मक - शून्य 1 (एक प्रतिक्रिया इंगित करें, यानी एक चर के मूल्यों में वृद्धि के साथ, विभिन्न मान कम हो जाते हैं)।

PR1।:

शर्मीली और द्विघात की निर्भरता का ग्राफ। जैसा कि आप देख सकते हैं, अंक (विषय) अराजक नहीं हैं, लेकिन एक पंक्ति के आसपास बनाया गया है, और इस लाइन को देखकर हम कह सकते हैं कि व्यक्ति को व्यक्ति में व्यक्त किया जाता है, अधिक अवसाद, यानी, ये घटनाएं जुड़ी हुई हैं।

पीआर 2।: शर्म और समाजशीलता के लिए अनुसूची। हम देखते हैं कि शर्मीली में वृद्धि के साथ, समाजशीलता कम हो जाती है। उनका सहसंबंध गुणांक -0.43 है। इस प्रकार, 0 से 1 तक सहसंबंध गुणांक प्रत्यक्ष आनुपातिक संचार (अधिक ... अधिक ...), और अपमानजनक के बारे में -1 से 0 तक गुणांक (जितना अधिक ... कम है। ।)

यदि सहसंबंध गुणांक 0 है, तो दोनों चर एक दूसरे से पूरी तरह से स्वतंत्र हैं।

सह - संबंध - यह एक कनेक्शन है जहां वास्तविक कारकों का एक्सपोजर केवल वास्तविक डेटा के बड़े पैमाने पर अवलोकन के साथ प्रवृत्ति (औसत पर) के रूप में प्रकट होता है। सहसंबंध निर्भरताओं के उदाहरण बैंक की संपत्ति के आकार और बैंक के मुनाफे की राशि, श्रम उत्पादकता की वृद्धि और कर्मचारियों के अनुभव के बीच निर्भरता हो सकते हैं।

उनकी ताकत में सहसंबंध संबंधों के वर्गीकरण की दो प्रणालियों का उपयोग किया जाता है: सामान्य और निजी।

सहसंबंधों का सामान्य वर्गीकरण: 1) मजबूत, या सहसंबंध गुणांक आर\u003e 0.70; 2) 0.500.70 पर औसत, और न केवल उच्च स्तर के महत्व का सहसंबंध।

निम्नलिखित तालिका ने विभिन्न प्रकार के तराजू के लिए सहसंबंध गुणांक के नाम लिखे।

डिकोटोमिक स्केल (1/0) रैंक (ऑर्डिनल) स्केल
डिकोटोमिक स्केल (1/0) पियरसन एसोसिएशन के गुणांक, चार बोर्ड पियरसन गुणांक। बेइज़िरियल सहसंबंध
रैंक (ऑर्डिनल) स्केल रैंक BISERIAL सहसंबंध। आत्मा या केंडल्ला के सहसंबंध का गुणांक।
अंतराल और पूर्ण पैमाने बेइज़िरियल सहसंबंध अंतराल पैमाने के मानों का अनुवाद रैंक में किया जाता है और इसका उपयोग रैंक गुणांक होता है पियरसन सहसंबंध गुणांक (रैखिक सहसंबंध गुणांक)

के लिये आर=0 रैखिक सहसंबंध गायब है। साथ ही, समूह औसत चर अपने साझा औसत के साथ मेल खाते हैं, और रिग्रेशन लाइन समन्वय अक्षों के समानांतर हैं।

समानता आर=0 यह केवल एक रैखिक सहसंबंध निर्भरता (चर के गैर-संक्षारण) की अनुपस्थिति के बारे में बोलता है, लेकिन सहसंबंध की अनुपस्थिति के बारे में नहीं, और इससे भी अधिक, सांख्यिकीय निर्भरता।

कभी-कभी सहसंबंध की अनुपस्थिति के बारे में निष्कर्ष एक मजबूत सहसंबंध की उपस्थिति से अधिक महत्वपूर्ण है। दो चर का शून्य सहसंबंध इंगित कर सकता है कि एक चर का कोई प्रभाव नहीं है, बशर्ते कि हम माप परिणामों पर भरोसा करते हैं।

एसपीएसएस में: 11.3.2 सहसंबंध गुणांक

अब तक, हमने केवल दो संकेतों के बीच सांख्यिकीय निर्भरता के अस्तित्व के तथ्य का पता लगाया। इसके बाद, हम यह पता लगाने की कोशिश करेंगे कि इस निर्भरता की ताकत या कमजोरी के साथ-साथ इसके रूप और अभिविन्यास के बारे में क्या निष्कर्ष निकाला जा सकता है। चर के बीच संबंधों के मात्रात्मक मूल्यांकन के मानदंड को सहसंबंध गुणांक या जुड़ाव उपायों कहा जाता है। दो चर एक दूसरे के साथ सकारात्मक रूप से सहसंबंध करते हैं, यदि उनके बीच प्रत्यक्ष, unidirectional अनुपात है। एक यूनिडायरेक्शनल अनुपात के साथ, एक चर के छोटे मूल्य किसी अन्य चर के छोटे मूल्यों के अनुरूप होते हैं, बड़े मूल्य बड़े होते हैं। दो चर एक दूसरे के साथ नकारात्मक रूप से सहसंबंधित होते हैं, अगर उनके बीच एक रिवर्स, मल्टीडायरेक्शनल अनुपात होता है। एक बहुआयामी अनुपात के साथ, एक चर के छोटे मूल्य किसी अन्य चर के बड़े मूल्यों के अनुरूप होते हैं और इसके विपरीत। सहसंबंध गुणांक के मूल्य हमेशा -1 से +1 तक की सीमा में झूठ बोल रहे हैं।

ऑर्डिनल स्केल से संबंधित चर के बीच सहसंबंध का गुणांक गुणांक के गुणांक, और अंतराल से संबंधित चर के लिए उपयोग किया जाता है - पियरसन सहसंबंध गुणांक (कार्यों का क्षण)। यह ध्यान दिया जाना चाहिए कि प्रत्येक dichotomous चर, यानी, नाममात्र पैमाने से संबंधित एक चर और दो श्रेणियों के रूप में क्रमबद्ध किया जा सकता है।

शुरू करने के लिए, हम जांच करेंगे कि studeih.sav फ़ाइल से सेक्स और साइके वैरिएबल्स के बीच सहसंबंध। साथ ही, हम ध्यान में रखते हैं कि सेक्स के डिकोटोमिक चर को सामान्य माना जा सकता है। इन चरणों का पालन करें:

· विश्लेषणात्मक आँकड़ों (वर्णनात्मक आंकड़े) का विश्लेषण कमांड मेनू में कमांड का चयन करें ... (संयोगशीलता तालिकाओं)

· लिंग वैरिएबल को स्ट्रिंग सूची में स्थानांतरित करें, और मनोविज्ञान चर कॉलम सूची में है।

· आंकड़ों पर क्लिक करें ... (सांख्यिकी) बटन। क्रॉसस्टैब्स में: सांख्यिकी संवाद, सहसंबंध चेकबॉक्स (सहसंबंध) का चयन करें। जारी रखें बटन के साथ संपर्क की पुष्टि करें।

क्रॉसस्टैब्स संवाद में, सुपरप्रेस टेबल चेक बॉक्स की जांच करके तालिकाओं को आउटपुट करने से इनकार करें। ठीक बटन पर क्लिक करें।

स्पिरोटे और पियरसन के सहसंबंध गुणांक के गुणांक की गणना की जाएगी, और उनके महत्व की जांच की जाएगी:

/ सिद्धांत। सहसंबंध गुणांक

सहसंबंध गुणांक - दो-आयामी वर्णनात्मक आंकड़े, दो चर के रिश्ते (संयुक्त परिवर्तनशीलता) का मात्रात्मक उपाय।

आज तक, एक महान कई अलग-अलग सहसंबंध गुणांक विकसित किए गए हैं। हालांकि, सबसे महत्वपूर्ण संचार उपायों - पियर्सन, स्पीरमैन और केंडल्ला . उनकी समग्र विशेषता यह है कि वे दो संकेतों के संबंध को दर्शाते हैं , एक मात्रात्मक पैमाने में मापा जाता है - रैंक या मीट्रिक .

आम तौर पर बोलना, कोई भी अनुभवजन्य अध्ययन दो या अधिक चर के रिश्तों का अध्ययन करने पर केंद्रित है। .

यदि प्रति इकाई एक चर में परिवर्तन हमेशा एक ही मूल्य पर किसी अन्य चर में परिवर्तन की ओर जाता है, तो फ़ंक्शन है रैखिक (अनुसूची एक सीधी रेखा का प्रतिनिधित्व करती है); कोई अन्य कनेक्शन - गैर रेखीय । यदि एक चर में वृद्धि दूसरे में वृद्धि के साथ जुड़ा हुआ है, तो संचार - सकारात्मक ( सीधे ) ; यदि एक चर में वृद्धि दूसरे में कमी के साथ जुड़ा हुआ है, फिर संचार - नकारात्मक ( श्लोक में ) . यदि एक चर के परिवर्तन की दिशा एक और चर में वृद्धि (अवरोही) में वृद्धि के साथ नहीं बदलता है, तो ऐसा समारोह - मोनोटोन ; अन्यथा समारोह कहा जाता है नॉनमोनोटोनिक .

कार्यात्मक संबंध आदर्श हैं। उनकी सुविधा यह है कि एक चर का एक मूल्य किसी अन्य चर के सख्ती से परिभाषित मूल्य से मेल खाता है। उदाहरण के लिए, यह दो भौतिक चर का संबंध है - वजन और शरीर की लंबाई (रैखिक सकारात्मक)। हालांकि, भौतिक प्रयोगों में भी, अनुभवजन्य संबंध अनचाहे या अज्ञात कारणों से कार्यात्मक संबंधों से भिन्न होंगे: सामग्री, माप त्रुटियों आदि की संरचना के ऑसीलेशन।

शोधकर्ता के दृश्य के क्षेत्र से संकेतों के संबंधों का अध्ययन करते समय, इन संकेतों की विविधता के कई संभावित कारण अनिवार्य रूप से गिरते हैं। नतीजा यह है कि वास्तविकता में भी मौजूद है, चर के बीच कार्यात्मक कनेक्शन एक संभाव्य (स्टोकास्टिक) के रूप में अनुभवजन्य रूप से कार्य करता है: एक चर का एक ही मूल्य किसी अन्य चर (और इसके विपरीत) के विभिन्न मूल्यों के वितरण से मेल खाता है।

सबसे सरल उदाहरण लोगों के विकास और वजन का अनुपात है। इन दो संकेतों के अध्ययन के अनुभवजन्य परिणाम निश्चित रूप से, उनके सकारात्मक संबंध दिखाएंगे। लेकिन यह अनुमान लगाना आसान है कि यह सख्त, रैखिक, सकारात्मक-आदर्श गणितीय समारोह से भिन्न होगा, यहां तक \u200b\u200bकि विषयों की सद्भाव या पूर्णता के लेखांकन पर शोधकर्ता की सभी चालों के साथ भी। यह असंभव है कि इस आधार पर कोई व्यक्ति शरीर की लंबाई और वजन के बीच सख्त कार्यात्मक संबंध की उपस्थिति के तथ्य से इनकार करने के लिए दिमाग में आएगा।

इसलिए, घटनाओं के कार्यात्मक संबंधों को अनुभवी रूप से संबंधित संकेतों के एक संभाव्य कनेक्शन के रूप में ही पता लगाया जा सकता है।

एक संभाव्य संचार के चरित्र का एक दृश्य विचार एक फैलाव आरेख देता है - एक ग्राफ, जिस की धुरी दो चर के मूल्यों से मेल खाती है, और प्रत्येक विषय एक बिंदु है। सहसंबंध गुणांक को संभाव्यता संचार की संख्यात्मक विशेषता के रूप में उपयोग किया जाता है।

आप संचार बल के लिए सहसंबंध मूल्यों के तीन ग्रेडेशन दर्ज कर सकते हैं:

आर< 0,3 - слабая связь (менее 10% от общей доли дисперсии);

0,3 < r < 0,7 - умеренная связь (от 10 до 50% от общей доли дисперсии);

आर\u003e 0.7 - मजबूत बंधन (फैलाव के कुल अंश का 50% या अधिक)।

निजी सहसंबंध

यह अक्सर होता है कि दो चर केवल इस तथ्य के कारण एक-दूसरे के साथ सहसंबंधित होते हैं कि वे दोनों कुछ तीसरे चर के प्रभाव में बदल रहे हैं। वास्तव में, इन दो चर के संबंधित गुणों के बीच संबंध अनुपस्थित है, लेकिन तीसरे चर के कुल कारण के प्रभाव में, एक सांख्यिकीय संबंध, या सहसंबंध में स्वयं प्रकट होता है)।

इस प्रकार, यदि एक निश्चित तीसरे यादृच्छिक मूल्य के साथ दो चर के बीच सहसंबंध कम हो जाता है, तो इसका मतलब है कि इस तीसरे चर के प्रभाव के माध्यम से उनका परस्पर निर्भरता भाग में होती है। यदि निजी सहसंबंध शून्य या बहुत छोटा है, तो हम यह निष्कर्ष निकाल सकते हैं कि उनकी परस्पर निर्भरता पूरी तरह से अपने प्रभाव के कारण है और तीसरे चर से संबंधित नहीं है।

इसके अलावा, यदि निजी सहसंबंध दो चर के बीच प्रारंभिक सहसंबंध से अधिक है, तो हम यह निष्कर्ष निकाल सकते हैं कि अन्य चर कनेक्शन को कमजोर कर दिया गया है, या "छुपा" सहसंबंध।

इसके अलावा, यह याद रखना आवश्यक है सहसंबंध कारण नहीं है । इस पर आधारित, हमें एक कारण कनेक्शन की उपस्थिति के बारे में डिजाइन करने का कोई अधिकार नहीं है: विश्लेषण में विचार किए गए विश्लेषण से कुछ पूरी तरह से अलग इस सहसंबंध का स्रोत हो सकता है। सामान्य सहसंबंध के साथ, और निजी सहसंबंधों के तहत, कारणता की धारणा में हमेशा अपनी गैर-महत्वपूर्ण नींव होनी चाहिए।

पियर्सन सहसंबंध गुणांक

आर- पियर्सन दो मीट्रिक चर के संबंधों का अध्ययन करने के लिए उपयोग किया जाता है , उसी नमूने पर मापा जाता है . ऐसी कई स्थितियां हैं जिनमें इसका उपयोग उचित है। क्या बुद्धि विश्वविद्यालय के वरिष्ठ पाठ्यक्रमों में अकादमिक प्रदर्शन को प्रभावित करती है? सहकर्मियों के लिए एक कर्मचारी की मजदूरी की राशि है? क्या स्कूल की मनोदशा एक जटिल अंकगणितीय कार्य को हल करने की सफलता को प्रभावित करती है? ऐसे प्रश्नों के उत्तर के लिए, शोधकर्ता को नमूने के प्रत्येक सदस्य को ब्याज के दो संकेतकों को मापना चाहिए।

सहसंबंध गुणांक का मूल्य इस बात को प्रभावित नहीं करता है कि माप इकाइयों में क्या संकेत प्रस्तुत किए जाते हैं। नतीजतन, किसी भी रैखिक चरित्र रूपांतरण (निरंतर, निरंतर के अतिरिक्त गुणा) सहसंबंध गुणांक के मूल्यों को नहीं बदलता है। अपवाद नकारात्मक स्थिरता पर एक संकेतों में से एक का गुणा है: सहसंबंध गुणांक इसके संकेत को विपरीत में बदल देता है।

पियर्सन सहसंबंध दो चर के बीच एक रैखिक संचार है . यह आपको निर्धारित करने की अनुमति देता है , दो चर की विविधता के प्रति आनुपातिक . यदि चर एक दूसरे के समान आनुपातिक हैं, तो ग्राफिक रूप से उनके बीच कनेक्शन को ढलान से सकारात्मक (प्रत्यक्ष अनुपात) या नकारात्मक (रिवर्स अनुपात) के साथ सीधी रेखा के रूप में दर्शाया जा सकता है।

व्यावहारिक रूप से, दो चर के बीच संबंध, यदि ऐसा है, तो संभाव्य और ग्राफिक रूप से एक दीर्घवृत्त रूप के बादल फैलाव की तरह दिखता है। हालांकि, यह एलिप्सिड, एक सीधी रेखा, या प्रतिगमन लाइनों के रूप में (अनुमानित) प्रस्तुत किया जा सकता है। बढतीरेखा - यह कम से कम वर्गों द्वारा निर्मित एक सीधी रेखा है: स्कैटरिंग शेड्यूल के प्रत्येक बिंदु से दूरी (वाई अक्ष के साथ गणना) के वर्गों का योग सीधे न्यूनतम है।

भविष्यवाणी सटीकता का अनुमान लगाने के लिए विशेष महत्व आश्रित चर के अनुमानों का फैलाव है। वास्तव में, आश्रित चर वाई के अनुमानों का फैलाव इसके पूर्ण फैलाव का हिस्सा है, जो एक स्वतंत्र चर एक्स के प्रभाव के कारण है। दूसरे शब्दों में, आश्रित चर के अनुमानों के फैलाव का अनुपात इसके सच है फैलाव सहसंबंध गुणांक के वर्ग के बराबर है।

आश्रित और स्वतंत्र चर के सहसंबंध गुणांक का वर्ग एक स्वतंत्र चर के प्रभाव के कारण आश्रित चर के फैलाव का एक अंश है, और कहा जाता है निर्धारण का गुणांक । दृढ़ संकल्प गुणांक, इस प्रकार, इस सीमा को दिखाता है कि एक चर की विविधता दूसरे चर के प्रभाव के साथ (निर्धारित) के कारण है।

दृढ़ संकल्प गुणांक का सहसंबंध गुणांक की तुलना में एक महत्वपूर्ण लाभ है। सहसंबंध दो चर के बीच एक रैखिक संचार समारोह नहीं है। इसलिए, कई नमूनों के लिए औसत अंकगणितीय सहसंबंध गुणांक इन नमूनों के सभी विषयों के लिए तुरंत गणना की गई सहसंबंध के साथ मेल नहीं खाता है (यानी, सहसंबंध गुणांक योजक नहीं है)। इसके विपरीत, दृढ़ संकल्प गुणांक कनेक्शन रैखिक रूप से दर्शाता है और इसलिए additive है: औसत नमूने के लिए इसकी औसत की अनुमति है।

संचार की शक्ति पर अतिरिक्त जानकारी वर्ग में सहसंबंध गुणांक का मूल्य देती है - निर्धारण गुणांक: यह एक चर के फैलाव का हिस्सा है, जिसे किसी अन्य चर के प्रभाव से समझाया जा सकता है। सहसंबंध गुणांक के विपरीत, निर्धारण गुणांक संचार बल में वृद्धि के साथ रैखिक रूप से बढ़ रहा है।

आत्मा के सहसंबंध गुणांक और τ-kendalla (रैंक सहसंबंध)। यदि दोनों चर के बीच कनेक्शन का अध्ययन किया जाता है, तो एक प्रक्रिया पैमाने में प्रस्तुत किया जाता है, या उनमें से एक - क्रम में, और दूसरा - मेट्रिक में, फिर रैंक सहसंबंध गुणांक लागू होते हैं: स्पीरमैन या τ - केंडेला . और टी। , और एक अन्य गुणांक के लिए दोनों चर की पूर्व रैंकिंग के उपयोग की आवश्यकता होती है। .

स्पीरमैन रैंक सहसंबंध गुणांक - यह गैर-पैरामीट्रिक विधि है , जो घटना के बीच संचार के सांख्यिकीय अध्ययन के उद्देश्य के लिए प्रयोग किया जाता है . इस मामले में, समांतरता की वास्तविक डिग्री अध्ययन की गई विशेषताओं की दो मात्रात्मक पंक्तियों के बीच निर्धारित की जाती है और इसे मात्रात्मक रूप से उच्चारण गुणांक का उपयोग करके स्थापित कनेक्शन की परिभाषा का आकलन दिया जाता है।

यदि समूह के सदस्यों के सदस्यों को एक्स चर के साथ पहले स्थान पर रखा गया था, तो परिवर्तनीय वाई के अनुसार, फिर एक्स और वाई चर के बीच सहसंबंध प्राप्त किया जा सकता है, बस रैंक की दो पंक्तियों के लिए पियरसन गुणांक की गणना करना। रैंक में बांड की अनुपस्थिति के अधीन (यानी, बार-बार रैंक की कमी) अन्य परिवर्तनीय पर, पियरसन के लिए सूत्र कम्प्यूटेशनल शर्तों में काफी सरल हो सकता है और जिसे ज्ञात सूत्र में परिवर्तित किया जा सकता है स्पिरमेन .

आत्मा के सहसंबंध के बिजली गुणांक पैरामीट्रिक सहसंबंध गुणांक की शक्ति से कुछ हद तक कम है.

रैंक सहसंबंध के गुणांक को लागू करने की सलाह दी जाती है यदि कोई छोटी संख्या में अवलोकन हो . इस विधि का उपयोग न केवल मात्रात्मक रूप से उच्चारण डेटा के लिए किया जा सकता है। , लेकिन मामलों में भी , जब पंजीकृत मान विभिन्न तीव्रता के वर्णनात्मक संकेतों द्वारा निर्धारित किए जाते हैं .

एक या दोनों या दोनों में समान संख्या में समान रैंक के साथ मादक के रैंक सहसंबंध का गुणांक मोटे मूल्यों को देता है। आदर्श रूप से, सहसंबंधित पंक्तियों दोनों अनुचित मूल्यों के दो अनुक्रम होना चाहिए।

अधिकारों के लिए सहसंबंध भाला का विकल्प सहसंबंध का प्रतिनिधित्व करता है τ-केंडल्ला । एम। केंडले द्वारा प्रस्तावित सहसंबंध के दिल में, यह विचार है कि संचार की दिशा का न्याय किया जा सकता है, एक जोड़ी में परीक्षणों की तुलना में स्वयं के बीच की तुलना में: यदि x के तहत परीक्षण की एक जोड़ी वाई में बदलाव के साथ दिशा में मेल खाती है, यह एक सकारात्मक कनेक्शन को इंगित करता है यदि मेल नहीं खाता है - फिर नकारात्मक कनेक्शन पर।

सहसंबंध गुणांक विशेष रूप से संख्यात्मक तराजू में मापा दो गुणों के बीच संचार की ताकत और संचार की दिशा के संख्यात्मक निर्धारण के लिए डिज़ाइन किए गए थे (मीट्रिक या रैंक)।

जैसा कि पहले ही उल्लेख किया संचार की अधिकतम ताकत सहसंबंध मूल्यों (सख्त प्रत्यक्ष या सीधे आनुपातिक संचार) और -1 (सख्त रिवर्स या बैक आनुपातिक संचार) से मेल खाती है, संचार की अनुपस्थिति शून्य के बराबर सहसंबंध से मेल खाती है।

संचार की शक्ति पर अतिरिक्त जानकारी निर्धारण गुणांक का मूल्य देती है: यह एक चर के फैलाव का हिस्सा है, जिसे किसी अन्य चर के प्रभाव से समझाया जा सकता है।

विषय 12 सहसंबंध विश्लेषण

कार्यात्मक निर्भरता और सहसंबंध। VI शताब्दी में अधिक हिप्पोक्रेट्स। ईसा पूर्व इ। शरीर की संरचना और एक या एक और बीमारियों के पूर्वाग्रह के बीच लोगों के शरीर और स्वभाव के बीच संचार की उपस्थिति पर ध्यान आकर्षित किया। इस संबंध के कुछ प्रकारों को जानवर और पौधे की दुनिया में भी पहचाना जाता है। तो, खेत जानवरों में शरीर और उत्पादकता के बीच एक रिश्ता है; बीज की गुणवत्ता और खेती वाले पौधों की उपज के बीच संबंध आदि। पारिस्थितिकी में ऐसी निर्भरताओं के लिए, मिट्टी में भारी धातुओं की सामग्री और वायुमंडलीय वायु, आदि में उनकी एकाग्रता से बर्फ के आवरण के बीच निर्भरताएं हैं। इसलिए, स्वाभाविक रूप से, मनुष्य के हितों में इस पैटर्न का उपयोग करने की इच्छा, इसे कम या कम सटीक मात्रात्मक अभिव्यक्ति दें।

जैसा कि ज्ञात है, फ़ंक्शन की गणितीय अवधारणा चर के बीच के लिंक का वर्णन करने के लिए लागू होती है एफजो एक स्वतंत्र चर के प्रत्येक विशिष्ट मूल्य के अनुरूप है एक्स। आश्रित चर का परिभाषित मूल्य वाई। । चर के बीच इस तरह के अस्पष्ट संबंध एक्स। तथा वाई कॉल कार्यात्मक। हालांकि, प्राकृतिक वस्तुओं में इस तरह का संचार हमेशा से दूर है। इसलिए, जैविक, साथ ही पर्यावरणीय संकेतों के बीच निर्भरता कार्यात्मक नहीं है, लेकिन एक सांख्यिकीय प्रकृति, जब सजातीय व्यक्तियों के द्रव्यमान में, एक तर्क के एक निश्चित मूल्य को तर्क के रूप में माना जाता है, एक ही संख्यात्मक महत्व के अनुरूप नहीं है, लेकिन एक संपूर्ण संख्यात्मक विविधताओं को वितरित करने की रेंज एक अन्य सुविधा के मान एक आश्रित चर, या कार्य के रूप में माना जाता है। चर के बीच इस तरह की निर्भरता कहा जाता है सह - संबंध या सह - संबंध ..

कार्यात्मक बॉन्ड को आसानी से एकल और समूह वस्तुओं पर पाया जा सकता है और मापा जा सकता है, लेकिन यह सहसंबंध बांड के साथ नहीं किया जा सकता है, जिसका उपयोग केवल गणितीय आंकड़ों के तरीकों से समूह वस्तुओं पर किया जा सकता है। संकेतों के बीच सहसंबंध बंधन रैखिक और nonlinear, सकारात्मक और नकारात्मक है। चुनिंदा सहसंबंध संकेतकों की सटीकता को सत्यापित करने के लिए अलग-अलग संकेतों, इसकी पीसने की माप और अंत में, सुरक्षा विश्लेषण का कार्य कम करने के लिए कम किया जाता है।

चर के बीच निर्भरता एक्स। तथा वाई इसे विश्लेषणात्मक रूप से (सूत्रों और समीकरणों की सहायता के साथ) और ग्राफिकल रूप से (आयताकार समन्वय प्रणाली में एक ज्यामितीय स्थान के रूप में) व्यक्त किया जा सकता है। सहसंबंध की लत का ग्राफ समीकरण समारोह द्वारा बनाया गया है या कहा जाता है वापसी। यहां और - औसत अंकगणित स्थिति पर पाया गया एक्स। या वाई कुछ मूल्य स्वीकार करेंगे एक्स। या वाई। इन माध्यमों को बुलाया जाता है सशर्त.

11.1। पैरामीट्रिक संचार संकेतक

सहसंबंध गुणांक। परिवर्तनीय मूल्यों के बीच एक्स। तथा वाई आप उनमें से एक के संख्यात्मक मानों को दूसरे के संबंधित मानों के साथ मिलकर सेट कर सकते हैं। यदि दूसरा एक चर में वृद्धि के साथ बढ़ता है, तो यह इंगित करता है सकारात्मक संचार इन मानों के बीच, और इसके विपरीत, जब एक चर में वृद्धि के साथ दूसरे के मूल्य में कमी के साथ होता है, तो यह इंगित करता है नकारात्मक संचार.

कनेक्शन को चिह्नित करने के लिए, उनकी दिशा और चर की संयोग्यता की डिग्री निम्नलिखित संकेतकों द्वारा उपयोग की जाती है:

    रैखिक लत - सहसंबंध गुणांक;

    nonlinear - सहसंबंध संबंध.

अनुभवजन्य सहसंबंध गुणांक निर्धारित करने के लिए, निम्न सूत्र का उपयोग किया जाता है:

. (1)

यहाँ एस एक्स। तथा एस वाई - मध्यम वर्गिक विचलन।

सहसंबंध गुणांक की गणना मध्यम आकार के वर्गबद्ध विचलन की गणना के बिना की जा सकती है, जो निम्न समान सूत्र के अनुसार कम्प्यूटेशनल काम को सरल बनाती है:

. (2)

सहसंबंध गुणांक -1 से +1 तक की सीमा में एक आयाम रहित संख्या है। संकेतों की स्वतंत्र भिन्नता के मामले में, जब उनके बीच संबंध पूरी तरह से अनुपस्थित है ,. संकेतों के बीच संयोजन मजबूत, सहसंबंध गुणांक मूल्य जितना अधिक होगा। इसलिए, इस सूचक के साथ न केवल उपस्थिति, बल्कि संकेतों के बीच संयोग की डिग्री भी विशेषता है। सकारात्मक या प्रत्यक्ष कनेक्शन के साथ, जब एक विशेषता के बड़े मूल्य दूसरे के सबसे बड़े मूल्यों के अनुरूप होते हैं, तो सहसंबंध गुणांक में सकारात्मक संकेत होता है और नकारात्मक या प्रतिक्रिया के साथ 0 से +1 की सीमा में होता है, जब अन्य के छोटे मूल्य एक फीचर के बड़े मूल्यों के अनुरूप होते हैं, तो सहसंबंध गुणांक एक नकारात्मक संकेत के साथ होता है और 0 से -1 तक होता है।

सहसंबंध गुणांक का व्यापक रूप से अभ्यास में उपयोग किया जाता था, लेकिन यह सहसंबंध बांड का सार्वभौमिक संकेतक नहीं है, क्योंकि केवल रैखिक कनेक्शन वर्णित करने में सक्षम हैं, यानी। रैखिक प्रतिगमन समीकरण द्वारा व्यक्त (विषय 12 देखें)। यदि अलग-अलग संकेतों के बीच गैर-रैखिक निर्भरता है, तो अन्य संचार संकेतकों का उपयोग किया जाता है, जो नीचे चर्चा की जाती है।

सहसंबंध गुणांक की गणना। यह गणना विभिन्न तरीकों से उत्पन्न होती है और विभिन्न तरीकों से अवलोकन की संख्या (नमूनाकरण) के आधार पर होती है। अलग-अलग नमूने और बड़ी मात्रा के नमूने की उपस्थिति में सहसंबंध गुणांक की गणना करने के विशिष्ट विचारों पर विचार करें।

छोटे नमूने। छोटे नमूनों की उपस्थिति में, सहसंबंध गुणांक की गणना आमतौर पर संयुग्मित संकेतों के मूल्यों के मूल्यों द्वारा की जाती है, बिना विभिन्न प्रकार के नमूना डेटा के समूह के समूह के बिना। इसके लिए, उपरोक्त सूत्र (1) और (2) परोसा जाता है। अधिक सुविधाजनक, विशेष रूप से बहुविकल्पित और आंशिक संख्या की उपस्थिति में, जो संस्करण द्वारा व्यक्त किए जाते हैं एच मैं। तथा वाई मैं। औसत से और, निम्नलिखित कार्य सूत्रों परोसा जाता है:

कहा पे ;

;

यहाँ एक्स। मैं। तथा वाई मैं। - संयुग्मित संकेतों के जोड़े संस्करण एक्स। तथा वाई; और -s- एक अंकगणित; - संयुग्मित संकेतों के जोड़े विकल्पों के बीच अंतर एक्स। तथा वाई; एन - युग्मित अवलोकनों की कुल संख्या, या चुनिंदा कुल की मात्रा।

अनुभवजन्य सहसंबंध गुणांक, किसी भी अन्य चुनिंदा संकेतक के रूप में, इसके मूल्यांकन के रूप में कार्य करता है सामान्य पैरामीटर ρ और एक यादृच्छिक मान के रूप में एक त्रुटि के साथ है:

इसकी त्रुटि के लिए चुनिंदा सहसंबंध गुणांक का अनुपात शून्य परिकल्पना की जांच के लिए एक मानदंड के रूप में कार्य करता है - यह धारणा सामान्य जनसंख्या में, यह पैरामीटर शून्य है, यानी । शून्य परिकल्पना स्वीकार्य महत्व स्तर पर अस्वीकार करती है α , यदि एक

महत्वपूर्ण बिंदुओं के मूल्य टी सेंट महत्व α के विभिन्न स्तरों के लिए और स्वतंत्रता की डिग्री की संख्या तालिका 1 अनुप्रयोगों में दी गई है।

यह स्थापित किया जाता है कि छोटे नमूने संसाधित करते समय (विशेष रूप से जब एन< 30 ) सूत्रों के अनुसार सहसंबंध गुणांक की गणना (1) - (3) सामान्य पैरामीटर के कई कम्यक्तेटेड अनुमान देता है ρ । निम्नलिखित संशोधन करना आवश्यक है:

फिशर जेड-रूपांतरण। सहसंबंध गुणांक के उचित उपयोग में यादृच्छिक चर के संयुग्म मूल्यों के दो-आयामी सेट का सामान्य वितरण शामिल है एक्स। तथा वाई। गणितीय आंकड़ों से, यह ज्ञात है कि चर के बीच एक महत्वपूर्ण सहसंबंध के साथ, यानी। कब अ आर xy। > 0,5 सामान्य रूप से वितरित सामान्य जनसंख्या से ली गई छोटी नमूने की एक बड़ी संख्या के लिए सहसंबंध गुणांक का चुनिंदा वितरण सामान्य वक्र से काफी विचलित होता है।

इस परिस्थिति को देखते हुए आर फिशर चुनिंदा सहसंबंध गुणांक के मूल्य के लिए सामान्य पैरामीटर का अनुमान लगाने के लिए एक और सटीक तरीका मिला। यह विधि बदलने के लिए नीचे आती है आर xy। ट्रांसफॉर्मेड वैल्यू जेड, जो अनुभवजन्य सहसंबंध गुणांक से जुड़ा हुआ है, जैसा कि निम्नानुसार है:

मान जेड का वितरण लगभग अपरिवर्तित है, क्योंकि नमूना के आकार और सामान्य आबादी में सहसंबंध गुणांक के मूल्य पर निर्भर करता है, और सामान्य वितरण के दृष्टिकोण पर निर्भर करता है।

सूचक जेड की विश्वसनीयता के लिए मानदंड निम्नलिखित दृष्टिकोण है:

शून्य परिकल्पना स्वीकार्य महत्व स्तर पर खारिज कर दी जाती है α और स्वतंत्रता की डिग्री की संख्या। महत्वपूर्ण बिंदुओं के मूल्य टी सेंट तालिका 1 अनुप्रयोगों में एलईडी।

आवेदन जेड को बदलने आपको चुनिंदा सहसंबंध गुणांक के सांख्यिकीय महत्व का मूल्यांकन करने की अनुमति देता है, साथ ही साथ अनुभवजन्य गुणांक के बीच अंतर, जब आवश्यकता उत्पन्न होती है।

सहसंबंध गुणांक के सटीक अनुमान के लिए न्यूनतम नमूना आकार। आप सहसंबंध गुणांक के निर्दिष्ट मूल्य के लिए नमूना के आकार की गणना कर सकते हैं, जो शून्य परिकल्पना को अस्वीकार करने के लिए पर्याप्त होगा (यदि संकेतों के बीच सहसंबंध वाई तथा एक्स। वास्तव में मौजूद है)। इसके लिए निम्नलिखित सूत्र के रूप में कार्य करता है:

कहा पे एन वांछित नमूना आकार; टी - महत्व के विभाजित स्तर के अनुसार निर्दिष्ट मूल्य (α \u003d 1% के लिए बेहतर); जेड - परिवर्तित अनुभवजन्य सहसंबंध गुणांक।

बड़े नमूने। कई स्रोत डेटा की उपस्थिति में, उन्हें विविधता पंक्तियों में समूहीकृत किया जाना चाहिए, और एक सहसंबंध ग्रिड का निर्माण, इसकी कोशिकाओं (कोशिकाओं) में अंतर संयुग्मन पंक्तियों की सामान्य आवृत्तियों का निर्माण करना होगा। सहसंबंध ग्रिल पंक्तियों और स्तंभों के चौराहे से गठित होता है, जिसकी संख्या समूहों की संख्या या सहसंबंधित पंक्तियों के वर्गों के बराबर होती है। कक्षाएं शीर्ष स्ट्रिंग में स्थित हैं और सहसंबंध तालिका के पहले (बाएं) कॉलम में, और प्रतीक द्वारा इंगित कुल आवृत्तियों एफ xy। - सहसंबंध जाली की कोशिकाओं में, जो सहसंबंध तालिका का मुख्य हिस्सा बनाता है।

तालिका की शीर्ष पंक्ति में रखी गई कक्षाएं आमतौर पर बढ़ते क्रम में बाएं से दाएं स्थित होती हैं, और तालिका के पहले कॉलम में - शीर्ष से नीचे तक घटते क्रम में। भिन्नता श्रृंखला के वर्ग के इस स्थान के साथ, उनकी कुल आवृत्तियों (यदि संकेतों के बीच सकारात्मक संबंध है वाई तथा एक्स।) उन्हें ऊपरी बाएं कोने से ऊपरी दाएं कोने में निचले बाएं कोने तक एक दीर्घवृत्त के रूप में जाली कोशिकाओं के माध्यम से वितरित किया जाएगा या ऊपरी बाएं कोने से दिशा में (संकेतों के बीच एक नकारात्मक कनेक्शन की उपस्थिति में) जाली के निचले दाएं कोने में। यदि आवृत्ति एफ xy। यह एक दीर्घवृत्त आकृति के बिना सहसंबंध जाली की कोशिकाओं पर अधिक या कम समान रूप से वितरित किया जाता है, यह संकेतों के बीच सहसंबंध की अनुपस्थिति को इंगित करेगा।

आवृत्ति वितरण एफ xy। सहसंबंध जाली की कोशिकाओं के अनुसार, संकेतों के बीच संचार की उपस्थिति या अनुपस्थिति का केवल एक सामान्य विचार दिया जाता है। मूल्य और हस्ताक्षर की वजह से कम या कम सहसंबंध गुणांक। अंतराल भिन्नता बैंड में नमूना डेटा के प्रारंभिक समूह के साथ सहसंबंध गुणांक की गणना करते समय बहुत व्यापक वर्ग अंतराल नहीं लिया जाना चाहिए। औसत मूल्यों और भिन्नता संकेतकों की गणना करते समय इस की तुलना में कोई भी समूह सहसंबंध गुणांक के मूल्य से कहीं अधिक मजबूत होता है।

याद रखें कि कक्षा अंतराल की परिमाण सूत्र द्वारा निर्धारित की जाती है

कहा पे एक्स। मैक्स , एक्स। न्यूनतम। - अधिकतम और न्यूनतम संयोजन विकल्प; सेवा मेरे - कक्षाओं की संख्या जिसमें सुविधा की विशेषता को विभाजित किया जाना चाहिए। अनुभव ने दिखाया है कि सहसंबंध विश्लेषण के क्षेत्र में, परिमाण सेवा मेरे इसे लगभग निम्नानुसार नमूना आकार के आदी हो सकते हैं (तालिका 1)।

तालिका एक

नमूनाकरण

अर्थ के।

50 ≥ n\u003e 30

100 ≥ n\u003e 50

200 ≥ n\u003e 100

300 ≥ n\u003e 200

विभिन्न सांख्यिकीय विशेषताओं की तरह भिन्नता श्रृंखला में प्रारंभिक डेटा के प्रारंभिक समूह के साथ गणना की गई, सहसंबंध गुणांक विभिन्न विधियों द्वारा निर्धारित किया जाता है जो पूरी तरह से समान परिणाम देते हैं।

कार्य विधि। सहसंबंध गुणांक की गणना मूल सूत्रों (1) या (2) का उपयोग करके गणना की जा सकती है, जो dimeric की कुल मिलाकर संस्करण की पुनरावृत्ति में सुधार कर रही है। साथ ही, प्रतीकवाद को सरल बनाना, उनके औसत से विचलन को दर्शाता है लेकिन अ। तथा। फिर फॉर्मूला (2), विचलन की पुनरावृत्ति को ध्यान में रखते हुए, निम्नलिखित अभिव्यक्ति लेंगे:

इस सूचक की विश्वसनीयता को छात्र के मानदंड द्वारा अनुमानित किया जाता है, जो फॉर्मूला द्वारा निर्धारित त्रुटि के लिए चुनिंदा सहसंबंध गुणांक के अनुपात का प्रतिनिधित्व करता है

इसलिए, और यदि यह मान स्वतंत्रता की डिग्री और महत्व के स्तर के लिए छात्र एसटी आलोचना के मानक मूल्य से अधिक है (अनुप्रयोगों की तालिका 2 देखें), तो शून्य परिकल्पना अस्वीकार कर रही है।

सशर्त औसत की विधि। विचलन विकल्प ("कक्षाएं") के सहसंबंध गुणांक की गणना करते समय, न केवल औसत अंकगणित से और यह सशर्त औसत और एक्स और ए वाई पर भी संभव है। इस मामले में, फॉर्मूला (2) के संख्यात्मक में विधि एक सुधार करती है और सूत्र निम्न फ़ॉर्म प्राप्त करता है:

कहा पे एफ xy। - एक और वितरण की अन्य पंक्तियों की कक्षाओं की आवृत्तियों; और, यानी वर्ग अंतराल के आकार से संबंधित सशर्त औसत से कक्षाओं के विचलन λ ; एन - जोड़ा गया अवलोकन, या नमूनाकरण की कुल संख्या; और - पहले आदेश के सशर्त क्षण, जहां एफ एक्स। - पंक्ति आवृत्तियों एच, लेकिन अ एफ वाई - पंक्ति आवृत्तियों वाई; एस एक्स। तथा एस वाई - श्रृंखला के मध्यम वर्गिक विचलन एक्स।तथा वाईसूत्र द्वारा गणना की गई।

सशर्त औसत की विधि के कार्यों की विधि पर एक फायदा होता है, क्योंकि यह आंशिक संख्याओं के साथ लेनदेन से बचने के लिए संभव बनाता है और वही (सकारात्मक) विचलन का संकेत देता है ए। एक्स। तथा ए। वाई यह कम्प्यूटेशनल काम की तकनीक को सरल बनाता है, खासकर बहुवलय संख्या की उपस्थिति में।

सहसंबंध गुणांक के बीच अंतर का मूल्यांकन। दो स्वतंत्र नमूनों के सहसंबंध गुणांक की तुलना करते समय, शून्य परिकल्पना इस धारणा में कम हो जाती है कि सामान्य आबादी में, इन संकेतकों के बीच का अंतर शून्य है। दूसरे शब्दों में, इसे इस धारणा से आगे बढ़ाया जाना चाहिए कि कॉम्पैकेबल अनुभवीय सहसंबंध गुणांक के बीच मनाया गया अंतर मौका से हुआ।

शून्य परिकल्पना की जांच करने के लिए, छात्र के टी-मानदंड परोसा जाता है, यानी। अनुभवजन्य सहसंबंध गुणांक के बीच अंतर का अनुपात आर 1 तथा आर 2 सूत्र द्वारा निर्धारित इसकी सांख्यिकीय त्रुटि के लिए:

कहा पे एस आर 1 तथा एस आर 2 - तुलनात्मक सहसंबंध गुणांक की त्रुटियां।

शून्य परिकल्पना को अस्वीकार कर दिया गया है, बशर्ते महत्व दर में हो α और स्वतंत्रता की डिग्री की संख्या।

यह ज्ञात है कि सहसंबंध गुणांक की सटीकता का एक और सटीक मूल्यांकन स्थानांतरित करके प्राप्त किया जाता है आर xy। संख्या जेड। चुनिंदा सहसंबंध गुणांक के बीच अंतर का अपवाद और मूल्यांकन नहीं आर 1 तथा आर 2 , विशेष रूप से उन मामलों में जहां उत्तरार्द्ध की गणना अपेक्षाकृत छोटी मात्रा के नमूने पर की जाती है ( एन< 100 ) और इसके पूर्ण मूल्य में 0.50 से अधिक है।

अंतर छात्र टी-मानदंड द्वारा अनुमानित है, जो सूत्र द्वारा गणना की गई त्रुटि के लिए इस अंतर के संबंध में बनाया गया है

महत्व के स्वीकृत स्तर के लिए शून्य परिकल्पना अस्वीकार कर रही है।

सहसंबंध। चर के बीच nonlinear संबंधों को मापने के लिए एक्स। तथा वाई एक संकेतक का उपयोग करें जिसे कहा जाता है सहसंबंध संबंधयह द्विपक्षीय कनेक्शन का वर्णन करता है। सहसंबंध संबंधों के डिजाइन में दो प्रकार की भिन्नता की तुलना शामिल होती है: व्यक्तिगत औसत मूल्य की तुलना में व्यक्तिगत औसत और निजी औसत की विविधताओं के संबंध में व्यक्तिगत अवलोकनों की विविधता। छोटे हिस्से दूसरे के संबंध में पहला घटक होगा, संचार के विषय अधिक होंगे। सीमा में, जब निजी औसत के पास व्यक्तिगत संकेतों की कोई भिन्नता नहीं होती है, तो यह बेहद बड़ा होगा। इसी प्रकार, निजी औसत की विविधता की अनुपस्थिति में, युग्मन न्यूनतम है। चूंकि भिन्नता के इस अनुपात को दो संकेतों में से प्रत्येक के लिए माना जा सकता है, इसलिए कठोरता के दो संकेतक प्राप्त किए जाते हैं - एच yx। तथा एच xy। । सहसंबंध संबंध रिश्तेदार का मूल्य है और 0 से 1 तक मान ले सकता है। एक ही समय में, सहसंबंध अनुपात के गुणांक आमतौर पर एक दूसरे के बराबर नहीं होते हैं, यानी। । इन संकेतकों के बीच समानता केवल संकेतों के बीच सख्ती से रैखिक संबंधों के साथ व्यवहार्य है। सहसंबंध संबंध एक सार्वभौमिक संकेतक है: यह आपको किसी भी प्रकार के सहसंबंध और रैखिक, और nonlinear की विशेषता है।

सहसंबंध अनुपात एच yx। तथा एच xy। ऊपर चर्चा की गई विधियों का निर्धारण करें, यानी। काम करने की विधि और सशर्त औसत की विधि।

कार्य विधि। सहसंबंध अनुपात एच yx। तथा एच xy। निम्नलिखित सूत्र निर्धारित करें:

जहां और समूह फैलाव,

ए और - सामान्य फैलाव।

यहां और - सामान्य औसत अंकगणित, और - समूह औसत अंकगणित; एफ यी। - पंक्ति आवृत्तियों वाई, लेकिन अ एफ ग्यारहवीं - पंक्ति आवृत्तियों एक्स।; क। - कक्षाओं की संख्या; एन - अलग-अलग संकेतों की संख्या।

सहसंबंध अनुपात की गणना के लिए सूत्र निम्नानुसार हैं:

सशर्त औसत की विधि। फॉर्मूला (15), कक्षा विकल्प के विचलन द्वारा सहसंबंध अनुपात के गुणांक निर्धारित करना एक्स। मैं। और वाई मुझे न केवल औसत अंकगणित से लिया जा सकता है और, बल्कि सशर्त औसत और एक्स और ए वाई से भी लिया जा सकता है। ऐसे मामलों में, समूह और सामान्य विचलनों की गणना सूत्रों और साथ ही, और, कहां से की जाती है।

सूत्र (15) के तैनात रूप में इस तरह दिखते हैं:

;

. (17)

इन सूत्रों में और - सशर्त औसत से कक्षाओं के विचलन, कक्षा अंतराल के मूल्य से संक्षिप्त; मूल्यों ए। वाई तथा ए। एक्स। प्राकृतिक पंक्तियों की संख्या व्यक्त की जाती है: 0, 1, 2, 3, 4, .... Ostal प्रतीकों को ऊपर बताया गया है।

सशर्त औसत की विधि के साथ कार्यों की विधि की तुलना करना, पहली विधि का लाभ नहीं देखना असंभव है, खासकर उन मामलों में जहां आपको बहु-मूल्यवान संख्याओं से निपटना होगा। अन्य चुनिंदा संकेतकों की तरह, सहसंबंध संबंध अपने सामान्य पैरामीटर का अनुमान है और एक यादृच्छिक मान के रूप में, सूत्र द्वारा निर्धारित त्रुटि के साथ है

छात्र के टी-मानदंड द्वारा सहसंबंध अनुमान की सटीकता की जांच की जा सकती है। एच 0 इस धारणा से एक hypotese आय है कि सामान्य पैरामीटर शून्य है, यानी निम्नलिखित शर्त की जानी चाहिए:

स्वतंत्रता की डिग्री और महत्व के स्तर की संख्या के लिए।

निर्धारण का गुणांक। सहसंबंध की मजबूती के संकेतकों द्वारा उठाए गए मूल्यों की व्याख्या करने के लिए; निर्धारण गुणांकजो दिखाता है कि एक सुविधा की विविधता का अनुपात किसी अन्य सुविधा की विविधता पर निर्भर करता है। एक रैखिक कनेक्शन की उपस्थिति में, दृढ़ संकल्प गुणांक सहसंबंध गुणांक आर 2 एक्सवाई का वर्ग है, और संकेतों के बीच गैर-रैखिक निर्भरता के साथ वाई तथा एक्स। - सहसंबंध अनुपात एच 2 वाईएक्स का वर्ग। दृढ़ संकल्प गुणांक निम्नलिखित अनुकरणीय पैमाने बनाने का कारण देते हैं, संकेतों के बीच कनेक्शन की मजबूती का न्याय करने की अनुमति देते हैं: कनेक्शन के साथ औसत माना जाता है; एक कमजोर कनेक्शन को इंगित करता है और केवल तभी जब कोई एक मजबूत कनेक्शन का न्याय कर सकता है, जब सुविधा की विशेषता का लगभग 50% वाई सुविधा की विविधता पर निर्भर करता है एक्स।.

संचार प्रपत्र का मूल्यांकन। चर के बीच सख्ती से रैखिक संबंधों के साथ वाई तथा एक्स। समानता की जाती है। ऐसे मामलों में, सहसंबंध संबंध के गुणांक सहसंबंध गुणांक के मूल्य के साथ मेल खाते हैं। इस मूल्य और निर्धारण गुणांक में संयोग, यानी । नतीजतन, इन मूल्यों के बीच अंतर के संदर्भ में, कोई चर के बीच सहसंबंध निर्भरता के रूप का न्याय कर सकता है वाई तथा एक्स।:

जाहिर है, चर के बीच एक रैखिक कनेक्शन के साथ वाई तथा एक्स। संकेतक γ शून्य होगा; यदि चर के बीच संबंध वाई तथा एक्स। Nonlinear, γ\u003e 0।

संकेतक γ सामान्य पैरामीटर का अनुमान है और, एक यादृच्छिक मूल्य के रूप में, सत्यापित करने की आवश्यकता है। यह इस धारणा से आगे बढ़ता है कि मूल्यों के बीच संबंध वाई तथा एक्स। रैखिक (शून्य परिकल्पना)। इस परिकल्पना की जांच करें फिशर के एफ-मानदंडों की अनुमति देता है:

कहा पे ए। - भिन्नता श्रृंखला के समूहों की संख्या, या कक्षाएं; एन - नमूना मात्रा। शून्य परिकल्पना को खारिज कर दिया जाता है यदि अनुप्रयोग क्षैतिज रूप से (क्षैतिज रूप से पाया जाता है), (एक ही तालिका के पहले कॉलम में पाया जाता है) और महत्व के गोद लेने वाले स्तर।

सहसंबंध के महत्व का निर्धारण

सहसंबंध गुणांक का वर्गीकरण

सहसंबंध गुणांक बल और महत्व द्वारा विशेषता है।

ताकत के लिए सहसंबंध गुणांक का वर्गीकरण।

महत्व के लिए सहसंबंध गुणांक का वर्गीकरण।

इन वर्गीकरणों में से 2 को भ्रमित नहीं किया जाना चाहिए, क्योंकि वे विभिन्न विशेषताओं को परिभाषित करते हैं। मजबूत सहसंबंध यादृच्छिक हो सकता है और, यह अविश्वसनीय हो गया। विशेष रूप से अक्सर यह नमूना में एक छोटी मात्रा के साथ होता है। और एक बड़े नमूने में, यहां तक \u200b\u200bकि एक कमजोर सहसंबंध भी अत्यधिक मूल्यवान हो सकता है।

सहसंबंध गुणांक की गणना करने के बाद, सांख्यिकीय परिकल्पनाओं को आगे बढ़ाना आवश्यक है:

एच 0: सहसंबंध दर शून्य से काफी अलग नहीं है (यह यादृच्छिक है)।

एच 1: सहसंबंध दर शून्य से काफी अलग है (यह गैर-यादृच्छिक है)।

हाइपोथिसिस की जांच तालिका महत्वपूर्ण मूल्यों के साथ परिणामी अनुभवजन्य गुणांक से की जाती है। यदि अनुभवजन्य महत्व महत्वपूर्ण है या उससे अधिक हो जाता है, तो शून्य परिकल्पना को खारिज कर दिया जाता है: आर ईएमएफ ≥ आर केआर लेकिन, þ एच 1। ऐसे मामलों में, वे निष्कर्ष निकालते हैं कि मतभेदों की सटीकता का पता चला है।

यदि अनुभवजन्य महत्व महत्वपूर्ण नहीं है, तो शून्य परिकल्पना को खारिज नहीं किया गया है: आर ईएमएफ< r кр Þ Н 0 . В таких случаях делают вывод, что достоверность различий не установлена.

सांख्यिकी / सहसंबंध

युग्मित गुणांक के मैट्रिक्स की गणना

सह - संबंध

युग्मित सहसंबंध गुणांक के मैट्रिक्स की गणना करने के लिए, मेनू को कॉल करें सहसंबंध Matrices मापांक आधारसांख्यिकीविदों.

अंजीर। 1 मॉड्यूल पैनल मूल सांख्यिकी

StatSt_S सिस्टम में सहसंबंध विश्लेषण का मुख्य चरण उदाहरण के डेटा को देखेंगे (चित्र 2 देखें)। प्रारंभिक डेटा उद्योगों में से एक के 23 उद्यमों की गतिविधियों के अवलोकनों का परिणाम है।

Fig.2 प्रारंभिक डेटा

तालिका ग्राफ में निम्न संकेतक होते हैं:

लाभदायक - लाभप्रदता,%;

दास का हिस्सा पीपीपी, इकाइयों की संरचना में श्रमिकों का हिस्सा है;

फोंडूट - फोंडो स्टूडियो, इकाइयां;

OSNFONDS - मुख्य उत्पादन सुविधाओं का औसत वार्षिक मूल्य, लाख रूबल;

अनूठा - गैर उत्पादन लागत, हजार रूबल। इसे अन्य से लाभप्रदता की निर्भरता की जांच करना आवश्यक है

जीआईएच संकेतक।

मान लीजिए कि सामान्य कुल में विचाराधीन संकेत सामान्य वितरण कानून के अधीन हैं, और ये अवलोकन कुल का नमूना हैं।

सभी चर के बीच युग्मित सहसंबंध गुणांक की गणना करें। लाइन का चयन करने के बाद सहसंबंध Matrices स्क्रीन पर एक संवाद बॉक्स दिखाई देता है। पियर्सन सहसंबंध। यह नाम इस तथ्य के कारण है कि पहली बार यह गुणांक पियरसन, एडमवर्थ और वेल्डन था।

विश्लेषण के लिए चर का चयन करें। ऐसा करने के लिए, संवाद बॉक्स में दो बटन हैं: क्वाड। गणित का सवाल (एक सूची) और सही। गणित का सवाल (दो सूची)।


अंजीर। 3 सहसंबंध विश्लेषण संवाद

पहला बटन कस्टम के मैट्रिक्स की गणना करने के लिए डिज़ाइन किया गया है। चर के सभी संयोजनों के जोड़ों की सहसंबंध गुणांक के साथ सममित प्रजाति। यदि आप विश्लेषण करते समय सभी संकेतकों का उपयोग करते हैं, तो आप चर चयन संवाद बॉक्स में बटन दबा सकते हैं। सभी चुनिए। (यदि चर एक पंक्ति में नहीं हैं, आप माउस क्लिक का चयन करना चुन सकते हैं एक साथ कुंजी दबाकर सीटीआरएल)


यदि आप क्लिक करते हैं विवरण। संवाद बॉक्स, प्रत्येक परिवर्तनीय लंबे नामों के लिए प्रदर्शित किया जाएगा। इस बटन पर फिर से क्लिक करके (इसे बुलाया जाएगा संक्षिप्त), मुझे छोटे नाम मिलते हैं।

बटन जानकारी चयनित पुन: के लिए विंडो खोलता है जिसमें आप इसकी विशेषताओं को देख सकते हैं: लंबे नाम, प्रदर्शन प्रारूप, मानों की क्रमबद्ध सूची, वर्णनात्मक आंकड़े (मूल्यों की संख्या, मानक विचलन)।

चर का चयन करने के बाद, ठीक या बटन पर क्लिक करें कोर्रेलैटिया संवाद बॉक्स सह - संबंध पियर्सन। स्क्रीन पर गणना किए गए सहसंबंध मैट्रिक्स दिखाई देते हैं।

स्क्रीन पर महत्वपूर्ण सहसंबंध गुणांक लाल रंग में हाइलाइट किए गए हैं।

हमारे उदाहरण में, लाभप्रदता संकेतक संकेतकों के साथ सबसे अधिक जुड़े थे फोंडोस्टिच (लिंक डायरेक्ट) और उत्पादन व्यय (प्रतिक्रिया, बढ़ती एक्स के साथ अंत वी शामिल)। लेकिन संकेत पारस्परिक रूप से कितने बारीकी से संतुष्ट हैं? तंग को 0.7 से कम और कमजोर - 0.3 से कम मॉड्यूल के गुणांक के मानों के साथ संबंध माना जाता है। इस प्रकार, आगे रिग्रेशन समीकरण के निर्माण के साथ, इसे सबसे अधिक जानकारीपूर्ण के रूप में "फंड-छात्र" और "गैर-उत्पादक खर्च" के संकेतकों तक ही सीमित होना चाहिए।

हालांकि, हमारे उदाहरण में एक घटना है। बहु रंग, जब स्वतंत्र चर के बीच एक लिंक होता है (मॉड्यूल में जोड़ी सहसंबंध गुणांक 0.8 से अधिक होता है)।

विकल्प आयताकार मैट्रिक्स (चर की दो सूची) दो परिवर्तनीय सूचियों का चयन करने के लिए एक संवाद बॉक्स खोलता है। तस्वीर के रूप में pose


नतीजतन, हम एक आयताकार सहसंबंध मैट्रिक्स प्राप्त करते हैं जिसमें आश्रित चर के साथ केवल सहसंबंध गुणांक होते हैं।


यदि विकल्प स्थापित है कोर। मैट्रिक्स (नमूने सार्थक),फिर बटन पर क्लिक करने के बाद सह - संबंध कोयोफ के साथ एक मैट्रिक्स का निर्माण किया जाएगा, महत्व के स्तर पर अलग किया जाएगा आर.


यदि विकल्प चुना गया है विस्तृत तालिका परिणाम, फिर फायर बटन पर सह - संबंध, हम एक ऐसी तालिका प्राप्त करते हैं जिसमें न केवल सहसंबंध गुणांक होते हैं, बल्कि मध्यम, मिल-डार्ट विचलन, रिग्रेशन समीकरण के गुणांक, रिग्रेशन समीकरण और अन्य आंकड़ों में इसके बॉडी सदस्य होते हैं


जब चर के पास एक छोटा सा सापेक्ष भिन्नता होती है (मानक विचलन का अनुपात 0.00 बिलियन 20,000,000 से कम औसत तक), मूल्यांकन की एक उच्च डिग्री की आवश्यकता होती है। इसे पियरसन सहसंबंध संवाद बॉक्स की बढ़ती सटीकता के साथ गणना विकल्प रखकर सेट किया जा सकता है।

मिस्ड डेटा के साथ ऑपरेशन का तरीका पीडी के desigid हटाने द्वारा निर्धारित किया जाता है। यदि आप इसे चुनते हैं, तो स्थिर सभी अवलोकनों को अनदेखा करता है जो छोड़ रहे हैं। विपरीत मामले में, उनकी जोड़ीदार हटाने की व्यवस्था की जाती है।

लंबे परिवर्तनीय नामों को प्रदर्शित करने के लिए एक चिह्नित मोड के परिणामस्वरूप लंबे परिवर्तनीय नामों वाली एक तालिका होगी।

सहसंबंध निर्भरता की ग्राफिक छवि

पियरसन सहसंबंध संवाद बॉक्स में सहसंबंध निर्भरता की ग्राफिक छवि प्राप्त करने के लिए कई बटन शामिल हैं।

2 एम स्कैटरिंग विकल्प प्रत्येक चयनित चर के लिए एक बिखरने वाला चार्ट अनुक्रम बनाता है। उनकी पसंद के लिए खिड़की चित्रा 6 के समान है। बाईं ओर, आपको सही स्वतंत्र - लाभदायक - जीवंत चर निर्दिष्ट करना चाहिए। ठीक क्लिक करके, हम एक ग्राफ प्राप्त करते हैं जिस पर रिग्रेशन का संरेखण प्रत्यक्ष और संज्ञानात्मकता की ट्रस्ट सीमाओं को चित्रित किया जाएगा।

रैखिक सहसंबंध गुणांक संचार के स्वर का सबसे महत्वपूर्ण मूल्यांकन देता है, यदि समन्वय प्रणाली में बिंदुओं का स्थान प्रत्यक्ष रेखा या एक विस्तारित दीर्घवृत्त जैसा दिखता है, यदि अंक एक वक्र के रूप में स्थित होते हैं, तो ऑरर्ज्यूलेशन गुणांक एक प्रभावित रेटिंग देता है।

अनुसूची के आधार पर, हम एक बार फिर लाभप्रदता और नींव संकेतकों के बीच संबंधों की पुष्टि कर सकते हैं, क्योंकि ये अवलोकन एक इच्छुक दीर्घवृत्त के रूप में स्थित हैं। यह कहा जाना चाहिए कि रिश्ते को इस तथ्य पर विचार किया जाता है कि दीर्घवृत्त की मुख्य धुरी के लिए एक ब्लिस्टर बिंदु है।

हमारे उदाहरण में, प्रति इकाई नींव के संकेतक में परिवर्तन से लाभप्रदता में 5.7376% की वृद्धि होगी।

आइए लाभप्रदता के मूल्य पर गैर-उत्पादक खर्चों के प्रभाव को देखें। ऐसा करने के लिए, एक समान कार्यक्रम बनाएं

विश्लेषण डेटा पहले से ही अपने दीर्घवृत्त रूप से याद दिलाया गया है, और सहसंबंध गुणांक कुछ हद तक कम है। प्रतिगमन गुणांक के पाए गए मूल्य से पता चलता है कि प्रति 1,000 रूबल प्रति उत्पादन खर्च में वृद्धि के साथ, लाभप्रदता 0.7017% की कमी आती है।

यह ध्यान दिया जाना चाहिए कि कई प्रतिगमन (बाद के अध्यायों में माना जाता है) का निर्माण, जब समीकरण एक ही समय में दोनों विशेषताओं, प्रतिगमन गुणांक के अन्य मूल्यों की ओर जाता है, जिसे बातचीत द्वारा समझाया गया है, जो स्वयं के बीच चर को समझाते हैं ।

बिखरने वाले आरेख पर एक बिंदु नाम बटन का उपयोग करते समय, यदि वे पूर्वनिर्धारित हैं तो आपको संबंधित संख्या या नाम मिलेंगे।

निम्नलिखित विकल्प जो मैट्रिक्स के ग्राफिक्स को इंगित करता है कि चयनित चर के लिए आरेखों को बिखरने का एक कारण बनता है।

इस मैट्रिक्स के ग्राफिक तत्व को देखकर एक संबंधित चर के साथ गठित एक सहसंबंध-जॉनिक फ़ील्ड शामिल हैं

उन पर प्रतिगमन लाइन पर शादी की।

बिखरने वाले आरेखों के मैट्रिक्स का विश्लेषण करते समय, उन चार्टों को ध्यान देना चाहिए जिनकी प्रतिगमन रेखाओं में एक्स अक्ष के लिए एक महत्वपूर्ण ढलान है, जो इसी प्रारंभिक संकेतों के बीच परस्पर निर्भरता के अस्तित्व का सुझाव देता है।

स्कैटरिंग एसएम विकल्प चयनित चर के लिए एक त्रि-आयामी सहसंबंध क्षेत्र बनाता है। यदि नाम बटन का उपयोग किया जाता है, तो बिखरने वाले आरेख पर बिंदुओं को उनके पास होने पर समान अवलोकनों के नंबरों या नामों द्वारा चिह्नित किया जाएगा।

ग्राफ़िक विकल्प सतह चयनित तीन क्रम सतह के साथ चयनित तीन चर के लिए स्कैटरिंग आरेख में एसएम बनाता है।

विकल्प catagor। बदले में बिखरने वाले आरेख चयनित संकेतकों के लिए सहसंबंध फ़ील्ड के कैस्केड बनाता है।

संबंधित बटन दबाए जाने के बाद, प्रोग्राम उपयोगकर्ता द्वारा चर बटन का उपयोग करके पहले चयन के दो सेट बनाने के लिए कहेगा। फिर एक नया स्क्रीन पर दिखाई देगा।

एक समूह चर के कार्य के लिए क्वेरी विंडो, जिसके आधार पर सभी उपलब्ध अवलोकनों को वर्गीकृत किया जाएगा।

परिणाम वेरिएबल के प्रत्येक जोड़ी के लिए अवलोकन समूहों के कटौती में सहसंबंध क्षेत्रों का निर्माण, विभिन्न सूचियों के लिए पुनरावृत्ति

3.4। निजी और एकाधिक गुणांक की गणनासहसंबंध

कोर के निजी और कई गुणांक की गणना करने के लिए। संबंध कॉल मॉड्यूल एकाधिक प्रतिगमनमॉड्यूल स्विच बटन का उपयोग करना। स्क्रीन पर निम्न संवाद बॉक्स प्रकट होता है:

बटन दबाएँ चर, विश्लेषण के लिए चर का चयन करें: बाएं आश्रित पर - लाभप्रदता, और स्वतंत्र के दाईं ओर - फोंडोस्टिच तथा अनुत्पादक व्यय। शेष चर आगे विश्लेषण में भाग नहीं लेगा - सहसंबंध विश्लेषण के आधार पर, उन्हें रिग्रेशन मॉडल के लिए गैर-जानकारीपूर्ण के रूप में पहचाना जाता है।

खेत मेँ फ़ाइल इनपुट सामान्य स्रोत डेटा इनपुट डेटा के रूप में प्रस्तावित किया जाता है, जो चर और अवलोकन, या एक सहसंबंध मैट्रिक्स वाला एक तालिका है। सहसंबंध मैट्रिक्स को एकाधिक प्रतिगमन मॉड्यूल में पूर्व-निर्मित किया जा सकता है या विकल्प की सहायता से त्वरित बुनियादी आंकड़ों की गणना की जा सकती है।

स्रोत डेटा फ़ाइल के साथ काम करते समय, आप लंघन के प्रतिपादन को सेट कर सकते हैं:

    हटाने का निर्माण। यदि यह विकल्प चुना गया है, तो केवल उन अवलोकनों में सभी चयनित चर में याद किए गए मान नहीं हैं, विश्लेषण में उपयोग किया जाता है।

    प्रतिस्थापन औसत। प्रत्येक चर में मिस्ड मान मौजूदा पूर्ण अवलोकनों द्वारा गणना की गई औसत के साथ प्रतिस्थापित किए जाते हैं।

    मिस्ड डेटा के माता-पिता को हटाना। यदि यह विकल्प चुना गया है, तो जोड़ी सहसंबंधों की गणना करते समय, अवलोकन जो संबंधित परिवर्तनीय जोड़े में मानों को याद करते हैं उन्हें हटा दिया जाता है।

खेत मेँ प्रतिगमन का प्रकार उपयोगकर्ता एक मानक या निश्चित nonlinear रिग्रेशन चुन सकते हैं। डिफ़ॉल्ट रूप से, एकाधिक प्रतिगमन का एक मानक विश्लेषण चुना जाता है, जिसमें सभी चयनित चर के मानक सहसंबंध मैट्रिक्स की गणना की जाती है।

मोड फिक्स्ड नॉनलाइनर रिग्रेशन आपको स्वतंत्र चर के विभिन्न परिवर्तनों को पूरा करने की अनुमति देता है। विकल्प आचरण का संचालन डिफ़ॉल्ट रूप से, एक नि: शुल्क सदस्य सहित मानक प्रतिगमन प्रसन्नता की परिभाषा के लिए उपयुक्त सेटिंग्स। यदि यह विकल्प रद्द कर दिया गया है, तो जब आप बटन पर क्लिक करें बटन पर क्लिक करें, तो मॉडल परिभाषा संवाद बॉक्स की परिभाषा जिसमें आप एक प्रकार के प्रतिगमन विश्लेषण के रूप में चुनने के लिए एक ईजेट हैं (उदाहरण के लिए, चरण-दर-चरण, क्रेस्ट , आदि) और अन्य विकल्प।

लाइन विकल्प चेकबॉक्स की जाँच वर्णनात्मक वर्णनात्मक दिखाएंकोर। Matrians और ठीक क्लिक करके, हम सांख्यिकीय डेटा विशेषताओं के साथ एक संवाद बॉक्स प्राप्त करते हैं।

इसमें, आप विस्तृत वर्णनात्मक आंकड़े देख सकते हैं (अवलोकनों की संख्या सहित जिनके द्वारा सहसंबंध गुणांक की गणना प्रत्येक जोड़ी के लिए गणना की गई है)। विश्लेषण जारी रखने और मॉडल निर्धारक संवाद बॉक्स खोलने के लिए, ठीक क्लिक करें।

यदि विश्लेषण संकेतकों के पास एक बेहद छोटा सापेक्ष फैलाव होता है तो औसत से विभाजित समग्र फैलाव के रूप में गणना की जाती है, फिर विकल्प के पास चेकबॉक्स की जांच करें उच्च सटीकता गणना सहसंबंध मैट्रिक्स तत्वों के अधिक सटीक मान प्राप्त करने के लिए।

संवाद बॉक्स में सभी आवश्यक मानकों को स्थापित करके। एकाधिक प्रतिगमन, ठीक दबाएं और आवश्यक गणना के परिणाम प्राप्त करें।

हमारे उदाहरण के अनुसार, एकाधिक सहसंबंध गुणांक 0.613579 9 0 हो गया और तदनुसार, निर्धारण गुणांक 0.37648029 है। इस प्रकार, सूचक "लाभप्रदता" के केवल 37.6% फैलाव को "फंडो-स्टडीज" और "गैर-उत्पादन लागत" के संकेतकों के माप से समझाया गया है। इस तरह के एक निम्न मूल्य मॉडल में पेश किए गए कारकों की संख्या की कमी को इंगित करता है। आइए पुन: "मुख्य फंड" की सूची जोड़कर स्वतंत्र चर की संख्या को बदलने की कोशिश करें (सूचक के मॉडल के लिए "पीपीपी में श्रमिकों का हिस्सा" बहुआयामी की ओर जाता है, जो अस्वीकार्य है)। दृढ़ संकल्प गुणांक कुछ हद तक बढ़ गया, लेकिन परिणामों में काफी सुधार करने के लिए बहुत कुछ नहीं - इसका मूल्य लगभग 41% था। जाहिर है, लाभप्रदता को प्रभावित करने वाले कारकों की पहचान करने के लिए हमारे कुटीर को अतिरिक्त शोध की आवश्यकता होती है।

एकाधिक सहसंबंध गुणांक का महत्व फिशर की एफ-मानदंड तालिका पर निस्संदेह है। यदि विचलन के संभाव्यता मूल्य निर्दिष्ट स्तर से अधिक हो तो इसके महत्व की परिकल्पना खारिज कर दी गई है (अक्सर एक \u003d 0.1, 0.05; 0.01 0.001; हमारे उदाहरण में पी \u003d 0.008882< 0.05, что свидетельствует о значимости коэффициента.

परिणाम तालिका में निम्न ग्राफ शामिल हैं:

    बीटा गुणांक (सी) - प्रासंगिक चर के मानकीकृत प्रतिगमन गुणांक;

    निजी सहसंबंध - मॉडल में शेष के प्रभाव को ठीक करते समय, उपयुक्त चर और निर्भर के बीच सहसंबंध के निजी गुणांक।

हमारे उदाहरण में लाभप्रदता और फंड-छात्र के बीच निजी सहसंबंध गुणांक 0.45 9 8 99 है। इसका मतलब है, गैर-उत्पादक आरएएस-ईवीआई के संकेतक के मॉडल में प्रवेश करने के बाद, लाभप्रदता पर फंड-भुगतान करने का प्रभाव कुछ हद तक कुछ हद तक है - 0.4 9 (जोड़ी के सहसंबंध गुणांक का मूल्य) 0.46। गैर-व्युत्पन्न व्यय के संकेतक के लिए एक समान गुणांक भी कम हो गया है - 0.46 (सहसंबंध के युग अनुपात का मूल्य) से 0.42 (वे मॉड्यूल का मूल्य लेते हैं), आश्रित चर के साथ कनेक्शन में परिवर्तन को दर्शाता है नींव संकेतक के मॉडल में इनपुट।

    पार्टी सहसंबंध एक अप्रत्याशित निर्भर चर और मॉडल में शामिल शेष के प्रभाव को ध्यान में रखते हुए संबंधित गैर-निर्भर के बीच एक सहसंबंध है।

    सहिष्णुता (1 के रूप में परिभाषित 1 से कम परिवर्तनीय और रिग्रेशन समीकरण में सभी स्वतंत्र चर के बीच बहुवचन सहसंबंध का वर्ग)।

    दृढ़ संकल्प गुणांक संबंधित स्वतंत्र चर और रिग्रेशन समीकरण में शामिल अन्य सभी चर के बीच एकाधिक सहसंबंध गुणांक का वर्ग है।

    1-मान - स्वतंत्रता की डिग्री की संख्या से निर्दिष्ट (ब्रैकेट में) के साथ निजी सहसंबंध गुणांक के महत्व के बारे में हाइपोथिसिस का परीक्षण करने के लिए छात्र के मानदंड का गणना मूल्य।

    आर-स्तर! - निजी सहसंबंध गुणांक के महत्व पर परिकल्पना के विचलन की संभावना।

हमारे मामले में, पहले गुणांक (0.031277) के लिए पी का प्राप्त मूल्य चयनित  \u003d 0.05 से कम है। दूसरे गुणांक का मूल्य कुछ हद तक अधिक है (0.050676), जो इस स्तर पर इसके महत्व को इंगित करता है। लेकिन यह महत्वपूर्ण है, उदाहरण के लिए,  \u003d 0.1 पर (एक सौ परिकल्पना से दस मामलों में, यह फिर भी गलत होगा)।

यह एक ऐसा मान है जो +1 से -1 से भिन्न हो सकता है। एक पूर्ण सकारात्मक सहसंबंध के मामले में, यह गुणांक प्लस 1 है (वे सुझाव देते हैं कि एक चर के मूल्य में वृद्धि के साथ, किसी अन्य चर का मूल्य), और पूर्ण नकारात्मक - शून्य 1 (एक प्रतिक्रिया इंगित करें, यानी एक चर के मूल्यों में वृद्धि के साथ, विभिन्न मान कम हो जाते हैं)।

शर्मीली और द्विघात की निर्भरता का ग्राफ। जैसा कि आप देख सकते हैं, अंक (विषय) अराजक नहीं हैं, लेकिन एक पंक्ति के आसपास बनाया गया है, और इस लाइन को देखकर हम कह सकते हैं कि व्यक्ति को व्यक्ति में व्यक्त किया जाता है, अधिक अवसाद, यानी, ये घटनाएं जुड़ी हुई हैं।

पीआर 2।: शर्म और समाजशीलता के लिए अनुसूची। हम देखते हैं कि शर्मीली में वृद्धि के साथ, समाजशीलता कम हो जाती है। उनका सहसंबंध गुणांक 0.43 है। इस प्रकार, 0 से 1 तक सहसंबंध गुणांक प्रत्यक्ष आनुपातिक संचार (अधिक ... अधिक ...), और अपमानजनक के बारे में -1 से 0 तक गुणांक (जितना अधिक ... कम है। ।)

यदि सहसंबंध गुणांक 0 है, तो दोनों चर एक दूसरे से पूरी तरह से स्वतंत्र हैं।

सह - संबंध - यह एक कनेक्शन है जहां वास्तविक कारकों का एक्सपोजर केवल वास्तविक डेटा के बड़े पैमाने पर अवलोकन के साथ प्रवृत्ति (औसत पर) के रूप में प्रकट होता है। सहसंबंध निर्भरताओं के उदाहरण बैंक की संपत्ति के आकार और बैंक के मुनाफे की राशि, श्रम उत्पादकता की वृद्धि और कर्मचारियों के अनुभव के बीच निर्भरता हो सकते हैं।

उनकी ताकत में सहसंबंध संबंधों के वर्गीकरण की दो प्रणालियों का उपयोग किया जाता है: सामान्य और निजी।

सहसंबंध संबंधों का सामान्य वर्गीकरण:

1) मजबूत, या सहसंबंध गुणांक आर 0.70 के साथ बंद;

2) औसत 0.50 पर< r < 0,69;

3) 0.30 पर मध्यम< r < 0,49;

4) 0.20 पर कमजोर< r < 0,29;5) очень слабая при r < 0,19.

सहसंबंध संबंधों का निजी वर्गीकरण:

1) सांख्यिकीय महत्व के स्तर के अनुरूप आर के साथ उच्च महत्वपूर्ण सहसंबंध ρ ≤ 0.01

2) सांख्यिकीय महत्व ρ ≤ 0.05 के स्तर के अनुरूप आर के साथ एक महत्वपूर्ण सहसंबंध;

3) सांख्यिकीय महत्व के स्तर के अनुरूप आर के साथ एक विश्वसनीय कनेक्शन की प्रवृत्ति ρ ≤ 0.10;

4) आर के साथ महत्वहीन सहसंबंध, सांख्यिकीय महत्व के स्तर तक नहीं पहुंच रहा है। दो ये वर्गीकरण मेल नहीं खाते हैं।

पहला केवल सहसंबंध गुणांक मान पर केंद्रित है, और दूसरा यह निर्धारित करता है कि इस नमूना मात्रा के तहत महत्व का स्तर सहसंबंध गुणांक के इस मूल्य तक कैसे पहुंचता है। नमूना का आकार जितना अधिक होगा, कम सहसंबंध गुणांक विश्वसनीय के रूप में मान्यता प्राप्त होने के लिए पर्याप्त हो जाता है। नतीजतन, एक छोटे नमूने के साथ, ऐसा हो सकता है कि एक मजबूत सहसंबंध अविश्वसनीय होगा। साथ ही, नमूना की बड़ी मात्रा के साथ, यहां तक \u200b\u200bकि एक कमजोर सहसंबंध भी विश्वसनीय हो सकता है। यह आमतौर पर दूसरे वर्गीकरण पर ध्यान केंद्रित करने के लिए परंपरागत होता है, क्योंकि यह नमूना के आकार को ध्यान में रखता है। साथ ही, यह याद रखना आवश्यक है कि एक मजबूत, या उच्च, सहसंबंध अनुपात आर\u003e 0.70 के साथ एक सहसंबंध है, न केवल उच्च स्तर के महत्व का सहसंबंध।


निम्नलिखित तालिका ने विभिन्न प्रकार के तराजू के लिए सहसंबंध गुणांक के नाम लिखे।

डिकोटोमिक स्केल (1/0) रैंक (ऑर्डिनल) स्केल
डिकोटोमिक स्केल (1/0) पियरसन एसोसिएशन के गुणांक, चार बोर्ड पियरसन गुणांक। बेइज़िरियल सहसंबंध
रैंक (ऑर्डिनल) स्केल रैंक BISERIAL सहसंबंध। आत्मा या केंडल्ला के सहसंबंध का गुणांक।
अंतराल और पूर्ण पैमाने बेइज़िरियल सहसंबंध अंतराल पैमाने के मानों का अनुवाद रैंक में किया जाता है और इसका उपयोग रैंक गुणांक होता है पियरसन सहसंबंध गुणांक (रैखिक सहसंबंध गुणांक)

के लिये आर= 0 रैखिक सहसंबंध गायब है। साथ ही, समूह औसत चर अपने सामान्य औसत के साथ मेल खाता है, और रिग्रेशन लाइन समन्वय अक्षों के समानांतर हैं।

समानता आर= 0 यह केवल एक रैखिक सहसंबंध निर्भरता (असंबद्ध चर) की अनुपस्थिति के बारे में बोलता है, लेकिन सहसंबंध की अनुपस्थिति के बारे में नहीं, और इससे भी अधिक, सांख्यिकीय निर्भरता।

कभी-कभी सहसंबंध की अनुपस्थिति के बारे में निष्कर्ष एक मजबूत सहसंबंध की उपस्थिति से अधिक महत्वपूर्ण है। दो चर का शून्य सहसंबंध इंगित कर सकता है कि एक चर का कोई प्रभाव नहीं है, बशर्ते कि हम माप परिणामों पर भरोसा करते हैं।

एसपीएसएस में: 11.3.2 सहसंबंध गुणांक

अब तक, हमने केवल दो संकेतों के बीच सांख्यिकीय निर्भरता के अस्तित्व के तथ्य का पता लगाया। इसके बाद, हम यह पता लगाने की कोशिश करेंगे कि इस निर्भरता की ताकत या कमजोरी के साथ-साथ इसके रूप और अभिविन्यास के बारे में क्या निष्कर्ष निकाला जा सकता है। चर के बीच संबंधों के मात्रात्मक मूल्यांकन के मानदंड को सहसंबंध गुणांक या जुड़ाव उपायों कहा जाता है। दो चर एक दूसरे के साथ सकारात्मक रूप से सहसंबंध करते हैं, यदि उनके बीच प्रत्यक्ष, unidirectional अनुपात है। एक यूनिडायरेक्शनल अनुपात के साथ, एक चर के छोटे मूल्य किसी अन्य चर के छोटे मूल्यों के अनुरूप होते हैं, बड़े मूल्य बड़े होते हैं। दो चर एक दूसरे के साथ नकारात्मक रूप से सहसंबंधित होते हैं, अगर उनके बीच एक रिवर्स, मल्टीडायरेक्शनल अनुपात होता है। एक बहुआयामी अनुपात के साथ, एक चर के छोटे मूल्य किसी अन्य चर के बड़े मूल्यों के अनुरूप होते हैं और इसके विपरीत। सहसंबंध गुणांक के मूल्य हमेशा -1 से +1 तक की सीमा में झूठ बोल रहे हैं।

ऑर्डिनल स्केल से संबंधित चर के बीच सहसंबंध का गुणांक गुणांक के गुणांक, और अंतराल से संबंधित चर के लिए उपयोग किया जाता है - पियरसन सहसंबंध गुणांक (कार्यों का क्षण)। यह ध्यान दिया जाना चाहिए कि प्रत्येक dichotomous चर, यानी, नाममात्र पैमाने से संबंधित एक चर और दो श्रेणियों के रूप में क्रमबद्ध किया जा सकता है।

शुरू करने के लिए, हम जांच करेंगे कि studeih.sav फ़ाइल से सेक्स और साइके वैरिएबल्स के बीच सहसंबंध। साथ ही, हम ध्यान में रखते हैं कि सेक्स के डिकोटोमिक चर को सामान्य माना जा सकता है।

इन चरणों का पालन करें:

· क्रॉसस्टैब्स का विश्लेषण कमांड मेनू (वर्णनात्मक आंकड़े) में वर्णनात्मक आंकड़े का चयन करें। (कॉनम टेबल)

· लिंग वैरिएबल को स्ट्रिंग सूची में स्थानांतरित करें, और मनोविज्ञान चर कॉलम सूची में है।

· आंकड़ों पर क्लिक करें ... (सांख्यिकी) बटन। क्रॉसस्टैब्स में: सांख्यिकी संवाद, सहसंबंध चेकबॉक्स (सहसंबंध) का चयन करें। जारी रखें बटन के साथ संपर्क की पुष्टि करें।

क्रॉसस्टैब्स संवाद में, सुपरप्रेस टेबल चेक बॉक्स की जांच करके तालिकाओं को आउटपुट करने से इनकार करें। ठीक बटन पर क्लिक करें।

रिग्रेशन विश्लेषण आपको मूल्यांकन करने की अनुमति देता है कि एक चर दूसरे पर निर्भर करता है और प्रत्यक्ष, परिभाषित निर्भरता को परिभाषित करने के लिए निर्भर चर के मूल्यों का भिन्नता क्या है। ये अनुमान और संबंधित आत्मविश्वास अंतराल आपको आश्रित चर के मूल्य की भविष्यवाणी करने और इस भविष्यवाणी की सटीकता निर्धारित करने की अनुमति देते हैं।

प्रतिगमन विश्लेषण के परिणाम केवल एक जटिल डिजिटल या ग्राफिकल रूप में दर्शाया जा सकता है। हालांकि, हम अक्सर एक चर के मूल्य से एक चर के मूल्य की भविष्यवाणी में रुचि रखते हैं, लेकिन एक संख्या में व्यक्त किए गए, उनके बीच कनेक्शन के कठोरता (बलों) की विशेषता।

इस विशेषता को सहसंबंध गुणांक कहा जाता है, इसे आमतौर पर पत्र जी द्वारा अंकित किया जाता है। सहसंबंध गुणांक

मान -1 से +1 तक मान लें। सहसंबंध गुणांक संकेत संचार की दिशा (प्रत्यक्ष या रिवर्स) दिखाता है, और पूर्ण मूल्य कठोरता है। -1 के बराबर गुणांक समान रूप से कठोर बंधन को 1 के बराबर निर्धारित करता है। संचार की अनुपस्थिति में, सहसंबंध गुणांक शून्य है।

अंजीर में। 8.10 निर्भरताओं के उदाहरण और उनके अनुरूप महत्व दिखाता है। हम दो सहसंबंध गुणांक पर विचार करेंगे।

पियरसन सहसंबंध गुणांक मात्रात्मक संकेतों के रैखिक संचार का वर्णन करने के लिए डिज़ाइन किया गया है; प्रतिगमन की तरह
ओनान विश्लेषण, इसके लिए वितरण की सामान्यता की आवश्यकता होती है। जब वे "सहसंबंध गुणांक" के बारे में कहते हैं, लगभग हमेशा पियर्सन के सहसंबंध गुणांक का मतलब है, तो हम कैसे आएंगे।

स्पिरमे के रैंक सहसंबंध के गुणांक का उपयोग तब किया जा सकता है जब कनेक्शन nonlinear है-न केवल मात्रात्मक के लिए, बल्कि क्रमिक संकेतों के लिए भी। यह गैर-पैरामीट्रिक विधि, इसे किसी विशेष वितरण प्रकार की आवश्यकता नहीं होती है।

मात्रात्मक, उच्च गुणवत्ता वाले और क्रमिक संकेतों पर, हमने पहले ही च में बात की है। 5. मात्रात्मक विशेषताएं सामान्य संख्यात्मक डेटा हैं, जैसे विकास, वजन, तापमान। मात्रात्मक सुविधा के मूल्यों की तुलना एक दूसरे के साथ की जा सकती है और कहती है कि कौन सा अधिक है, जहां तक \u200b\u200bऔर कितनी बार। उदाहरण के लिए, यदि एक मार्टियन का वजन 15 ग्राम होता है, और दूसरा 10, तो पहला दूसरे और डेढ़ बार और 5 ग्राम की तुलना में भारी होता है। क्रमिक संकेत के मूल्यों की तुलना भी की जा सकती है, यह कहकर कि कौन सा है अधिक है, लेकिन नहीं कहा जा सकता है, नहीं, और न ही कितनी बार। दवा में, क्रमिक संकेत अक्सर पाए जाते हैं। उदाहरण के लिए, पापानिकोलाऊ के योनि स्मीयर के अध्ययन के परिणाम इस तरह के पैमाने के अनुसार अनुमानित हैं: 1) मानक, 2) लाइट डिस्प्लेसिया, 3) मध्यम डिस्प्लेसिया, 4) भारी डिस्प्लेसिया, 5) सीटू में कैंसर। और मात्रात्मक, और आदेशात्मक संकेतों को क्रम में व्यवस्थित किया जा सकता है - इस सामान्य संपत्ति में, गैर-पैरामीट्रिक मानदंड का एक बड़ा समूह आधारित है, जिस पर रेटिंग सहसंबंध गुणांक। अन्य गैर-पैरामीट्रिक मानदंडों के साथ, हम च में परिचित हो जाएंगे। 10।

पियर्सन सहसंबंध गुणांक

और फिर भी, मजबूती का वर्णन करने के लिए प्रतिगमन विश्लेषण का उपयोग करना क्यों जरूरी नहीं है? एक उपाय के रूप में, अवशिष्ट मानक विचलन का उपयोग करने की क्षमता का उपयोग किया जा सकता है। हालांकि, यदि आप स्थानों में आश्रित और स्वतंत्र चर बदलते हैं, अवशिष्ट मानक विचलन, साथ ही साथ अन्य प्रतिगमन विश्लेषण संकेतक, अलग होंगे।

अंजीर में एक नज़र डालें। 8.11। हमारे अनुसार 10 मार्टियन का नमूना, दो प्रतिगमन लाइनें बनाई गई थीं। एक मामले में, वजन दूसरे - स्वतंत्र में निर्भर चर है। रिग्रेशन लाइनें



20

यदि आप फ़ील्ड एक्स और वाई को बदलते हैं, तो रिग्रेशन समीकरण दूसरों द्वारा प्राप्त किया जाएगा, और सहसंबंध का गुणांक समान रहेगा।

चायत यह पता चला है कि वजन के साथ विकास का कनेक्शन एक है, और विकास के साथ वजन अलग है। रिग्रेशन विश्लेषण की असमानता यह है कि यह संचार बल को दर्शाने के लिए इसका उपयोग करने के लिए सीधे हस्तक्षेप करता है। सहसंबंध गुणांक, हालांकि उनका विचार इस कमी से मुक्त, प्रतिगमन विश्लेषण से आता है। हम सूत्र प्रस्तुत करते हैं।

r y (x - x) (y - y)

& ((- एक्स) एस (वाई - वाई) 2 "

जहां एक्स और वाई चर के औसत मूल्य हैं x और वाई। आर "सममित रूप से" के लिए अभिव्यक्ति xi y के स्थानों में उतना ही, हमें एक ही मूल्य मिलता है। सहसंबंध गुणांक -1 से +1 तक मान लेता है। अधिक निकटता से कनेक्शन, सहसंबंध गुणांक का पूर्ण मूल्य जितना अधिक होगा। संकेत संचार की दिशा दिखाता है। आर\u003e 0 के साथ, एक प्रत्यक्ष सहसंबंध है (एक चर में वृद्धि के साथ, दूसरा भी बढ़ रहा है), आर के साथ 10 मार्टरों के साथ एक उदाहरण लें, जिसे हमने पहले ही प्रतिगमन विश्लेषण के दृष्टिकोण से विचार किया है। सहसंबंध गुणांक की गणना करें। गणना के प्रारंभिक डेटा और मध्यवर्ती परिणाम तालिका में दिखाए जाते हैं। 8.3। नमूनाकरण मात्रा एन \u003d 10, मध्यम ऊंचाई

X \u003d £ x / n \u003d 369/10 \u003d 36.9 और वजन y \u003d £ y / n \u003d 103.8 / 10 \u003d 10.38।

हमें sh - x) (y- y) \u003d 99.9, sh - x) 2 \u003d 224.8, £ (y - y) 2 \u003d 51.9।

हम सहसंबंध गुणांक के लिए सूत्र में प्राप्त मूल्यों को प्रतिस्थापित करते हैं:

224.8 x 51.9 '"

आर का मूल्य 1 के करीब है, जो विकास और वजन के करीबी कनेक्शन को इंगित करता है। बेहतर कल्पना करने के लिए कि किस सहसंबंध गुणांक को महान माना जाना चाहिए, और महत्वहीन क्या है, दिखता है

तालिका 8.3। सहसंबंध गुणांक की गणना
एक्स। वाई एक्स-एक्स। Y-y (x -x) (y-y) (X -x) 2 (Y-y) 2
31 7,8 -5,9 -2,6 15,3 34,8 6,8
32 8,3 -4,9 -2,1 10,3 24,0 4,4
33 7,6 -3,9 -2,8 10,9 15,2 7,8
34 9,1 -2,9 -1,3 3,8 8,4 1,7
35 9,6 -1,9 -0,8 1,5 3,6 0,6
35 9,8 -1,9 -0,6 1,1 3,6 0,4
40 11,8 3,1 1,4 4,3 9,6 2,0
41 12,1 4,1 1,7 7,0 16,8 2,9
42 14,7 5,1 4,3 22,0 26,0 18,5
46 13,0 9,1 2,6 23,7 82,8 6,8
369 103,8 0,0 0,2 99,9 224,8 51,9


मेज पर। 8.4 - यह उन उदाहरणों के लिए सहसंबंध गुणांक दिखाता है जिन्हें हम पहले समझ गए थे।

प्रतिगमन और सहसंबंध

सहसंबंध गुणांक (तालिका 8.4) के सभी उदाहरण मूल रूप से प्रतिगमन लाइनों का निर्माण करने के लिए उपयोग किए जाते थे। दरअसल, सहसंबंध गुणांक और प्रतिगमन विश्लेषण के पैरामीटर के बीच एक करीबी कनेक्शन है, जिसे हम अब प्रदर्शित करेंगे। सहसंबंध गुणांक का प्रतिनिधित्व करने के विभिन्न तरीके, जिन्हें हम प्राप्त करेंगे, इस सूचक के अर्थ को सबसे अच्छी तरह से समझेंगे।

याद रखें कि प्रतिगमन समीकरण बनाया गया है ताकि प्रतिगमन रेखा से विचलन के वर्गों के योग को कम किया जा सके।


इस न्यूनतम राशि के वर्गों को इंगित करें (इस मान को वर्गों का अवशिष्ट योग कहा जाता है)। आश्रित चर वाई के मूल्यों के विचलन के वर्गों का औसत y denote s ^ से। फिर:

जी 2 के मान को दृढ़ संकल्प गुणांक कहा जाता है - यह केवल सहसंबंध गुणांक का वर्ग है। दृढ़ संकल्प गुणांक बिजली की ताकत दिखाता है, लेकिन इसकी दिशात्मकता नहीं है।

उपर्युक्त सूत्र से, यह देखा जा सकता है कि यदि निर्भर चर के मान प्रत्यक्ष प्रतिगमन पर स्थित हैं, तो s \u003d 0, और इस प्रकार आर \u003d +1 या आर \u003d -1, यानी, एक रैखिक कनेक्शन है आश्रित और स्वतंत्र चर। एक स्वतंत्र चर के किसी भी मूल्य के लिए, आप आश्रित चर के मूल्य की पूरी भविष्यवाणी कर सकते हैं। इसके विपरीत, यदि चर आम तौर पर एक-दूसरे से संबंधित नहीं होते हैं, तो soci \u003d sofsisi फिर r \u003d 0।

यह भी देखा जा सकता है कि दृढ़ संकल्प गुणांक एस ^ के कुल फैलाव के अनुपात के बराबर है, जो कि नियत है या जैसा कि वे कहते हैं, रैखिक प्रतिगमन द्वारा समझाया गया है।

वर्गों का अवशिष्ट योग एसओसीजे \u003d (पी - 2) एस ^ अनुपात, और वर्गों की कुल राशि द्वारा अवशिष्ट फैलाव s2y \\ x से जुड़ा हुआ है, अनुपात एस 2 द्वारा फैलाव एस 2 के साथ ) एस 2। इस मामले में

r2 \u003d 1 _ n _ 2 sy \\ x p _1 sy

यह सूत्र आपको पूर्ण फैलाव में अवशिष्ट फैलाव के हिस्से पर सहसंबंध गुणांक की निर्भरता का न्याय करने की अनुमति देता है

इस शेयर की तुलना में छः / S2Y कम है, अधिक से अधिक (पूर्ण मूल्य से) सहसंबंध गुणांक, और इसके विपरीत।

हमने यह सुनिश्चित किया है कि सहसंबंध गुणांक चर के रैखिक संचार की समयबद्धता को दर्शाता है। हालांकि, अगर हम दूसरे के मूल्य से एक चर के मूल्य की भविष्यवाणी के बारे में बात कर रहे हैं, तो
सहसंबंध गुणांक बहुत भरोसा नहीं करना चाहिए। उदाहरण के लिए, अंजीर में डेटा। 8.7 एक बहुत ही उच्च सहसंबंध गुणांक (आर \u003d 0.92) से मेल खाता है, हालांकि, मूल्यों के ट्रस्ट क्षेत्र की चौड़ाई से पता चलता है कि भविष्यवाणी अनिश्चितता काफी महत्वपूर्ण है। इसलिए, यहां तक \u200b\u200bकि एक बड़े सहसंबंध गुणांक के साथ, मूल्यों के ट्रस्ट क्षेत्र की गणना करना सुनिश्चित करें।


और अंत में हम सहसंबंध गुणांक का सहसंबंध अनुपात प्रस्तुत करते हैं और प्रत्यक्ष प्रतिगमन के झुकाव गुणांक बी:

जहां बी वेरिएबल के प्रत्यक्ष प्रतिगमन, एसएक्स और एसई-मानक विचलन का झुकाव गुणांक है।

यदि आप केस एसएक्स \u003d 0 को ध्यान में रखते हैं, तो सहसंबंध गुणांक शून्य है और केवल अगर बी \u003d 0. हम अब सहसंबंध के सांख्यिकीय महत्व का आकलन करने के लिए इस तथ्य का उपयोग करेंगे।

सहसंबंध का सांख्यिकीय महत्व

Γ \u003d 0 के बाद से, सहसंबंध की अनुपस्थिति की परिकल्पना प्रत्यक्ष प्रतिगमन की शून्य ढलान की परिकल्पना के बराबर है। इसलिए, सहसंबंध के सांख्यिकीय महत्व का आकलन करने के लिए, आप शून्य से अंतर बी के सांख्यिकीय महत्व का आकलन करने के लिए पहले से ज्ञात सूत्र का उपयोग कर सकते हैं:

यहां, स्वतंत्रता वी \u003d एन -2 की डिग्री की संख्या 2. हालांकि, यदि सहसंबंध गुणांक पहले ही गणना की गई है, तो सूत्र का उपयोग करना अधिक सुविधाजनक है:

यहां स्वतंत्रता डिग्री की संख्या भी v \u003d p - 2 है।

टी के लिए दो सूत्रों के बाहरी स्लोवेंस के साथ, वे समान हैं। वास्तव में, किससे


r 2 _ 1 - n_ 2 sy] x_

एक मानक त्रुटि के लिए सूत्र में sy ^ x के मान को प्रतिस्थापित करना

स्तन पशु और स्तन कैंसर

प्रयोगशाला जानवरों पर प्रयोगों में, यह दिखाया गया था कि आहार में पशु वसा की उच्च सामग्री स्तन कैंसर का खतरा बढ़ जाती है। क्या इस निर्भरता में लोग हैं? के। कैरोलो ने 39 देशों में स्तन कैंसर से वसा और मृत्यु दर की पशु खपत पर डेटा एकत्र किया। परिणाम छवि में प्रस्तुत किया गया है। 8.12 ए। स्तन कैंसर से पशु वसा और मृत्यु दर के बीच सहसंबंध गुणांक 0.90 था। आइए हम सहसंबंध के सांख्यिकीय महत्व का अनुमान लगाएं।

0,90 1 - 0,902 39 - 2

स्वतंत्रता वी \u003d 39 - 2 \u003d 37 की डिग्री की संख्या के साथ टी का महत्वपूर्ण मूल्य 3.574 है, फिर यह हमारे से कम है। इस प्रकार, 0.001 के महत्व के स्तर पर, यह तर्क दिया जा सकता है कि स्तन कैंसर से पशु वसा और मृत्यु दर की खपत के बीच एक सहसंबंध है।

अब जांचें कि मृत्यु दर सब्जी वसा की खपत से जुड़ा हुआ है या नहीं? संबंधित डेटा अंजीर में दिखाया गया है। 8.12 बी। सहसंबंध गुणांक 0.15 है। फिर

1 - 0,152 39 - 2

यहां तक \u200b\u200bकि 0.10 के महत्व स्तर के साथ, गणना की गई टी मान कम महत्वपूर्ण है। सहसंबंध सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

सहसंबंध में एक चरित्र की एक ही परिमाण दूसरे की विभिन्न मात्राओं से मेल खाती है। उदाहरण के लिए: विकास और वजन के बीच उम्र के घातक नियोप्लाज्म की घटनाओं के बीच एक सहसंबंध बंधन है।

सहसंबंध गुणांक की गणना के लिए 2 तरीके हैं: स्क्वायर विधि (पियरसन), रैंक विधि (SPOROTE)।

सबसे सटीक वर्ग (पियर्सन) की विधि है, जिसमें सहसंबंध गुणांक सूत्र द्वारा निर्धारित किया जाता है: जहां

आर हू एक्स और वाई के पास सांख्यिकीय के बीच सहसंबंध गुणांक है।

डी एक्स अपने मध्य अंकगणित से सांख्यिकीय श्रृंखला एक्स की प्रत्येक संख्या का विचलन है।

डी वाई अपने मध्य अंकगणित से सांख्यिकीय श्रृंखला वाई की प्रत्येक संख्या का विचलन है।

संचार और इसकी दिशा की ताकत के आधार पर, सहसंबंध गुणांक 0 से 1 (-1) की सीमा में हो सकता है। 0 के बराबर सहसंबंध गुणांक संचार की पूरी अनुपस्थिति को इंगित करता है। सहसंबंध गुणांक के स्तर को 1 या (-1), जितना अधिक क्रमशः, प्रत्यक्ष या प्रतिक्रिया द्वारा अधिक बारीकी से मापा जाता है। 1 या (-1) के बराबर सहसंबंध गुणांक के साथ, कनेक्शन पूर्ण, कार्यात्मक है।

सहसंबंध गुणांक के लिए सहसंबंध के लिए मूल्यांकन योजना

संचार की शक्ति

की उपस्थिति में सहसंबंध गुणांक की परिमाण

प्रत्यक्ष लिंक (+)

प्रतिपुष्टि (-)

कोई कनेक्शन नहीं

मलाया कनेक्शन (कमजोर)

0 से +0.29 तक

0 से -0.29 तक

औसत कनेक्शन (मध्यम)

+0.3 से +069 तक

-0.3 से -0.69 तक

बड़ा कनेक्शन (मजबूत)

+0.7 से +0.99 तक

-0.7 से -0.99 तक

संचार पूरा

(कार्यात्मक)

वर्ग विधि के अनुसार सहसंबंध गुणांक की गणना करने के लिए, 7 कॉलम की एक तालिका की जाती है। हम उदाहरण पर गणना प्रक्रिया का विश्लेषण करेंगे:

के बीच संबंध की ताकत और प्रकृति का निर्धारण करें

पोरा-

नोस्टा

ज़ोबोम

(वी वाई )

डी x \u003d। वी एक्स।म। एक्स।

डी y \u003d। वी वाईम। वाई

डी एक्स। डी वाई

डी एक्स। 2

डी वाई 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. पानी में औसत आयोडीन सामग्री निर्धारित करें (एमजी / एल में)।

एमजी / एल।

2.% में औसत महिमा गोइटर निर्धारित करें।

3. एम एक्स से प्रत्येक वी एक्स के विचलन का निर्धारण करें, यानी डी एक्स।

201-138 \u003d 63; 178-138 \u003d 40, आदि

4. इसी प्रकार, एम वाई, यानी से प्रत्येक वी वाई के विचलन का निर्धारण करें। डी यू।

0.2-3.8 \u003d -3.6; 0.6-38 \u003d -3.2, आदि

5. विचलन के कार्यों का निर्धारण करें। परिणामी उत्पाद सारांश और प्राप्त कर रहा है।

6. डी एक्स मुझे वर्ग में लाया जाएगा और परिणाम संक्षेप में हैं, हमें मिलता है।

7. इसी तरह, हम वर्ग डी वाई में बनाए जाएंगे, परिणाम संक्षेप में हैं, हमें मिलता है

8. अंत में, सभी राशियों को सूत्र में प्रतिस्थापित किया जाता है:

सहसंबंध गुणांक की सटीकता के मुद्दे को हल करने के लिए, यह सूत्र द्वारा इसकी औसत त्रुटि से निर्धारित किया जाता है:

(यदि अवलोकन की संख्या 30 से कम है, तो एन -1 denominator में)।

हमारे उदाहरण में

सहसंबंध गुणांक की परिमाण विश्वसनीय माना जाता है, यदि 3 गुना से कम इसकी औसत त्रुटि से अधिक नहीं है।

हमारे उदाहरण में

इस प्रकार, सहसंबंध गुणांक विश्वसनीय नहीं है, जो अवलोकनों की संख्या में वृद्धि की आवश्यकता का कारण बनता है।

सहसंबंध गुणांक को कुछ हद तक कम सटीक परिभाषित किया जा सकता है, लेकिन बहुत आसान - रैंक (spirmen) की विधि द्वारा।

स्पीरमैन विधि: पी \u003d 1- (6σd 2 / एन- (एन 2 -1))

पहले और दूसरी पंक्ति को क्रमशः एक्स और वाई को दर्शाते हुए, युग्मित संकेतों की दो पंक्तियां बनाएं। साथ ही, एक संकेत की पहली पंक्ति को घटते या बढ़ते क्रम में पेश करने के लिए, और दूसरी पंक्ति के संख्यात्मक मान पहली पंक्ति के उन मूल्यों के विपरीत स्थित हैं जिनके अनुरूप हैं

प्रत्येक की तुलना की गई पंक्तियों में साइन का मूल्य अनुक्रम संख्या (रैंक) द्वारा प्रतिस्थापित किया गया है। रैंक, या संख्याएं, पहली और दूसरी पंक्तियों के संकेतकों (मूल्यों) के स्थानों को इंगित करती हैं। साथ ही, रैंकों के दूसरे संकेतों की संख्या को उसी क्रम में असाइन किया जाना चाहिए क्योंकि उन्हें अपनाया गया था जब उन्हें पहली सुविधा के उनके मूल्यों में वितरित किया गया था। श्रृंखला में साइन के समान मूल्यों के साथ, रैंक को इन मूल्यों की अनुक्रम संख्या की औसत के रूप में निर्धारित किया जाना चाहिए

एक्स और वाई (डी) के बीच रैंक का अंतर निर्धारित करें: डी \u003d एक्स -

वर्ग (D 2) में रैंक अंतर में अंतर का मूल्यांकन करें

अंतर के वर्गों का योग प्राप्त करें (σ डी 2) और सूत्र में प्राप्त मूल्यों को प्रतिस्थापित करें:

उदाहरण: हम निम्नलिखित डेटा प्राप्त होने पर वर्षों में कार्य अनुभव और चोटों की आवृत्ति के बीच संबंधों की दिशा और ताकत निर्धारित करते हैं:

विधि की पसंद का औचित्य: कार्य को हल करने के लिए, केवल रैंक सहसंबंध की विधि का चयन किया जा सकता है, क्योंकि "वर्षों में कार्य अनुभव" की पहली पंक्ति में खुले विकल्प हैं (1 वर्ष और 7 साल या उससे अधिक का कार्य अनुभव), जो संबंधित सुविधाओं - वर्ग विधि के बीच संचार स्थापित करने के लिए एक और सटीक विधि का उपयोग करने की अनुमति नहीं देता है।

फेसला। गणना अनुक्रम पाठ में निर्धारित किया गया है, परिणाम तालिका में प्रस्तुत किए जाते हैं। 2।

तालिका 2

वर्षों में कार्य अनुभव

चोट की संख्या

आदेश संख्या (रैंक)

ट्रैक अंतर

वर्ग रैंक अंतर

डी (एक्स-वाई)

डी 2

"X" और "y" (कॉलम 1-2) के माध्यम से नामित करने के लिए जोड़े गए संकेतों की पंक्तियों में से प्रत्येक।

प्रत्येक संकेत का मूल्य एक रैंक (ऑर्डिनल) संख्या द्वारा प्रतिस्थापित किया गया है। श्रृंखला "एक्स" में रैंक के वितरण की प्रक्रिया निम्न है: फीचर का न्यूनतम मूल्य (1 वर्ष का अनुभव) अनुक्रम संख्या "1", क्रमशः संकेत की संख्या के बाद के रूपों को असाइन किया गया है, 2, तीसरे, 4 वें और 5-वें ऑर्डिनल नंबरों के आवर्धन के क्रम में - रैंक (देखें गिनती 3)। एक समान आदेश तब देखा जाता है जब रैंक दूसरे आधार "वाई" (कॉलम 4) द्वारा वितरित किए जाते हैं। ऐसे मामलों में जहां कई बार एक ही संस्करण होते हैं (उदाहरण के लिए, संदर्भ कार्य में, यह प्रति 100 प्रति 100 रुपये प्रति 100 3-4 साल और 5-6 साल पर काम कर रहा है, अनुक्रम संख्या इसकी औसत संख्या को इंगित करती है उनकी अनुक्रम संख्या। रैंकिंग के दौरान चोटों (12 चोटों) की संख्या पर ये आंकड़े 2 और 3 स्थानों पर कब्जा कर सकते हैं, इस प्रकार उनमें से औसत संख्या (2 + 3) / 2 \u003d 2.5 के बराबर है। इस प्रकार, चोटों की संख्या "12 "और" 12 "() आपको रैंकिंग नंबरों को उसी" 2.5 "(ग्राफ़ 4) वितरित करना चाहिए।

रैंक डी \u003d (एक्स - वाई) के बीच का अंतर निर्धारित करें - (ग्राफ़ 5)

रैंक का अंतर एक वर्ग (डी 2) में बनाया गया है और रैंक अंतर σ 2 (ग्राफ़ 6) के वर्गों का योग प्राप्त करें।

सूत्र द्वारा रेटिंग सहसंबंध गुणांक की गणना करें:

जहां एन श्रृंखला "एक्स" में संस्करण की तुलना में जोड़ों की संख्या है और पंक्ति में "वाई"

"