१०० रुपहला ऑर्डर बोनस
कार्य के प्रकार का चयन करें डिप्लोमा कार्य अवधि कार्य सार मास्टर थीसिस अभ्यास रिपोर्ट लेख रिपोर्ट समीक्षा परीक्षा कार्य मोनोग्राफ समस्या समाधान व्यवसाय योजना प्रश्नों के उत्तर रचनात्मक कार्य निबंध ड्राइंग निबंध अनुवाद प्रस्तुतियाँ टाइपिंग अन्य पाठ की विशिष्टता को बढ़ाना पीएचडी थीसिस प्रयोगशाला कार्य ऑनलाइन सहायता
कीमत पता करें
कम से कम वर्ग विधि एक गणितीय (गणितीय और सांख्यिकीय) तकनीक है जिसका उपयोग समय श्रृंखला को संरेखित करने के लिए किया जाता है, यादृच्छिक चर आदि के बीच सहसंबंध के रूप को प्रकट करने के लिए। इसमें यह तथ्य शामिल है कि इस घटना का वर्णन करने वाला फ़ंक्शन एक सरल फ़ंक्शन द्वारा अनुमानित है। इसके अलावा, बाद वाले को चुना जाता है ताकि संरेखित बिंदुओं से देखे गए बिंदुओं पर फ़ंक्शन के वास्तविक स्तरों का मानक विचलन (विक्षेपण देखें) सबसे छोटा हो।
उदाहरण के लिए, उपलब्ध आंकड़ों के अनुसार ( ग्यारहवीं,यी) (मैं = 1, 2, ..., एन) ऐसा वक्र प्लॉट किया जाता है आप = ए + बीएक्स, जिस पर विचलन के वर्गों का योग न्यूनतम तक पहुंच जाता है
यानी, दो मापदंडों के आधार पर फ़ंक्शन को छोटा किया जाता है: ए- निर्देशांक अक्ष पर एक खंड और बी- सीधी रेखा का ढलान।
किसी फ़ंक्शन को छोटा करने के लिए आवश्यक शर्तें देने वाले समीकरण एस(ए,बी) कहा जाता है सामान्य समीकरण।सन्निकटन कार्यों के रूप में, न केवल रैखिक (एक सीधी रेखा में संरेखण), बल्कि द्विघात, परवलयिक, घातांक, आदि का भी उपयोग किया जाता है। एक सीधी रेखा में समय श्रृंखला के संरेखण के उदाहरण के लिए, चित्र देखें। एम.2, जहां वर्ग दूरी का योग ( आप 1 – मैं 1)2 + (आप 2 – मैं 2) 2 .... सबसे छोटी है, और परिणामी सीधी रेखा समय के साथ कुछ संकेतक के अवलोकनों की गतिशील श्रृंखला की प्रवृत्ति को सर्वोत्तम रूप से दर्शाती है।
ओएलएस अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: यादृच्छिक त्रुटि की गणितीय अपेक्षा, कारकों के संदर्भ में सशर्त, शून्य के बराबर होनी चाहिए। यह स्थिति, विशेष रूप से, संतुष्ट होती है यदि: 1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और 2. कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं। पहली शर्त को हमेशा एक स्थिरांक वाले मॉडल के लिए पूर्ण माना जा सकता है, क्योंकि एक स्थिरांक त्रुटियों की एक गैर-शून्य गणितीय अपेक्षा पर ले जाता है। दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)।
प्रतिगमन समीकरणों के मापदंडों के सांख्यिकीय आकलन के अभ्यास में सबसे आम है कम से कम वर्गों की विधि। यह विधि डेटा की प्रकृति और मॉडल निर्माण के परिणामों के बारे में कई मान्यताओं पर आधारित है। मुख्य हैं आश्रित और स्वतंत्र लोगों में प्रारंभिक चर का एक स्पष्ट विभाजन, समीकरणों में शामिल कारकों की असंबद्धता, रिश्ते की रैखिकता, अवशेषों के स्वत: सहसंबंध की अनुपस्थिति, उनकी गणितीय अपेक्षाओं की समानता शून्य और स्थिर भिन्नता।
मुख्य ओएलएस परिकल्पनाओं में से एक यह धारणा है कि विचलन के प्रसरण समान हैं, अर्थात। श्रृंखला के माध्य (शून्य) मान के आसपास उनका फैलाव एक स्थिर मान होना चाहिए। इस गुण को समरूपता कहते हैं। व्यवहार में, विचलन के विचलन अक्सर समान नहीं होते हैं, अर्थात विषमलैंगिकता देखी जाती है। यह विभिन्न कारणों से हो सकता है। उदाहरण के लिए, मूल डेटा में त्रुटियां संभव हैं। मूल जानकारी में आकस्मिक अशुद्धियाँ, जैसे संख्याओं के क्रम में त्रुटियाँ, परिणामों पर एक ठोस प्रभाव डाल सकती हैं। अक्सर, विचलन का एक बड़ा प्रसार i आश्रित चर (ओं) के बड़े मूल्यों पर मनाया जाता है। यदि डेटा में एक महत्वपूर्ण त्रुटि है, तो स्वाभाविक रूप से, गलत डेटा से गणना किए गए मॉडल मान का विचलन भी बड़ा होगा। इस त्रुटि से छुटकारा पाने के लिए, हमें गणना परिणामों में इन आंकड़ों के योगदान को कम करना होगा, अन्य सभी की तुलना में उनके लिए कम वजन निर्धारित करना होगा। यह विचार भारित ओएलएस में लागू किया गया है।
आइए हम घात 2 के बहुपद के साथ फलन का अनुमान लगाएं। ऐसा करने के लिए, हम समीकरणों की सामान्य प्रणाली के गुणांक की गणना करते हैं:
, ,
आइए कम से कम वर्गों की एक सामान्य प्रणाली की रचना करें, जिसका रूप है:
सिस्टम समाधान खोजना आसान है :,,।
इस प्रकार, दूसरी डिग्री का बहुपद पाया जाता है:।
सैद्धांतिक पृष्ठभूमि
पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>
उदाहरण 2... एक बहुपद की इष्टतम घात ज्ञात करना।
पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>
उदाहरण 3... अनुभवजन्य निर्भरता के मापदंडों को खोजने के लिए समीकरणों की सामान्य प्रणाली की व्युत्पत्ति।
आइए हम गुणांक और फलन के निर्धारण के लिए समीकरणों की एक प्रणाली प्राप्त करें , जो अंकों द्वारा दिए गए फ़ंक्शन का रूट-माध्य-वर्ग सन्निकटन करता है। आइए फ़ंक्शन की रचना करें और इसके लिए आवश्यक चरम शर्त लिखिए:
तब सामान्य प्रणाली रूप लेगी:
अज्ञात मापदंडों के संबंध में समीकरणों की एक रैखिक प्रणाली प्राप्त की और, जिसे आसानी से हल किया जाता है।
सैद्धांतिक पृष्ठभूमि
पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>
उदाहरण।
चर के मूल्यों पर प्रायोगिक डेटा एन एसतथा परतालिका में दिए गए हैं।
उनके संरेखण के परिणामस्वरूप, फ़ंक्शन
का उपयोग करते हुए कम से कम वर्ग विधि, इस डेटा को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + बी(पैरामीटर खोजें एतथा बी) पता लगाएँ कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ।
कम से कम वर्गों (OLS) की विधि का सार।
कार्य रैखिक निर्भरता के गुणांकों को खोजना है जिसके लिए दो चर का कार्य एतथा बीसबसे छोटा मान लेता है। यानी दिया गया एतथा बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के विचलन के वर्गों का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।
इस प्रकार, उदाहरण का समाधान दो चरों के एक फ़ंक्शन के चरम को खोजने के लिए कम हो गया है।
गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।
दो अज्ञात के साथ दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। फ़ंक्शन के आंशिक व्युत्पन्न खोजें चर द्वारा एतथा बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।
हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए प्रतिस्थापन विधिया क्रैमर की विधि) और हम कम से कम वर्गों (OLS) की विधि द्वारा गुणांक खोजने के लिए सूत्र प्राप्त करते हैं।
डेटा के साथ एतथा बीसमारोह सबसे छोटा मान लेता है। इस तथ्य का प्रमाण पृष्ठ के अंत में पाठ में नीचे दिया गया है।
यह पूरी तरह से कम से कम वर्ग विधि है। पैरामीटर खोजने के लिए सूत्र एरकम शामिल है,,, और पैरामीटर एन- प्रयोगात्मक डेटा की मात्रा। हम इन राशियों के मूल्यों की अलग से गणना करने की सलाह देते हैं।
गुणक बीगणना के बाद है ए.
मूल उदाहरण को याद करने का समय आ गया है।
समाधान।
हमारे उदाहरण में एन = 5... वांछित गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका में भरते हैं।
तालिका की चौथी पंक्ति के मान दूसरी पंक्ति के मानों को प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.
तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किए जाते हैं मैं.
तालिका के अंतिम कॉलम में मान मानों की पंक्ति योग हैं।
हम गुणांक ज्ञात करने के लिए अल्पतम वर्ग विधि के सूत्रों का उपयोग करते हैं एतथा बी... हम उनमें तालिका के अंतिम कॉलम से संबंधित मानों को प्रतिस्थापित करते हैं:
अत, वाई = 0.165x + 2.184आवश्यक सन्निकटन सीधी रेखा है।
यह पता लगाना बाकी है कि कौन सी पंक्तियाँ वाई = 0.165x + 2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाता है।
कम से कम वर्ग विधि की त्रुटि का अनुमान।
ऐसा करने के लिए, आपको इन पंक्तियों से प्रारंभिक डेटा के विचलन के वर्गों के योग की गणना करने की आवश्यकता है तथा , छोटा मान उस रेखा से मेल खाता है जो कम से कम वर्ग विधि के अर्थ में मूल डेटा का बेहतर अनुमान लगाती है।
तब से सीधे वाई = 0.165x + 2.184मूल डेटा का बेहतर अनुमान लगाता है।
कम से कम वर्ग (mns) की विधि का चित्रमय चित्रण।
सब कुछ रेखांकन पर पूरी तरह से दिखाई देता है। लाल रेखा पाई जाने वाली सीधी रेखा है वाई = 0.165x + 2.184, नीली रेखा है , गुलाबी बिंदु कच्चे डेटा हैं।
यह किस लिए है, ये सभी अनुमान किस लिए हैं?
मैं व्यक्तिगत रूप से डेटा स्मूथिंग, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं की समस्याओं को हल करने के लिए उपयोग करता हूं (मूल उदाहरण में, आपने प्रेक्षित मूल्य का मूल्य खोजने के लिए कहा होगा) आपपर एक्स = 3या कि एक्स = 6ओएलएस विधि द्वारा)। लेकिन हम इसके बारे में साइट के दूसरे भाग में बाद में और विस्तार से बात करेंगे।
पेज के ऊपर पुन: लौटिए
सबूत।
ताकि जब मिले एतथा बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था। आइए इसे दिखाते हैं।
दूसरे क्रम के अंतर का रूप है:
अर्थात्
इसलिए, द्विघात रूप के मैट्रिक्स का रूप है
और तत्वों का मान निर्भर नहीं करता एतथा बी.
आइए हम दिखाते हैं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए कॉर्नर माइनर्स का पॉजिटिव होना जरूरी है।
पहले क्रम का कोना माइनर ... असमानता सख्त है, क्योंकि अंक मेल नहीं खाते। आगे हम इसका क्या अर्थ निकालेंगे।
दूसरे क्रम का कोना माइनर
आइए साबित करें कि गणितीय प्रेरण की विधि द्वारा।
उत्पादन: पाया मान एतथा बीसबसे छोटे फ़ंक्शन मान के अनुरूप हों इसलिए, न्यूनतम वर्ग विधि के लिए आवश्यक पैरामीटर हैं।
यह पता लगाने का समय नहीं है?
समाधान का आदेश दें
पेज के ऊपर पुन: लौटिए
कम से कम वर्ग विधि का उपयोग करके पूर्वानुमान विकसित करना। समस्या को हल करने का एक उदाहरण
एक्सट्रपलेशन वैज्ञानिक अनुसंधान की एक विधि है, जो पूर्वानुमान वस्तु के भविष्य के विकास के लिए अतीत और वर्तमान प्रवृत्तियों, पैटर्न, कनेक्शन के प्रसार पर आधारित है। एक्सट्रपलेशन विधियों में शामिल हैं चलती औसत विधि, घातीय चौरसाई विधि, कम से कम वर्ग विधि।
तत्व कम से कम वर्ग विधि प्रेक्षित और परिकलित मानों के बीच मानक विचलनों के योग को न्यूनतम करना शामिल है। परिकलित मान फिट किए गए समीकरण के अनुसार पाए जाते हैं - प्रतिगमन समीकरण। वास्तविक मानों और परिकलित मानों के बीच की दूरी जितनी छोटी होगी, प्रतिगमन समीकरण के आधार पर पूर्वानुमान उतना ही सटीक होगा।
अध्ययन के तहत घटना के सार का सैद्धांतिक विश्लेषण, जिसमें परिवर्तन एक समय श्रृंखला द्वारा प्रदर्शित किया जाता है, वक्र चुनने के आधार के रूप में कार्य करता है। कभी-कभी श्रृंखला के स्तरों की वृद्धि की प्रकृति के बारे में विचार किया जाता है। इसलिए, यदि उत्पादन में वृद्धि एक अंकगणितीय प्रगति में अपेक्षित है, तो एक सीधी रेखा के साथ चौरसाई किया जाता है। यदि यह पता चलता है कि विकास घातीय है, तो घातीय कार्य के अनुसार चौरसाई किया जाना चाहिए।
कम से कम वर्ग वर्किंग फॉर्मूला : वाई टी + 1 = ए * एक्स + बी, जहां t + 1 पूर्वानुमान अवधि है; t + 1 - अनुमानित संकेतक; ए और बी - गुणांक; X समय का प्रतीक है।
गुणांक ए और बी की गणना निम्नलिखित सूत्रों के अनुसार की जाती है:
जहाँ, Uf - कई गतिकी के वास्तविक मान; n समय श्रृंखला में स्तरों की संख्या है;
कम से कम वर्ग विधि द्वारा समय श्रृंखला को चौरसाई करना अध्ययन के तहत घटना के विकास के पैटर्न को प्रतिबिंबित करने का कार्य करता है। प्रवृत्ति की विश्लेषणात्मक अभिव्यक्ति में, समय को एक स्वतंत्र चर माना जाता है, और श्रृंखला के स्तर इस स्वतंत्र चर के कार्य के रूप में कार्य करते हैं।
किसी घटना का विकास इस बात पर निर्भर नहीं करता है कि शुरुआती क्षण से कितने साल बीत चुके हैं, बल्कि इस बात पर निर्भर करता है कि उसके विकास को किन कारकों ने प्रभावित किया, किस दिशा में और किस तीव्रता से। इसलिए, यह स्पष्ट है कि समय में एक घटना का विकास इन कारकों की कार्रवाई के परिणामस्वरूप प्रकट होता है।
वक्र के प्रकार को सही ढंग से स्थापित करना, समय पर विश्लेषणात्मक निर्भरता का प्रकार पूर्व-पूर्वानुमान विश्लेषण के सबसे कठिन कार्यों में से एक है। .
प्रवृत्ति का वर्णन करने वाले फ़ंक्शन के प्रकार का चयन, जिनमें से पैरामीटर कम से कम वर्ग विधि द्वारा निर्धारित किए जाते हैं, ज्यादातर मामलों में अनुभवजन्य रूप से, कई कार्यों का निर्माण करके और उन्हें एक दूसरे के साथ माध्य वर्ग त्रुटि के मूल्य से तुलना करके किया जाता है। सूत्र द्वारा गणना:
जहाँ Uf - कई गतिकी के वास्तविक मूल्य; उर - कई गतिकी के परिकलित (चिकना) मान; n समय श्रृंखला में स्तरों की संख्या है; p प्रवृत्ति (विकास की प्रवृत्ति) का वर्णन करने वाले सूत्रों में परिभाषित मापदंडों की संख्या है।
कम से कम वर्ग विधि के नुकसान :
- गणितीय समीकरण का उपयोग करके अध्ययन की गई आर्थिक घटना का वर्णन करने का प्रयास करते समय, पूर्वानुमान थोड़े समय के लिए सटीक होगा और नई जानकारी उपलब्ध होने पर प्रतिगमन समीकरण की पुनर्गणना की जानी चाहिए;
- प्रतिगमन समीकरण के चयन की जटिलता, जो विशिष्ट कंप्यूटर प्रोग्राम का उपयोग करते समय हल करने योग्य है।
पूर्वानुमान विकसित करने के लिए कम से कम वर्ग विधि का उपयोग करने का एक उदाहरण
टास्क ... इस क्षेत्र में बेरोजगारी दर को दर्शाने वाला डेटा है,%
- निम्न विधियों का उपयोग करके नवंबर, दिसंबर, जनवरी महीनों के लिए क्षेत्र में बेरोजगारी दर का पूर्वानुमान बनाएं: मूविंग एवरेज, एक्सपोनेंशियल स्मूथिंग, कम से कम वर्ग।
- प्रत्येक विधि का उपयोग करके प्राप्त भविष्यवाणियों की त्रुटियों की गणना करें।
- परिणामों की तुलना करें, निष्कर्ष निकालें।
कम से कम वर्ग समाधान
समस्या को हल करने के लिए, हम एक तालिका तैयार करेंगे जिसमें हम आवश्यक गणना करेंगे:
= २८.६३ / १० = २.८६% पूर्वानुमान सटीकताउच्च।
उत्पादन : गणना में प्राप्त परिणामों की तुलना चलती औसत विधि , घातांक सुगम करना और कम से कम वर्ग विधि से, हम कह सकते हैं कि घातीय चौरसाई विधि द्वारा गणना में औसत सापेक्ष त्रुटि 20-50% की सीमा के भीतर आती है। इसका मतलब है कि इस मामले में पूर्वानुमान की सटीकता केवल संतोषजनक है।
पहले और तीसरे मामलों में, पूर्वानुमान सटीकता अधिक है, क्योंकि औसत सापेक्ष त्रुटि 10% से कम है। लेकिन मूविंग एवरेज की विधि ने अधिक विश्वसनीय परिणाम प्राप्त करना संभव बना दिया (नवंबर के लिए पूर्वानुमान - 1.52%, दिसंबर के लिए पूर्वानुमान - 1.53%, जनवरी के लिए पूर्वानुमान - 1.49%), क्योंकि इस पद्धति का उपयोग करते समय औसत सापेक्ष त्रुटि सबसे छोटी है - 1,13%।
कम से कम वर्ग विधि
इस विषय पर अन्य लेख:
प्रयुक्त स्रोतों की सूची
- सामाजिक जोखिमों और पूर्वानुमान चुनौतियों, खतरों और सामाजिक परिणामों के निदान पर वैज्ञानिक और पद्धति संबंधी सिफारिशें। रूसी राज्य सामाजिक विश्वविद्यालय। मास्को। 2010;
- व्लादिमीरोवा एल.पी. बाजार की स्थितियों में पूर्वानुमान और योजना: पाठ्यपुस्तक। भत्ता। एम।: पब्लिशिंग हाउस "दशकोव एंड कंपनी", 2001;
- नोविकोवा एन.वी., पॉज़्डीवा ओ.जी. राष्ट्रीय अर्थव्यवस्था का पूर्वानुमान: अध्ययन गाइड। येकातेरिनबर्ग: यूराल पब्लिशिंग हाउस। राज्य अर्थव्यवस्था। विश्वविद्यालय, 2007;
- स्लटस्किन एल.एन. व्यापार में पूर्वानुमान पर एमबीए पाठ्यक्रम। एम।: अल्पना बिजनेस बुक्स, 2006।
ओएलएस कार्यक्रम
डेटा दर्ज करें
डेटा और सन्निकटन वाई = ए + बी एक्स
मैं- प्रायोगिक बिंदु संख्या;
एक्स मैं- बिंदु पर निश्चित पैरामीटर का मान मैं;
यी- बिंदु पर मापा पैरामीटर का मान मैं;
मैं- एक बिंदु पर माप का वजन मैं;
वाई मैं, कैल्क।- प्रतिगमन मूल्य द्वारा मापा और परिकलित के बीच का अंतर आपबिंदु पर मैं;
एस एक्स मैं (एक्स मैं)- त्रुटि अनुमान एक्स मैंमापते समय आपबिंदु पर मैं.
डेटा और सन्निकटन वाई = के एक्स
मैं | एक्स मैं | यी | मैं | वाई मैं, कैल्क। | मैं | एस एक्स मैं (एक्स मैं) |
---|
ग्राफ पर क्लिक करें,
बहुराष्ट्रीय कंपनी ऑनलाइन कार्यक्रम के उपयोगकर्ता के लिए निर्देश।
डेटा फ़ील्ड में, प्रत्येक अलग लाइन पर एक ही परीक्षण बिंदु पर `x` और` y` मान दर्ज करें। मानों को एक व्हाइटस्पेस वर्ण (स्पेस या टैब) से अलग किया जाना चाहिए।
तीसरा मान बिंदु `w` का भार हो सकता है। यदि बिंदु भार निर्दिष्ट नहीं है, तो यह एक के बराबर है। अधिकांश मामलों में, प्रायोगिक बिंदुओं के भार अज्ञात हैं या गणना नहीं की गई है, अर्थात। सभी प्रायोगिक डेटा को समतुल्य माना जाता है। कभी-कभी मूल्यों की जांच की गई सीमा में वजन बिल्कुल समान नहीं होते हैं और सैद्धांतिक रूप से भी गणना की जा सकती है। उदाहरण के लिए, स्पेक्ट्रोफोटोमेट्री में, वजन की गणना सरल सूत्रों का उपयोग करके की जा सकती है, हालांकि मूल रूप से हर कोई श्रम लागत को कम करने के लिए इसकी उपेक्षा करता है।
डेटा को क्लिपबोर्ड के माध्यम से ऑफिस सूट स्प्रेडशीट जैसे माइक्रोसॉफ्ट ऑफिस से एक्सेल या ओपन ऑफिस से कैल्क से चिपकाया जा सकता है। ऐसा करने के लिए, स्प्रैडशीट में, कॉपी किए जाने वाले डेटा की श्रेणी का चयन करें, क्लिपबोर्ड पर कॉपी करें और डेटा को इस पृष्ठ पर डेटा फ़ील्ड में पेस्ट करें।
कम से कम वर्गों की विधि द्वारा गणना के लिए, दो गुणांक निर्धारित करने के लिए कम से कम दो बिंदुओं की आवश्यकता होती है `बी` - सीधी रेखा के ढलान के स्पर्शक और `ए` - मूल्य को सीधी रेखा से काट दिया जाता है `y` एक्सिस।
गणना किए गए प्रतिगमन गुणांक की त्रुटि का अनुमान लगाने के लिए, आपको दो से अधिक प्रयोगात्मक बिंदुओं की संख्या निर्धारित करने की आवश्यकता है।
कम से कम वर्ग विधि (OLS)।
प्रायोगिक बिंदुओं की संख्या जितनी अधिक होगी, गुणांकों का सांख्यिकीय अनुमान उतना ही सटीक होगा (छात्र के गुणांक में कमी के कारण) और सामान्य नमूने के अनुमान के करीब अनुमान।
प्रत्येक प्रायोगिक बिंदु पर मूल्य प्राप्त करना अक्सर श्रम गहन होता है, इसलिए अक्सर प्रयोगों की संख्या में एक व्यापार-बंद होता है जो एक सुपाच्य अनुमान देता है और अत्यधिक श्रम लागत का कारण नहीं बनता है। एक नियम के रूप में, दो गुणांक वाले रैखिक कम से कम वर्ग निर्भरता के लिए प्रायोगिक बिंदुओं की संख्या 5-7 अंक के क्षेत्र में चयन करती है।
रैखिक निर्भरता के लिए कम से कम वर्गों की विधि का संक्षिप्त सिद्धांत
मान लीजिए कि हमारे पास प्रयोगात्मक डेटा का एक सेट है जो मूल्यों के जोड़े के रूप में है [`y_i`,` x_i`], जहां `i` 1 से` n` तक एक प्रयोगात्मक माप की संख्या है; `y_i` - बिंदु पर मापे गए मान का मान` i`; `x_i` - उस पैरामीटर का मान जिसे हम बिंदु `i` पर सेट करते हैं।
एक उदाहरण के रूप में, ओम के नियम के संचालन पर विचार करें। विद्युत परिपथ के वर्गों के बीच वोल्टेज (संभावित अंतर) को बदलकर, हम इस खंड से गुजरने वाली धारा की मात्रा को मापते हैं। भौतिकी हमें प्रयोगात्मक रूप से मिली निर्भरता देता है:
`मैं = यू / आर`,
जहां `मैं` - वर्तमान ताकत; `आर` - प्रतिरोध; `यू` - वोल्टेज।
इस मामले में, `y_i` मापा गया वर्तमान मान है, और` x_i` वोल्टेज मान है।
एक अन्य उदाहरण के रूप में, किसी विलयन में किसी पदार्थ के विलयन द्वारा प्रकाश के अवशोषण पर विचार करें। रसायन विज्ञान हमें सूत्र देता है:
`ए = ε एल सी`,
जहाँ `A` विलयन का प्रकाशिक घनत्व है; `ε` विलेय का संप्रेषण है; `एल` - पथ की लंबाई जब प्रकाश एक समाधान के साथ एक क्युवेट से गुजरता है; `C` - विलेय की सांद्रता।
इस मामले में, `y_i` हमारे पास ऑप्टिकल घनत्व का मापा मूल्य है `ए`, और `x_i` हमारे द्वारा निर्धारित पदार्थ की एकाग्रता का मूल्य है।
हम उस मामले पर विचार करेंगे जब `x_i` सेट करने में सापेक्ष त्रुटि `y_i` को मापने में सापेक्ष त्रुटि से बहुत कम है। हम यह भी मानेंगे कि सभी मापा मान `y_i` यादृच्छिक हैं और सामान्य रूप से वितरित हैं, अर्थात। सामान्य वितरण कानून का पालन करें।
x पर `y` की रैखिक निर्भरता के मामले में, हम एक सैद्धांतिक निर्भरता लिख सकते हैं:
`वाई = ए + बी एक्स`।
एक ज्यामितीय दृष्टिकोण से, गुणांक `बी` रेखा के झुकाव के कोण के स्पर्शरेखा को` x` अक्ष, और गुणांक `ए` - के मूल्य `y` के चौराहे के बिंदु पर दर्शाता है `y` अक्ष के साथ रेखा (` x = 0` पर)।
प्रतिगमन रेखा के मापदंडों का पता लगाना।
प्रयोग में, 'y_i' के मापा मान वास्तविक जीवन में हमेशा निहित माप त्रुटियों के कारण सैद्धांतिक सीधी रेखा पर बिल्कुल झूठ नहीं हो सकते हैं। इसलिए, समीकरणों की एक प्रणाली द्वारा एक रैखिक समीकरण का प्रतिनिधित्व किया जाना चाहिए:
`y_i = a + b x_i + _i` (1),
जहां `ε_i` अज्ञात माप त्रुटि है` y` `i`-वें प्रयोग में।
निर्भरता (1) को भी कहते हैं वापसी, अर्थात। सांख्यिकीय महत्व के साथ एक दूसरे से दो मूल्यों की निर्भरता।
निर्भरता को बहाल करने का कार्य प्रायोगिक बिंदुओं [`y_i`,` x_i`] से गुणांक `a` और` b` को खोजना है।
गुणांक ज्ञात करने के लिए `a` तथा` b` आमतौर पर प्रयोग किया जाता है कम से कम वर्ग विधि(ओएलएस)। यह अधिकतम संभावना सिद्धांत का एक विशेष मामला है।
आइए हम (1) को `ε_i = y_i - a - b x_i` के रूप में फिर से लिखें।
तब त्रुटियों के वर्गों का योग होगा
`Φ = sum_ (i = 1) ^ (n) ε_i ^ 2 = sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2`। (2)
कम से कम वर्ग विधि (कम से कम वर्ग विधि) का सिद्धांत योग (2) को पैरामीटर `ए` और` बी` के संबंध में कम करना है.
न्यूनतम तक पहुँच जाता है जब गुणांक के संबंध में योग (2) के आंशिक व्युत्पन्न `a` तथा` b` शून्य के बराबर हैं:
`फ़्रेक (आंशिक Φ) (आंशिक a) = फ़्रेक (आंशिक योग_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (आंशिक a) = 0`
फ़्रेक (आंशिक Φ) (आंशिक b) = फ़्रेक (आंशिक योग_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (आंशिक b) = 0`
डेरिवेटिव का विस्तार करते हुए, हम दो अज्ञात के साथ दो समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_ (i = 1) ^ (n) (2a + 2bx_i - 2y_i) = sum_ (i = 1) ^ (n) (a + bx_i - y_i) = 0`
`sum_ (i = 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) = sum_ (i = 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) = 0`
हम कोष्ठक खोलते हैं और मांगे गए गुणांक से स्वतंत्र राशि को दूसरे आधे हिस्से में स्थानांतरित करते हैं, हम रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_ (i = 1) ^ (n) y_i = a n + b sum_ (i = 1) ^ (n) bx_i
`sum_ (i = 1) ^ (n) x_iy_i = a sum_ (i = 1) ^ (n) x_i + b sum_ (i = 1) ^ (n) x_i ^ 2`
परिणामी प्रणाली को हल करते हुए, हम गुणांक `a` और` b` के लिए सूत्र पाते हैं:
`ए = फ़्रैक (sum_ (i = 1) ^ (n) y_i sum_ (i = 1) ^ (n) x_i ^ 2 - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n) ) x_iy_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.1)
`बी = फ़्रेक (एन योग_ (i = 1) ^ (एन) x_iy_i - योग_ (i = 1) ^ (एन) x_i योग_ (i = 1) ^ (एन) y_i) (एन योग_ (i = 1) ^ (एन) x_i ^ 2 - (योग_ (i = 1) ^ (एन) x_i) ^ 2) `(3.2)
इन सूत्रों का समाधान तब होता है जब `n> 1` (रेखा कम से कम 2 बिंदुओं से खींची जा सकती है) और जब निर्धारक `D = n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ) ^ (एन) x_i) ^ 2! = 0`, अर्थात जब प्रयोग में बिंदु `x_i` भिन्न हों (अर्थात जब रेखा लंबवत न हो)।
प्रतीपगमन रेखा के गुणांकों की त्रुटियों का अनुमान
गुणांक `ए` और` बी` की गणना में त्रुटि के अधिक सटीक अनुमान के लिए, बड़ी संख्या में प्रयोगात्मक बिंदुओं का होना वांछनीय है। जब `n = 2`, गुणांकों की त्रुटि का अनुमान लगाना असंभव है, क्योंकि सन्निकटन रेखा स्पष्ट रूप से दो बिंदुओं से होकर गुजरेगी।
यादृच्छिक चर `V` की त्रुटि निर्धारित की जाती है त्रुटियों के संचय का नियम
`S_V ^ 2 = sum_ (i = 1) ^ p (फ़्रेक (आंशिक f) (आंशिक z_i)) ^ 2 S_ (z_i) ^ 2`,
जहां `p` एक त्रुटि `S_ (z_i)` के साथ पैरामीटर की संख्या `z_i` है जो `S_V` त्रुटि को प्रभावित करती है;
`f` - `z_i` पर `V` की निर्भरता का कार्य।
आइए हम गुणांक `a` और` b` . की त्रुटि के लिए त्रुटियों के संचय के नियम को लिखें
`S_a ^ 2 = sum_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) (आंशिक y_i)) ^ 2 S_ (y_i) ^ 2 + योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) ) (आंशिक x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) (आंशिक y_i)) ^ 2 `,
`एस_बी ^ 2 = योग_ (i = 1) ^ (एन) (फ़्रेक (आंशिक बी) (आंशिक y_i)) ^ 2 एस_ (वाई_आई) ^ 2 + योग_ (i = 1) ^ (एन) (फ़्रेक (आंशिक बी) ) (आंशिक x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक b) (आंशिक y_i)) ^ 2 `,
जबसे `S_ (x_i) ^ 2 = 0` (हमने पहले आरक्षण किया था कि `x` की त्रुटि नगण्य है)।
`S_y ^ 2 = S_ (y_i) ^ 2` - माप में त्रुटि (विचरण, मानक विचलन का वर्ग) y`, यह मानते हुए कि त्रुटि `y` के सभी मूल्यों के लिए एक समान है।
प्राप्त व्यंजकों में `a` और` b` की गणना के लिए सूत्रों को प्रतिस्थापित करने पर, हम प्राप्त करते हैं
`S_a ^ 2 = S_y ^ 2 फ़्रेक (sum_ (i = 1) ^ (n) (sum_ (i = 1) ^ (n) x_i ^ 2 - x_i sum_ (i = 1) ^ (n) x_i) ^ 2 ) (डी ^ 2) = एस_वाई ^ 2 फ़्रेक ((एन योग_ (i = 1) ^ (एन) x_i ^ 2 - (योग_ (i = 1) ^ (एन) x_i) ^ 2) योग_ (i = 1) ^ (एन) x_i ^ 2) (डी ^ 2) = एस_वाई ^ 2 फ़्रेक (योग_ (i = 1) ^ (एन) x_i ^ 2) (डी) `(4.1)
`S_b ^ 2 = S_y ^ 2 फ़्रेक (sum_ (i = 1) ^ (n) (n x_i - sum_ (i = 1) ^ (n) x_i) ^ 2) (D ^ 2) = S_y ^ 2 फ़्रैक ( n (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2)) (D ^ 2) = S_y ^ 2 फ़्रेक (n) (D) `(4.2)
अधिकांश वास्तविक जीवन प्रयोगों में, `Sy` मान को नहीं मापा जाता है। ऐसा करने के लिए, योजना के एक या कई बिंदुओं पर कई समानांतर माप (प्रयोग) करना आवश्यक है, जिससे प्रयोग का समय (और संभवतः लागत) बढ़ जाता है। इसलिए, आमतौर पर यह माना जाता है कि प्रतिगमन रेखा से `y` के विचलन को यादृच्छिक माना जा सकता है। इस मामले में विचरण `y` का अनुमान सूत्र द्वारा परिकलित किया जाता है।
`S_y ^ 2 = S_ (y, बाकी) ^ 2 = फ़्रेक (sum_ (i = 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)`।
भाजक `n-2` प्रकट होता है क्योंकि हमने प्रयोगात्मक डेटा के एक ही नमूने के लिए दो गुणांकों की गणना के कारण स्वतंत्रता की डिग्री की संख्या में कमी की है।
इस अनुमान को प्रतिगमन रेखा `S_ (y, बाकी) ^ 2` के सापेक्ष अवशिष्ट विचरण भी कहा जाता है।
गुणांक के महत्व का आकलन छात्र की कसौटी के अनुसार किया जाता है
`t_a = frac (| a |) (S_a)`, `t_b = frac (| b |) (S_b)`
यदि परिकलित मानदंड `t_a`,` t_b` तालिका मानदंड `t (P, n-2)` से कम हैं, तो यह माना जाता है कि संबंधित गुणांक किसी दिए गए प्रायिकता `P` के साथ शून्य से महत्वपूर्ण रूप से भिन्न नहीं है।
एक रैखिक संबंध के विवरण की गुणवत्ता का आकलन करने के लिए, आप फिशर के परीक्षण का उपयोग करके माध्य के सापेक्ष `S_ (y, बाकी) ^ 2` और` S_ (बार y) की तुलना कर सकते हैं।
`एस_ (बार y) = फ़्रेक (योग_ (i = 1) ^ n (y_i - बार y) ^ 2) (n-1) = फ़्रेक (sum_ (i = 1) ^ n (y_i - (sum_ (i =) १) ^ n y_i) / n) ^ २) (n-1) `- विचरण का नमूना अनुमान` y` माध्य के सापेक्ष।
निर्भरता का वर्णन करने के लिए प्रतिगमन समीकरण की प्रभावशीलता का आकलन करने के लिए, फिशर गुणांक की गणना की जाती है
`एफ = एस_ (बार वाई) / एस_ (वाई, बाकी) ^ 2`,
जिसकी तुलना तालिका फिशर गुणांक F (p, n-1, n-2) से की जाती है।
यदि `F> F (P, n-1, n-2)`, निर्भरता के विवरण के बीच का अंतर `y = f (x)` प्रतिगमन समीकरण का उपयोग करते हुए और माध्य का उपयोग करने वाले विवरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है संभावना `पी`। वे। प्रतिगमन माध्य के सापेक्ष `y` के प्रकीर्णन से बेहतर संबंध का वर्णन करता है।
ग्राफ पर क्लिक करें,
तालिका में मान जोड़ने के लिए
कम से कम वर्ग विधि। कम से कम वर्ग विधि को अज्ञात मापदंडों के निर्धारण के रूप में समझा जाता है a, b, c, अपनाई गई कार्यात्मक निर्भरता
कम से कम वर्ग विधि को अज्ञात मापदंडों के निर्धारण के रूप में समझा जाता है ए, बी, सी, ...स्वीकृत कार्यात्मक निर्भरता
वाई = एफ (एक्स, ए, बी, सी, ...),
जो न्यूनतम माध्य वर्ग (विचरण) त्रुटि प्रदान करेगा
, (24)
जहाँ x i, y i - प्रयोग से प्राप्त संख्याओं के युग्मों का एक समूह।
चूंकि कई चर के एक फ़ंक्शन के चरम के लिए शर्त इसके आंशिक डेरिवेटिव के शून्य की समानता की स्थिति है, पैरामीटर ए, बी, सी, ...समीकरणों की प्रणाली से निर्धारित होते हैं:
; ; ; … (25)
यह याद रखना चाहिए कि फ़ंक्शन प्रकार के बाद पैरामीटर का चयन करने के लिए कम से कम वर्ग विधि का उपयोग किया जाता है वाई = एफ (एक्स)परिभाषित।
यदि सैद्धांतिक विचारों से कोई निष्कर्ष निकालना असंभव है कि अनुभवजन्य सूत्र क्या होना चाहिए, तो किसी को दृश्य प्रतिनिधित्व द्वारा निर्देशित किया जाना चाहिए, मुख्य रूप से देखे गए डेटा का ग्राफिकल प्रतिनिधित्व।
व्यवहार में, वे अक्सर निम्न प्रकार के कार्यों तक सीमित होते हैं:
1) रैखिक ;
2) द्विघात a.
इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन के अन्य सरल लोगों द्वारा अनुमानित प्रतिनिधित्व की अनुमति देता है। ओएलएस अवलोकनों के प्रसंस्करण में अत्यंत उपयोगी हो सकता है, और यह सक्रिय रूप से दूसरों के माप के परिणामों से कुछ मात्राओं का अनुमान लगाने के लिए उपयोग किया जाता है जिनमें यादृच्छिक त्रुटियां होती हैं। यह आलेख आपको दिखाएगा कि एक्सेल में कम से कम वर्ग गणना कैसे कार्यान्वित करें।
एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण
मान लीजिए कि दो संकेतक एक्स और वाई हैं। इसके अलावा, वाई एक्स पर निर्भर करता है। चूंकि ओएलएस प्रतिगमन विश्लेषण के दृष्टिकोण से हमारे लिए रूचि रखता है (एक्सेल में, इसकी विधियों को अंतर्निहित कार्यों का उपयोग करके कार्यान्वित किया जाता है), तो आपको तुरंत चाहिए एक विशिष्ट समस्या पर विचार करने के लिए आगे बढ़ें।
तो, एक्स को एक किराने की दुकान का खुदरा स्थान होने दें, जिसे वर्ग मीटर में मापा जाता है, और वाई - वार्षिक कारोबार, लाखों रूबल में मापा जाता है।
यह भविष्यवाणी करना आवश्यक है कि यदि किसी विशेष खुदरा स्थान में स्टोर का टर्नओवर (Y) होगा तो उसका क्या होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टाल से अधिक सामान बेचता है।
भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द
मान लें कि हमारे पास n स्टोर्स के लिए डेटा से निर्मित एक टेबल है।
गणितीय आँकड़ों के अनुसार, कम से कम 5-6 वस्तुओं के डेटा की जांच करने पर परिणाम कमोबेश सही होंगे। इसके अलावा, आप "असामान्य" परिणामों का उपयोग नहीं कर सकते। विशेष रूप से, एक कुलीन छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े रिटेल आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।
विधि सार
तालिका डेटा को कार्तीय तल पर बिंदुओं M 1 (x 1, y 1),… M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन के लिए कम हो जाएगा, जिसमें एक ग्राफ जितना संभव हो सके बिंदुओं M 1, M 2, .. M n के करीब से गुजर रहा हो।
बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि यह भी गलत है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसे आपको पता लगाने की आवश्यकता है। सबसे उचित समाधान सीधी रेखा y = ax + b को खोजना है, जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाता है, या इसके बजाय, गुणांक - ए और बी।
शुद्धता मूल्यांकन
किसी भी सन्निकटन के लिए, उसकी शुद्धता के आकलन का विशेष महत्व है। आइए हम बिंदु x i के लिए कार्यात्मक और प्रायोगिक मूल्यों के बीच अंतर (विचलन) को e i द्वारा निरूपित करें, अर्थात e i = y i - f (x i)।
जाहिर है, सन्निकटन की सटीकता का अनुमान लगाने के लिए, विचलन के योग का उपयोग किया जा सकता है, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, सबसे छोटे मान वाले को वरीयता दी जानी चाहिए सभी बिंदुओं पर विचाराधीन योग। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ, नकारात्मक व्यावहारिक रूप से मौजूद होंगे।
विचलन या उनके वर्गों के मॉड्यूल का उपयोग करके समस्या को हल किया जा सकता है। बाद की विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण शामिल है (एक्सेल इसे दो अंतर्निहित कार्यों के साथ लागू करता है), और लंबे समय से इसके लायक साबित हुआ है।
कम से कम वर्ग विधि
एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित श्रेणी में स्थित सभी मानों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, हमें व्यंजक के मान की गणना करने से कोई नहीं रोकता है (e 1 2 + e 2 2 + e 3 2 + ... e n 2)।
गणितीय संकेतन में, ऐसा लगता है:
चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित करने के लिए किया गया था, हमारे पास है:
इस प्रकार, एक्स और वाई की मात्राओं की विशिष्ट निर्भरता का सबसे अच्छा वर्णन करने वाली सीधी रेखा को खोजने की समस्या दो चर के न्यूनतम फ़ंक्शन की गणना करने के लिए कम हो जाती है:
इसके लिए नए चर ए और बी के संबंध में आंशिक डेरिवेटिव को शून्य करने की आवश्यकता है, और एक आदिम प्रणाली को हल करना जिसमें दो अज्ञात फॉर्म के साथ दो समीकरण शामिल हैं:
कुछ सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेर-फेर करना शामिल है, हम प्राप्त करते हैं:
इसे हल करना, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, अर्थात, यह अनुमान लगाने के लिए कि किसी निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको एक सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के लिए क्रेडिट पर स्टोर खरीदने से भुगतान होगा।
एक्सेल में कम से कम वर्ग विधि कैसे लागू करें
एक्सेल में ओएलएस मान की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: "TREND" (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक।)। आइए एक्सेल में ओएलएस की गणना के लिए हमारी तालिका में सूत्र लागू करें।
ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि द्वारा गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिह्न दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:
- वाई के लिए ज्ञात मूल्यों की श्रेणी (इस मामले में, टर्नओवर के लिए डेटा);
- रेंज x 1,… x n, यानी रिटेल स्पेस का आकार;
- और x के ज्ञात और अज्ञात मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाना होगा (वर्कशीट पर उनके स्थान की जानकारी के लिए, नीचे देखें)।
इसके अलावा, सूत्र में बूलियन चर "कॉन्स्ट" होता है। यदि आप संबंधित क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि गणना की जानी चाहिए, यह मानते हुए कि बी = 0।
यदि आपको x के एक से अधिक मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको कीबोर्ड पर "Shift" + "Control" + "Enter" संयोजन टाइप करना होगा। ("प्रवेश करना")।
कुछ सुविधाएं
प्रतिगमन विश्लेषण डमी के लिए भी उपलब्ध हो सकता है। अज्ञात चरों की एक सरणी के मूल्य की भविष्यवाणी करने के लिए एक्सेल का सूत्र - "ट्रेंड" - उन लोगों द्वारा भी उपयोग किया जा सकता है जिन्होंने कम से कम वर्गों की विधि के बारे में कभी नहीं सुना है। उसके काम की कुछ विशेषताओं को जानने के लिए बस इतना ही काफी है। विशेष रूप से:
- यदि आप y चर के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में व्यवस्थित करते हैं, तो ज्ञात x मानों वाली प्रत्येक पंक्ति (स्तंभ) को प्रोग्राम द्वारा एक अलग चर के रूप में माना जाएगा।
- यदि ज्ञात x के साथ एक श्रेणी "ट्रेंड" विंडो में निर्दिष्ट नहीं है, तो यदि एक्सेल में फ़ंक्शन का उपयोग किया जाता है, तो प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या निर्दिष्ट मानों के साथ श्रेणी से मेल खाती है। वाई चर के।
- आउटपुट के रूप में "अनुमानित" मानों की एक सरणी प्राप्त करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
- यदि x के नए मान निर्दिष्ट नहीं हैं, तो "TREND" फ़ंक्शन उन्हें ज्ञात मान के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
- नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुरूप होना चाहिए।
- ज्ञात x मानों वाली एक सरणी में कई चर हो सकते हैं। हालांकि, अगर हम केवल एक के बारे में बात कर रहे हैं, तो x और y के दिए गए मानों के साथ श्रेणियों का अनुरूप होना आवश्यक है। एकाधिक चर के मामले में, आप चाहते हैं कि दिए गए y मानों वाली श्रेणी एक कॉलम या एक पंक्ति में फ़िट हो।
पूर्वानुमान समारोह
इसे कई कार्यों के साथ कार्यान्वित किया जाता है। उनमें से एक को "पूर्वानुमान" कहा जाता है। यह "TREND" के समान है, अर्थात यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y मान अज्ञात है।
अब आप एक्सेल में डमी के लिए सूत्रों को जानते हैं जो आपको एक रैखिक प्रवृत्ति के अनुसार किसी दिए गए संकेतक के भविष्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।
प्रतिगमन समारोह के प्रकार को चुनने के बाद, अर्थात। एक्स (या वाई पर एक्स) पर वाई की निर्भरता के माना मॉडल का प्रकार, उदाहरण के लिए, एक रैखिक मॉडल y x = a + bx, मॉडल के गुणांक के विशिष्ट मूल्यों को निर्धारित करना आवश्यक है।
ए और बी के विभिन्न मूल्यों के लिए, yx = a + bx के रूप की अनंत संख्या में निर्भरताएं बनाई जा सकती हैं, अर्थात समन्वय विमान पर अनंत संख्या में सीधी रेखाएं होती हैं, लेकिन हमें ऐसी निर्भरता की आवश्यकता होती है कि सबसे अच्छे तरीके से देखे गए मूल्यों से मेल खाता है। इस प्रकार, कार्य को सर्वोत्तम गुणांक के चयन के लिए कम कर दिया गया है।
हम उपलब्ध प्रेक्षणों की एक निश्चित संख्या से ही आगे बढ़ते हुए रैखिक फलन a + bx की खोज करते हैं। प्रेक्षित मानों के लिए सबसे उपयुक्त फलन ज्ञात करने के लिए, हम अल्पतम वर्ग विधि का उपयोग करते हैं।
निरूपित करें: Y i वह मान है जिसकी गणना समीकरण Y i = a + bx i के अनुसार की जाती है। y i मापा गया मान है, i = y i -Y i समीकरण के अनुसार मापा और परिकलित मानों के बीच का अंतर है, i = y i -a-bx i.
न्यूनतम वर्ग विधि के लिए i की आवश्यकता होती है, मापा y i और परिकलित Y i मानों के बीच का अंतर न्यूनतम होना चाहिए। इसलिए, हम गुणांक ए और बी पाते हैं ताकि प्रतिगमन की सीधी रेखा पर मूल्यों से देखे गए मूल्यों के विचलन के वर्गों का योग सबसे छोटा हो:
तर्कों के इस कार्य की खोज करना और डेरिवेटिव की मदद से चरम के लिए, कोई यह साबित कर सकता है कि यदि गुणांक ए और बी सिस्टम के समाधान हैं तो फ़ंक्शन न्यूनतम मान लेता है:
(2)
यदि हम सामान्य समीकरणों के दोनों पक्षों को n से विभाजित करते हैं, तो हमें प्राप्त होता है:
उस पर विचार करना (3)
हम पाते हैं , यहाँ से, a के मान को पहले समीकरण में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:
इस मामले में, b को समाश्रयण गुणांक कहा जाता है; a को समाश्रयण समीकरण का मुक्त पद कहा जाता है और इसकी गणना सूत्र द्वारा की जाती है:
परिणामी सीधी रेखा सैद्धांतिक प्रतिगमन रेखा के लिए एक अनुमान है। हमारे पास है:
इसलिए, एक रैखिक प्रतिगमन समीकरण है।
प्रतिगमन प्रत्यक्ष (बी> 0) और उलटा (बी उदाहरण 1 हो सकता है। एक्स और वाई के मूल्यों को मापने के परिणाम तालिका में दिए गए हैं:
एक्स मैं | -2 | 0 | 1 | 2 | 4 |
यी | 0.5 | 1 | 1.5 | 2 | 3 |
यह मानते हुए कि X और Y के बीच एक रैखिक संबंध y = a + bx है, न्यूनतम वर्ग विधि का उपयोग करके गुणांक a और b निर्धारित करें।
समाधान। यहाँ n = 5
एक्स आई = -2 + 0 + 1 + 2 + 4 = 5;
x मैं २ = ४ + ० + १ + ४ + १६ = २५
x i y i = -2 0.5 + 0 1 + 1 1.5 + 2 2 + 4 3 = 16.5
वाई मैं = 0.5 + 1 + 1.5 + 2 + 3 = 8
और सामान्य प्रणाली (2) का रूप है
इस प्रणाली को हल करने पर, हम प्राप्त करते हैं: b = 0.425, a = 1.175। इसलिए, y = 1.175 + 0.425x।
उदाहरण 2. आर्थिक संकेतकों (एक्स) और (वाई) के 10 अवलोकनों का एक नमूना है।
एक्स मैं | 180 | 172 | 173 | 169 | 175 | 170 | 179 | 170 | 167 | 174 |
यी | 186 | 180 | 176 | 171 | 182 | 166 | 182 | 172 | 169 | 177 |
नमूना Y-X प्रतिगमन समीकरण को खोजना आवश्यक है। Y-X नमूना प्रतिगमन रेखा को प्लॉट करें।
समाधान। 1. आइए डेटा को x i और y i के मानों से सॉर्ट करें। हमें एक नई तालिका मिलती है:
एक्स मैं | 167 | 169 | 170 | 170 | 172 | 173 | 174 | 175 | 179 | 180 |
यी | 169 | 171 | 166 | 172 | 180 | 176 | 177 | 182 | 182 | 186 |
गणनाओं को सरल बनाने के लिए, हम एक गणना तालिका तैयार करेंगे जिसमें हम आवश्यक संख्यात्मक मान दर्ज करेंगे।
एक्स मैं | यी | एक्स मैं २ | एक्स मैं वाई मैं |
167 | 169 | 27889 | 28223 |
169 | 171 | 28561 | 28899 |
170 | 166 | 28900 | 28220 |
170 | 172 | 28900 | 29240 |
172 | 180 | 29584 | 30960 |
173 | 176 | 29929 | 30448 |
174 | 177 | 30276 | 30798 |
175 | 182 | 30625 | 31850 |
179 | 182 | 32041 | 32578 |
180 | 186 | 32400 | 33480 |
x मैं = १७२९ | y मैं = १७६१ | x मैं २ २९९१०५ | x मैं y मैं = ३०४६९६ |
एक्स = 172.9 | वाई = 176.1 | x मैं २ = २९९१०.५ | xy = ३०४६९.६ |
सूत्र (4) के अनुसार, हम प्रतिगमन गुणांक की गणना करते हैं
और सूत्र द्वारा (5)
इस प्रकार, प्रतिदर्श समाश्रयण समीकरण y = -59.34 + 1.3804x है।
आइए निर्देशांक तल पर बिंदु (x i; y i) बनाएं और समाश्रयण रेखा को चिह्नित करें।
अंजीर 4
चित्र 4 दिखाता है कि कैसे देखे गए मान प्रतिगमन रेखा के सापेक्ष स्थित हैं। Y i से y i के विचलन के संख्यात्मक मूल्यांकन के लिए, जहां y i मनाया जाता है, और Y i प्रतिगमन द्वारा निर्धारित मान हैं, हम एक तालिका तैयार करेंगे:
एक्स मैं | यी | यी | वाई मैं-वाई मैं |
167 | 169 | 168.055 | -0.945 |
169 | 171 | 170.778 | -0.222 |
170 | 166 | 172.140 | 6.140 |
170 | 172 | 172.140 | 0.140 |
172 | 180 | 174.863 | -5.137 |
173 | 176 | 176.225 | 0.225 |
174 | 177 | 177.587 | 0.587 |
175 | 182 | 178.949 | -3.051 |
179 | 182 | 184.395 | 2.395 |
180 | 186 | 185.757 | -0.243 |
Y i मानों की गणना प्रतिगमन समीकरण के अनुसार की जाती है।
प्रतिगमन रेखा से कुछ देखे गए मानों के ध्यान देने योग्य विचलन को कम संख्या में टिप्पणियों द्वारा समझाया गया है। X पर Y की रैखिक निर्भरता की डिग्री का अध्ययन करते समय, टिप्पणियों की संख्या को ध्यान में रखा जाता है। निर्भरता की ताकत सहसंबंध गुणांक के मूल्य से निर्धारित होती है।
कम से कम वर्ग एक रैखिक समीकरण के निर्माण के लिए एक गणितीय प्रक्रिया है जो एक सीधी रेखा के समीकरण में गुणांक, ए और बी के मूल्यों को खोजने के द्वारा क्रमबद्ध जोड़े के एक सेट से सबसे अच्छी तरह मेल खाता है। कम से कम वर्ग विधि का लक्ष्य y और के मानों के बीच कुल चुकता त्रुटि को कम करना है। यदि प्रत्येक बिंदु के लिए हम त्रुटि निर्धारित करते हैं, तो कम से कम वर्ग विधि न्यूनतम होती है:
जहाँ n = रेखा के चारों ओर क्रमित युग्मों की संख्या। डेटा के जितना करीब हो सके।
इस अवधारणा को चित्र में दिखाया गया है।
आंकड़े को देखते हुए, वह रेखा जो डेटा को सबसे अच्छी तरह से फिट करती है, प्रतिगमन रेखा, ग्राफ़ पर चार बिंदुओं की कुल चुकता त्रुटि को कम करती है। मैं आपको दिखाऊंगा कि निम्न उदाहरण में कम से कम वर्ग विधि का उपयोग करके इसे कैसे निर्धारित किया जाए।
एक युवा जोड़े की कल्पना करें जो हाल ही में एक साथ रह रहे हैं और एक साथ बाथरूम वैनिटी टेबल साझा कर रहे हैं। युवक ने नोटिस करना शुरू कर दिया कि उसकी आधी मेज लगातार सिकुड़ रही थी, बालों के मूस और सोया परिसरों से जमीन खो रही थी। पिछले कुछ महीनों से, वह आदमी उस दर पर बारीकी से नज़र रख रहा है जिस पर उसके टेबल पर आइटमों की संख्या बढ़ रही है। नीचे दी गई तालिका से पता चलता है कि पिछले कुछ महीनों में एक लड़की ने बाथरूम की मेज पर कितनी चीजें जमा की हैं।
चूंकि हमारा लक्ष्य यह पता लगाना है कि क्या समय के साथ वस्तुओं की संख्या बढ़ती है, "माह" स्वतंत्र चर होगा, और "वस्तुओं की संख्या" आश्रित चर होगा।
कम से कम वर्गों की विधि का उपयोग करते हुए, हम उस समीकरण को निर्धारित करते हैं जो डेटा के लिए सबसे उपयुक्त है a के मानों की गणना करके, y-अक्ष पर खंड, और b, रेखा का ढलान:
ए = वाई एवी - बीएक्स एवी
जहाँ x av, x का औसत मान है, स्वतंत्र चर, y av, y, स्वतंत्र चर का औसत मान है।
नीचे दी गई तालिका इन समीकरणों के लिए आवश्यक गणनाओं को सारांशित करती है।
हमारे बाथटब उदाहरण के लिए प्रभाव वक्र निम्नलिखित समीकरण द्वारा निर्धारित किया जाएगा:
चूंकि हमारे समीकरण में 0.976 की सकारात्मक ढलान है, आदमी के पास सबूत है कि टेबल पर वस्तुओं की संख्या प्रति माह 1 आइटम की औसत दर से समय के साथ बढ़ती है। ग्राफ क्रमित युग्मों के साथ प्रभाव वक्र दिखाता है।
अगले छह महीनों (महीने 16) में वस्तुओं की संख्या की उम्मीद की गणना निम्नानुसार की जाएगी:
= 5.13 + 0.976x = 5.13 + 0.976 (16) ~ 20.7 = 21 आइटम
तो यह हमारे नायक के लिए कुछ कार्रवाई करने का समय है।
एक्सेल में ट्रेंड फ़ंक्शन
जैसा कि आप शायद पहले ही अनुमान लगा चुके हैं, एक्सेल के पास मूल्य की गणना के लिए एक फ़ंक्शन है कम से कम वर्ग विधि।इस सुविधा को ट्रेंड कहा जाता है। इसका सिंटैक्स इस प्रकार है:
रुझान (ज्ञात Y-मान; ज्ञात X-मान; नए X-मान; स्थिरांक)
ज्ञात Y मान - आश्रित चर की एक सरणी, हमारे मामले में, तालिका में वस्तुओं की संख्या
एक्स के ज्ञात मूल्य - स्वतंत्र चर की एक सरणी, हमारे मामले में यह एक महीना है
नया X मान - नया X (माह) मान जिसके लिए समारोह प्रवृत्तिआश्रित चरों का अपेक्षित मान लौटाता है (वस्तुओं की संख्या)
कॉन्स्ट वैकल्पिक है। एक बूलियन मान जो इंगित करता है कि क्या स्थिरांक b का 0 होना आवश्यक है।
उदाहरण के लिए, उदाहरण 16वें महीने के लिए बाथरूम की मेज पर आइटम की अपेक्षित संख्या निर्धारित करने के लिए उपयोग किए गए TREND फ़ंक्शन को दिखाता है।