कम से कम वर्ग कार्यपुस्तिका। एक्सेल में कम से कम वर्ग विधि

१०० रुपहला ऑर्डर बोनस

कार्य के प्रकार का चयन करें डिप्लोमा कार्य अवधि कार्य सार मास्टर थीसिस अभ्यास रिपोर्ट लेख रिपोर्ट समीक्षा परीक्षा कार्य मोनोग्राफ समस्या समाधान व्यवसाय योजना प्रश्नों के उत्तर रचनात्मक कार्य निबंध ड्राइंग निबंध अनुवाद प्रस्तुतियाँ टाइपिंग अन्य पाठ की विशिष्टता को बढ़ाना पीएचडी थीसिस प्रयोगशाला कार्य ऑनलाइन सहायता

कीमत पता करें

कम से कम वर्ग विधि एक गणितीय (गणितीय और सांख्यिकीय) तकनीक है जिसका उपयोग समय श्रृंखला को संरेखित करने के लिए किया जाता है, यादृच्छिक चर आदि के बीच सहसंबंध के रूप को प्रकट करने के लिए। इसमें यह तथ्य शामिल है कि इस घटना का वर्णन करने वाला फ़ंक्शन एक सरल फ़ंक्शन द्वारा अनुमानित है। इसके अलावा, बाद वाले को चुना जाता है ताकि संरेखित बिंदुओं से देखे गए बिंदुओं पर फ़ंक्शन के वास्तविक स्तरों का मानक विचलन (विक्षेपण देखें) सबसे छोटा हो।

उदाहरण के लिए, उपलब्ध आंकड़ों के अनुसार ( ग्यारहवीं,यी) (मैं = 1, 2, ..., एन) ऐसा वक्र प्लॉट किया जाता है आप = ए + बीएक्स, जिस पर विचलन के वर्गों का योग न्यूनतम तक पहुंच जाता है

यानी, दो मापदंडों के आधार पर फ़ंक्शन को छोटा किया जाता है: ए- निर्देशांक अक्ष पर एक खंड और बी- सीधी रेखा का ढलान।

किसी फ़ंक्शन को छोटा करने के लिए आवश्यक शर्तें देने वाले समीकरण एस(ए,बी) कहा जाता है सामान्य समीकरण।सन्निकटन कार्यों के रूप में, न केवल रैखिक (एक सीधी रेखा में संरेखण), बल्कि द्विघात, परवलयिक, घातांक, आदि का भी उपयोग किया जाता है। एक सीधी रेखा में समय श्रृंखला के संरेखण के उदाहरण के लिए, चित्र देखें। एम.2, जहां वर्ग दूरी का योग ( आप 1 – मैं 1)2 + (आप 2 – मैं 2) 2 .... सबसे छोटी है, और परिणामी सीधी रेखा समय के साथ कुछ संकेतक के अवलोकनों की गतिशील श्रृंखला की प्रवृत्ति को सर्वोत्तम रूप से दर्शाती है।

ओएलएस अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: यादृच्छिक त्रुटि की गणितीय अपेक्षा, कारकों के संदर्भ में सशर्त, शून्य के बराबर होनी चाहिए। यह स्थिति, विशेष रूप से, संतुष्ट होती है यदि: 1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और 2. कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं। पहली शर्त को हमेशा एक स्थिरांक वाले मॉडल के लिए पूर्ण माना जा सकता है, क्योंकि एक स्थिरांक त्रुटियों की एक गैर-शून्य गणितीय अपेक्षा पर ले जाता है। दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)।

प्रतिगमन समीकरणों के मापदंडों के सांख्यिकीय आकलन के अभ्यास में सबसे आम है कम से कम वर्गों की विधि। यह विधि डेटा की प्रकृति और मॉडल निर्माण के परिणामों के बारे में कई मान्यताओं पर आधारित है। मुख्य हैं आश्रित और स्वतंत्र लोगों में प्रारंभिक चर का एक स्पष्ट विभाजन, समीकरणों में शामिल कारकों की असंबद्धता, रिश्ते की रैखिकता, अवशेषों के स्वत: सहसंबंध की अनुपस्थिति, उनकी गणितीय अपेक्षाओं की समानता शून्य और स्थिर भिन्नता।

मुख्य ओएलएस परिकल्पनाओं में से एक यह धारणा है कि विचलन के प्रसरण समान हैं, अर्थात। श्रृंखला के माध्य (शून्य) मान के आसपास उनका फैलाव एक स्थिर मान होना चाहिए। इस गुण को समरूपता कहते हैं। व्यवहार में, विचलन के विचलन अक्सर समान नहीं होते हैं, अर्थात विषमलैंगिकता देखी जाती है। यह विभिन्न कारणों से हो सकता है। उदाहरण के लिए, मूल डेटा में त्रुटियां संभव हैं। मूल जानकारी में आकस्मिक अशुद्धियाँ, जैसे संख्याओं के क्रम में त्रुटियाँ, परिणामों पर एक ठोस प्रभाव डाल सकती हैं। अक्सर, विचलन का एक बड़ा प्रसार i आश्रित चर (ओं) के बड़े मूल्यों पर मनाया जाता है। यदि डेटा में एक महत्वपूर्ण त्रुटि है, तो स्वाभाविक रूप से, गलत डेटा से गणना किए गए मॉडल मान का विचलन भी बड़ा होगा। इस त्रुटि से छुटकारा पाने के लिए, हमें गणना परिणामों में इन आंकड़ों के योगदान को कम करना होगा, अन्य सभी की तुलना में उनके लिए कम वजन निर्धारित करना होगा। यह विचार भारित ओएलएस में लागू किया गया है।

आइए हम घात 2 के बहुपद के साथ फलन का अनुमान लगाएं। ऐसा करने के लिए, हम समीकरणों की सामान्य प्रणाली के गुणांक की गणना करते हैं:

, ,

आइए कम से कम वर्गों की एक सामान्य प्रणाली की रचना करें, जिसका रूप है:

सिस्टम समाधान खोजना आसान है :,,।

इस प्रकार, दूसरी डिग्री का बहुपद पाया जाता है:।

सैद्धांतिक पृष्ठभूमि

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण 2... एक बहुपद की इष्टतम घात ज्ञात करना।

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण 3... अनुभवजन्य निर्भरता के मापदंडों को खोजने के लिए समीकरणों की सामान्य प्रणाली की व्युत्पत्ति।

आइए हम गुणांक और फलन के निर्धारण के लिए समीकरणों की एक प्रणाली प्राप्त करें , जो अंकों द्वारा दिए गए फ़ंक्शन का रूट-माध्य-वर्ग सन्निकटन करता है। आइए फ़ंक्शन की रचना करें और इसके लिए आवश्यक चरम शर्त लिखिए:

तब सामान्य प्रणाली रूप लेगी:

अज्ञात मापदंडों के संबंध में समीकरणों की एक रैखिक प्रणाली प्राप्त की और, जिसे आसानी से हल किया जाता है।

सैद्धांतिक पृष्ठभूमि

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एन एसतथा परतालिका में दिए गए हैं।

उनके संरेखण के परिणामस्वरूप, फ़ंक्शन

का उपयोग करते हुए कम से कम वर्ग विधि, इस डेटा को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + बी(पैरामीटर खोजें एतथा बी) पता लगाएँ कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ।

कम से कम वर्गों (OLS) की विधि का सार।

कार्य रैखिक निर्भरता के गुणांकों को खोजना है जिसके लिए दो चर का कार्य एतथा बीसबसे छोटा मान लेता है। यानी दिया गया एतथा बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के विचलन के वर्गों का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण का समाधान दो चरों के एक फ़ंक्शन के चरम को खोजने के लिए कम हो गया है।

गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।

दो अज्ञात के साथ दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। फ़ंक्शन के आंशिक व्युत्पन्न खोजें चर द्वारा एतथा बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए प्रतिस्थापन विधिया क्रैमर की विधि) और हम कम से कम वर्गों (OLS) की विधि द्वारा गुणांक खोजने के लिए सूत्र प्राप्त करते हैं।

डेटा के साथ एतथा बीसमारोह सबसे छोटा मान लेता है। इस तथ्य का प्रमाण पृष्ठ के अंत में पाठ में नीचे दिया गया है।

यह पूरी तरह से कम से कम वर्ग विधि है। पैरामीटर खोजने के लिए सूत्र एरकम शामिल है,,, और पैरामीटर एन- प्रयोगात्मक डेटा की मात्रा। हम इन राशियों के मूल्यों की अलग से गणना करने की सलाह देते हैं।

गुणक बीगणना के बाद है ए.

मूल उदाहरण को याद करने का समय आ गया है।

समाधान।

हमारे उदाहरण में एन = 5... वांछित गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका में भरते हैं।

तालिका की चौथी पंक्ति के मान दूसरी पंक्ति के मानों को प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम कॉलम में मान मानों की पंक्ति योग हैं।

हम गुणांक ज्ञात करने के लिए अल्पतम वर्ग विधि के सूत्रों का उपयोग करते हैं एतथा बी... हम उनमें तालिका के अंतिम कॉलम से संबंधित मानों को प्रतिस्थापित करते हैं:

अत, वाई = 0.165x + 2.184आवश्यक सन्निकटन सीधी रेखा है।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ वाई = 0.165x + 2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाता है।

कम से कम वर्ग विधि की त्रुटि का अनुमान।

ऐसा करने के लिए, आपको इन पंक्तियों से प्रारंभिक डेटा के विचलन के वर्गों के योग की गणना करने की आवश्यकता है तथा , छोटा मान उस रेखा से मेल खाता है जो कम से कम वर्ग विधि के अर्थ में मूल डेटा का बेहतर अनुमान लगाती है।

तब से सीधे वाई = 0.165x + 2.184मूल डेटा का बेहतर अनुमान लगाता है।

कम से कम वर्ग (mns) की विधि का चित्रमय चित्रण।

सब कुछ रेखांकन पर पूरी तरह से दिखाई देता है। लाल रेखा पाई जाने वाली सीधी रेखा है वाई = 0.165x + 2.184, नीली रेखा है , गुलाबी बिंदु कच्चे डेटा हैं।

यह किस लिए है, ये सभी अनुमान किस लिए हैं?

मैं व्यक्तिगत रूप से डेटा स्मूथिंग, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं की समस्याओं को हल करने के लिए उपयोग करता हूं (मूल उदाहरण में, आपने प्रेक्षित मूल्य का मूल्य खोजने के लिए कहा होगा) आपपर एक्स = 3या कि एक्स = 6ओएलएस विधि द्वारा)। लेकिन हम इसके बारे में साइट के दूसरे भाग में बाद में और विस्तार से बात करेंगे।

पेज के ऊपर पुन: लौटिए

सबूत।

ताकि जब मिले एतथा बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था। आइए इसे दिखाते हैं।

दूसरे क्रम के अंतर का रूप है:

अर्थात्

इसलिए, द्विघात रूप के मैट्रिक्स का रूप है

और तत्वों का मान निर्भर नहीं करता एतथा बी.

आइए हम दिखाते हैं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए कॉर्नर माइनर्स का पॉजिटिव होना जरूरी है।

पहले क्रम का कोना माइनर ... असमानता सख्त है, क्योंकि अंक मेल नहीं खाते। आगे हम इसका क्या अर्थ निकालेंगे।

दूसरे क्रम का कोना माइनर

आइए साबित करें कि गणितीय प्रेरण की विधि द्वारा।

उत्पादन: पाया मान एतथा बीसबसे छोटे फ़ंक्शन मान के अनुरूप हों इसलिए, न्यूनतम वर्ग विधि के लिए आवश्यक पैरामीटर हैं।

यह पता लगाने का समय नहीं है?
समाधान का आदेश दें

पेज के ऊपर पुन: लौटिए

कम से कम वर्ग विधि का उपयोग करके पूर्वानुमान विकसित करना। समस्या को हल करने का एक उदाहरण

एक्सट्रपलेशन वैज्ञानिक अनुसंधान की एक विधि है, जो पूर्वानुमान वस्तु के भविष्य के विकास के लिए अतीत और वर्तमान प्रवृत्तियों, पैटर्न, कनेक्शन के प्रसार पर आधारित है। एक्सट्रपलेशन विधियों में शामिल हैं चलती औसत विधि, घातीय चौरसाई विधि, कम से कम वर्ग विधि।

तत्व कम से कम वर्ग विधि प्रेक्षित और परिकलित मानों के बीच मानक विचलनों के योग को न्यूनतम करना शामिल है। परिकलित मान फिट किए गए समीकरण के अनुसार पाए जाते हैं - प्रतिगमन समीकरण। वास्तविक मानों और परिकलित मानों के बीच की दूरी जितनी छोटी होगी, प्रतिगमन समीकरण के आधार पर पूर्वानुमान उतना ही सटीक होगा।

अध्ययन के तहत घटना के सार का सैद्धांतिक विश्लेषण, जिसमें परिवर्तन एक समय श्रृंखला द्वारा प्रदर्शित किया जाता है, वक्र चुनने के आधार के रूप में कार्य करता है। कभी-कभी श्रृंखला के स्तरों की वृद्धि की प्रकृति के बारे में विचार किया जाता है। इसलिए, यदि उत्पादन में वृद्धि एक अंकगणितीय प्रगति में अपेक्षित है, तो एक सीधी रेखा के साथ चौरसाई किया जाता है। यदि यह पता चलता है कि विकास घातीय है, तो घातीय कार्य के अनुसार चौरसाई किया जाना चाहिए।

कम से कम वर्ग वर्किंग फॉर्मूला : वाई टी + 1 = ए * एक्स + बी, जहां t + 1 पूर्वानुमान अवधि है; t + 1 - अनुमानित संकेतक; ए और बी - गुणांक; X समय का प्रतीक है।

गुणांक ए और बी की गणना निम्नलिखित सूत्रों के अनुसार की जाती है:

जहाँ, Uf - कई गतिकी के वास्तविक मान; n समय श्रृंखला में स्तरों की संख्या है;

कम से कम वर्ग विधि द्वारा समय श्रृंखला को चौरसाई करना अध्ययन के तहत घटना के विकास के पैटर्न को प्रतिबिंबित करने का कार्य करता है। प्रवृत्ति की विश्लेषणात्मक अभिव्यक्ति में, समय को एक स्वतंत्र चर माना जाता है, और श्रृंखला के स्तर इस स्वतंत्र चर के कार्य के रूप में कार्य करते हैं।

किसी घटना का विकास इस बात पर निर्भर नहीं करता है कि शुरुआती क्षण से कितने साल बीत चुके हैं, बल्कि इस बात पर निर्भर करता है कि उसके विकास को किन कारकों ने प्रभावित किया, किस दिशा में और किस तीव्रता से। इसलिए, यह स्पष्ट है कि समय में एक घटना का विकास इन कारकों की कार्रवाई के परिणामस्वरूप प्रकट होता है।

वक्र के प्रकार को सही ढंग से स्थापित करना, समय पर विश्लेषणात्मक निर्भरता का प्रकार पूर्व-पूर्वानुमान विश्लेषण के सबसे कठिन कार्यों में से एक है। .

प्रवृत्ति का वर्णन करने वाले फ़ंक्शन के प्रकार का चयन, जिनमें से पैरामीटर कम से कम वर्ग विधि द्वारा निर्धारित किए जाते हैं, ज्यादातर मामलों में अनुभवजन्य रूप से, कई कार्यों का निर्माण करके और उन्हें एक दूसरे के साथ माध्य वर्ग त्रुटि के मूल्य से तुलना करके किया जाता है। सूत्र द्वारा गणना:

जहाँ Uf - कई गतिकी के वास्तविक मूल्य; उर - कई गतिकी के परिकलित (चिकना) मान; n समय श्रृंखला में स्तरों की संख्या है; p प्रवृत्ति (विकास की प्रवृत्ति) का वर्णन करने वाले सूत्रों में परिभाषित मापदंडों की संख्या है।

कम से कम वर्ग विधि के नुकसान :

गणितीय समीकरण का उपयोग करके अध्ययन की गई आर्थिक घटना का वर्णन करने का प्रयास करते समय, पूर्वानुमान थोड़े समय के लिए सटीक होगा और नई जानकारी उपलब्ध होने पर प्रतिगमन समीकरण की पुनर्गणना की जानी चाहिए;
प्रतिगमन समीकरण के चयन की जटिलता, जो विशिष्ट कंप्यूटर प्रोग्राम का उपयोग करते समय हल करने योग्य है।

पूर्वानुमान विकसित करने के लिए कम से कम वर्ग विधि का उपयोग करने का एक उदाहरण

टास्क ... इस क्षेत्र में बेरोजगारी दर को दर्शाने वाला डेटा है,%

निम्न विधियों का उपयोग करके नवंबर, दिसंबर, जनवरी महीनों के लिए क्षेत्र में बेरोजगारी दर का पूर्वानुमान बनाएं: मूविंग एवरेज, एक्सपोनेंशियल स्मूथिंग, कम से कम वर्ग।
प्रत्येक विधि का उपयोग करके प्राप्त भविष्यवाणियों की त्रुटियों की गणना करें।
परिणामों की तुलना करें, निष्कर्ष निकालें।

कम से कम वर्ग समाधान

समस्या को हल करने के लिए, हम एक तालिका तैयार करेंगे जिसमें हम आवश्यक गणना करेंगे:

= २८.६३ / १० = २.८६% पूर्वानुमान सटीकताउच्च।

उत्पादन : गणना में प्राप्त परिणामों की तुलना चलती औसत विधि , घातांक सुगम करना और कम से कम वर्ग विधि से, हम कह सकते हैं कि घातीय चौरसाई विधि द्वारा गणना में औसत सापेक्ष त्रुटि 20-50% की सीमा के भीतर आती है। इसका मतलब है कि इस मामले में पूर्वानुमान की सटीकता केवल संतोषजनक है।

पहले और तीसरे मामलों में, पूर्वानुमान सटीकता अधिक है, क्योंकि औसत सापेक्ष त्रुटि 10% से कम है। लेकिन मूविंग एवरेज की विधि ने अधिक विश्वसनीय परिणाम प्राप्त करना संभव बना दिया (नवंबर के लिए पूर्वानुमान - 1.52%, दिसंबर के लिए पूर्वानुमान - 1.53%, जनवरी के लिए पूर्वानुमान - 1.49%), क्योंकि इस पद्धति का उपयोग करते समय औसत सापेक्ष त्रुटि सबसे छोटी है - 1,13%।

कम से कम वर्ग विधि

इस विषय पर अन्य लेख:

प्रयुक्त स्रोतों की सूची

सामाजिक जोखिमों और पूर्वानुमान चुनौतियों, खतरों और सामाजिक परिणामों के निदान पर वैज्ञानिक और पद्धति संबंधी सिफारिशें। रूसी राज्य सामाजिक विश्वविद्यालय। मास्को। 2010;
व्लादिमीरोवा एल.पी. बाजार की स्थितियों में पूर्वानुमान और योजना: पाठ्यपुस्तक। भत्ता। एम।: पब्लिशिंग हाउस "दशकोव एंड कंपनी", 2001;
नोविकोवा एन.वी., पॉज़्डीवा ओ.जी. राष्ट्रीय अर्थव्यवस्था का पूर्वानुमान: अध्ययन गाइड। येकातेरिनबर्ग: यूराल पब्लिशिंग हाउस। राज्य अर्थव्यवस्था। विश्वविद्यालय, 2007;
स्लटस्किन एल.एन. व्यापार में पूर्वानुमान पर एमबीए पाठ्यक्रम। एम।: अल्पना बिजनेस बुक्स, 2006।

ओएलएस कार्यक्रम

डेटा दर्ज करें

डेटा और सन्निकटन वाई = ए + बी एक्स

मैं- प्रायोगिक बिंदु संख्या;
एक्स मैं- बिंदु पर निश्चित पैरामीटर का मान मैं;
यी- बिंदु पर मापा पैरामीटर का मान मैं;
मैं- एक बिंदु पर माप का वजन मैं;
वाई मैं, कैल्क।- प्रतिगमन मूल्य द्वारा मापा और परिकलित के बीच का अंतर आपबिंदु पर मैं;
एस एक्स मैं (एक्स मैं)- त्रुटि अनुमान एक्स मैंमापते समय आपबिंदु पर मैं.

डेटा और सन्निकटन वाई = के एक्स

मैं	एक्स मैं	यी	मैं	वाई मैं, कैल्क।	मैं	एस एक्स मैं (एक्स मैं)

ग्राफ पर क्लिक करें,

बहुराष्ट्रीय कंपनी ऑनलाइन कार्यक्रम के उपयोगकर्ता के लिए निर्देश।

डेटा फ़ील्ड में, प्रत्येक अलग लाइन पर एक ही परीक्षण बिंदु पर `x` और` y` मान दर्ज करें। मानों को एक व्हाइटस्पेस वर्ण (स्पेस या टैब) से अलग किया जाना चाहिए।

तीसरा मान बिंदु `w` का भार हो सकता है। यदि बिंदु भार निर्दिष्ट नहीं है, तो यह एक के बराबर है। अधिकांश मामलों में, प्रायोगिक बिंदुओं के भार अज्ञात हैं या गणना नहीं की गई है, अर्थात। सभी प्रायोगिक डेटा को समतुल्य माना जाता है। कभी-कभी मूल्यों की जांच की गई सीमा में वजन बिल्कुल समान नहीं होते हैं और सैद्धांतिक रूप से भी गणना की जा सकती है। उदाहरण के लिए, स्पेक्ट्रोफोटोमेट्री में, वजन की गणना सरल सूत्रों का उपयोग करके की जा सकती है, हालांकि मूल रूप से हर कोई श्रम लागत को कम करने के लिए इसकी उपेक्षा करता है।

डेटा को क्लिपबोर्ड के माध्यम से ऑफिस सूट स्प्रेडशीट जैसे माइक्रोसॉफ्ट ऑफिस से एक्सेल या ओपन ऑफिस से कैल्क से चिपकाया जा सकता है। ऐसा करने के लिए, स्प्रैडशीट में, कॉपी किए जाने वाले डेटा की श्रेणी का चयन करें, क्लिपबोर्ड पर कॉपी करें और डेटा को इस पृष्ठ पर डेटा फ़ील्ड में पेस्ट करें।

कम से कम वर्गों की विधि द्वारा गणना के लिए, दो गुणांक निर्धारित करने के लिए कम से कम दो बिंदुओं की आवश्यकता होती है `बी` - सीधी रेखा के ढलान के स्पर्शक और `ए` - मूल्य को सीधी रेखा से काट दिया जाता है `y` एक्सिस।

गणना किए गए प्रतिगमन गुणांक की त्रुटि का अनुमान लगाने के लिए, आपको दो से अधिक प्रयोगात्मक बिंदुओं की संख्या निर्धारित करने की आवश्यकता है।

कम से कम वर्ग विधि (OLS)।

प्रायोगिक बिंदुओं की संख्या जितनी अधिक होगी, गुणांकों का सांख्यिकीय अनुमान उतना ही सटीक होगा (छात्र के गुणांक में कमी के कारण) और सामान्य नमूने के अनुमान के करीब अनुमान।

प्रत्येक प्रायोगिक बिंदु पर मूल्य प्राप्त करना अक्सर श्रम गहन होता है, इसलिए अक्सर प्रयोगों की संख्या में एक व्यापार-बंद होता है जो एक सुपाच्य अनुमान देता है और अत्यधिक श्रम लागत का कारण नहीं बनता है। एक नियम के रूप में, दो गुणांक वाले रैखिक कम से कम वर्ग निर्भरता के लिए प्रायोगिक बिंदुओं की संख्या 5-7 अंक के क्षेत्र में चयन करती है।

रैखिक निर्भरता के लिए कम से कम वर्गों की विधि का संक्षिप्त सिद्धांत

मान लीजिए कि हमारे पास प्रयोगात्मक डेटा का एक सेट है जो मूल्यों के जोड़े के रूप में है [`y_i`,` x_i`], जहां `i` 1 से` n` तक एक प्रयोगात्मक माप की संख्या है; `y_i` - बिंदु पर मापे गए मान का मान` i`; `x_i` - उस पैरामीटर का मान जिसे हम बिंदु `i` पर सेट करते हैं।

एक उदाहरण के रूप में, ओम के नियम के संचालन पर विचार करें। विद्युत परिपथ के वर्गों के बीच वोल्टेज (संभावित अंतर) को बदलकर, हम इस खंड से गुजरने वाली धारा की मात्रा को मापते हैं। भौतिकी हमें प्रयोगात्मक रूप से मिली निर्भरता देता है:

`मैं = यू / आर`,
जहां `मैं` - वर्तमान ताकत; `आर` - प्रतिरोध; `यू` - वोल्टेज।

इस मामले में, `y_i` मापा गया वर्तमान मान है, और` x_i` वोल्टेज मान है।

एक अन्य उदाहरण के रूप में, किसी विलयन में किसी पदार्थ के विलयन द्वारा प्रकाश के अवशोषण पर विचार करें। रसायन विज्ञान हमें सूत्र देता है:

`ए = ε एल सी`,
जहाँ `A` विलयन का प्रकाशिक घनत्व है; `ε` विलेय का संप्रेषण है; `एल` - पथ की लंबाई जब प्रकाश एक समाधान के साथ एक क्युवेट से गुजरता है; `C` - विलेय की सांद्रता।

इस मामले में, `y_i` हमारे पास ऑप्टिकल घनत्व का मापा मूल्य है `ए`, और `x_i` हमारे द्वारा निर्धारित पदार्थ की एकाग्रता का मूल्य है।

हम उस मामले पर विचार करेंगे जब `x_i` सेट करने में सापेक्ष त्रुटि `y_i` को मापने में सापेक्ष त्रुटि से बहुत कम है। हम यह भी मानेंगे कि सभी मापा मान `y_i` यादृच्छिक हैं और सामान्य रूप से वितरित हैं, अर्थात। सामान्य वितरण कानून का पालन करें।

x पर `y` की रैखिक निर्भरता के मामले में, हम एक सैद्धांतिक निर्भरता लिख सकते हैं:
`वाई = ए + बी एक्स`।

एक ज्यामितीय दृष्टिकोण से, गुणांक `बी` रेखा के झुकाव के कोण के स्पर्शरेखा को` x` अक्ष, और गुणांक `ए` - के मूल्य `y` के चौराहे के बिंदु पर दर्शाता है `y` अक्ष के साथ रेखा (` x = 0` पर)।

प्रतिगमन रेखा के मापदंडों का पता लगाना।

प्रयोग में, 'y_i' के मापा मान वास्तविक जीवन में हमेशा निहित माप त्रुटियों के कारण सैद्धांतिक सीधी रेखा पर बिल्कुल झूठ नहीं हो सकते हैं। इसलिए, समीकरणों की एक प्रणाली द्वारा एक रैखिक समीकरण का प्रतिनिधित्व किया जाना चाहिए:
`y_i = a + b x_i + _i` (1),
जहां `ε_i` अज्ञात माप त्रुटि है` y` `i`-वें प्रयोग में।

निर्भरता (1) को भी कहते हैं वापसी, अर्थात। सांख्यिकीय महत्व के साथ एक दूसरे से दो मूल्यों की निर्भरता।

निर्भरता को बहाल करने का कार्य प्रायोगिक बिंदुओं [`y_i`,` x_i`] से गुणांक `a` और` b` को खोजना है।

गुणांक ज्ञात करने के लिए `a` तथा` b` आमतौर पर प्रयोग किया जाता है कम से कम वर्ग विधि(ओएलएस)। यह अधिकतम संभावना सिद्धांत का एक विशेष मामला है।

आइए हम (1) को `ε_i = y_i - a - b x_i` के रूप में फिर से लिखें।

तब त्रुटियों के वर्गों का योग होगा
`Φ = sum_ (i = 1) ^ (n) ε_i ^ 2 = sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2`। (2)

कम से कम वर्ग विधि (कम से कम वर्ग विधि) का सिद्धांत योग (2) को पैरामीटर `ए` और` बी` के संबंध में कम करना है.

न्यूनतम तक पहुँच जाता है जब गुणांक के संबंध में योग (2) के आंशिक व्युत्पन्न `a` तथा` b` शून्य के बराबर हैं:
`फ़्रेक (आंशिक Φ) (आंशिक a) = फ़्रेक (आंशिक योग_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (आंशिक a) = 0`
फ़्रेक (आंशिक Φ) (आंशिक b) = फ़्रेक (आंशिक योग_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (आंशिक b) = 0`

डेरिवेटिव का विस्तार करते हुए, हम दो अज्ञात के साथ दो समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_ (i = 1) ^ (n) (2a + 2bx_i - 2y_i) = sum_ (i = 1) ^ (n) (a + bx_i - y_i) = 0`
`sum_ (i = 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) = sum_ (i = 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) = 0`

हम कोष्ठक खोलते हैं और मांगे गए गुणांक से स्वतंत्र राशि को दूसरे आधे हिस्से में स्थानांतरित करते हैं, हम रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_ (i = 1) ^ (n) y_i = a n + b sum_ (i = 1) ^ (n) bx_i
`sum_ (i = 1) ^ (n) x_iy_i = a sum_ (i = 1) ^ (n) x_i + b sum_ (i = 1) ^ (n) x_i ^ 2`

परिणामी प्रणाली को हल करते हुए, हम गुणांक `a` और` b` के लिए सूत्र पाते हैं:

`ए = फ़्रैक (sum_ (i = 1) ^ (n) y_i sum_ (i = 1) ^ (n) x_i ^ 2 - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n) ) x_iy_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.1)

`बी = फ़्रेक (एन योग_ (i = 1) ^ (एन) x_iy_i - योग_ (i = 1) ^ (एन) x_i योग_ (i = 1) ^ (एन) y_i) (एन योग_ (i = 1) ^ (एन) x_i ^ 2 - (योग_ (i = 1) ^ (एन) x_i) ^ 2) `(3.2)

इन सूत्रों का समाधान तब होता है जब `n> 1` (रेखा कम से कम 2 बिंदुओं से खींची जा सकती है) और जब निर्धारक `D = n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ) ^ (एन) x_i) ^ 2! = 0`, अर्थात जब प्रयोग में बिंदु `x_i` भिन्न हों (अर्थात जब रेखा लंबवत न हो)।

प्रतीपगमन रेखा के गुणांकों की त्रुटियों का अनुमान

गुणांक `ए` और` बी` की गणना में त्रुटि के अधिक सटीक अनुमान के लिए, बड़ी संख्या में प्रयोगात्मक बिंदुओं का होना वांछनीय है। जब `n = 2`, गुणांकों की त्रुटि का अनुमान लगाना असंभव है, क्योंकि सन्निकटन रेखा स्पष्ट रूप से दो बिंदुओं से होकर गुजरेगी।

यादृच्छिक चर `V` की त्रुटि निर्धारित की जाती है त्रुटियों के संचय का नियम
`S_V ^ 2 = sum_ (i = 1) ^ p (फ़्रेक (आंशिक f) (आंशिक z_i)) ^ 2 S_ (z_i) ^ 2`,
जहां `p` एक त्रुटि `S_ (z_i)` के साथ पैरामीटर की संख्या `z_i` है जो `S_V` त्रुटि को प्रभावित करती है;
`f` - `z_i` पर `V` की निर्भरता का कार्य।

आइए हम गुणांक `a` और` b` . की त्रुटि के लिए त्रुटियों के संचय के नियम को लिखें
`S_a ^ 2 = sum_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) (आंशिक y_i)) ^ 2 S_ (y_i) ^ 2 + योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) ) (आंशिक x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) (आंशिक y_i)) ^ 2 `,
`एस_बी ^ 2 = योग_ (i = 1) ^ (एन) (फ़्रेक (आंशिक बी) (आंशिक y_i)) ^ 2 एस_ (वाई_आई) ^ 2 + योग_ (i = 1) ^ (एन) (फ़्रेक (आंशिक बी) ) (आंशिक x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक b) (आंशिक y_i)) ^ 2 `,
जबसे `S_ (x_i) ^ 2 = 0` (हमने पहले आरक्षण किया था कि `x` की त्रुटि नगण्य है)।

`S_y ^ 2 = S_ (y_i) ^ 2` - माप में त्रुटि (विचरण, मानक विचलन का वर्ग) y`, यह मानते हुए कि त्रुटि `y` के सभी मूल्यों के लिए एक समान है।

प्राप्त व्यंजकों में `a` और` b` की गणना के लिए सूत्रों को प्रतिस्थापित करने पर, हम प्राप्त करते हैं

`S_a ^ 2 = S_y ^ 2 फ़्रेक (sum_ (i = 1) ^ (n) (sum_ (i = 1) ^ (n) x_i ^ 2 - x_i sum_ (i = 1) ^ (n) x_i) ^ 2 ) (डी ^ 2) = एस_वाई ^ 2 फ़्रेक ((एन योग_ (i = 1) ^ (एन) x_i ^ 2 - (योग_ (i = 1) ^ (एन) x_i) ^ 2) योग_ (i = 1) ^ (एन) x_i ^ 2) (डी ^ 2) = एस_वाई ^ 2 फ़्रेक (योग_ (i = 1) ^ (एन) x_i ^ 2) (डी) `(4.1)

`S_b ^ 2 = S_y ^ 2 फ़्रेक (sum_ (i = 1) ^ (n) (n x_i - sum_ (i = 1) ^ (n) x_i) ^ 2) (D ^ 2) = S_y ^ 2 फ़्रैक ( n (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2)) (D ^ 2) = S_y ^ 2 फ़्रेक (n) (D) `(4.2)

अधिकांश वास्तविक जीवन प्रयोगों में, `Sy` मान को नहीं मापा जाता है। ऐसा करने के लिए, योजना के एक या कई बिंदुओं पर कई समानांतर माप (प्रयोग) करना आवश्यक है, जिससे प्रयोग का समय (और संभवतः लागत) बढ़ जाता है। इसलिए, आमतौर पर यह माना जाता है कि प्रतिगमन रेखा से `y` के विचलन को यादृच्छिक माना जा सकता है। इस मामले में विचरण `y` का अनुमान सूत्र द्वारा परिकलित किया जाता है।

`S_y ^ 2 = S_ (y, बाकी) ^ 2 = फ़्रेक (sum_ (i = 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)`।

भाजक `n-2` प्रकट होता है क्योंकि हमने प्रयोगात्मक डेटा के एक ही नमूने के लिए दो गुणांकों की गणना के कारण स्वतंत्रता की डिग्री की संख्या में कमी की है।

इस अनुमान को प्रतिगमन रेखा `S_ (y, बाकी) ^ 2` के सापेक्ष अवशिष्ट विचरण भी कहा जाता है।

गुणांक के महत्व का आकलन छात्र की कसौटी के अनुसार किया जाता है

`t_a = frac (| a |) (S_a)`, `t_b = frac (| b |) (S_b)`

यदि परिकलित मानदंड `t_a`,` t_b` तालिका मानदंड `t (P, n-2)` से कम हैं, तो यह माना जाता है कि संबंधित गुणांक किसी दिए गए प्रायिकता `P` के साथ शून्य से महत्वपूर्ण रूप से भिन्न नहीं है।

एक रैखिक संबंध के विवरण की गुणवत्ता का आकलन करने के लिए, आप फिशर के परीक्षण का उपयोग करके माध्य के सापेक्ष `S_ (y, बाकी) ^ 2` और` S_ (बार y) की तुलना कर सकते हैं।

`एस_ (बार y) = फ़्रेक (योग_ (i = 1) ^ n (y_i - बार y) ^ 2) (n-1) = फ़्रेक (sum_ (i = 1) ^ n (y_i - (sum_ (i =) १) ^ n y_i) / n) ^ २) (n-1) `- विचरण का नमूना अनुमान` y` माध्य के सापेक्ष।

निर्भरता का वर्णन करने के लिए प्रतिगमन समीकरण की प्रभावशीलता का आकलन करने के लिए, फिशर गुणांक की गणना की जाती है
`एफ = एस_ (बार वाई) / एस_ (वाई, बाकी) ^ 2`,
जिसकी तुलना तालिका फिशर गुणांक F (p, n-1, n-2) से की जाती है।

यदि `F> F (P, n-1, n-2)`, निर्भरता के विवरण के बीच का अंतर `y = f (x)` प्रतिगमन समीकरण का उपयोग करते हुए और माध्य का उपयोग करने वाले विवरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है संभावना `पी`। वे। प्रतिगमन माध्य के सापेक्ष `y` के प्रकीर्णन से बेहतर संबंध का वर्णन करता है।

ग्राफ पर क्लिक करें,
तालिका में मान जोड़ने के लिए

कम से कम वर्ग विधि। कम से कम वर्ग विधि को अज्ञात मापदंडों के निर्धारण के रूप में समझा जाता है a, b, c, अपनाई गई कार्यात्मक निर्भरता

कम से कम वर्ग विधि को अज्ञात मापदंडों के निर्धारण के रूप में समझा जाता है ए, बी, सी, ...स्वीकृत कार्यात्मक निर्भरता

वाई = एफ (एक्स, ए, बी, सी, ...),

जो न्यूनतम माध्य वर्ग (विचरण) त्रुटि प्रदान करेगा

, (24)

जहाँ x i, y i - प्रयोग से प्राप्त संख्याओं के युग्मों का एक समूह।

चूंकि कई चर के एक फ़ंक्शन के चरम के लिए शर्त इसके आंशिक डेरिवेटिव के शून्य की समानता की स्थिति है, पैरामीटर ए, बी, सी, ...समीकरणों की प्रणाली से निर्धारित होते हैं:

; ; ; … (25)

यह याद रखना चाहिए कि फ़ंक्शन प्रकार के बाद पैरामीटर का चयन करने के लिए कम से कम वर्ग विधि का उपयोग किया जाता है वाई = एफ (एक्स)परिभाषित।

यदि सैद्धांतिक विचारों से कोई निष्कर्ष निकालना असंभव है कि अनुभवजन्य सूत्र क्या होना चाहिए, तो किसी को दृश्य प्रतिनिधित्व द्वारा निर्देशित किया जाना चाहिए, मुख्य रूप से देखे गए डेटा का ग्राफिकल प्रतिनिधित्व।

व्यवहार में, वे अक्सर निम्न प्रकार के कार्यों तक सीमित होते हैं:

1) रैखिक ;

2) द्विघात a.

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन के अन्य सरल लोगों द्वारा अनुमानित प्रतिनिधित्व की अनुमति देता है। ओएलएस अवलोकनों के प्रसंस्करण में अत्यंत उपयोगी हो सकता है, और यह सक्रिय रूप से दूसरों के माप के परिणामों से कुछ मात्राओं का अनुमान लगाने के लिए उपयोग किया जाता है जिनमें यादृच्छिक त्रुटियां होती हैं। यह आलेख आपको दिखाएगा कि एक्सेल में कम से कम वर्ग गणना कैसे कार्यान्वित करें।

एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण

मान लीजिए कि दो संकेतक एक्स और वाई हैं। इसके अलावा, वाई एक्स पर निर्भर करता है। चूंकि ओएलएस प्रतिगमन विश्लेषण के दृष्टिकोण से हमारे लिए रूचि रखता है (एक्सेल में, इसकी विधियों को अंतर्निहित कार्यों का उपयोग करके कार्यान्वित किया जाता है), तो आपको तुरंत चाहिए एक विशिष्ट समस्या पर विचार करने के लिए आगे बढ़ें।

तो, एक्स को एक किराने की दुकान का खुदरा स्थान होने दें, जिसे वर्ग मीटर में मापा जाता है, और वाई - वार्षिक कारोबार, लाखों रूबल में मापा जाता है।

यह भविष्यवाणी करना आवश्यक है कि यदि किसी विशेष खुदरा स्थान में स्टोर का टर्नओवर (Y) होगा तो उसका क्या होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टाल से अधिक सामान बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लें कि हमारे पास n स्टोर्स के लिए डेटा से निर्मित एक टेबल है।

गणितीय आँकड़ों के अनुसार, कम से कम 5-6 वस्तुओं के डेटा की जांच करने पर परिणाम कमोबेश सही होंगे। इसके अलावा, आप "असामान्य" परिणामों का उपयोग नहीं कर सकते। विशेष रूप से, एक कुलीन छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े रिटेल आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।

विधि सार

तालिका डेटा को कार्तीय तल पर बिंदुओं M 1 (x 1, y 1),… M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन के लिए कम हो जाएगा, जिसमें एक ग्राफ जितना संभव हो सके बिंदुओं M 1, M 2, .. M n के करीब से गुजर रहा हो।

बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि यह भी गलत है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसे आपको पता लगाने की आवश्यकता है। सबसे उचित समाधान सीधी रेखा y = ax + b को खोजना है, जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाता है, या इसके बजाय, गुणांक - ए और बी।

शुद्धता मूल्यांकन

किसी भी सन्निकटन के लिए, उसकी शुद्धता के आकलन का विशेष महत्व है। आइए हम बिंदु x i के लिए कार्यात्मक और प्रायोगिक मूल्यों के बीच अंतर (विचलन) को e i द्वारा निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, सन्निकटन की सटीकता का अनुमान लगाने के लिए, विचलन के योग का उपयोग किया जा सकता है, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, सबसे छोटे मान वाले को वरीयता दी जानी चाहिए सभी बिंदुओं पर विचाराधीन योग। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ, नकारात्मक व्यावहारिक रूप से मौजूद होंगे।

विचलन या उनके वर्गों के मॉड्यूल का उपयोग करके समस्या को हल किया जा सकता है। बाद की विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण शामिल है (एक्सेल इसे दो अंतर्निहित कार्यों के साथ लागू करता है), और लंबे समय से इसके लायक साबित हुआ है।

कम से कम वर्ग विधि

एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित श्रेणी में स्थित सभी मानों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, हमें व्यंजक के मान की गणना करने से कोई नहीं रोकता है (e 1 2 + e 2 2 + e 3 2 + ... e n 2)।

गणितीय संकेतन में, ऐसा लगता है:

चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित करने के लिए किया गया था, हमारे पास है:

इस प्रकार, एक्स और वाई की मात्राओं की विशिष्ट निर्भरता का सबसे अच्छा वर्णन करने वाली सीधी रेखा को खोजने की समस्या दो चर के न्यूनतम फ़ंक्शन की गणना करने के लिए कम हो जाती है:

इसके लिए नए चर ए और बी के संबंध में आंशिक डेरिवेटिव को शून्य करने की आवश्यकता है, और एक आदिम प्रणाली को हल करना जिसमें दो अज्ञात फॉर्म के साथ दो समीकरण शामिल हैं:

कुछ सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेर-फेर करना शामिल है, हम प्राप्त करते हैं:

इसे हल करना, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, अर्थात, यह अनुमान लगाने के लिए कि किसी निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको एक सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के लिए क्रेडिट पर स्टोर खरीदने से भुगतान होगा।

एक्सेल में कम से कम वर्ग विधि कैसे लागू करें

एक्सेल में ओएलएस मान की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: "TREND" (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक।)। आइए एक्सेल में ओएलएस की गणना के लिए हमारी तालिका में सूत्र लागू करें।

ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि द्वारा गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिह्न दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

वाई के लिए ज्ञात मूल्यों की श्रेणी (इस मामले में, टर्नओवर के लिए डेटा);
रेंज x 1,… x n, यानी रिटेल स्पेस का आकार;
और x के ज्ञात और अज्ञात मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाना होगा (वर्कशीट पर उनके स्थान की जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में बूलियन चर "कॉन्स्ट" होता है। यदि आप संबंधित क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि गणना की जानी चाहिए, यह मानते हुए कि बी = 0।

यदि आपको x के एक से अधिक मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको कीबोर्ड पर "Shift" + "Control" + "Enter" संयोजन टाइप करना होगा। ("प्रवेश करना")।

कुछ सुविधाएं

प्रतिगमन विश्लेषण डमी के लिए भी उपलब्ध हो सकता है। अज्ञात चरों की एक सरणी के मूल्य की भविष्यवाणी करने के लिए एक्सेल का सूत्र - "ट्रेंड" - उन लोगों द्वारा भी उपयोग किया जा सकता है जिन्होंने कम से कम वर्गों की विधि के बारे में कभी नहीं सुना है। उसके काम की कुछ विशेषताओं को जानने के लिए बस इतना ही काफी है। विशेष रूप से:

यदि आप y चर के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में व्यवस्थित करते हैं, तो ज्ञात x मानों वाली प्रत्येक पंक्ति (स्तंभ) को प्रोग्राम द्वारा एक अलग चर के रूप में माना जाएगा।
यदि ज्ञात x के साथ एक श्रेणी "ट्रेंड" विंडो में निर्दिष्ट नहीं है, तो यदि एक्सेल में फ़ंक्शन का उपयोग किया जाता है, तो प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या निर्दिष्ट मानों के साथ श्रेणी से मेल खाती है। वाई चर के।
आउटपुट के रूप में "अनुमानित" मानों की एक सरणी प्राप्त करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
यदि x के नए मान निर्दिष्ट नहीं हैं, तो "TREND" फ़ंक्शन उन्हें ज्ञात मान के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुरूप होना चाहिए।
ज्ञात x मानों वाली एक सरणी में कई चर हो सकते हैं। हालांकि, अगर हम केवल एक के बारे में बात कर रहे हैं, तो x और y के दिए गए मानों के साथ श्रेणियों का अनुरूप होना आवश्यक है। एकाधिक चर के मामले में, आप चाहते हैं कि दिए गए y मानों वाली श्रेणी एक कॉलम या एक पंक्ति में फ़िट हो।

पूर्वानुमान समारोह

इसे कई कार्यों के साथ कार्यान्वित किया जाता है। उनमें से एक को "पूर्वानुमान" कहा जाता है। यह "TREND" के समान है, अर्थात यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y मान अज्ञात है।

अब आप एक्सेल में डमी के लिए सूत्रों को जानते हैं जो आपको एक रैखिक प्रवृत्ति के अनुसार किसी दिए गए संकेतक के भविष्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

प्रतिगमन समारोह के प्रकार को चुनने के बाद, अर्थात। एक्स (या वाई पर एक्स) पर वाई की निर्भरता के माना मॉडल का प्रकार, उदाहरण के लिए, एक रैखिक मॉडल y x = a + bx, मॉडल के गुणांक के विशिष्ट मूल्यों को निर्धारित करना आवश्यक है।

ए और बी के विभिन्न मूल्यों के लिए, yx = a + bx के रूप की अनंत संख्या में निर्भरताएं बनाई जा सकती हैं, अर्थात समन्वय विमान पर अनंत संख्या में सीधी रेखाएं होती हैं, लेकिन हमें ऐसी निर्भरता की आवश्यकता होती है कि सबसे अच्छे तरीके से देखे गए मूल्यों से मेल खाता है। इस प्रकार, कार्य को सर्वोत्तम गुणांक के चयन के लिए कम कर दिया गया है।

हम उपलब्ध प्रेक्षणों की एक निश्चित संख्या से ही आगे बढ़ते हुए रैखिक फलन a + bx की खोज करते हैं। प्रेक्षित मानों के लिए सबसे उपयुक्त फलन ज्ञात करने के लिए, हम अल्पतम वर्ग विधि का उपयोग करते हैं।

निरूपित करें: Y i वह मान है जिसकी गणना समीकरण Y i = a + bx i के अनुसार की जाती है। y i मापा गया मान है, i = y i -Y i समीकरण के अनुसार मापा और परिकलित मानों के बीच का अंतर है, i = y i -a-bx i.

न्यूनतम वर्ग विधि के लिए i की आवश्यकता होती है, मापा y i और परिकलित Y i मानों के बीच का अंतर न्यूनतम होना चाहिए। इसलिए, हम गुणांक ए और बी पाते हैं ताकि प्रतिगमन की सीधी रेखा पर मूल्यों से देखे गए मूल्यों के विचलन के वर्गों का योग सबसे छोटा हो:

तर्कों के इस कार्य की खोज करना और डेरिवेटिव की मदद से चरम के लिए, कोई यह साबित कर सकता है कि यदि गुणांक ए और बी सिस्टम के समाधान हैं तो फ़ंक्शन न्यूनतम मान लेता है:

(2)

यदि हम सामान्य समीकरणों के दोनों पक्षों को n से विभाजित करते हैं, तो हमें प्राप्त होता है:

उस पर विचार करना (3)

हम पाते हैं , यहाँ से, a के मान को पहले समीकरण में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

इस मामले में, b को समाश्रयण गुणांक कहा जाता है; a को समाश्रयण समीकरण का मुक्त पद कहा जाता है और इसकी गणना सूत्र द्वारा की जाती है:

परिणामी सीधी रेखा सैद्धांतिक प्रतिगमन रेखा के लिए एक अनुमान है। हमारे पास है:

इसलिए, एक रैखिक प्रतिगमन समीकरण है।

प्रतिगमन प्रत्यक्ष (बी> 0) और उलटा (बी उदाहरण 1 हो सकता है। एक्स और वाई के मूल्यों को मापने के परिणाम तालिका में दिए गए हैं:

एक्स मैं	-2	0	1	2	4
यी	0.5	1	1.5	2	3

यह मानते हुए कि X और Y के बीच एक रैखिक संबंध y = a + bx है, न्यूनतम वर्ग विधि का उपयोग करके गुणांक a और b निर्धारित करें।

समाधान। यहाँ n = 5
एक्स आई = -2 + 0 + 1 + 2 + 4 = 5;
x मैं २ = ४ + ० + १ + ४ + १६ = २५
x i y i = -2 0.5 + 0 1 + 1 1.5 + 2 2 + 4 3 = 16.5
वाई मैं = 0.5 + 1 + 1.5 + 2 + 3 = 8

और सामान्य प्रणाली (2) का रूप है

इस प्रणाली को हल करने पर, हम प्राप्त करते हैं: b = 0.425, a = 1.175। इसलिए, y = 1.175 + 0.425x।

उदाहरण 2. आर्थिक संकेतकों (एक्स) और (वाई) के 10 अवलोकनों का एक नमूना है।

एक्स मैं	180	172	173	169	175	170	179	170	167	174
यी	186	180	176	171	182	166	182	172	169	177

नमूना Y-X प्रतिगमन समीकरण को खोजना आवश्यक है। Y-X नमूना प्रतिगमन रेखा को प्लॉट करें।

समाधान। 1. आइए डेटा को x i और y i के मानों से सॉर्ट करें। हमें एक नई तालिका मिलती है:

एक्स मैं	167	169	170	170	172	173	174	175	179	180
यी	169	171	166	172	180	176	177	182	182	186

गणनाओं को सरल बनाने के लिए, हम एक गणना तालिका तैयार करेंगे जिसमें हम आवश्यक संख्यात्मक मान दर्ज करेंगे।

एक्स मैं	यी	एक्स मैं २	एक्स मैं वाई मैं
167	169	27889	28223
169	171	28561	28899
170	166	28900	28220
170	172	28900	29240
172	180	29584	30960
173	176	29929	30448
174	177	30276	30798
175	182	30625	31850
179	182	32041	32578
180	186	32400	33480
x मैं = १७२९	y मैं = १७६१	x मैं २ २९९१०५	x मैं y मैं = ३०४६९६
एक्स = 172.9	वाई = 176.1	x मैं २ = २९९१०.५	xy = ३०४६९.६

सूत्र (4) के अनुसार, हम प्रतिगमन गुणांक की गणना करते हैं

और सूत्र द्वारा (5)

इस प्रकार, प्रतिदर्श समाश्रयण समीकरण y = -59.34 + 1.3804x है।
आइए निर्देशांक तल पर बिंदु (x i; y i) बनाएं और समाश्रयण रेखा को चिह्नित करें।

अंजीर 4

चित्र 4 दिखाता है कि कैसे देखे गए मान प्रतिगमन रेखा के सापेक्ष स्थित हैं। Y i से y i के विचलन के संख्यात्मक मूल्यांकन के लिए, जहां y i मनाया जाता है, और Y i प्रतिगमन द्वारा निर्धारित मान हैं, हम एक तालिका तैयार करेंगे:

एक्स मैं	यी	यी	वाई मैं-वाई मैं
167	169	168.055	-0.945
169	171	170.778	-0.222
170	166	172.140	6.140
170	172	172.140	0.140
172	180	174.863	-5.137
173	176	176.225	0.225
174	177	177.587	0.587
175	182	178.949	-3.051
179	182	184.395	2.395
180	186	185.757	-0.243

Y i मानों की गणना प्रतिगमन समीकरण के अनुसार की जाती है।

प्रतिगमन रेखा से कुछ देखे गए मानों के ध्यान देने योग्य विचलन को कम संख्या में टिप्पणियों द्वारा समझाया गया है। X पर Y की रैखिक निर्भरता की डिग्री का अध्ययन करते समय, टिप्पणियों की संख्या को ध्यान में रखा जाता है। निर्भरता की ताकत सहसंबंध गुणांक के मूल्य से निर्धारित होती है।

कम से कम वर्ग एक रैखिक समीकरण के निर्माण के लिए एक गणितीय प्रक्रिया है जो एक सीधी रेखा के समीकरण में गुणांक, ए और बी के मूल्यों को खोजने के द्वारा क्रमबद्ध जोड़े के एक सेट से सबसे अच्छी तरह मेल खाता है। कम से कम वर्ग विधि का लक्ष्य y और के मानों के बीच कुल चुकता त्रुटि को कम करना है। यदि प्रत्येक बिंदु के लिए हम त्रुटि निर्धारित करते हैं, तो कम से कम वर्ग विधि न्यूनतम होती है:

जहाँ n = रेखा के चारों ओर क्रमित युग्मों की संख्या। डेटा के जितना करीब हो सके।

इस अवधारणा को चित्र में दिखाया गया है।

आंकड़े को देखते हुए, वह रेखा जो डेटा को सबसे अच्छी तरह से फिट करती है, प्रतिगमन रेखा, ग्राफ़ पर चार बिंदुओं की कुल चुकता त्रुटि को कम करती है। मैं आपको दिखाऊंगा कि निम्न उदाहरण में कम से कम वर्ग विधि का उपयोग करके इसे कैसे निर्धारित किया जाए।

एक युवा जोड़े की कल्पना करें जो हाल ही में एक साथ रह रहे हैं और एक साथ बाथरूम वैनिटी टेबल साझा कर रहे हैं। युवक ने नोटिस करना शुरू कर दिया कि उसकी आधी मेज लगातार सिकुड़ रही थी, बालों के मूस और सोया परिसरों से जमीन खो रही थी। पिछले कुछ महीनों से, वह आदमी उस दर पर बारीकी से नज़र रख रहा है जिस पर उसके टेबल पर आइटमों की संख्या बढ़ रही है। नीचे दी गई तालिका से पता चलता है कि पिछले कुछ महीनों में एक लड़की ने बाथरूम की मेज पर कितनी चीजें जमा की हैं।

चूंकि हमारा लक्ष्य यह पता लगाना है कि क्या समय के साथ वस्तुओं की संख्या बढ़ती है, "माह" स्वतंत्र चर होगा, और "वस्तुओं की संख्या" आश्रित चर होगा।

कम से कम वर्गों की विधि का उपयोग करते हुए, हम उस समीकरण को निर्धारित करते हैं जो डेटा के लिए सबसे उपयुक्त है a के मानों की गणना करके, y-अक्ष पर खंड, और b, रेखा का ढलान:

ए = वाई एवी - बीएक्स एवी

जहाँ x av, x का औसत मान है, स्वतंत्र चर, y av, y, स्वतंत्र चर का औसत मान है।

नीचे दी गई तालिका इन समीकरणों के लिए आवश्यक गणनाओं को सारांशित करती है।

हमारे बाथटब उदाहरण के लिए प्रभाव वक्र निम्नलिखित समीकरण द्वारा निर्धारित किया जाएगा:

चूंकि हमारे समीकरण में 0.976 की सकारात्मक ढलान है, आदमी के पास सबूत है कि टेबल पर वस्तुओं की संख्या प्रति माह 1 आइटम की औसत दर से समय के साथ बढ़ती है। ग्राफ क्रमित युग्मों के साथ प्रभाव वक्र दिखाता है।

अगले छह महीनों (महीने 16) में वस्तुओं की संख्या की उम्मीद की गणना निम्नानुसार की जाएगी:

= 5.13 + 0.976x = 5.13 + 0.976 (16) ~ 20.7 = 21 आइटम

तो यह हमारे नायक के लिए कुछ कार्रवाई करने का समय है।

एक्सेल में ट्रेंड फ़ंक्शन

जैसा कि आप शायद पहले ही अनुमान लगा चुके हैं, एक्सेल के पास मूल्य की गणना के लिए एक फ़ंक्शन है कम से कम वर्ग विधि।इस सुविधा को ट्रेंड कहा जाता है। इसका सिंटैक्स इस प्रकार है:

रुझान (ज्ञात Y-मान; ज्ञात X-मान; नए X-मान; स्थिरांक)

ज्ञात Y मान - आश्रित चर की एक सरणी, हमारे मामले में, तालिका में वस्तुओं की संख्या

एक्स के ज्ञात मूल्य - स्वतंत्र चर की एक सरणी, हमारे मामले में यह एक महीना है

नया X मान - नया X (माह) मान जिसके लिए समारोह प्रवृत्तिआश्रित चरों का अपेक्षित मान लौटाता है (वस्तुओं की संख्या)

कॉन्स्ट वैकल्पिक है। एक बूलियन मान जो इंगित करता है कि क्या स्थिरांक b का 0 होना आवश्यक है।

उदाहरण के लिए, उदाहरण 16वें महीने के लिए बाथरूम की मेज पर आइटम की अपेक्षित संख्या निर्धारित करने के लिए उपयोग किए गए TREND फ़ंक्शन को दिखाता है।

विश्लेषण के बारे में वेबसाइट। अपने स्वास्थ्य को बेहतर तरीके से कैसे नियंत्रित करें

कम से कम वर्गों (OLS) की विधि का सार।

गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।

कम से कम वर्ग विधि की त्रुटि का अनुमान।

कम से कम वर्ग (mns) की विधि का चित्रमय चित्रण।

कम से कम वर्ग विधि का उपयोग करके पूर्वानुमान विकसित करना। समस्या को हल करने का एक उदाहरण

पूर्वानुमान विकसित करने के लिए कम से कम वर्ग विधि का उपयोग करने का एक उदाहरण

कम से कम वर्ग विधि

इस विषय पर अन्य लेख:

ओएलएस कार्यक्रम

डेटा दर्ज करें

डेटा और सन्निकटन वाई = ए + बी एक्स

डेटा और सन्निकटन वाई = के एक्स

बहुराष्ट्रीय कंपनी ऑनलाइन कार्यक्रम के उपयोगकर्ता के लिए निर्देश।

कम से कम वर्ग विधि (OLS)।

रैखिक निर्भरता के लिए कम से कम वर्गों की विधि का संक्षिप्त सिद्धांत

प्रतिगमन रेखा के मापदंडों का पता लगाना।

प्रतीपगमन रेखा के गुणांकों की त्रुटियों का अनुमान

एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

विधि सार

शुद्धता मूल्यांकन

कम से कम वर्ग विधि

एक्सेल में कम से कम वर्ग विधि कैसे लागू करें

कुछ सुविधाएं

पूर्वानुमान समारोह

एक्सेल में ट्रेंड फ़ंक्शन

समान लेख