कम से कम वर्ग कार्यपुस्तिका। एक्सेल में कम से कम वर्ग विधि

१०० रुपहला ऑर्डर बोनस

कार्य के प्रकार का चयन करें डिप्लोमा कार्य अवधि कार्य सार मास्टर थीसिस अभ्यास रिपोर्ट लेख रिपोर्ट समीक्षा परीक्षा कार्य मोनोग्राफ समस्या समाधान व्यवसाय योजना प्रश्नों के उत्तर रचनात्मक कार्य निबंध ड्राइंग निबंध अनुवाद प्रस्तुतियाँ टाइपिंग अन्य पाठ की विशिष्टता को बढ़ाना पीएचडी थीसिस प्रयोगशाला कार्य ऑनलाइन सहायता

कीमत पता करें

कम से कम वर्ग विधि एक गणितीय (गणितीय और सांख्यिकीय) तकनीक है जिसका उपयोग समय श्रृंखला को संरेखित करने के लिए किया जाता है, यादृच्छिक चर आदि के बीच सहसंबंध के रूप को प्रकट करने के लिए। इसमें यह तथ्य शामिल है कि इस घटना का वर्णन करने वाला फ़ंक्शन एक सरल फ़ंक्शन द्वारा अनुमानित है। इसके अलावा, बाद वाले को चुना जाता है ताकि संरेखित बिंदुओं से देखे गए बिंदुओं पर फ़ंक्शन के वास्तविक स्तरों का मानक विचलन (विक्षेपण देखें) सबसे छोटा हो।

उदाहरण के लिए, उपलब्ध आंकड़ों के अनुसार ( ग्यारहवीं,यी) (मैं = 1, 2, ..., एन) ऐसा वक्र प्लॉट किया जाता है आप = + बीएक्स, जिस पर विचलन के वर्गों का योग न्यूनतम तक पहुंच जाता है

यानी, दो मापदंडों के आधार पर फ़ंक्शन को छोटा किया जाता है: - निर्देशांक अक्ष पर एक खंड और बी- सीधी रेखा का ढलान।

किसी फ़ंक्शन को छोटा करने के लिए आवश्यक शर्तें देने वाले समीकरण एस(,बी) कहा जाता है सामान्य समीकरण।सन्निकटन कार्यों के रूप में, न केवल रैखिक (एक सीधी रेखा में संरेखण), बल्कि द्विघात, परवलयिक, घातांक, आदि का भी उपयोग किया जाता है। एक सीधी रेखा में समय श्रृंखला के संरेखण के उदाहरण के लिए, चित्र देखें। एम.2, जहां वर्ग दूरी का योग ( आप 1 – मैं 1)2 + (आप 2 – मैं 2) 2 .... सबसे छोटी है, और परिणामी सीधी रेखा समय के साथ कुछ संकेतक के अवलोकनों की गतिशील श्रृंखला की प्रवृत्ति को सर्वोत्तम रूप से दर्शाती है।

ओएलएस अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: यादृच्छिक त्रुटि की गणितीय अपेक्षा, कारकों के संदर्भ में सशर्त, शून्य के बराबर होनी चाहिए। यह स्थिति, विशेष रूप से, संतुष्ट होती है यदि: 1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और 2. कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं। पहली शर्त को हमेशा एक स्थिरांक वाले मॉडल के लिए पूर्ण माना जा सकता है, क्योंकि एक स्थिरांक त्रुटियों की एक गैर-शून्य गणितीय अपेक्षा पर ले जाता है। दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)।

प्रतिगमन समीकरणों के मापदंडों के सांख्यिकीय आकलन के अभ्यास में सबसे आम है कम से कम वर्गों की विधि। यह विधि डेटा की प्रकृति और मॉडल निर्माण के परिणामों के बारे में कई मान्यताओं पर आधारित है। मुख्य हैं आश्रित और स्वतंत्र लोगों में प्रारंभिक चर का एक स्पष्ट विभाजन, समीकरणों में शामिल कारकों की असंबद्धता, रिश्ते की रैखिकता, अवशेषों के स्वत: सहसंबंध की अनुपस्थिति, उनकी गणितीय अपेक्षाओं की समानता शून्य और स्थिर भिन्नता।

मुख्य ओएलएस परिकल्पनाओं में से एक यह धारणा है कि विचलन के प्रसरण समान हैं, अर्थात। श्रृंखला के माध्य (शून्य) मान के आसपास उनका फैलाव एक स्थिर मान होना चाहिए। इस गुण को समरूपता कहते हैं। व्यवहार में, विचलन के विचलन अक्सर समान नहीं होते हैं, अर्थात विषमलैंगिकता देखी जाती है। यह विभिन्न कारणों से हो सकता है। उदाहरण के लिए, मूल डेटा में त्रुटियां संभव हैं। मूल जानकारी में आकस्मिक अशुद्धियाँ, जैसे संख्याओं के क्रम में त्रुटियाँ, परिणामों पर एक ठोस प्रभाव डाल सकती हैं। अक्सर, विचलन का एक बड़ा प्रसार i आश्रित चर (ओं) के बड़े मूल्यों पर मनाया जाता है। यदि डेटा में एक महत्वपूर्ण त्रुटि है, तो स्वाभाविक रूप से, गलत डेटा से गणना किए गए मॉडल मान का विचलन भी बड़ा होगा। इस त्रुटि से छुटकारा पाने के लिए, हमें गणना परिणामों में इन आंकड़ों के योगदान को कम करना होगा, अन्य सभी की तुलना में उनके लिए कम वजन निर्धारित करना होगा। यह विचार भारित ओएलएस में लागू किया गया है।

आइए हम घात 2 के बहुपद के साथ फलन का अनुमान लगाएं। ऐसा करने के लिए, हम समीकरणों की सामान्य प्रणाली के गुणांक की गणना करते हैं:

, ,

आइए कम से कम वर्गों की एक सामान्य प्रणाली की रचना करें, जिसका रूप है:

सिस्टम समाधान खोजना आसान है :,,।

इस प्रकार, दूसरी डिग्री का बहुपद पाया जाता है:।

सैद्धांतिक पृष्ठभूमि

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण 2... एक बहुपद की इष्टतम घात ज्ञात करना।

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण 3... अनुभवजन्य निर्भरता के मापदंडों को खोजने के लिए समीकरणों की सामान्य प्रणाली की व्युत्पत्ति।

आइए हम गुणांक और फलन के निर्धारण के लिए समीकरणों की एक प्रणाली प्राप्त करें , जो अंकों द्वारा दिए गए फ़ंक्शन का रूट-माध्य-वर्ग सन्निकटन करता है। आइए फ़ंक्शन की रचना करें और इसके लिए आवश्यक चरम शर्त लिखिए:

तब सामान्य प्रणाली रूप लेगी:

अज्ञात मापदंडों के संबंध में समीकरणों की एक रैखिक प्रणाली प्राप्त की और, जिसे आसानी से हल किया जाता है।

सैद्धांतिक पृष्ठभूमि

पृष्ठ पर वापस जाएं<Введение в вычислительную математику. Примеры>

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एन एसतथा परतालिका में दिए गए हैं।

उनके संरेखण के परिणामस्वरूप, फ़ंक्शन

का उपयोग करते हुए कम से कम वर्ग विधि, इस डेटा को एक रैखिक निर्भरता के साथ अनुमानित करें वाई = कुल्हाड़ी + बी(पैरामीटर खोजें तथा बी) पता लगाएँ कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ।

कम से कम वर्गों (OLS) की विधि का सार।

कार्य रैखिक निर्भरता के गुणांकों को खोजना है जिसके लिए दो चर का कार्य तथा बीसबसे छोटा मान लेता है। यानी दिया गया तथा बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के विचलन के वर्गों का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण का समाधान दो चरों के एक फ़ंक्शन के चरम को खोजने के लिए कम हो गया है।

गुणांक खोजने के लिए सूत्रों की व्युत्पत्ति।

दो अज्ञात के साथ दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। फ़ंक्शन के आंशिक व्युत्पन्न खोजें चर द्वारा तथा बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि से हल करते हैं (उदाहरण के लिए प्रतिस्थापन विधिया क्रैमर की विधि) और हम कम से कम वर्गों (OLS) की विधि द्वारा गुणांक खोजने के लिए सूत्र प्राप्त करते हैं।

डेटा के साथ तथा बीसमारोह सबसे छोटा मान लेता है। इस तथ्य का प्रमाण पृष्ठ के अंत में पाठ में नीचे दिया गया है।

यह पूरी तरह से कम से कम वर्ग विधि है। पैरामीटर खोजने के लिए सूत्र रकम शामिल है,,, और पैरामीटर एन- प्रयोगात्मक डेटा की मात्रा। हम इन राशियों के मूल्यों की अलग से गणना करने की सलाह देते हैं।

गुणक बीगणना के बाद है .

मूल उदाहरण को याद करने का समय आ गया है।

समाधान।

हमारे उदाहरण में एन = 5... वांछित गुणांक के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका में भरते हैं।

तालिका की चौथी पंक्ति के मान दूसरी पंक्ति के मानों को प्रत्येक संख्या के लिए तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को चुकता करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम कॉलम में मान मानों की पंक्ति योग हैं।

हम गुणांक ज्ञात करने के लिए अल्पतम वर्ग विधि के सूत्रों का उपयोग करते हैं तथा बी... हम उनमें तालिका के अंतिम कॉलम से संबंधित मानों को प्रतिस्थापित करते हैं:

अत, वाई = 0.165x + 2.184आवश्यक सन्निकटन सीधी रेखा है।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ वाई = 0.165x + 2.184या मूल डेटा का बेहतर अनुमान लगाता है, यानी कम से कम वर्ग विधि का उपयोग करके अनुमान लगाता है।

कम से कम वर्ग विधि की त्रुटि का अनुमान।

ऐसा करने के लिए, आपको इन पंक्तियों से प्रारंभिक डेटा के विचलन के वर्गों के योग की गणना करने की आवश्यकता है तथा , छोटा मान उस रेखा से मेल खाता है जो कम से कम वर्ग विधि के अर्थ में मूल डेटा का बेहतर अनुमान लगाती है।

तब से सीधे वाई = 0.165x + 2.184मूल डेटा का बेहतर अनुमान लगाता है।

कम से कम वर्ग (mns) की विधि का चित्रमय चित्रण।

सब कुछ रेखांकन पर पूरी तरह से दिखाई देता है। लाल रेखा पाई जाने वाली सीधी रेखा है वाई = 0.165x + 2.184, नीली रेखा है , गुलाबी बिंदु कच्चे डेटा हैं।

यह किस लिए है, ये सभी अनुमान किस लिए हैं?

मैं व्यक्तिगत रूप से डेटा स्मूथिंग, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं की समस्याओं को हल करने के लिए उपयोग करता हूं (मूल उदाहरण में, आपने प्रेक्षित मूल्य का मूल्य खोजने के लिए कहा होगा) आपपर एक्स = 3या कि एक्स = 6ओएलएस विधि द्वारा)। लेकिन हम इसके बारे में साइट के दूसरे भाग में बाद में और विस्तार से बात करेंगे।

पेज के ऊपर पुन: लौटिए

सबूत।

ताकि जब मिले तथा बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था। आइए इसे दिखाते हैं।

दूसरे क्रम के अंतर का रूप है:

अर्थात्

इसलिए, द्विघात रूप के मैट्रिक्स का रूप है

और तत्वों का मान निर्भर नहीं करता तथा बी.

आइए हम दिखाते हैं कि मैट्रिक्स सकारात्मक निश्चित है। इसके लिए कॉर्नर माइनर्स का पॉजिटिव होना जरूरी है।

पहले क्रम का कोना माइनर ... असमानता सख्त है, क्योंकि अंक मेल नहीं खाते। आगे हम इसका क्या अर्थ निकालेंगे।

दूसरे क्रम का कोना माइनर

आइए साबित करें कि गणितीय प्रेरण की विधि द्वारा।

उत्पादन: पाया मान तथा बीसबसे छोटे फ़ंक्शन मान के अनुरूप हों इसलिए, न्यूनतम वर्ग विधि के लिए आवश्यक पैरामीटर हैं।

यह पता लगाने का समय नहीं है?
समाधान का आदेश दें

पेज के ऊपर पुन: लौटिए

कम से कम वर्ग विधि का उपयोग करके पूर्वानुमान विकसित करना। समस्या को हल करने का एक उदाहरण

एक्सट्रपलेशन वैज्ञानिक अनुसंधान की एक विधि है, जो पूर्वानुमान वस्तु के भविष्य के विकास के लिए अतीत और वर्तमान प्रवृत्तियों, पैटर्न, कनेक्शन के प्रसार पर आधारित है। एक्सट्रपलेशन विधियों में शामिल हैं चलती औसत विधि, घातीय चौरसाई विधि, कम से कम वर्ग विधि।

तत्व कम से कम वर्ग विधि प्रेक्षित और परिकलित मानों के बीच मानक विचलनों के योग को न्यूनतम करना शामिल है। परिकलित मान फिट किए गए समीकरण के अनुसार पाए जाते हैं - प्रतिगमन समीकरण। वास्तविक मानों और परिकलित मानों के बीच की दूरी जितनी छोटी होगी, प्रतिगमन समीकरण के आधार पर पूर्वानुमान उतना ही सटीक होगा।

अध्ययन के तहत घटना के सार का सैद्धांतिक विश्लेषण, जिसमें परिवर्तन एक समय श्रृंखला द्वारा प्रदर्शित किया जाता है, वक्र चुनने के आधार के रूप में कार्य करता है। कभी-कभी श्रृंखला के स्तरों की वृद्धि की प्रकृति के बारे में विचार किया जाता है। इसलिए, यदि उत्पादन में वृद्धि एक अंकगणितीय प्रगति में अपेक्षित है, तो एक सीधी रेखा के साथ चौरसाई किया जाता है। यदि यह पता चलता है कि विकास घातीय है, तो घातीय कार्य के अनुसार चौरसाई किया जाना चाहिए।

कम से कम वर्ग वर्किंग फॉर्मूला : वाई टी + 1 = ए * एक्स + बी, जहां t + 1 पूर्वानुमान अवधि है; t + 1 - अनुमानित संकेतक; ए और बी - गुणांक; X समय का प्रतीक है।

गुणांक ए और बी की गणना निम्नलिखित सूत्रों के अनुसार की जाती है:

जहाँ, Uf - कई गतिकी के वास्तविक मान; n समय श्रृंखला में स्तरों की संख्या है;

कम से कम वर्ग विधि द्वारा समय श्रृंखला को चौरसाई करना अध्ययन के तहत घटना के विकास के पैटर्न को प्रतिबिंबित करने का कार्य करता है। प्रवृत्ति की विश्लेषणात्मक अभिव्यक्ति में, समय को एक स्वतंत्र चर माना जाता है, और श्रृंखला के स्तर इस स्वतंत्र चर के कार्य के रूप में कार्य करते हैं।

किसी घटना का विकास इस बात पर निर्भर नहीं करता है कि शुरुआती क्षण से कितने साल बीत चुके हैं, बल्कि इस बात पर निर्भर करता है कि उसके विकास को किन कारकों ने प्रभावित किया, किस दिशा में और किस तीव्रता से। इसलिए, यह स्पष्ट है कि समय में एक घटना का विकास इन कारकों की कार्रवाई के परिणामस्वरूप प्रकट होता है।

वक्र के प्रकार को सही ढंग से स्थापित करना, समय पर विश्लेषणात्मक निर्भरता का प्रकार पूर्व-पूर्वानुमान विश्लेषण के सबसे कठिन कार्यों में से एक है। .

प्रवृत्ति का वर्णन करने वाले फ़ंक्शन के प्रकार का चयन, जिनमें से पैरामीटर कम से कम वर्ग विधि द्वारा निर्धारित किए जाते हैं, ज्यादातर मामलों में अनुभवजन्य रूप से, कई कार्यों का निर्माण करके और उन्हें एक दूसरे के साथ माध्य वर्ग त्रुटि के मूल्य से तुलना करके किया जाता है। सूत्र द्वारा गणना:

जहाँ Uf - कई गतिकी के वास्तविक मूल्य; उर - कई गतिकी के परिकलित (चिकना) मान; n समय श्रृंखला में स्तरों की संख्या है; p प्रवृत्ति (विकास की प्रवृत्ति) का वर्णन करने वाले सूत्रों में परिभाषित मापदंडों की संख्या है।

कम से कम वर्ग विधि के नुकसान :

  • गणितीय समीकरण का उपयोग करके अध्ययन की गई आर्थिक घटना का वर्णन करने का प्रयास करते समय, पूर्वानुमान थोड़े समय के लिए सटीक होगा और नई जानकारी उपलब्ध होने पर प्रतिगमन समीकरण की पुनर्गणना की जानी चाहिए;
  • प्रतिगमन समीकरण के चयन की जटिलता, जो विशिष्ट कंप्यूटर प्रोग्राम का उपयोग करते समय हल करने योग्य है।

पूर्वानुमान विकसित करने के लिए कम से कम वर्ग विधि का उपयोग करने का एक उदाहरण

टास्क ... इस क्षेत्र में बेरोजगारी दर को दर्शाने वाला डेटा है,%

  • निम्न विधियों का उपयोग करके नवंबर, दिसंबर, जनवरी महीनों के लिए क्षेत्र में बेरोजगारी दर का पूर्वानुमान बनाएं: मूविंग एवरेज, एक्सपोनेंशियल स्मूथिंग, कम से कम वर्ग।
  • प्रत्येक विधि का उपयोग करके प्राप्त भविष्यवाणियों की त्रुटियों की गणना करें।
  • परिणामों की तुलना करें, निष्कर्ष निकालें।

कम से कम वर्ग समाधान

समस्या को हल करने के लिए, हम एक तालिका तैयार करेंगे जिसमें हम आवश्यक गणना करेंगे:

= २८.६३ / १० = २.८६% पूर्वानुमान सटीकताउच्च।

उत्पादन : गणना में प्राप्त परिणामों की तुलना चलती औसत विधि , घातांक सुगम करना और कम से कम वर्ग विधि से, हम कह सकते हैं कि घातीय चौरसाई विधि द्वारा गणना में औसत सापेक्ष त्रुटि 20-50% की सीमा के भीतर आती है। इसका मतलब है कि इस मामले में पूर्वानुमान की सटीकता केवल संतोषजनक है।

पहले और तीसरे मामलों में, पूर्वानुमान सटीकता अधिक है, क्योंकि औसत सापेक्ष त्रुटि 10% से कम है। लेकिन मूविंग एवरेज की विधि ने अधिक विश्वसनीय परिणाम प्राप्त करना संभव बना दिया (नवंबर के लिए पूर्वानुमान - 1.52%, दिसंबर के लिए पूर्वानुमान - 1.53%, जनवरी के लिए पूर्वानुमान - 1.49%), क्योंकि इस पद्धति का उपयोग करते समय औसत सापेक्ष त्रुटि सबसे छोटी है - 1,13%।

कम से कम वर्ग विधि

इस विषय पर अन्य लेख:

प्रयुक्त स्रोतों की सूची

  1. सामाजिक जोखिमों और पूर्वानुमान चुनौतियों, खतरों और सामाजिक परिणामों के निदान पर वैज्ञानिक और पद्धति संबंधी सिफारिशें। रूसी राज्य सामाजिक विश्वविद्यालय। मास्को। 2010;
  2. व्लादिमीरोवा एल.पी. बाजार की स्थितियों में पूर्वानुमान और योजना: पाठ्यपुस्तक। भत्ता। एम।: पब्लिशिंग हाउस "दशकोव एंड कंपनी", 2001;
  3. नोविकोवा एन.वी., पॉज़्डीवा ओ.जी. राष्ट्रीय अर्थव्यवस्था का पूर्वानुमान: अध्ययन गाइड। येकातेरिनबर्ग: यूराल पब्लिशिंग हाउस। राज्य अर्थव्यवस्था। विश्वविद्यालय, 2007;
  4. स्लटस्किन एल.एन. व्यापार में पूर्वानुमान पर एमबीए पाठ्यक्रम। एम।: अल्पना बिजनेस बुक्स, 2006।

ओएलएस कार्यक्रम

डेटा दर्ज करें

डेटा और सन्निकटन वाई = ए + बी एक्स

मैं- प्रायोगिक बिंदु संख्या;
एक्स मैं- बिंदु पर निश्चित पैरामीटर का मान मैं;
यी- बिंदु पर मापा पैरामीटर का मान मैं;
मैं- एक बिंदु पर माप का वजन मैं;
वाई मैं, कैल्क।- प्रतिगमन मूल्य द्वारा मापा और परिकलित के बीच का अंतर आपबिंदु पर मैं;
एस एक्स मैं (एक्स मैं)- त्रुटि अनुमान एक्स मैंमापते समय आपबिंदु पर मैं.

डेटा और सन्निकटन वाई = के एक्स

मैं एक्स मैं यी मैं वाई मैं, कैल्क। मैं एस एक्स मैं (एक्स मैं)

ग्राफ पर क्लिक करें,

बहुराष्ट्रीय कंपनी ऑनलाइन कार्यक्रम के उपयोगकर्ता के लिए निर्देश।

डेटा फ़ील्ड में, प्रत्येक अलग लाइन पर एक ही परीक्षण बिंदु पर `x` और` y` मान दर्ज करें। मानों को एक व्हाइटस्पेस वर्ण (स्पेस या टैब) से अलग किया जाना चाहिए।

तीसरा मान बिंदु `w` का भार हो सकता है। यदि बिंदु भार निर्दिष्ट नहीं है, तो यह एक के बराबर है। अधिकांश मामलों में, प्रायोगिक बिंदुओं के भार अज्ञात हैं या गणना नहीं की गई है, अर्थात। सभी प्रायोगिक डेटा को समतुल्य माना जाता है। कभी-कभी मूल्यों की जांच की गई सीमा में वजन बिल्कुल समान नहीं होते हैं और सैद्धांतिक रूप से भी गणना की जा सकती है। उदाहरण के लिए, स्पेक्ट्रोफोटोमेट्री में, वजन की गणना सरल सूत्रों का उपयोग करके की जा सकती है, हालांकि मूल रूप से हर कोई श्रम लागत को कम करने के लिए इसकी उपेक्षा करता है।

डेटा को क्लिपबोर्ड के माध्यम से ऑफिस सूट स्प्रेडशीट जैसे माइक्रोसॉफ्ट ऑफिस से एक्सेल या ओपन ऑफिस से कैल्क से चिपकाया जा सकता है। ऐसा करने के लिए, स्प्रैडशीट में, कॉपी किए जाने वाले डेटा की श्रेणी का चयन करें, क्लिपबोर्ड पर कॉपी करें और डेटा को इस पृष्ठ पर डेटा फ़ील्ड में पेस्ट करें।

कम से कम वर्गों की विधि द्वारा गणना के लिए, दो गुणांक निर्धारित करने के लिए कम से कम दो बिंदुओं की आवश्यकता होती है `बी` - सीधी रेखा के ढलान के स्पर्शक और `ए` - मूल्य को सीधी रेखा से काट दिया जाता है `y` एक्सिस।

गणना किए गए प्रतिगमन गुणांक की त्रुटि का अनुमान लगाने के लिए, आपको दो से अधिक प्रयोगात्मक बिंदुओं की संख्या निर्धारित करने की आवश्यकता है।

कम से कम वर्ग विधि (OLS)।

प्रायोगिक बिंदुओं की संख्या जितनी अधिक होगी, गुणांकों का सांख्यिकीय अनुमान उतना ही सटीक होगा (छात्र के गुणांक में कमी के कारण) और सामान्य नमूने के अनुमान के करीब अनुमान।

प्रत्येक प्रायोगिक बिंदु पर मूल्य प्राप्त करना अक्सर श्रम गहन होता है, इसलिए अक्सर प्रयोगों की संख्या में एक व्यापार-बंद होता है जो एक सुपाच्य अनुमान देता है और अत्यधिक श्रम लागत का कारण नहीं बनता है। एक नियम के रूप में, दो गुणांक वाले रैखिक कम से कम वर्ग निर्भरता के लिए प्रायोगिक बिंदुओं की संख्या 5-7 अंक के क्षेत्र में चयन करती है।

रैखिक निर्भरता के लिए कम से कम वर्गों की विधि का संक्षिप्त सिद्धांत

मान लीजिए कि हमारे पास प्रयोगात्मक डेटा का एक सेट है जो मूल्यों के जोड़े के रूप में है [`y_i`,` x_i`], जहां `i` 1 से` n` तक एक प्रयोगात्मक माप की संख्या है; `y_i` - बिंदु पर मापे गए मान का मान` i`; `x_i` - उस पैरामीटर का मान जिसे हम बिंदु `i` पर सेट करते हैं।

एक उदाहरण के रूप में, ओम के नियम के संचालन पर विचार करें। विद्युत परिपथ के वर्गों के बीच वोल्टेज (संभावित अंतर) को बदलकर, हम इस खंड से गुजरने वाली धारा की मात्रा को मापते हैं। भौतिकी हमें प्रयोगात्मक रूप से मिली निर्भरता देता है:

`मैं = यू / आर`,
जहां `मैं` - वर्तमान ताकत; `आर` - प्रतिरोध; `यू` - वोल्टेज।

इस मामले में, `y_i` मापा गया वर्तमान मान है, और` x_i` वोल्टेज मान है।

एक अन्य उदाहरण के रूप में, किसी विलयन में किसी पदार्थ के विलयन द्वारा प्रकाश के अवशोषण पर विचार करें। रसायन विज्ञान हमें सूत्र देता है:

`ए = ε एल सी`,
जहाँ `A` विलयन का प्रकाशिक घनत्व है; `ε` विलेय का संप्रेषण है; `एल` - पथ की लंबाई जब प्रकाश एक समाधान के साथ एक क्युवेट से गुजरता है; `C` - विलेय की सांद्रता।

इस मामले में, `y_i` हमारे पास ऑप्टिकल घनत्व का मापा मूल्य है `ए`, और `x_i` हमारे द्वारा निर्धारित पदार्थ की एकाग्रता का मूल्य है।

हम उस मामले पर विचार करेंगे जब `x_i` सेट करने में सापेक्ष त्रुटि `y_i` को मापने में सापेक्ष त्रुटि से बहुत कम है। हम यह भी मानेंगे कि सभी मापा मान `y_i` यादृच्छिक हैं और सामान्य रूप से वितरित हैं, अर्थात। सामान्य वितरण कानून का पालन करें।

x पर `y` की रैखिक निर्भरता के मामले में, हम एक सैद्धांतिक निर्भरता लिख ​​सकते हैं:
`वाई = ए + बी एक्स`।

एक ज्यामितीय दृष्टिकोण से, गुणांक `बी` रेखा के झुकाव के कोण के स्पर्शरेखा को` x` अक्ष, और गुणांक `ए` - के मूल्य `y` के चौराहे के बिंदु पर दर्शाता है `y` अक्ष के साथ रेखा (` x = 0` पर)।

प्रतिगमन रेखा के मापदंडों का पता लगाना।

प्रयोग में, 'y_i' के मापा मान वास्तविक जीवन में हमेशा निहित माप त्रुटियों के कारण सैद्धांतिक सीधी रेखा पर बिल्कुल झूठ नहीं हो सकते हैं। इसलिए, समीकरणों की एक प्रणाली द्वारा एक रैखिक समीकरण का प्रतिनिधित्व किया जाना चाहिए:
`y_i = a + b x_i + _i` (1),
जहां `ε_i` अज्ञात माप त्रुटि है` y` `i`-वें प्रयोग में।

निर्भरता (1) को भी कहते हैं वापसी, अर्थात। सांख्यिकीय महत्व के साथ एक दूसरे से दो मूल्यों की निर्भरता।

निर्भरता को बहाल करने का कार्य प्रायोगिक बिंदुओं [`y_i`,` x_i`] से गुणांक `a` और` b` को खोजना है।

गुणांक ज्ञात करने के लिए `a` तथा` b` आमतौर पर प्रयोग किया जाता है कम से कम वर्ग विधि(ओएलएस)। यह अधिकतम संभावना सिद्धांत का एक विशेष मामला है।

आइए हम (1) को `ε_i = y_i - a - b x_i` के रूप में फिर से लिखें।

तब त्रुटियों के वर्गों का योग होगा
`Φ = sum_ (i = 1) ^ (n) ε_i ^ 2 = sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2`। (2)

कम से कम वर्ग विधि (कम से कम वर्ग विधि) का सिद्धांत योग (2) को पैरामीटर `ए` और` बी` के संबंध में कम करना है.

न्यूनतम तक पहुँच जाता है जब गुणांक के संबंध में योग (2) के आंशिक व्युत्पन्न `a` तथा` b` शून्य के बराबर हैं:
`फ़्रेक (आंशिक Φ) (आंशिक a) = फ़्रेक (आंशिक योग_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (आंशिक a) = 0`
फ़्रेक (आंशिक Φ) (आंशिक b) = फ़्रेक (आंशिक योग_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (आंशिक b) = 0`

डेरिवेटिव का विस्तार करते हुए, हम दो अज्ञात के साथ दो समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_ (i = 1) ^ (n) (2a + 2bx_i - 2y_i) = sum_ (i = 1) ^ (n) (a + bx_i - y_i) = 0`
`sum_ (i = 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) = sum_ (i = 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) = 0`

हम कोष्ठक खोलते हैं और मांगे गए गुणांक से स्वतंत्र राशि को दूसरे आधे हिस्से में स्थानांतरित करते हैं, हम रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:
`sum_ (i = 1) ^ (n) y_i = a n + b sum_ (i = 1) ^ (n) bx_i
`sum_ (i = 1) ^ (n) x_iy_i = a sum_ (i = 1) ^ (n) x_i + b sum_ (i = 1) ^ (n) x_i ^ 2`

परिणामी प्रणाली को हल करते हुए, हम गुणांक `a` और` b` के लिए सूत्र पाते हैं:

`ए = फ़्रैक (sum_ (i = 1) ^ (n) y_i sum_ (i = 1) ^ (n) x_i ^ 2 - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n) ) x_iy_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.1)

`बी = फ़्रेक (एन योग_ (i = 1) ^ (एन) x_iy_i - योग_ (i = 1) ^ (एन) x_i योग_ (i = 1) ^ (एन) y_i) (एन योग_ (i = 1) ^ (एन) x_i ^ 2 - (योग_ (i = 1) ^ (एन) x_i) ^ 2) `(3.2)

इन सूत्रों का समाधान तब होता है जब `n> 1` (रेखा कम से कम 2 बिंदुओं से खींची जा सकती है) और जब निर्धारक `D = n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ) ^ (एन) x_i) ^ 2! = 0`, अर्थात जब प्रयोग में बिंदु `x_i` भिन्न हों (अर्थात जब रेखा लंबवत न हो)।

प्रतीपगमन रेखा के गुणांकों की त्रुटियों का अनुमान

गुणांक `ए` और` बी` की गणना में त्रुटि के अधिक सटीक अनुमान के लिए, बड़ी संख्या में प्रयोगात्मक बिंदुओं का होना वांछनीय है। जब `n = 2`, गुणांकों की त्रुटि का अनुमान लगाना असंभव है, क्योंकि सन्निकटन रेखा स्पष्ट रूप से दो बिंदुओं से होकर गुजरेगी।

यादृच्छिक चर `V` की त्रुटि निर्धारित की जाती है त्रुटियों के संचय का नियम
`S_V ^ 2 = sum_ (i = 1) ^ p (फ़्रेक (आंशिक f) (आंशिक z_i)) ^ 2 S_ (z_i) ^ 2`,
जहां `p` एक त्रुटि `S_ (z_i)` के साथ पैरामीटर की संख्या `z_i` है जो `S_V` त्रुटि को प्रभावित करती है;
`f` - `z_i` पर `V` की निर्भरता का कार्य।

आइए हम गुणांक `a` और` b` . की त्रुटि के लिए त्रुटियों के संचय के नियम को लिखें
`S_a ^ 2 = sum_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) (आंशिक y_i)) ^ 2 S_ (y_i) ^ 2 + योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) ) (आंशिक x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक a) (आंशिक y_i)) ^ 2 `,
`एस_बी ^ 2 = योग_ (i = 1) ^ (एन) (फ़्रेक (आंशिक बी) (आंशिक y_i)) ^ 2 एस_ (वाई_आई) ^ 2 + योग_ (i = 1) ^ (एन) (फ़्रेक (आंशिक बी) ) (आंशिक x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 योग_ (i = 1) ^ (n) (फ़्रेक (आंशिक b) (आंशिक y_i)) ^ 2 `,
जबसे `S_ (x_i) ^ 2 = 0` (हमने पहले आरक्षण किया था कि `x` की त्रुटि नगण्य है)।

`S_y ^ 2 = S_ (y_i) ^ 2` - माप में त्रुटि (विचरण, मानक विचलन का वर्ग) y`, यह मानते हुए कि त्रुटि `y` के सभी मूल्यों के लिए एक समान है।

प्राप्त व्यंजकों में `a` और` b` की गणना के लिए सूत्रों को प्रतिस्थापित करने पर, हम प्राप्त करते हैं

`S_a ^ 2 = S_y ^ 2 फ़्रेक (sum_ (i = 1) ^ (n) (sum_ (i = 1) ^ (n) x_i ^ 2 - x_i sum_ (i = 1) ^ (n) x_i) ^ 2 ) (डी ^ 2) = एस_वाई ^ 2 फ़्रेक ((एन योग_ (i = 1) ^ (एन) x_i ^ 2 - (योग_ (i = 1) ^ (एन) x_i) ^ 2) योग_ (i = 1) ^ (एन) x_i ^ 2) (डी ^ 2) = एस_वाई ^ 2 फ़्रेक (योग_ (i = 1) ^ (एन) x_i ^ 2) (डी) `(4.1)

`S_b ^ 2 = S_y ^ 2 फ़्रेक (sum_ (i = 1) ^ (n) (n x_i - sum_ (i = 1) ^ (n) x_i) ^ 2) (D ^ 2) = S_y ^ 2 फ़्रैक ( n (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2)) (D ^ 2) = S_y ^ 2 फ़्रेक (n) (D) `(4.2)

अधिकांश वास्तविक जीवन प्रयोगों में, `Sy` मान को नहीं मापा जाता है। ऐसा करने के लिए, योजना के एक या कई बिंदुओं पर कई समानांतर माप (प्रयोग) करना आवश्यक है, जिससे प्रयोग का समय (और संभवतः लागत) बढ़ जाता है। इसलिए, आमतौर पर यह माना जाता है कि प्रतिगमन रेखा से `y` के विचलन को यादृच्छिक माना जा सकता है। इस मामले में विचरण `y` का अनुमान सूत्र द्वारा परिकलित किया जाता है।

`S_y ^ 2 = S_ (y, बाकी) ^ 2 = फ़्रेक (sum_ (i = 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)`।

भाजक `n-2` प्रकट होता है क्योंकि हमने प्रयोगात्मक डेटा के एक ही नमूने के लिए दो गुणांकों की गणना के कारण स्वतंत्रता की डिग्री की संख्या में कमी की है।

इस अनुमान को प्रतिगमन रेखा `S_ (y, बाकी) ^ 2` के सापेक्ष अवशिष्ट विचरण भी कहा जाता है।

गुणांक के महत्व का आकलन छात्र की कसौटी के अनुसार किया जाता है

`t_a = frac (| a |) (S_a)`, `t_b = frac (| b |) (S_b)`

यदि परिकलित मानदंड `t_a`,` t_b` तालिका मानदंड `t (P, n-2)` से कम हैं, तो यह माना जाता है कि संबंधित गुणांक किसी दिए गए प्रायिकता `P` के साथ शून्य से महत्वपूर्ण रूप से भिन्न नहीं है।

एक रैखिक संबंध के विवरण की गुणवत्ता का आकलन करने के लिए, आप फिशर के परीक्षण का उपयोग करके माध्य के सापेक्ष `S_ (y, बाकी) ^ 2` और` S_ (बार y) की तुलना कर सकते हैं।

`एस_ (बार y) = फ़्रेक (योग_ (i = 1) ^ n (y_i - बार y) ^ 2) (n-1) = फ़्रेक (sum_ (i = 1) ^ n (y_i - (sum_ (i =) १) ^ n y_i) / n) ^ २) (n-1) `- विचरण का नमूना अनुमान` y` माध्य के सापेक्ष।

निर्भरता का वर्णन करने के लिए प्रतिगमन समीकरण की प्रभावशीलता का आकलन करने के लिए, फिशर गुणांक की गणना की जाती है
`एफ = एस_ (बार वाई) / एस_ (वाई, बाकी) ^ 2`,
जिसकी तुलना तालिका फिशर गुणांक F (p, n-1, n-2) से की जाती है।

यदि `F> F (P, n-1, n-2)`, निर्भरता के विवरण के बीच का अंतर `y = f (x)` प्रतिगमन समीकरण का उपयोग करते हुए और माध्य का उपयोग करने वाले विवरण को सांख्यिकीय रूप से महत्वपूर्ण माना जाता है संभावना `पी`। वे। प्रतिगमन माध्य के सापेक्ष `y` के प्रकीर्णन से बेहतर संबंध का वर्णन करता है।

ग्राफ पर क्लिक करें,
तालिका में मान जोड़ने के लिए

कम से कम वर्ग विधि। कम से कम वर्ग विधि को अज्ञात मापदंडों के निर्धारण के रूप में समझा जाता है a, b, c, अपनाई गई कार्यात्मक निर्भरता

कम से कम वर्ग विधि को अज्ञात मापदंडों के निर्धारण के रूप में समझा जाता है ए, बी, सी, ...स्वीकृत कार्यात्मक निर्भरता

वाई = एफ (एक्स, ए, बी, सी, ...),

जो न्यूनतम माध्य वर्ग (विचरण) त्रुटि प्रदान करेगा

, (24)

जहाँ x i, y i - प्रयोग से प्राप्त संख्याओं के युग्मों का एक समूह।

चूंकि कई चर के एक फ़ंक्शन के चरम के लिए शर्त इसके आंशिक डेरिवेटिव के शून्य की समानता की स्थिति है, पैरामीटर ए, बी, सी, ...समीकरणों की प्रणाली से निर्धारित होते हैं:

; ; ; … (25)

यह याद रखना चाहिए कि फ़ंक्शन प्रकार के बाद पैरामीटर का चयन करने के लिए कम से कम वर्ग विधि का उपयोग किया जाता है वाई = एफ (एक्स)परिभाषित।

यदि सैद्धांतिक विचारों से कोई निष्कर्ष निकालना असंभव है कि अनुभवजन्य सूत्र क्या होना चाहिए, तो किसी को दृश्य प्रतिनिधित्व द्वारा निर्देशित किया जाना चाहिए, मुख्य रूप से देखे गए डेटा का ग्राफिकल प्रतिनिधित्व।

व्यवहार में, वे अक्सर निम्न प्रकार के कार्यों तक सीमित होते हैं:

1) रैखिक ;

2) द्विघात a.

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन के अन्य सरल लोगों द्वारा अनुमानित प्रतिनिधित्व की अनुमति देता है। ओएलएस अवलोकनों के प्रसंस्करण में अत्यंत उपयोगी हो सकता है, और यह सक्रिय रूप से दूसरों के माप के परिणामों से कुछ मात्राओं का अनुमान लगाने के लिए उपयोग किया जाता है जिनमें यादृच्छिक त्रुटियां होती हैं। यह आलेख आपको दिखाएगा कि एक्सेल में कम से कम वर्ग गणना कैसे कार्यान्वित करें।

एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण

मान लीजिए कि दो संकेतक एक्स और वाई हैं। इसके अलावा, वाई एक्स पर निर्भर करता है। चूंकि ओएलएस प्रतिगमन विश्लेषण के दृष्टिकोण से हमारे लिए रूचि रखता है (एक्सेल में, इसकी विधियों को अंतर्निहित कार्यों का उपयोग करके कार्यान्वित किया जाता है), तो आपको तुरंत चाहिए एक विशिष्ट समस्या पर विचार करने के लिए आगे बढ़ें।

तो, एक्स को एक किराने की दुकान का खुदरा स्थान होने दें, जिसे वर्ग मीटर में मापा जाता है, और वाई - वार्षिक कारोबार, लाखों रूबल में मापा जाता है।

यह भविष्यवाणी करना आवश्यक है कि यदि किसी विशेष खुदरा स्थान में स्टोर का टर्नओवर (Y) होगा तो उसका क्या होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टाल से अधिक सामान बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लें कि हमारे पास n स्टोर्स के लिए डेटा से निर्मित एक टेबल है।

गणितीय आँकड़ों के अनुसार, कम से कम 5-6 वस्तुओं के डेटा की जांच करने पर परिणाम कमोबेश सही होंगे। इसके अलावा, आप "असामान्य" परिणामों का उपयोग नहीं कर सकते। विशेष रूप से, एक कुलीन छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े रिटेल आउटलेट्स के टर्नओवर से कई गुना अधिक हो सकता है।

विधि सार

तालिका डेटा को कार्तीय तल पर बिंदुओं M 1 (x 1, y 1),… M n (x n, y n) के रूप में प्रदर्शित किया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन के लिए कम हो जाएगा, जिसमें एक ग्राफ जितना संभव हो सके बिंदुओं M 1, M 2, .. M n के करीब से गुजर रहा हो।

बेशक, आप एक उच्च डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि यह भी गलत है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसे आपको पता लगाने की आवश्यकता है। सबसे उचित समाधान सीधी रेखा y = ax + b को खोजना है, जो प्रयोगात्मक डेटा का सबसे अच्छा अनुमान लगाता है, या इसके बजाय, गुणांक - ए और बी।

शुद्धता मूल्यांकन

किसी भी सन्निकटन के लिए, उसकी शुद्धता के आकलन का विशेष महत्व है। आइए हम बिंदु x i के लिए कार्यात्मक और प्रायोगिक मूल्यों के बीच अंतर (विचलन) को e i द्वारा निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, सन्निकटन की सटीकता का अनुमान लगाने के लिए, विचलन के योग का उपयोग किया जा सकता है, अर्थात, Y पर X की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा का चयन करते समय, सबसे छोटे मान वाले को वरीयता दी जानी चाहिए सभी बिंदुओं पर विचाराधीन योग। हालांकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ, नकारात्मक व्यावहारिक रूप से मौजूद होंगे।

विचलन या उनके वर्गों के मॉड्यूल का उपयोग करके समस्या को हल किया जा सकता है। बाद की विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण शामिल है (एक्सेल इसे दो अंतर्निहित कार्यों के साथ लागू करता है), और लंबे समय से इसके लायक साबित हुआ है।

कम से कम वर्ग विधि

एक्सेल में, जैसा कि आप जानते हैं, एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित श्रेणी में स्थित सभी मानों के मूल्यों की गणना करने की अनुमति देता है। इस प्रकार, हमें व्यंजक के मान की गणना करने से कोई नहीं रोकता है (e 1 2 + e 2 2 + e 3 2 + ... e n 2)।

गणितीय संकेतन में, ऐसा लगता है:

चूंकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित करने के लिए किया गया था, हमारे पास है:

इस प्रकार, एक्स और वाई की मात्राओं की विशिष्ट निर्भरता का सबसे अच्छा वर्णन करने वाली सीधी रेखा को खोजने की समस्या दो चर के न्यूनतम फ़ंक्शन की गणना करने के लिए कम हो जाती है:

इसके लिए नए चर ए और बी के संबंध में आंशिक डेरिवेटिव को शून्य करने की आवश्यकता है, और एक आदिम प्रणाली को हल करना जिसमें दो अज्ञात फॉर्म के साथ दो समीकरण शामिल हैं:

कुछ सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेर-फेर करना शामिल है, हम प्राप्त करते हैं:

इसे हल करना, उदाहरण के लिए, क्रैमर की विधि द्वारा, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, अर्थात, यह अनुमान लगाने के लिए कि किसी निश्चित क्षेत्र के लिए स्टोर का टर्नओवर क्या होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको एक सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन इससे आपको यह अंदाजा लगाने में मदद मिलेगी कि क्या किसी विशेष क्षेत्र के लिए क्रेडिट पर स्टोर खरीदने से भुगतान होगा।

एक्सेल में कम से कम वर्ग विधि कैसे लागू करें

एक्सेल में ओएलएस मान की गणना के लिए एक फ़ंक्शन है। इसका निम्न रूप है: "TREND" (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक।)। आइए एक्सेल में ओएलएस की गणना के लिए हमारी तालिका में सूत्र लागू करें।

ऐसा करने के लिए, उस सेल में जिसमें एक्सेल में कम से कम वर्ग विधि द्वारा गणना का परिणाम प्रदर्शित किया जाना चाहिए, "=" चिह्न दर्ज करें और "ट्रेंड" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

  • वाई के लिए ज्ञात मूल्यों की श्रेणी (इस मामले में, टर्नओवर के लिए डेटा);
  • रेंज x 1,… x n, यानी रिटेल स्पेस का आकार;
  • और x के ज्ञात और अज्ञात मान, जिसके लिए आपको टर्नओवर के आकार का पता लगाना होगा (वर्कशीट पर उनके स्थान की जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में बूलियन चर "कॉन्स्ट" होता है। यदि आप संबंधित क्षेत्र में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि गणना की जानी चाहिए, यह मानते हुए कि बी = 0।

यदि आपको x के एक से अधिक मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद, आपको "एंटर" नहीं दबाना चाहिए, लेकिन आपको कीबोर्ड पर "Shift" + "Control" + "Enter" संयोजन टाइप करना होगा। ("प्रवेश करना")।

कुछ सुविधाएं

प्रतिगमन विश्लेषण डमी के लिए भी उपलब्ध हो सकता है। अज्ञात चरों की एक सरणी के मूल्य की भविष्यवाणी करने के लिए एक्सेल का सूत्र - "ट्रेंड" - उन लोगों द्वारा भी उपयोग किया जा सकता है जिन्होंने कम से कम वर्गों की विधि के बारे में कभी नहीं सुना है। उसके काम की कुछ विशेषताओं को जानने के लिए बस इतना ही काफी है। विशेष रूप से:

  • यदि आप y चर के ज्ञात मानों की श्रेणी को एक पंक्ति या स्तंभ में व्यवस्थित करते हैं, तो ज्ञात x मानों वाली प्रत्येक पंक्ति (स्तंभ) को प्रोग्राम द्वारा एक अलग चर के रूप में माना जाएगा।
  • यदि ज्ञात x के साथ एक श्रेणी "ट्रेंड" विंडो में निर्दिष्ट नहीं है, तो यदि एक्सेल में फ़ंक्शन का उपयोग किया जाता है, तो प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या निर्दिष्ट मानों के साथ श्रेणी से मेल खाती है। वाई चर के।
  • आउटपुट के रूप में "अनुमानित" मानों की एक सरणी प्राप्त करने के लिए, प्रवृत्ति अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
  • यदि x के नए मान निर्दिष्ट नहीं हैं, तो "TREND" फ़ंक्शन उन्हें ज्ञात मान के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से दिए गए पैरामीटर y के साथ सीमा के अनुरूप है।
  • नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के अनुरूप होना चाहिए।
  • ज्ञात x मानों वाली एक सरणी में कई चर हो सकते हैं। हालांकि, अगर हम केवल एक के बारे में बात कर रहे हैं, तो x और y के दिए गए मानों के साथ श्रेणियों का अनुरूप होना आवश्यक है। एकाधिक चर के मामले में, आप चाहते हैं कि दिए गए y मानों वाली श्रेणी एक कॉलम या एक पंक्ति में फ़िट हो।

पूर्वानुमान समारोह

इसे कई कार्यों के साथ कार्यान्वित किया जाता है। उनमें से एक को "पूर्वानुमान" कहा जाता है। यह "TREND" के समान है, अर्थात यह कम से कम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y मान अज्ञात है।

अब आप एक्सेल में डमी के लिए सूत्रों को जानते हैं जो आपको एक रैखिक प्रवृत्ति के अनुसार किसी दिए गए संकेतक के भविष्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

प्रतिगमन समारोह के प्रकार को चुनने के बाद, अर्थात। एक्स (या वाई पर एक्स) पर वाई की निर्भरता के माना मॉडल का प्रकार, उदाहरण के लिए, एक रैखिक मॉडल y x = a + bx, मॉडल के गुणांक के विशिष्ट मूल्यों को निर्धारित करना आवश्यक है।

ए और बी के विभिन्न मूल्यों के लिए, yx = a + bx के रूप की अनंत संख्या में निर्भरताएं बनाई जा सकती हैं, अर्थात समन्वय विमान पर अनंत संख्या में सीधी रेखाएं होती हैं, लेकिन हमें ऐसी निर्भरता की आवश्यकता होती है कि सबसे अच्छे तरीके से देखे गए मूल्यों से मेल खाता है। इस प्रकार, कार्य को सर्वोत्तम गुणांक के चयन के लिए कम कर दिया गया है।

हम उपलब्ध प्रेक्षणों की एक निश्चित संख्या से ही आगे बढ़ते हुए रैखिक फलन a + bx की खोज करते हैं। प्रेक्षित मानों के लिए सबसे उपयुक्त फलन ज्ञात करने के लिए, हम अल्पतम वर्ग विधि का उपयोग करते हैं।

निरूपित करें: Y i वह मान है जिसकी गणना समीकरण Y i = a + bx i के अनुसार की जाती है। y i मापा गया मान है, i = y i -Y i समीकरण के अनुसार मापा और परिकलित मानों के बीच का अंतर है, i = y i -a-bx i.

न्यूनतम वर्ग विधि के लिए i की आवश्यकता होती है, मापा y i और परिकलित Y i मानों के बीच का अंतर न्यूनतम होना चाहिए। इसलिए, हम गुणांक ए और बी पाते हैं ताकि प्रतिगमन की सीधी रेखा पर मूल्यों से देखे गए मूल्यों के विचलन के वर्गों का योग सबसे छोटा हो:

तर्कों के इस कार्य की खोज करना और डेरिवेटिव की मदद से चरम के लिए, कोई यह साबित कर सकता है कि यदि गुणांक ए और बी सिस्टम के समाधान हैं तो फ़ंक्शन न्यूनतम मान लेता है:

(2)

यदि हम सामान्य समीकरणों के दोनों पक्षों को n से विभाजित करते हैं, तो हमें प्राप्त होता है:

उस पर विचार करना (3)

हम पाते हैं , यहाँ से, a के मान को पहले समीकरण में प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

इस मामले में, b को समाश्रयण गुणांक कहा जाता है; a को समाश्रयण समीकरण का मुक्त पद कहा जाता है और इसकी गणना सूत्र द्वारा की जाती है:

परिणामी सीधी रेखा सैद्धांतिक प्रतिगमन रेखा के लिए एक अनुमान है। हमारे पास है:

इसलिए, एक रैखिक प्रतिगमन समीकरण है।

प्रतिगमन प्रत्यक्ष (बी> 0) और उलटा (बी उदाहरण 1 हो सकता है। एक्स और वाई के मूल्यों को मापने के परिणाम तालिका में दिए गए हैं:

एक्स मैं -2 0 1 2 4
यी 0.5 1 1.5 2 3

यह मानते हुए कि X और Y के बीच एक रैखिक संबंध y = a + bx है, न्यूनतम वर्ग विधि का उपयोग करके गुणांक a और b निर्धारित करें।

समाधान। यहाँ n = 5
एक्स आई = -2 + 0 + 1 + 2 + 4 = 5;
x मैं २ = ४ + ० + १ + ४ + १६ = २५
x i y i = -2 0.5 + 0 1 + 1 1.5 + 2 2 + 4 3 = 16.5
वाई मैं = 0.5 + 1 + 1.5 + 2 + 3 = 8

और सामान्य प्रणाली (2) का रूप है

इस प्रणाली को हल करने पर, हम प्राप्त करते हैं: b = 0.425, a = 1.175। इसलिए, y = 1.175 + 0.425x।

उदाहरण 2. आर्थिक संकेतकों (एक्स) और (वाई) के 10 अवलोकनों का एक नमूना है।

एक्स मैं 180 172 173 169 175 170 179 170 167 174
यी 186 180 176 171 182 166 182 172 169 177

नमूना Y-X प्रतिगमन समीकरण को खोजना आवश्यक है। Y-X नमूना प्रतिगमन रेखा को प्लॉट करें।

समाधान। 1. आइए डेटा को x i और y i के मानों से सॉर्ट करें। हमें एक नई तालिका मिलती है:

एक्स मैं 167 169 170 170 172 173 174 175 179 180
यी 169 171 166 172 180 176 177 182 182 186

गणनाओं को सरल बनाने के लिए, हम एक गणना तालिका तैयार करेंगे जिसमें हम आवश्यक संख्यात्मक मान दर्ज करेंगे।

एक्स मैं यी एक्स मैं २ एक्स मैं वाई मैं
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
x मैं = १७२९ y मैं = १७६१ x मैं २ २९९१०५ x मैं y मैं = ३०४६९६
एक्स = 172.9 वाई = 176.1 x मैं २ = २९९१०.५ xy = ३०४६९.६

सूत्र (4) के अनुसार, हम प्रतिगमन गुणांक की गणना करते हैं

और सूत्र द्वारा (5)

इस प्रकार, प्रतिदर्श समाश्रयण समीकरण y = -59.34 + 1.3804x है।
आइए निर्देशांक तल पर बिंदु (x i; y i) बनाएं और समाश्रयण रेखा को चिह्नित करें।


अंजीर 4

चित्र 4 दिखाता है कि कैसे देखे गए मान प्रतिगमन रेखा के सापेक्ष स्थित हैं। Y i से y i के विचलन के संख्यात्मक मूल्यांकन के लिए, जहां y i मनाया जाता है, और Y i प्रतिगमन द्वारा निर्धारित मान हैं, हम एक तालिका तैयार करेंगे:

एक्स मैं यी यी वाई मैं-वाई मैं
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Y i मानों की गणना प्रतिगमन समीकरण के अनुसार की जाती है।

प्रतिगमन रेखा से कुछ देखे गए मानों के ध्यान देने योग्य विचलन को कम संख्या में टिप्पणियों द्वारा समझाया गया है। X पर Y की रैखिक निर्भरता की डिग्री का अध्ययन करते समय, टिप्पणियों की संख्या को ध्यान में रखा जाता है। निर्भरता की ताकत सहसंबंध गुणांक के मूल्य से निर्धारित होती है।

कम से कम वर्ग एक रैखिक समीकरण के निर्माण के लिए एक गणितीय प्रक्रिया है जो एक सीधी रेखा के समीकरण में गुणांक, ए और बी के मूल्यों को खोजने के द्वारा क्रमबद्ध जोड़े के एक सेट से सबसे अच्छी तरह मेल खाता है। कम से कम वर्ग विधि का लक्ष्य y और के मानों के बीच कुल चुकता त्रुटि को कम करना है। यदि प्रत्येक बिंदु के लिए हम त्रुटि निर्धारित करते हैं, तो कम से कम वर्ग विधि न्यूनतम होती है:

जहाँ n = रेखा के चारों ओर क्रमित युग्मों की संख्या। डेटा के जितना करीब हो सके।

इस अवधारणा को चित्र में दिखाया गया है।

आंकड़े को देखते हुए, वह रेखा जो डेटा को सबसे अच्छी तरह से फिट करती है, प्रतिगमन रेखा, ग्राफ़ पर चार बिंदुओं की कुल चुकता त्रुटि को कम करती है। मैं आपको दिखाऊंगा कि निम्न उदाहरण में कम से कम वर्ग विधि का उपयोग करके इसे कैसे निर्धारित किया जाए।

एक युवा जोड़े की कल्पना करें जो हाल ही में एक साथ रह रहे हैं और एक साथ बाथरूम वैनिटी टेबल साझा कर रहे हैं। युवक ने नोटिस करना शुरू कर दिया कि उसकी आधी मेज लगातार सिकुड़ रही थी, बालों के मूस और सोया परिसरों से जमीन खो रही थी। पिछले कुछ महीनों से, वह आदमी उस दर पर बारीकी से नज़र रख रहा है जिस पर उसके टेबल पर आइटमों की संख्या बढ़ रही है। नीचे दी गई तालिका से पता चलता है कि पिछले कुछ महीनों में एक लड़की ने बाथरूम की मेज पर कितनी चीजें जमा की हैं।

चूंकि हमारा लक्ष्य यह पता लगाना है कि क्या समय के साथ वस्तुओं की संख्या बढ़ती है, "माह" स्वतंत्र चर होगा, और "वस्तुओं की संख्या" आश्रित चर होगा।

कम से कम वर्गों की विधि का उपयोग करते हुए, हम उस समीकरण को निर्धारित करते हैं जो डेटा के लिए सबसे उपयुक्त है a के मानों की गणना करके, y-अक्ष पर खंड, और b, रेखा का ढलान:

ए = वाई एवी - बीएक्स एवी

जहाँ x av, x का औसत मान है, स्वतंत्र चर, y av, y, स्वतंत्र चर का औसत मान है।

नीचे दी गई तालिका इन समीकरणों के लिए आवश्यक गणनाओं को सारांशित करती है।

हमारे बाथटब उदाहरण के लिए प्रभाव वक्र निम्नलिखित समीकरण द्वारा निर्धारित किया जाएगा:

चूंकि हमारे समीकरण में 0.976 की सकारात्मक ढलान है, आदमी के पास सबूत है कि टेबल पर वस्तुओं की संख्या प्रति माह 1 आइटम की औसत दर से समय के साथ बढ़ती है। ग्राफ क्रमित युग्मों के साथ प्रभाव वक्र दिखाता है।

अगले छह महीनों (महीने 16) में वस्तुओं की संख्या की उम्मीद की गणना निम्नानुसार की जाएगी:

= 5.13 + 0.976x = 5.13 + 0.976 (16) ~ 20.7 = 21 आइटम

तो यह हमारे नायक के लिए कुछ कार्रवाई करने का समय है।

एक्सेल में ट्रेंड फ़ंक्शन

जैसा कि आप शायद पहले ही अनुमान लगा चुके हैं, एक्सेल के पास मूल्य की गणना के लिए एक फ़ंक्शन है कम से कम वर्ग विधि।इस सुविधा को ट्रेंड कहा जाता है। इसका सिंटैक्स इस प्रकार है:

रुझान (ज्ञात Y-मान; ज्ञात X-मान; नए X-मान; स्थिरांक)

ज्ञात Y मान - आश्रित चर की एक सरणी, हमारे मामले में, तालिका में वस्तुओं की संख्या

एक्स के ज्ञात मूल्य - स्वतंत्र चर की एक सरणी, हमारे मामले में यह एक महीना है

नया X मान - नया X (माह) मान जिसके लिए समारोह प्रवृत्तिआश्रित चरों का अपेक्षित मान लौटाता है (वस्तुओं की संख्या)

कॉन्स्ट वैकल्पिक है। एक बूलियन मान जो इंगित करता है कि क्या स्थिरांक b का 0 होना आवश्यक है।

उदाहरण के लिए, उदाहरण 16वें महीने के लिए बाथरूम की मेज पर आइटम की अपेक्षित संख्या निर्धारित करने के लिए उपयोग किए गए TREND फ़ंक्शन को दिखाता है।