40% की छूट पाएं
नया! 💥 प्राप्त करें प्रोपिक्स जो रणनीति देखने के लिए जिसने S&P 500 को 1,183%+ से हराया है40% की छूट क्लेम करें

क्वांटाइल रिग्रेशन के साथ डेटा आउटलेर्स का प्रबंधन: भाग I

प्रकाशित 09/09/2021, 10:50 am
अपडेटेड 09/07/2023, 04:01 pm

मॉडलिंग के लिए सबसे कठिन चुनौतियों में से एक यह तय करना है कि चरम डेटा बिंदुओं से कैसे (या यदि) निपटना है। यह आर्थिक और वित्तीय संख्या में एक आम समस्या है। उदाहरण के लिए, स्टॉक मार्केट रिटर्न में फैट टेल डिस्ट्रीब्यूशन मानक किराया है। इस बीच, पिछले साल महामारी के दौरान अर्थव्यवस्था में नाटकीय गिरावट एक अनुस्मारक है कि आउटलेयर मैक्रो एनालिटिक्स में भी पॉप अप करते हैं।

यह प्रश्न की ओर जाता है: क्या करना है? कई उत्तर हैं, जो डेटा सेट और विश्लेषणात्मक लक्ष्यों के आधार पर भिन्न होते हैं। प्रतिगमन विश्लेषण में अक्सर समस्या उत्पन्न होती है, जो कई मॉडलिंग अनुप्रयोगों की नींव है। एक समाधान यह है कि मानक रैखिक प्रतिगमन को हटा दिया जाए और इसे मात्रात्मक प्रतिगमन के साथ बदल दिया जाए, जो चरम डेटा बिंदुओं के लिए कम असुरक्षित है।

इन प्रतिगमनों में क्या अंतर है? रैबिट होल के बहुत नीचे जाने के बिना, रैखिक प्रतिगमन (LR) डेटा को मॉडल करने के लिए सशर्त माध्य की गणना करने के लिए कम से कम वर्ग पद्धति का उपयोग करता है। क्वांटाइल रिग्रेशन (QR) सशर्त माध्यिका (या कोई अन्य क्वांटाइल, या क्वांटाइल, जिसे आप चुनते हैं) का अनुमान लगाते हैं। यह क्यूआर को एलआर पर कई फायदे देता है, जिसमें आउटलेर्स का सामना करते समय उच्च स्तर की स्थिरता शामिल है।

एक साधारण उदाहरण के रूप में, संख्याओं के दो सेटों पर विचार करें - डेटा ए और डेटा बी। ये अपेक्षाकृत अच्छी तरह से व्यवहार किए गए डेटा सेट हैं और इसलिए अपेक्षाकृत स्पष्ट, तंग संबंध है। नतीजतन, रैखिक और मात्रात्मक प्रतिगमन चलाने से समान परिणाम मिलते हैं। (नोट: क्यूआर मॉडल इस उदाहरण में माध्यिका मात्रा का उपयोग करता है।)

तृतीय पक्ष विज्ञापन। Investing.com द्वारा कोई प्रस्ताव या अनुशंसा नहीं। यहां प्रकटीकरण देखें या विज्ञापन हटा दें
Regression Analysis

लेकिन यह एक और कहानी है जब हम नीचे दिए गए अगले चार्ट में लाल रंग में दिखाए गए कुछ बाहरी डेटा बिंदु जोड़ते हैं। प्रतिगमन को फिर से चलाने से पता चलता है कि LR परिणाम काफी हद तक शिफ्ट होते हैं - धराशायी हरी रेखा (बाहरी डेटा के साथ LR) बनाम ठोस हरी रेखा (बाहरी डेटा के बिना LR) द्वारा इंगित किया जाता है। तुलना करके, दो मात्रात्मक प्रतिगमन अनिवार्य रूप से अपरिवर्तित हैं, जो इंगित करता है कि परिणामों पर आउटलेर्स का बहुत कम प्रभाव पड़ता है। (हां, दो क्यूआर रिग्रेशन लाइनों को देखना मुश्किल है क्योंकि वे अनिवार्य रूप से समान हैं।)

Regression Analysis

QR में अधिक मजबूत परिणाम चरम घटनाओं को वित्तीय और आर्थिक मॉडलिंग प्रयासों में कहर पैदा करने से रोकने के लिए एक शक्तिशाली तरीके का प्रतिनिधित्व करते हैं। यह दुनिया में एक विशेष रूप से उपयोगी उपकरण है जहां आर्थिक और वित्तीय डेटा वितरण में वसा पूंछ की सुविधा है।

QR का एक अन्य लाभ, जिसे मैं आगामी पोस्ट में विस्तार से बताऊंगा, विभिन्न मात्राओं में प्रतिगमन की गणना करने की क्षमता है, जो मॉडलिंग के साथ एक व्यापक, अधिक लचीला प्रोफाइलिंग एप्लिकेशन प्रदान करता है।

अभी भी ऐसे मामले हैं जब एक बुनियादी रैखिक प्रतिगमन का उपयोग करना समझ में आता है। अच्छी खबर यह है कि विकल्प हैं, और क्वांटाइल रिग्रेशन शॉर्ट लिस्ट में है।

नवीनतम टिप्पणियाँ

हमारा ऐप इंस्टॉल करें
जोखिम प्रकटीकरण: वित्तीय उपकरण एवं/या क्रिप्टो करेंसी में ट्रेडिंग में आपके निवेश की राशि के कुछ, या सभी को खोने का जोखिम शामिल है, और सभी निवेशकों के लिए उपयुक्त नहीं हो सकता है। क्रिप्टो करेंसी की कीमत काफी अस्थिर होती है एवं वित्तीय, नियामक या राजनैतिक घटनाओं जैसे बाहरी कारकों से प्रभावित हो सकती है। मार्जिन पर ट्रेडिंग से वित्तीय जोखिम में वृद्धि होती है।
वित्तीय उपकरण या क्रिप्टो करेंसी में ट्रेड करने का निर्णय लेने से पहले आपको वित्तीय बाज़ारों में ट्रेडिंग से जुड़े जोखिमों एवं खर्चों की पूरी जानकारी होनी चाहिए, आपको अपने निवेश लक्ष्यों, अनुभव के स्तर एवं जोखिम के परिमाण पर सावधानी से विचार करना चाहिए, एवं जहां आवश्यकता हो वहाँ पेशेवर सलाह लेनी चाहिए।
फ्यूज़न मीडिया आपको याद दिलाना चाहता है कि इस वेबसाइट में मौजूद डेटा पूर्ण रूप से रियल टाइम एवं सटीक नहीं है। वेबसाइट पर मौजूद डेटा और मूल्य पूर्ण रूप से किसी बाज़ार या एक्सचेंज द्वारा नहीं दिए गए हैं, बल्कि बाज़ार निर्माताओं द्वारा भी दिए गए हो सकते हैं, एवं अतः कीमतों का सटीक ना होना एवं किसी भी बाज़ार में असल कीमत से भिन्न होने का अर्थ है कि कीमतें परिचायक हैं एवं ट्रेडिंग उद्देश्यों के लिए उपयुक्त नहीं है। फ्यूज़न मीडिया एवं इस वेबसाइट में दिए गए डेटा का कोई भी प्रदाता आपकी ट्रेडिंग के फलस्वरूप हुए नुकसान या हानि, अथवा इस वेबसाइट में दी गयी जानकारी पर आपके विश्वास के लिए किसी भी प्रकार से उत्तरदायी नहीं होगा।
फ्यूज़न मीडिया एवं/या डेटा प्रदाता की स्पष्ट पूर्व लिखित अनुमति के बिना इस वेबसाइट में मौजूद डेटा का प्रयोग, संचय, पुनरुत्पादन, प्रदर्शन, संशोधन, प्रेषण या वितरण करना निषिद्ध है। सभी बौद्धिक संपत्ति अधिकार प्रदाताओं एवं/या इस वेबसाइट में मौजूद डेटा प्रदान करने वाले एक्सचेंज द्वारा आरक्षित हैं।
फ्यूज़न मीडिया को विज्ञापनों या विज्ञापनदाताओं के साथ हुई आपकी बातचीत के आधार पर वेबसाइट पर आने वाले विज्ञापनों के लिए मुआवज़ा दिया जा सकता है।
इस समझौते का अंग्रेजी संस्करण मुख्य संस्करण है, जो अंग्रेजी संस्करण और हिंदी संस्करण के बीच विसंगति होने पर प्रभावी होता है।
© 2007-2024 - फ्यूजन मीडिया लिमिटेड सर्वाधिकार सुरक्षित