अध्याय 01 आंकड़े : स्रोत और संकलन

आप आंकड़ों के विभिन्न प्रकार देख और उपयोग कर चुके हैं। उदाहरण के लिए, दूदर्शन पर प्रत्येक समाचार बुलेटिन के अंत में, मुख्य शहरों के अभिलिखित तापमान प्रदर्शित किये जाते हैं। उसी प्रकार, भारत के भूगोल पर लिखी गई पुस्तकें, जनसंख्या की वृद्धि एवं वितरण और विभिन्न फसलों, खनिजों और औद्योगिक उत्पादों संबंधी आंकड़ों को तालिका के रूप में दर्शाती हैं। क्या आपने कभी सोचा है कि उनका अर्थ क्या है? ये आंकड़े कहाँ से प्राप्त किए जाते हैं? अर्थपूर्ण सूचनाएँ प्राप्त करने के लिए वे किस प्रकार से तालिकाबद्ध एवं प्रक्रमित किए जाते हैं। इस अध्याय में हम आंकड़ों के इन पक्षों पर विचार-विमर्श करेंगे और इन अनेक प्रश्नों के उत्तर देने का प्रयत्न करेंगे।

आंकड़े क्या हैं?

आंकड़ों को ऐसी संख्याओं के रूप में परिभाषित किया गया है जो यथार्थ विश्व के मापन को प्रदर्शित करती हैं। आधार सामग्री एकमात्र माप है। हम प्राय: समाचार पढ़ते हैं, जैसे-बाड़मेर में लगातार 20 से.मी. वर्षा अथवा चौबीस घंटों में बाँसवाड़ा में निरंतर 35 से.मी. वर्षा अथवा सूचना जैसे-रेलगाड़ी द्वारा नयी दिल्ली-मुंबई की दूरी, वाया कोटा-वड़ोदरा 1305 कि.मी. है और वाया इटारसी-मनमाड 1542 कि.मी. है। यह संख्यात्मक सूचना आंकड़ा कहलाती है। यह आसानी से अनुभव किया जा सकता है कि आज के संसार में बड़ी संख्या में आंकड़े उपलब्ध हैं फिर भी इन आंकड़ों से तार्किक निष्कर्ष निकालना उस समय कठिन हो जाता है जबकि ये अपरिष्कृत रूप में होते हैं। इसलिए यह सुनिश्चित कर लेना महत्वपूर्ण है कि मापी गई सूचना प्रतीक गणितीय रूप से प्राप्त की गई है अथवा तार्किक रूप से निगमित किए गए हैं अथवा सांख्यिकीय विधि से परिकलित किए गए हैं। सूचना को एक प्रश्न के अर्थपूर्ण उत्तर अथवा अर्थपूर्ण उद्दीपक के रूप में परिभाषित किया गया है जिसे अगले प्रश्नों में सोपानित किया जा सकता है।

आंकड़ों की आवश्यकता

भौगोलिक अध्ययन में मानचित्र एक महत्वपूर्ण साधन है। इसके अतिरिक्त परिघटनाओं के वितरण और वृद्धि को सारणीबद्ध रूप में आंकड़ों के द्वारा स्पष्ट किया गया है। हम जानते हैं कि पृथ्वी की सतह पर बहुत-सी परिघटनाओं के मध्य अंतर्संबंध होते हैं। ये अन्योन्य क्रियाएँ बहुत से चरों द्वारा प्रभावित होती हैं जिनकी सबसे अच्छी व्याख्या मात्रात्मक रूप में की जा सकती है। आज उन चरों का सांख्यिकीय विश्लेषण आवश्यक हो गया है। उदाहरण के लिए किसी क्षेत्र के शस्य प्रारूप के अध्ययन के लिए, फसल के अंतर्गत क्षेत्र, फसल की उत्पादकता और उत्पादन, सिंचित क्षेत्र, वर्षा की मात्रा और उर्वरक, कीटनाशक और पीड़कनाशी के प्रयोग जैसे निवेश के बारे में सांख्यिकीय सूचना का होना आवश्यक है। इसी प्रकार से किसी क्षेत्र में एक नगर के विकास के अध्ययन के लिए कुल जनसंख्या, घनत्व, प्रवासियों की संख्या, लोगों के व्यवसाय, उनके वेतन, उद्योगों, यातायात और संचार के साधनों से संबंधित आंकड़े आवश्यक होते हैं। इस प्रकार, आंकड़े भौगोलिक विश्लेषण में एक महत्वपूर्ण भूमिका निभाता है।

आंकड़ों का प्रस्तुतीकरण

आपने एक व्यक्ति की कहानी सुनी होगी जो अपनी पत्नी और पाँच साल के बच्चे के साथ यात्रा कर रहा था। रास्ते में उसे एक नदी पार करनी थी। सबसे पहले उसने चार बिंदुओं की गहराई 0.6, 0.8, 0.9, 1.5 मीटर के रूप में मापी। उसने औसत गहराई 0.95 मीटर निकाली। उसके बच्चे की लंबाई 1 मीटर थी। इसलिए उसने उसे नदी पार करने के लिए उतार दिया और उसका बच्चा नदी में डूब गया। दूसरे किनारे पर वह चिंतन करता हुआ बैठ गया, “लेखा-जोखा थाए, तो बच्चा डूबा काहे?” (बच्चा क्यों डूब गया जब गहराई सभी की पहुँच में थी?) इसे सांख्यिकीय दोष कहते हैं जो कि आपको यथार्थ स्थिति से भ्रमित कर सकता है। इसलिए तथ्यों और आकार को जानने के लिए आंकड़ों को एकत्र करना बहुत आवश्यक है, लेकिन उतना ही महत्वपूर्ण आंकड़ों का प्रस्तुतीकरण है। आज सांख्यिकीय विधियों का उपयोग विश्लेषण, प्रस्तुतीकरण और निष्कर्षों को निकालने में भूगोल सहित लगभग सभी शास्त्रों में जो कि आंकड़ों का उपयोग करते हैं, एक महत्वपूर्ण भूमिका निभाता है। इससे यह अनुमान लगाया जा सकता है कि परिघटनाओं का सांद्रण भिन्न पाया जाता है। जैसे कि जनसंख्या, वन अथवा यातायात या संचार नेटवर्क न केवल स्थान और समय के अनुसार बल्कि आंकड़ों के उपयोग से आसानी से समझाया जा सकता है। अन्य शब्दों में आप कह सकते हैं कि चरों के बीच संबंधों की व्याख्या करने में गुणात्मक विश्लेषण से मात्रात्मक विश्लेषण में स्थानांतरण है। इसलिए इन दिनों विश्लेषणात्मक साधन और तकनीकें, विषय को और अधिक तार्किक बनाने और परिशुद्ध निष्कर्ष प्राप्त करने के लिए अत्यधिक महत्वपूर्ण हो गए हैं। आंकड़ों के एकत्रण और संकलन के आरंभ से ही उनके सारणीयन, संगठन, क्रमबद्धता और संक्रियात्मक विश्लेषण तक जब तक कि निष्कर्ष प्राप्त न हो जाए परिशुद्ध सांख्यिकीय तकनीकों का प्रयोग किया जाता है।

आंकड़ों के स्रोत

आंकड़े निम्नलिखित विधियों से एकत्रित किए जाते हैं-1. प्राथमिक स्रोत 2 . द्वितीयक स्रोत।

जो आंकड़े प्रथम बार व्यक्तिगत रूप से अथवा व्यक्तियों के समूह संस्था/संगठन द्वारा एकत्रित किए जाते हैं, आंकड़ों के प्राथमिक स्रोत कहलाते हैं। दूसरी तरफ़ जो आंकड़े किसी प्रकाशित अथवा अप्रकाशित साधनों द्वारा एकत्र किए जाते हैं, द्वितीयक स्रोत कहलाते हैं। चित्र 1.1 में आंकड़ा संग्रह की विभिन्न विधियाँ दर्शाई गई हैं।

प्राथमिक आंकड़ों के साधन

1. व्यक्तिगत प्रेक्षण

यह सूचनाओं के उस संग्रह की ओर संकेत करता है जो व्यक्तिगत या व्यक्तियों के समूह द्वारा क्षेत्र में प्रत्यक्ष प्रेक्षण द्वारा एकत्र किया जाता है। क्षेत्र-सर्वेक्षण के द्वारा भू-आकृति के लक्षणों, अपवाह प्रारूप, मिट्टी और प्राकृतिक वनस्पति के प्रकारों के साथ-साथ जनसंख्या संरचना, लिंग अनुपात, साक्षरता, परिवहन और संचार के साधन, नगरीय और ग्रामीण अधिवास आदि के बारे में सूचनाएँ एकत्र की जाती हैं। फिर भी व्यक्तिगत

चित्र 1.1 : आंकड़ों के संग्रह की विधियाँ

प्रेक्षण करते समय उसमें सम्मिलित व्यक्ति/व्यक्तियों को निष्पक्ष मूल्यांकन के लिए विषय का सैद्धांतिक ज्ञान और वैज्ञानिक दृष्टिकोण होना चाहिए।

2. साक्षात्कार

इस विधि में शोधकर्ता उत्तर देने वाले से प्रत्यक्ष सूचना संवाद और बातचीत द्वारा प्राप्त करता है। फिर भी, साक्षात्कारकर्ता को क्षेत्र के लोगों से साक्षात्कार करते समय निम्नलिखित सावधानियों को बरतना चाहिए-

(i) लोगों से साक्षात्कार द्वारा जिन सूचनाओं को इकट्ठा करना है, उन विषयों की एक परिशुद्ध सूची तैयार कर लेनी चाहिए।
(ii) साक्षात्कार लेने वाले व्यक्ति/व्यक्तियों को सर्वेक्षण के उद्देश्यों के बारे में स्पष्ट जानकारी होनी चाहिए।
(iii) कोई भी संवेदनशील प्रश्न पूछने से पहले, उत्तर देने वालों को विश्वास में लेना चाहिए और उसे यह विश्वास दिलाना चाहिए कि गोपनीयता बनाई रखी जाएगी।
(iv) अनुकूल वातावरण होना चाहिए जिससे उत्तर देने वाला बिना झिझक के तथ्यों को स्पष्ट कर सके।
(v) प्रश्नों की भाषा साधारण और शिष्ट होनी चाहिए जिससे उत्तर देने वाला प्रेरित होकर सहज ही० प्रश्नों से संबंधित सूचना देने के लिए सहमत हो जाए।
(vi) ऐसे प्रश्नों को पूछने से बचना चाहिए जिससे उत्तर देने वालों के आत्मसम्मान अथवा धार्मिक भावनाओं को ठेस न पहुँचे।
(vii) साक्षात्कार के अंत में उत्तर देने वालों से पूछना चाहिए कि वह जो सूचना दे चुके हैं, इसकें अतिरिक्त और क्या जानकारी दे सकते हैं?
(viii) उन्हें आपके लिए अपना बहुमूल्य समय प्रदान करने के लिए धन्यवाद और कृतज्ञता ज्ञापित करनी चाहिए।

3. प्रश्नावली अनुसूची

इस विधि में, साधारण प्रश्नों और उनके संभावित उत्तर एक सादे कागज़ पर लिखे रहते हैं और उत्तर देने वालों को दिए गए विकल्पों में से सही उत्तर पर निशान लगाना होता है। कई बार प्रश्नावली में संरचनात्मक प्रश्नों का एक समूह लिखा रहता है और उत्तर देने वालों के विचार जानने के लिए पर्याप्त स्थान दिया रहता है। यदि केवल विवृत्तांत प्रश्नों के माध्यम से लोगों के विचारों को एकत्र करने की जरूरत है तो इसे प्रश्नावली कहते हैं। प्रश्नावली में सर्वेक्षण के उद्देश्य स्पष्ट रूप से उल्लिखित होने चाहिए। यह विधि बड़े क्षेत्र के सर्वेक्षण के लिए उपयोगी होती है। प्रश्नावली को दूरवर्ती क्षेत्रों में भी भेजा जा सकता है। इस विधि की सीमा यह है कि आवश्यक सूचनाओं को उपलब्ध कराने के लिए केवल साक्षर और शिक्षित लोगों से ही संपर्क किया जा सकता है। प्रश्नावली से मिलती-जुलती जिसमें जाँच-पड़ताल से जुड़े प्रश्न दिए रहते हैं, उसे अनुसूची कहा जाता है। प्रश्नावली और अनुसूची में केवल यह अंतर होता है कि प्रश्नावली में उत्तर देने वाला प्रश्नावलियों को स्वयं भरता है जबकि सूची में परिगणक उत्तर देने वाले से प्रश्न पूछकर स्वयं भरता है। प्रश्नावली की तुलना में अनुसूची का मुख्य लाभ यह है कि इसके द्वारा सूचना शिक्षित और अशिक्षित दोनों ही उत्तर देने वालों से एकत्र की जा सकती हैं। एक अनुसूची को भरने के लिए गणनाकर्ता को पूरी तरह प्रशिक्षित होना चाहिए।

4. अन्य विधियाँ

मृदा और जल के गुणों से संबंधित आंकड़े सीधे क्षेत्रों से, मृदा किट और जल गुणवत्ता किट का उपयोग करते हुए उनकी विशेषताओं को माप कर एकत्र किए जाते हैं। इसी तरह क्षेत्र-वैज्ञानिक के उपयोग से फसलों और वनस्पति के स्वास्थ्य के बारे में आंकड़े इकट्टे कर रहे हैं (चित्र 1.2 )।

आंकड़ों के द्वितीयक स्रोत

द्वितीयक स्रोतों के अंतर्गत आंकड़ों के प्रकाशित और अप्रकाशित स्रोत आते हैं जिनमें सरकारी प्रकाशन, प्रलेख और रिपोर्टें सम्मिलित किए जाते हैं।

प्रकाशित साधन

1. सरकारी प्रकाशन

विभिन्न मंत्रालयों और भारत सरकार के विभागों, राज्य सरकारों के प्रकाशन और ज़िलों के बुलेटिन द्वितीयक सूचनाओं के महत्वपूर्ण साधन हैं। इनके अंतर्गत भारत के महापंजीयक कार्यालय द्वारा प्रकाशित भारत की जनगणना, राष्ट्रीय प्रतिदर्श सर्वेक्षण की रिपोर्टें, भारतीय मौसम विज्ञान विभाग की मौसम रिपोर्ट, राज्य सरकारों द्वारा प्रकाशित सांख्यिकीय सारांश और विभिन्न आयोगों द्वारा प्रकाशित आवधिक रिपोटें सम्मिलित किए जाते हैं। कुछ सरकारी प्रकाशन चित्र 1.3 में दर्शाए गए हैं।

चित्र 1.2 : फसल के स्वास्थ्य की माप लेते हुए क्षेत्र वैज्ञानिक

चित्र 1.3 : कुछ सरकारी प्रकाशन

2. अर्ध सरकारी प्रकाशन

इस श्रेणी के अंतर्गत नगर विकास प्राधिकरणों और विभिन्न नगरों और शहरों के नगर-निगमों और ज़िला परिषदों के प्रकाशन और रिपोर्ट आते हैं।

3. अंतर्राष्ट्रीय प्रकाशन

अंतर्राष्ट्रीय प्रकाशनों के अंतर्गत वार्षिकी, संयुक्त राष्ट्र के विभिन्न अभिकरणों जैसे-संयुक्त राष्ट्र अभिकरण, वैज्ञानिक तथा सांस्कृतिक संगठन (यूनेस्को), संयुक्त राष्ट्र विकास कार्यक्रम (यू. न. डी. पी.), विश्व स्वास्थ्य संगठन (डब्ल्यू. एच. ओ.), खाद्य व कृषि परिषद् (एफ. ए. ओ.) आदि द्वारा प्रकाशित रिपोर्ट और मोनोग्राफ़ सम्मिलित किए जाते हैं। संयुक्त राष्ट्र के कुछ महत्वपूर्ण प्रकाशन जो आवधिक छपते हैं, वे हैं- डैमोग्राफ़िक इयर बुक, स्टेटिस्टीकल इयर बुक और मानव विकास रिपोर्ट (चित्र 1.4)।

4. निजी प्रकाशन

इस श्रेणी के अंतर्गत समाचारपत्र और निजी संस्थाओं द्वारा प्रकाशित वार्षिकी पुस्तिका, सर्वेक्षण शोध रिपोर्ट और प्रबंध आते हैं।

चित्र 1.4 : कुछ संयुक्त राष्ट्र प्रकाशन

5. समाचारपत्र और पत्रिकाएँ

दैनिक समाचारपत्र और साप्ताहिक, पाक्षिक और मासिक पत्रिकाएँ द्वितीयक आंकड़ों के आसानी से प्राप्य स्रोत हैं।

6. इलेक्ट्रॉनिक

यह स्रोत वर्तमान में इलेक्ट्रॉनिक माध्यम विशेषकर इंटरनेट, द्वितीयक आंकड़ों का एक महत्वपूर्ण स्रोत बनकर उभरा है।

अप्रकाशित साधन

1. सरकारी प्रलेख

द्वितीयक आंकड़ों के अन्य स्रोत अप्रकाशित रिपोरें, मोनोग्राफ़ और प्रलेख हैं। ये प्रलेख सरकार के विभिन्न स्तरों पर अप्रकाशित रिकार्ड के रूप में तैयार किए और अनुरक्षित रखे जाते हैं। उदाहरण के लिए, गाँव के स्तर पर, राजस्व अभिलेख गाँव के पटवारियों के द्वारा बनाए जाते हैं जो एक गाँव स्तर की सूचना का महत्वपूर्ण साधन हैं

2. अर्ध सरकारी प्रलेख

अर्ध सरकारी प्रलेखों में, विभिन्न नगर निगम, ज़िला परिषदों और लोक सेवा विभागों द्वारा तैयार और अनुरक्षित की गई आवधिक रिपोटें और विकास योजनाएँ सम्मिलित की जाती हैं।

3. निजी प्रलेख

इसके अंर्गत कंपनियों, व्यापार संघों, विभिन्न राजनैतिक और अराजनैतिक संगठनों और निवासीय कल्याण संघों के अप्रकाशित रिपोर्ट और रिकार्ड सम्मिलित किए जाते हैं।

आंकड़ों का सारणीयन और वर्गीकरण

प्राथमिक अथवा द्वितीयक साधनों द्वारा एकत्र किए गए आंकड़े प्रारंभ में बहुत कम समझ में आने वाली सूचनाओं के एक उलझे समूह के रूप में दिखाई देते हैं। यह आंकड़ा संरचना कच्चा आंकड़ा कहलाती है। अर्थपूर्ण निष्कर्ष निकालने और उपयोग में लाने के लिए उन अपरिष्कृत कच्चे आंकड़ों के सारणीयन और वर्गीकरण की जरूरत होती है।

सांख्यिकीय सारणी, आंकड़ों को संक्षिप्त करने और प्रस्तुत करने के सबसे साधारण उपायों में से एक है। यह आंकड़ों की कॉलम और पंक्तियों में की गई एक सुव्यवस्थित व्यवस्था है। इस सारणी का उद्देश्य प्रस्तुतीकरण को आसान और तुलना को सरल बनाना है। इस सारणी से पाठकों को वांछित सूचना शीघ्र मिल जाती है। इस प्रकार तालिकाएँ विश्लेषक के लिए, कम स्थान में आंकड़ों के विशाल समूह को प्रस्तुत करना संभव बनाती हैं।

आंकड़ों का संग्रह और प्रस्तुतीकरण

आंकड़ों का संग्रह, सारणीयन और सारणी रूप में प्रस्तुतीकरण या तो निरपेक्ष रूप से, प्रतिशत में अथवा संकेत सूची के रूप में होता है।

निरपेक्ष आंकड़ा

जब आंकड़े अपने मूल रूप में पूर्णांक की तरह प्रस्तुत किए जाते हैं, उन्हें निरपेक्ष आंकड़े अथवा कच्चा आंकड़े कहते हैं। उदाहरण के लिए, एक देश अथवा राज्य की कुल जनसंख्या, एक फसल अथवा एक विनिर्माण उद्योग का कुल उत्पादन आदि। सारणी 1.1 भारत और उसके कुछ चुने हुए राज्यों की जनसंख्या के निरपेक्ष आंकड़े दर्शाती हैं।

प्रतिशत/अनुपात

कई बार आंकड़े अनुपात अथवा प्रतिशत रूप में सारणीबद्ध किए जाते हैं जो कि एक सामान्य प्राचल से परिकलित होते हैं, जैसे साक्षरता दर अथवा जनसंख्या की वृद्धि दर, कृषि उत्पादों अथवा औद्योगिक उत्पादों का प्रतिशत आदि। सारणी 1.2 विभिन्न दशकों की भारत की साक्षरता दर को प्रतिशत रूप में प्रस्तुत करती है।

सारणी 1.1 : भारत और चुने हुए राज्यों/केंद्र शासित प्रदेशों की जनसंख्या, 2011

राज्य/
केंद
शासित
कोड
भारत/राज्य/
केंद्न शासित प्रदेश
कुल जनसंख्या
व्यक्ति पुरुष स्त्री
1 2 3 4 5
भारत ${ }^{1}$ 1,21,05,69,573 62,31,21,843 58,74,47,730
1. जम्मू और कश्मीर ${}^{2}$ 1,25,41,302 66,40,662 59,00,640
2. हिमाचल प्रदेश 68,64,602 34,81,873 33,82,729
3. पंजाब 2,77,43,338 1,46,39,465 1,31,03,873
4. चंडीगढ़ ${}^{3}$ 10,55,450 5,80,663 4,74,787
5. उत्तराखंड 1,00,86,292 51,37,773 49,48,519
6. हरियाणा 2,53,51,462 1,34,94,734 1,18,56,728
7. राष्ट्रीय राजधानी प्रदेश, दिल्ली 1,67,87,941 89,87,326 78,00,615
8. राजस्थान 6,85,48,437 3,55,50,997 3,29,97,440
9. उत्तर प्रदेश 19,98,12,341 10,44,80,510 9,53,31,831
10. बिहार 10,40,99,452 5,42,78,157 4,98,21,295

स्रोतः 2011 की जनगणना के आंकड़े।

साक्षरता दर का परिकलन इस प्रकार किया गया है -

$$ \dfrac{\text { कुल साक्षर व्यक्ति }}{\text { कुल जनसंख्या }} \times 100 $$

सूचकांक

सूचकांक चर अथवा एक सांख्यिकीय माप है जिसे चर अथवा समय भौगोलिक स्थिति या दूसरी विशेषताओं के संदर्भ में संबंधित चरों के संबंधित समूह में परिवर्तन को दर्शाने के लिए अभिकल्पित किया जाता है।

सारणी 1.2 : साक्षरता दर : 1951 - 2011

वर्ष व्यक्ति पुरुष स्त्री
1951 18.33 27.16 8.86
1961 28.3 40.4 15.35
1971 34.45 45.96 21.97
1981 43.57 56.38 29.76
1991 52.21 64.13 39.29
2001 64.84 75.85 54.16
2011 73.04 80.9 64.6

स्रोत - 2011 की जनगणना के आंकड़े।

यहाँ ध्यान देने योग्य बात यह है कि सूचकांक न केवल समय के साथ हुए परिवर्तनों की माप करता है बल्कि विभिन्न स्थानों, उद्योगों, नगरों अथवा देशों की आर्थिक दशाओं की तुलना भी करता है। सूचकांक का उपयोग व्यापक रूप में अर्थशास्त्र और व्यवसाय में लागत और मात्रा में आए परिवर्तनों को देखने के लिए किया जाता है। सूचकांक के परिकलन के लिए विभिन्न प्रकार की विधियाँ हैं। फिर भी साधारण समुच्चय विधि सबसे अधिक उपयोग में लाई जाती है। इसे निम्नलिखित सूत्र द्वारा प्राप्त किया जाता है :

$$ \dfrac{q_{1}}{q_{0}} \times 100 $$

$\sum q_{1}=$ वर्तमान वर्ष के उत्पादन का योग

$\sum q_{0}=$ आधार वर्ष के उत्पादन का योग

साधारणतया आधार वर्ष का मूल्य 100 लिया जाता है और उसके आधार पर सूचकांक की गणना की जाती है। उदाहरण के लिए, तालिका 1.3 भारत में लौह अयस्क के उत्पादन और 1970-71 को आधारवर्ष मानते हुए 1970-71 से 2000-01 तक के सूचकांकों में परिवर्तन को दर्शाती है।

सारणी 1.3 : भारत में लौह अयस्क का उत्पादन

वर्ष
उत्पादन
(मिलियन टन में)
परिकलन सूचकांक
$1970-71$ 32.5 $\dfrac{32.5}{32.5} \times 100$ 100
$1980-81$ 42.2 $\dfrac{42.2}{32.5} \times 100$ 130
$1990-91$ 53.7 $\dfrac{53.7}{32.5} \times 100$ 165
$2000-01$ 67.4 $\dfrac{67.4}{32.5} \times 100$ 207

स्रोत- भारत : आर्थिक सर्वेक्षण, 2005

आंकड़ों का प्रकमण

कच्चे आंकड़ों का प्रक्रमण करने के लिए चयनित वर्गों में उनके सारणीयन और वर्गीकरण की आवश्यकता होती है। उदाहरण के लिए, तालिका 1.4 में दिए गए आँकड़े का उपयोग यह समझने के लिए किया जा सकता है कि वे किस प्रकार प्रक्रमित किए गए हैं।
$\quad$ हम देख सकते हैं कि दिया गया आंकड़ा अवर्गीकृत हैं। इसलिए सबसे पहला कदम अपरिष्कृत आंकड़ों की मात्रा का बोधगम्य लघुकरण करके उनको वर्गीकृत करना है।

आंकड़ों का वर्गीकरण

कच्चे आंकड़ों के वर्गीकरण के लिए श्रेणियों की संख्याओं को निर्धारित करना होता है जिसमें अपरिष्कृत आंकड़े अपने अंतराल के साथ वर्गीकृत किए जाते हैं। वर्ग अंतराल का चुनाव और वर्गों की संख्या, अपरिष्कृत आंकड़ों के परिसर और वर्गीकरण के उद्देश्यों पर निर्भर करते हैं। तालिका 1.4 में दिए गए कच्चे आंकड़े 2 से 96 तक हैं। सुविधा के लिए हम आंकड़ों को प्रत्येक वर्ग में 10 इकाइयों के अंतराल के साथ, दस वर्गों में रख सकते हैं, उदाहरण के लिए 0-10, 10-20, 20-30 आदि (तालिका 1.5 )।

सारणी 1.4 : भूगोल विषय में 60 विद्यार्धियों के प्राप्तांक

47 02 39 64 22 46 28 02 09 10
89 96 74 06 26 15 92 84 84 90
32 22 53 62 73 57 37 44 67 50
18 51 36 58 28 65 63 59 75 70
56 58 43 74 64 12 35 42 68 80
64 37 17 31 41 71 56 83 59 90

वर्गीकरण की प्रक्रिया

जब एक बार वर्गों की संख्या और प्रत्येक वर्ग का वर्ग अंतराल निश्चित कर लिया जाता है, तब कच्चे आंकड़ों को वर्गीकृत किया जाता है जैसा कि तालिका 1.5 में दर्शाया गया है। यह एक प्रचलित विधि है जिसे फोर एंड क्रास विधि या मिलान चिह्न के नाम से जाना जाता है।

सबसे पहले, वर्ग की प्रत्येक इकाई के लिए जिसके अंतर्गत वह आता है, एक मिलान चिह्न निर्धारित करते हैं। उदाहरण के लिए, कच्चे आंकड़ों में पहली संख्या 47 है, जो 40-50 के वर्ग में आती है, सारणी 1.5 के तीसरे कॉलम में एक मिलान चिह्न अंकित कर दिया जाता है।

सारणी 1.5 : आवृत्ति प्राप्त करने के लिए बनाए गए मिलान चिह्न


आवृत्ति वितरण

तालिका 1.5 में हम मात्रात्मक चरों के कच्चे आंकड़े को वर्गीकृत और उन्हें वर्गानुसार सामूहिक कर चुके हैं। मदों की संख्याएँ ( तालिका 1.5 के चतुर्थ कॉलम में दिए गए स्थान) आवृत्ति कहलाती है और कॉलम आवृत्ति वितरण को प्रदर्शित करता है। यह स्पष्ट होता है कि एक चर की विभिन्न मदों को कैसे वितरित किया गया है। आवृत्तियों को साधारण और संचयी आवृत्तियों में वर्गीकृत किया जाता है।

साधारण आवृत्ति

’ $f$ ’ द्वारा प्रदर्शित साधारण आवृत्ति, प्रत्येक वर्ग के व्यक्तियों की संख्या को प्रदर्शित करती है। (तालिका 1.6) सभी वर्गों के लिए दी गई आवृत्ति का योग, दी गई श्रेणी में व्यक्तिगत अवलोकनों के कुल योग को दर्शाता है। सांख्यिकी में, यह ‘N’ संकेत से स्पष्ट किया गया है जो कि $\sum f$. के बराबर है। इसे $\sum f=N=$ 60 (तालिका 1.5 और 1.6 ) की तरह व्यक्त किया गया है।

सारणी 1.6 : आवृत्ति वितरण

पर्ग $\boldsymbol{f}$ Cf
$00-10$ 4 4
$10-20$ 5 9
$20-30$ 5 14
$30-40$ 7 21
$40-50$ 6 27
$50-60$ 10 37
$60-70$ 8 45
$70-80$ 6 51
$80-90$ 5 56
$90-100$ 4 60
$\sum f=N=60$

संचयी आवृत्ति

संचयी आवृत्ति को ’ $\boldsymbol{C}$ ‘, द्वारा प्रदर्शित किया गया है जिसे प्रत्येक वर्ग में दी गई क्रमिक सामान्य आवृत्ति को पहले योग के साथ जोड़कर प्राप्त किया जा सकता है, जैसा कि तालिका 1.6 के कॉलम 3 में प्रदर्शित है। उदाहरण के लिए तालिका 1.6 में पहली सामान्य आवृत्ति 4 है। अगली आवृत्ति 5 को 4 में जोड़ा गया है जिसका योग 9 है जो अगली संचयी आवृत्ति है। इसी प्रकार प्रत्येक अगली संख्या को जोड़ते जाते हैं जब तक कि अंतिम संचयी आवृत्ति 60 प्राप्त नहीं हो जाती है। ध्यान देने योग्य बात यह है कि यह $\mathrm{N}$ अथवा $\sum f$ के बराबर है।

संचयी आवृत्ति का लाभ यह है कि एक व्यक्ति आसानी से समझ सकता है कि 27 व्यक्ति ऐसे हैं जिनके प्राप्तांक 50 से नीचे हैं अथवा 60 व्यक्तियों में से 45 व्यक्तियों के प्राप्तांक 70 से नीचे हैं।

प्रत्येक सामान्य आवृत्ति इसके समूह अथवा वर्ग से संबंधित होती है। समूहों या वर्गों को तैयार करने के लिए अपवर्ती अथवा समावेशी विधि प्रयोग में लाई जाती है।

अपवर्ती विधि

जैसा कि तालिका 1.6 में सबसे पहले कॉलम में दो संख्याएँ दर्शाई गई हैं। ध्यान दें कि एक वर्ग की उच्च सीमा अगले वर्ग की निम्न सीमा के जैसी है। उदाहरण के लिए एक वर्ग (20-30) की उच्च सीमा 30 है जो कि अगले वर्ग (30-40) की निम्न सीमा है। 30 दोनों वर्ग में प्रदर्शित हैं। लेकिन कोई भी अवलोकन जिसका मूल्य 30 है, उसी वर्ग में रखा जाएगा जिसमें यह निम्न सीमा पर आता है और यह उस वर्ग से निकाल दिया जाता है जिसमें यह उच्च सीमा (20-30) पर है। इसीलिए इस विधि को अपवर्ती विधि कहते है। अबे आप जान सकते हो कि तालिका 1.4 के सभी सीमांत मूल्य कहाँ जाएँगे।

फिर से तालिका 1.6 में देखिए, इसके वर्गों की निम्नलिखित प्रकार से व्याख्या की गई है

0 और 10 से नीचे $\qquad$ $\qquad$ $\qquad$ $\qquad$ 10 और 20 से नीचे
20 और 30 से नीचे $\qquad$ $\qquad$ $\qquad$ $\qquad$ 30 और 40 से नीचे
40 और 50 से नीचे $\qquad$ $\qquad$ $\qquad$ $\qquad$ 50 और 60 से नीचे
60 और 70 से नीचे $\qquad$ $\qquad$ $\qquad$ $\qquad$ 70 और 80 से नीचे
80 और 90 से नीचे $\qquad$ $\qquad$ $\qquad$ $\qquad$ 90 और 100 से नीचे

इस तरह के समूहीकरण में, श्रेणी का विस्तार 10 इकाइयों तक होता है। उदाहरण के लिए 20, 21, $22,23,24,25,26,27,28$ और 29 तक संख्याएँ तीसरे वर्ग में आती हैं।

समावेशी विधि

इस विधि में एक मूल्य जो वर्ग की उच्च सीमा के मूल्य के समान होता है, उसे उसी वर्ग में रखा जाता है। इसीलिए इस विधि को समावेशी विधि कहते हैं। इस विधि में वर्गों को अलग प्रकार से प्रदर्शित किया जाता है जैसा तालिका 1.7 के पहले कॉलम में दिखाया गया है। साधारणतया वर्ग की उच्च सीमा में अगले वर्ग की निम्न सीमा से 1 का अंतर होता है। महत्वपूर्ण बात यह है कि इस विधि में भी वर्ग का विस्तार 10 इकाइयों तक होता है। उदाहरण के लिए $50-59$ का वर्ग 10 मानों $50,51,52,53$, $54,55,56,57,58$ और 59 (तालिका 1.7 ) का समावेश करता है। इस विधि में उच्च और निम्न दोनों सीमाएँ आवृत्ति वितरण को प्राप्त करने के लिए समाविष्ट की जाती हैं।

सारणी 1.6 : आवृत्ति वितरण : समावेशी विधि

वर्ग $\boldsymbol{f}$ $\boldsymbol{C f}$
0-9 4 4
10-19 5 9
20-29 5 14
30-39 7 21
40-49 6 27
50-59 10 37
60-69 8 45
70-79 6 51
80-89 5 56
90-99 4 60
$\sum f=N=60$

आवृत्ति बहुभुज

आवृत्तियों वितरण का ग्राफ़ आवृत्ति बहुभुज के नाम से जाना जाता है। यह दो या दो से अधिक आवृत्ति वितरण की तुलना में सहायता करता है। दो आवृत्ति को दंड आरेख और रेखाचित्र के द्वारा दिखाया गया है।

ओजाइव

जब आवृत्ति को जोड़ दिया जाता है, उन्हें संचयी आवृत्ति कहा जाता है और जिस सारणी में सूचीगत किए जाते हैं, उसे संचयी आवृत्ति सारणी कहते हैं। संचयी आवृत्ति द्वारा प्राप्त किए गए वक्र को ओजाइव कहते हैं। जिसका उच्चारण ओजाइव है। इसका निर्माण या तो कमतर विधि (less than method) या अधिकतर विधि (more than method) द्वारा करते हैं।

चित्र 1.5 : आवृत्ति वितरण बहुभुज

कमतर विधि में, हम श्रेणियों की उच्च सीमा से शुरू करते हैं और आवृत्ति को जोड़ते जाते हैं। जब इन आवृत्तियों को अंकित किया जाता है, तो हमें एक उभरता हुआ वक्र प्राप्त होता है जिसे तालिका 1.8 और चित्र 1.5 में दर्शाया गया है।

अधिकतर विधि में, हम वर्गों की निम्न सीमा से शुरू करते हैं और संचयी आवृत्ति से प्रत्येक वर्ग की आवृत्ति को घटा देते हैं। जब ये आवृत्तियाँ अंकित की जाती हैं तब हमें एक गिरता हुआ वक्र प्राप्त होता है जैसा कि तालिका 1.9 और चित्र 1.6 में दर्शाया गया है।

कमतर ओजाइव और अधिकतर ओजाइव का तुलनात्मक चित्र प्राप्त करने के लिए ऊपर के दोनों चित्रों 1.5 और 1.6 का संयोजन कर सकते हैं जैसा कि तालिका 1.10 और चित्र 1.7 में दिखाया गया है।

सारणी 1.8 : आवृत्ति वितरण कमतर विधि

कमतर विधि $C f$
10 से कम 4
20 से कम 9
30 से कम 14
40 से कम 21
50 से कम 27
60 से कम 37
70 से कम 45
80 से कम 51
90 से कम 56
100 से कम 60

चित्र 1.6 : कमतर ओजाइव

सारणी 1.9 : आवृत्ति वितरण अधिकतर विधि

अधिकतर विधि Cf
0 से अधिक 60
10 से अधिक 56
20 से अधिक 51
30 से अधिक 44
40 से अधिक 38
50 से अधिक 28
60 से अधिक 20
70 से अधिक 14
80 से अधिक 9
90 से अधिक 4

चित्र 1.7: अधिकतर ओजाइव

सारणी 1.10 : कमतर और अधिकतर ओजाइव

प्राप्त प्राप्तांक कमतर अधिकतर
0-10 4 60
10-20 9 56
20-30 14 51
30-40 21 44
30-40 27 38
50-60 37 28
60-70 45 20
70-80 51 14
80-90 56 9
90-100 60 4

अभ्यास

1. नीचे दिए गए चार विकल्पों में से सही उत्तर चुनिए :

(i) एक संख्या अथवा लक्षण को जो मापन को प्रदर्शित करता है, कहते हैं

(क) अंक
(ख) आँकड़े
(ग) संख्या
(घ) लक्षण

(ii) एकल आधार सामग्री एकमात्र माप है

(क) तालिका
(ख) आवृत्ति
(ग) वास्तविक संसार
(घ) सूचना

(iii) एक मिलान चिह्न में, फोर एंड क्रांसिंग फिफ्थ द्वारा समूहीकरण को कहते हैं

(क) फोर एंड क्रास विधि
(ख) मिलान चिह्न विधि
(ग) आवृत्ति अंकित विधि
(घ) समावेश विधि

(iv) ओजाइव एक विधि है जिसमें

(क) साधारण आवृत्ति नापी जाती है।
(ख) संचयी आवृत्ति नापी जाती है।
(ग) साधारण आवृत्ति अंकित की जाती है।
(घ) संचयी आवृत्ति अंकित की जाती है।

(v) यदि वर्ग के दोनों अंत आवृत्ति समूह में लिए गए हों, इसे कहते हैं

(क) बहिष्कार विधि
(ख) समावेश विधि
(ग) चिह्न विधि
(घ) सांख्यिकीय विधि

2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दीजिए :

(i) आंकड़ा और सूचना के बीच अंतर।
(ii) आंकड़ों से आप क्या समझते हैं?
(iii) एक तालिका में पाद टिप्पणी से क्या लाभ हैं?
(iv) आंकड़ों के प्राथमिक स्रोतों से आपका क्या तात्पर्य है?
(v) द्वितीयक आंकड़ों के पाँच स्रोत बताइए।
(vi) आवृत्ति वर्गीकरण की अपवर्ती विधि क्या है?

3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दीजिए :

(i) राष्ट्रीय और अंतर्राष्ट्रीय अभिकरणों की चर्चा कीजिए जहाँ से द्वितीयक आँकड़े एकत्र किए जा सकते हैं।
(ii) सूचकांक का क्या महत्त्व है? सूचकांक की परिकलन की प्रक्रिया को बताने के लिए एक उदाहरण लीजिए और परिवर्तनों को दिखाइए।

क्रियाकलाप

1. भूगोल की 35 विद्यार्थियों की कक्षा में, निम्नलिखित अंक, 10 अंक के यूनिट टेस्ट में प्राप्त किए गए हैं - 1,0,2,3,4,5,6,7,2,3,4,0,2,5,8,4,5,3,6,3,2,7,6,5,4,3,7,8,9,7,9,4,5,4,3 आँकड़े को संचयी आवृत्ति वितरण के रूप में प्रस्तुत करिए। अपनी कक्षा के भूगोल विषय की अंतिम परीक्षा का परिणाम एकत्र कीजिए और प्राप्तांकों को संचयी आवृत्ति वितरण के रूप में प्रदर्शित कीजिए।



sathee Ask SATHEE

Welcome to SATHEE !
Select from 'Menu' to explore our services, or ask SATHEE to get started. Let's embark on this journey of growth together! 🌐📚🚀🎓

I'm relatively new and can sometimes make mistakes.
If you notice any error, such as an incorrect solution, please use the thumbs down icon to aid my learning.
To begin your journey now, click on

Please select your preferred language
कृपया अपनी पसंदीदा भाषा चुनें