अध्याय 03 डेटा का संगठन

30 min read

1. भूमिका पिछले अध्याय में आपने सीखा कि आँकड़े कैसे एकत्र किए जाते हैं। आपने यह भी जाना कि जनगणना और प्रतिदर्श के बीच क्या अंतर होता है। इस अध्याय में आप...

1. भूमिका

पिछले अध्याय में आपने सीखा कि आँकड़े कैसे एकत्र किए जाते हैं। आपने यह भी जाना कि जनगणना और प्रतिदर्श के बीच क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्र किए गए आँकड़ों को कैसे वर्गीकृत किया जाए। कच्चे आँकड़ों को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना होता है ताकि उन्हें आगे की सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।

क्या आपने कभी अपने स्थानीय कबाड़ वाले या कबाड़ीवाले को देखा है, जिसे आप पुराने अखबार, टूटे-फूटे घरेलू सामान, खाली काँच की बोतलें, प्लास्टिक आदि बेचते हैं? वह ये चीजें आपसे खरीदता है और उन्हें उन लोगों को बेचता है जो इनका पुनर्चक्रण करते हैं। लेकिन उसकी दुकान में इतना सारा कबाड़ होने पर, यदि वह उन्हें ठीक से संगठित न करे तो अपना व्यापार चलाना बहुत मुश्किल हो जाएगा। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ को उपयुक्त रूप से समूहों या “वर्गों” में बाँटता है। वह पुराने अखबारों को एक साथ रखता है और उन्हें रस्सी से बाँधता है। फिर सभी खाली काँच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाता है और उन्हें “लोहा”, “ताँबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बाँटता है। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों - “अखबार”, “प्लास्टिक”, “काँच”, “धातु” आदि - में बाँटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो किसी खास वस्तु को खोजना, जो कोई खरीदार माँगे, आसान हो जाता है।

इसी प्रकार जब आप अपनी स्कूल की किताबों को किसी निश्चित क्रम में रखते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं, जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। इसलिए, जब आपको इतिहास की कोई विशेष किताब चाहिए, तो आपको बस “इतिहास” समूह में उस किताब को खोजना होता है। अन्यथा, आपको अपनी पूरी संग्रह में उस विशेष किताब को खोजना पड़ता।

जबकि वस्तुओं या चीजों का वर्गीकरण हमारा बहुमूल्य समय और प्रयास बचाता है, यह मनमाने ढंग से नहीं किया जाता है। कबड़ीवाला अपने कबाड़ को पुन: प्रयुक्त वस्तुओं के बाजार के अनुसार समूहित करता है। उदाहरण के लिए, “काँच” समूह के अंतर्गत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखेगा। इसी प्रकार जब आप अपनी इतिहास की किताबों को “इतिहास” समूह के अंतर्गत वर्गीकृत करते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूहन का संपूर्ण उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीजों को समूहों या वर्गों में व्यवस्थित करना है।

गतिविधि

  • अपने स्थानीय डाकघर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।

2. कच्चा आँकड़ा

कबड़ीवाले के कबाड़े की तरह, अवर्गीकृत डेटा या कच्चे डेटा अत्यधिक अव्यवस्थित होते हैं। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे कोई अर्थपूर्ण निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि ये सांख्यिकीय विधियों पर आसानी से काम नहीं करते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा का उचित संगठन और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला कदम उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए आप विद्यार्थियों की गणित में प्रदर्शन जानना चाहते हैं और आपने अपने विद्यालय के 100 विद्यार्थियों के गणित में प्राप्तांक एकत्र किए हैं। यदि आप उन्हें सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस प्रकार दिखाई देंगे जैसे सारणी 3.1।

सारणी 3.1 एक परीक्षा में 100 विद्यार्थियों द्वारा गणित में प्राप्त किए गए अंक

474510605156661004940
60595655624859555141
42696466505957656250
64303775175620145590
62515514253490495654
70474982408260856566
49446469704812285565
4940254171800561422
66534670436159123035
45445776823932149025

या आपने अपने पड़ोस के 50 घरों के मासिक खाद्य व्यय के आंकड़े जुटाए हों ताकि उनका औसत खाद्य व्यय जाना जा सके। उस स्थिति में एकत्रित आंकड़े, यदि आपने उन्हें सारणी के रूप में प्रस्तुत किया होता, तो वे सारणी 3.2 जैसे दिखते। सारणी 3.1 और सारणी 3.2 दोनों ही कच्चे या अवर्गीकृत आंकड़े हैं। दोनों सारणियों में आप देखते हैं कि संख्याएँ किसी क्रम में व्यवस्थित नहीं हैं। अब यदि आपसे सारणी 3.1 से गणित में अधिकतम अंक मांगे जाएँ तो आपको पहले 100 विद्यार्थियों के अंकों को या तो आरोही या अवरोही क्रम में व्यवस्थित करना होगा। यह एक थकाऊ कार्य है। यह और भी अधिक थकाऊ हो जाता है, यदि 100 के स्थान पर आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, सारणी 3.2 में आप देखेंगे कि आपके लिए 50 घरों का औसत मासिक व्यय ज्ञात करना कठिन है। और यह कठिनाई कई गुना बढ़ जाएगी यदि संख्या बड़ी हो—मान लीजिए, 5,000 घर। हमारे कबड़ीवाले की तरह, जिसे अपना कबाड़ बड़ा और अव्यवस्थित होने पर कोई विशेष वस्तु ढूँढ़ने में परेशानी होती है, आपको भी कच्चे और बड़े आंकड़ों से कोई सूचना निकालने में ऐसी ही स्थिति का सामना करना पड़ेगा। एक शब्द में, इसलिए, बड़े अवर्गीकृत आंकड़ों से सूचना निकालना एक थकाऊ कार्य है।

सारणी 3.2 50 घरों का खाद्य पर मासिक घरेलू व्यय (रुपयों में)

19041559347317352760
20411612175318554439
50901085182323461523
12111360111021521183
12181315110526282712
42481812126411831171
10071180195311372048
20251583132426213676
13971832196221772575
12931365114632221396

कच्चे आंकड़ों को संक्षेप में प्रस्तुत किया जाता है और वर्गीकरण द्वारा उन्हें समझने योग्य बनाया जाता है। जब समान लक्षणों वाले तथ्यों को एक ही वर्ग में रखा जाता है, तो इससे उन्हें आसानी से खोजा जा सकता है, तुलना की जा सकती है और बिना किसी कठिनाई के निष्कर्ष निकाले जा सकते हैं। आपने अध्याय 2 में पढ़ा है कि भारत सरकार दस वर्षों में एक बार जनगणना करती है। जनगणना 2001 में लगभग 20 करोड़ व्यक्तियों से संपर्क किया गया था। जनगणना के कच्चे आंकड़े इतने विशाल और टुकड़ों में बटे हुए होते हैं कि उनसे कोई सार्थक निष्कर्ष निकालना लगभग असंभव सा प्रतीत होता है। लेकिन जब उन्हीं आंकड़ों को लिंग, शिक्षा, वैवाहिक स्थिति, व्यवसाय आदि के अनुसार वर्गीकृत किया जाता है, तब भारत की जनसंख्या की संरचना और स्वरूप को आसानी से समझा जा सकता है।

कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। तालिका 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों को दर्शाते हैं। उदाहरण के लिए तालिका 3.1 को देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक दिए गए हैं। हम इन अंकों का अर्थ कैसे निकाल सकते हैं? इन अंकों को देखते हुए गणित की शिक्षिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण रहे हैं? हम आंकड़ों को किस प्रकार वर्गीकृत करते हैं, यह इस बात पर निर्भर करता है कि हमारा उद्देश्य क्या है। इस स्थिति में शिक्षिका इन विद्यार्थियों के प्रदर्शन की गहराई से समझ बनाना चाहती है। वह संभवतः बारंबारता बंटन बनाने का विकल्प चुनेगी। इसकी चर्चा अगले खंड में की गई है।

गतिविधि

  • अपने परिवार के कुल साप्ताहिक व्यय का एक वर्ष का आंकड़ा इकट्ठा कीजिए और उसे एक तालिका में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक रूप से व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।

3. आंकड़ों का वर्गीकरण

वर्गीकरण के समूह या वर्ग विभिन्न तरीकों से बनाए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णानुक्रम में भी वर्गीकृत कर सकते थे। या फिर आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते थे। आप उन्हें जिस तरह वर्गीकृत करना चाहेंगे, वह आपकी आवश्यकता पर निर्भर करेगा।

इसी प्रकार, कच्चे आंकड़ों को विभिन्न तरीकों से वर्गीकृत किया जाता है, जिसका उद्देश्य होता है। इन्हें समय के अनुसार भी समूहीकृत किया जा सकता है। इस प्रकार की वर्गीकरण को कालानुक्रमिक वर्गीकरण कहा जाता है। इस वर्गीकरण में आंकड़ों को समय के संदर्भ में या तो आरोही या अवरोही क्रम में वर्गीकृत किया जाता है, जैसे वर्ष, तिमाही, महीने, सप्ताह आदि। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के संदर्भ में वर्गीकृत करता है। चर ‘जनसंख्या’ एक समय श्रृंखला है क्योंकि यह विभिन्न वर्षों के लिए मानों की एक श्रृंखला को दर्शाता है।

उदाहरण 1

भारत की जनसंख्या (करोड़ों में)

वर्षजनसंख्या (करोड़ों में)
195135.7
196143.8
197154.6
198168.4
199181.8
2001102.7
2011121.0

स्थानिक वर्गीकरण में आंकड़ों को भौगोलिक स्थानों के संदर्भ में वर्गीकृत किया जाता है, जैसे देश, राज्य, शहर, जिले आदि।

उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार को दर्शाता है।

उदाहरण 2

विभिन्न देशों में गेहूं की पैदावार (2013)

देशगेहूं की पैदावार (किग्रा/हेक्टेयर)
कनाडा3594
चीन5055
फ्रांस7254
जर्मनी7998
भारत3154
पाकिस्तान2787

स्रोत: इंडियन एग्रीकल्चरल स्टैटिस्टिक्स एट अ ग्लांस, 2015

गतिविधियाँ

  • उदाहरण 1 में वे वर्ष ज्ञात कीजिए जिनमें भारत की जनसंख्या न्यूनतम और अधिकतम थी।
  • उदाहरण 2 में वह देश ज्ञात कीजिए जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। वह प्रतिशत के रूप में कितनी होगी?
  • उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित कीजिए। पैदावार के अवरोही क्रम के लिए भी वही व्यायाम कीजिए।

कभी-कभी आप ऐसी विशेषताओं से मिलते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसी विशेषताओं को गुणधर्म कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन गुणधर्मों को किसी गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। गुणधर्मों पर आधारित ऐसे आँकड़ों के वर्गीकरण को गुणात्मक वर्गीकरण कहा जाता है। निम्नलिखित उदाहरण में हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो विशेषताओं को वैवाहिक स्थिति के आधार पर आगे इस प्रकार वर्गीकृत किया जा सकता है:

उदाहरण 3

पहले चरण का वर्गीकरण किसी गुण की उपस्थिति और अनुपस्थिति के आधार पर किया जाता है, अर्थात् पुरुष या पुरुष नहीं (महिला)। दूसरे चरण पर, प्रत्येक वर्ग — पुरुष और महिला — को एक अन्य गुण की उपस्थिति या अनुपस्थिति के आधार पर और उपविभाजित किया जाता है, अर्थात् विवाहित या अविवाहित। लक्षण, जैसे ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि, प्रकृति में मात्रात्मक होते हैं। जब ऐसे लक्षणों के संग्रहित आँकड़ों को वर्गों में समूहबद्ध किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।

गतिविधि

  • आस-पास की वस्तुओं को जीवित या अजीवित के रूप में समूहबद्ध किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित में अंकों का बारंबारता बंटन

अंकबारंबारता
0-101
10-208
20-306
30-407
40-5021
50-6023
60-7019
70-806
80-905
90-1004
कुल100

उदाहरण 4 में सारणी 3.1 में दिए गए 100 छात्रों के गणित में अंकों का मात्रात्मक वर्गीकरण दिखाया गया है।

गतिविधि

  • उदाहरण 4 की बारंबारता मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।
  • उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सान्निध्यता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सान्निध्यता है?

4. चर: सतत और विविक्त

एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि वह कैसे भिन्न होता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:

(i) निरंतर और अबाधित

(ii) विविक्त गणित।

एक निरंतर चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4, \ldots)$, भिन्न मान $(1 / 2,2 / 3,3 / 4, \ldots)$, और ऐसे मान भी ले सकता है जो ठीक-ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$ )। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे-जैसे वह बढ़ता है मान लीजिए $90 \mathrm{~cm}$ से $150 \mathrm{~cm}$ तक, इनके बीच के सभी मान लेगी। यह पूर्ण संख्याओं जैसे $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$ के रूप में मान ले सकती है। यह भिन्न मान भी ले सकती है जैसे 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान प्रकट करने में सक्षम है और इसके मानों को अनंत स्तरों में भी तोड़ा जा सकता है। निरंतर चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।

एक सतत चर के विपरीत, एक विच्छिन्न चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” द्वारा बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन उनके बीच कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, एक चर जैसे “कक्षा में छात्रों की संख्या”, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के रूप में मान ग्रहण करेगा। यह कोई भिन्नात्मक मान जैसे 0.5 नहीं ले सकता क्योंकि “आधा छात्र” असंगत है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 या 26 हो सकता था। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, उनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विच्छिन्न चर कोई भिन्नात्मक मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1 / 8,1$ / $16,1 / 32,1 / 64, \ldots$ जैसे मान लेता है। क्या यह एक विच्छिन्न चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्नात्मक मान लेता है, यह दो आसन्न भिन्नात्मक मानों के बीच कोई मान नहीं ले सकता। यह $1 /$ 8 से $1 / 16$ और $1 / 16$ से $1 / 32$ पर बदलता या “छलांग” लगाता है। लेकिन यह $1 / 8$ और $1 / 16$ या $1 / 16$ और $1 / 32$ के बीच कोई मान नहीं ले सकता।

गतिविधि

  • निम्नलिखित चरों को सतत और विच्छिन्न के रूप में भेद कीजिए: क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

उदाहरण 4 दिखाता है कि किस प्रकार 100 छात्रों के अंकों को वर्गों में समूहबद्ध किया गया है। आप सोच रहे होंगे कि हमने यह टेबल 3.1 के कच्चे आँकड़ों से कैसे प्राप्त किया। लेकिन इस प्रश्न को हल करने से पहले, आपको यह जानना होगा कि बारंबारता बंटन क्या होता है।

5. बारंबारता बंटन क्या है?

बारंबारता बंटन एक मात्रात्मक चर के कच्चे आँकड़ों को वर्गीकृत करने का एक व्यापक तरीका है। यह दिखाता है कि चर के विभिन्न मान (यहाँ, एक छात्र द्वारा गणित में प्राप्त अंक) विभिन्न वर्गों में किस प्रकार बँटे हैं और उनके संगत वर्ग बारंबारताएँ क्या हैं। इस स्थिति में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20, \ldots$, 90-100। वर्ग बारंबारता शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में हमें टेबल 3.1 के कच्चे आँकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग 30-40 की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि 40- जो कच्चे आँकड़ों में दो बार आ रहा है- वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल किया जाता तो वर्ग 30-40 की बारंबारता 7 के स्थान पर 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप इस अध्याय को धैर्यपूर्वक पढ़ें। इसलिए आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।

प्रत्येक वर्ग आवृत्ति बंटन सारणी में वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ किसी वर्ग के दो छोर होते हैं। सबसे छोटा मान निम्न वर्ग सीमा कहलाता है और सबसे बड़ा मान उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और उच्च वर्ग सीमा 70 है। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए वर्ग अंतराल 10 है (उच्च वर्ग सीमा घटा निम्न वर्ग सीमा)।

वर्ग मध्य-बिंदु या वर्ग चिह्न किसी वर्ग का मध्य मान होता है। यह वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के बीच आधे रास्ते पर स्थित होता है और निम्न प्रकार से ज्ञात किया जा सकता है:

वर्ग मध्य-बिंदु या वर्ग चिह्न

$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$

प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान उस वर्ग को प्रस्तुत करने के लिए प्रयोग किया जाता है। एक बार कच्चे आँकड़ों को वर्गों में समूहबद्ध करने के बाद, व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयोग नहीं किए जाते। इसके बजाय वर्ग चिह्न का उपयोग किया जाता है।

TABLE 3.3 The Lower Class Limits, the Upper Class Limits and the Class Mark

वर्गआवृत्तिनिचली वर्ग सीमाऊपरी वर्ग सीमावर्ग चिह्न
0-1010105
10-208102015
20-306203025
30-407304035
40-5021405045
50-6023506055
60-7019607065
70-806708075
80-905809085
90-10049010095

आवृत्ति वक्र एक आवृत्ति बंटन का चित्रात्मक प्रतिनिधित्व है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$-अक्ष पर लेखांकित करते हैं।

चित्र 3.1: आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।

आवृत्ति बंटन तैयार करने की विधि

आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों का समाधान करना आवश्यक होता है:

  1. क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
  2. हमें कितने वर्ग होने चाहिए?
  3. प्रत्येक वर्ग का आकार क्या होना चाहिए?
  4. वर्ग सीमाएँ कैसे निर्धारित करें?
  5. प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

ऐसी दो परिस्थितियाँ होती हैं जिनमें असमान आकार के अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय और अन्य समान चरों पर आँकड़े हों जहाँ परास बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर कई सौ करोड़ रुपये तक हो सकती है। ऐसी स्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों तो बहुत सारे वर्ग बन जाएँगे। (ii) यदि वर्ग अंतराल छोटे हों तो हम या तो बहुत कम स्तर या बहुत अधिक स्तर की आय की सूचना को दबाने की ओर अग्रसर होंगे।

दूसरी, यदि बड़ी संख्या में मान परास के एक छोटे भाग में केंद्रित हों, तो समान वर्ग अंतराल कई मानों पर सूचना की कमी का कारण बनेंगे।

अन्य सभी मामलों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का प्रयोग किया जाता है।

हमें कितने वर्ग होने चाहिए?

वर्गों की संख्या सामान्यतः छह से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हों तो वर्गों की संख्या परास (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से भाग देकर निकाली जा सकती है।

गतिविधियाँ

निम्नलिखित की परास ज्ञात कीजिए:

  • उदाहरण 1 में भारत की जनसंख्या,
  • उदाहरण 2 में गेहूँ की पैदावार।

प्रत्येक नमूने का आकार कितना होना चाहिए?

इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई हो, तो हम वर्ग अंतराल तय करने के बाद वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक को तय किए बिना दूसरे को तय नहीं कर सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया है, इसलिए वर्ग अंतराल स्वतः 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालाँकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई के होते।

वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?

वर्ग सीमाएँ निश्चित और स्पष्ट रूप से कही गई होनी चाहिए। सामान्यतः, खुली सीमाओं वाले वर्ग जैसे “70 और ऊपर” या “10 से कम” वांछनीय नहीं होते।

निम्न और उच्च वर्ग सीमाओं को इस प्रकार निर्धारित करना चाहिए कि प्रत्येक वर्ग की आवृत्तियाँ वितरण के मध्य में केंद्रित होने की प्रवृत्ति रखें।

वर्ग अंतराल दो प्रकार के होते हैं:

(i) समावेशी वर्ग अंतराल: इस स्थिति में, किसी वर्ग की निम्न और उच्च सीमा के बराबर मान उसी वर्ग की आवृत्ति में शामिल किए जाते हैं।

(ii) अपवर्जी वर्ग अंतराल: इस स्थिति में, कोई वस्तु जो निम्न या उच्च वर्ग सीमा के बराबर हो, उस वर्ग की आवृत्ति से बाहर रखी जाती है।

विच्छिन्न चरों के मामले में, केवल अपवर्जी वर्ग अंतराल ही प्रयुक्त किए जा सकते हैं।

संयत चरों के मामले में विशिष्ट वर्ग अंतरालों का प्रायः उपयोग किया जाता है।

उदाहरण

मान लीजिए हमारे पास एक परीक्षा में विद्यार्थियों द्वारा प्राप्त अंकों का आंकड़ा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए विद्यार्थियों द्वारा प्राप्त अंक 0 से 100 तक भिन्न-भिन्न हैं।

यह एक विचरित चर का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस स्थिति में, यदि हम समान आकार के वर्ग अंतरालों का उपयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं, तो वर्ग अंतराल निम्नलिखित में से किसी भी रूप में हो सकते हैं:

समावेशी रूप के वर्ग अंतराल:

$0-10$

$11-20$

$21-30$

$-$

$-$

$91-100$

विशिष्ट रूप के वर्ग अंतराल: 0–10

$10-20$

$20-30$

$-$

$-$

$90-100$

विशिष्ट वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें कोई मान वर्ग सीमा के बराबर मिलता है तो उसे क्या करना है। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को क्रमशः “0 से 10” और “20 से 30” वर्ग अंतरालों में रखा जाए। इसे निम्न सीमा बहिष्कृत का मामला कहा जा सकता है।

अथवा हम 10, 30 आदि मानों को क्रमशः “10 से 20” और “30 से 40” वर्ग अंतरालों में रख सकते हैं। इसे निम्न सीमा बहिष्कृत का मामला कहा जा सकता है।

संयत चर का उदाहरण

मान लीजिए हमारे पास ऊंचाई (सेंटीमीटर) या वजन (किलोग्राम) जैसे चर का आंकड़ा है। यह आंकड़ा संयत प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित प्रकार से परिभाषित किए जा सकते हैं:

$30 \mathrm{Kg}-39.999 \ldots \mathrm{Kg}$

$40 \mathrm{Kg}-49.999 \ldots \mathrm{Kg}$

$50 \mathrm{Kg}-59.999 \ldots \mathrm{Kg}$ आदि।

इन वर्ग अंतरालों को निम्नलिखित तरीके से समझा जाता है:

$30 \mathrm{Kg}$ और उससे ऊपर तथा $40 \mathrm{Kg}$ से कम

$40 \mathrm{Kg}$ और उससे ऊपर तथा $50 \mathrm{Kg}$ से कम

$50 \mathrm{Kg}$ और उससे ऊपर तथा $60 \mathrm{Kg}$ से कम, आदि।

TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय की बारंबारता बंटन

आय $(Rs)$कर्मचारियों की संख्या
800-89950
900-999100
1000-1099200
1100-1199150
1200-129940
1300-139910
कुल550

वर्ग अंतराल में समायोजन

Table 3.4 में समावेशी विधि का सावधानीपूर्वक निरीक्षण करने पर यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, फिर भी जब वर्ग बनाए जाते हैं तो ऐसी निरंतरता बनाए नहीं रखी जाती। हम एक वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांध्यता पाते हैं। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा: 899 और दूसरे वर्ग की निचली सीमा: 900 के बीच हमें 1 का “अंतराल” दिखाई देता है। तो फिर हम वर्गीकरण करते समय चर की निरंतरता कैसे सुनिश्चित करते हैं? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिखित तरीके से किया जाता है:

  1. दूसरे वर्ग की निचली सीमा और पहले वर्ग की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, तालिका 3.4 में दूसरे वर्ग की निचली सीमा 900 है और पहले वर्ग की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899=1)$
  2. (1) में प्राप्त अंतर को दो से विभाजित करें, अर्थात् $(1 / 2 = 0.5)$
  3. (2) में प्राप्त मान को सभी वर्गों की निचली सीमाओं से घटाएँ (निचली वर्ग सीमा – 0.5)
  4. (2) में प्राप्त मान को सभी वर्गों की ऊपरी सीमाओं में जोड़ें (ऊपरी वर्ग सीमा + 0.5)।

आवृत्ति बंटन में डेटा की सांतत्यता को पुनः स्थापित करने वाले समायोजन के बाद, तालिका 3.4 को तालिका 3.5 में संशोधित किया गया है।

वर्ग सीमाओं में समायोजन के बाद, वर्ग-चिह्न के मान को निर्धारित करने वाला सूत्र (1) इस प्रकार संशोधित किया गया है:

समायोजित वर्ग-चिह्न = (समायोजित ऊपरी वर्ग सीमा + समायोजित निचली वर्ग सीमा)/2।

तालिका 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय (रु.)कर्मचारियों की संख्या
799.5-899.550
899.5-999.5100
999.5-1099.5200
1099.5-1199.5150
1199.5-1299.540
1299.5-1399.510
कुल550

प्रत्येक वर्ग के लिए आवृत्ति हमें कैसे प्राप्त करनी चाहिए?

सरल शब्दों में, एक प्रेक्षण की आवृत्ति का अर्थ है कि वह प्रेक्षण कच्चे आंकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक बार आता है; 49 पाँच बार आता है आदि। इस प्रकार 40 की आवृत्ति 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है आदि। परंतु जब आंकड़ों को वर्गों में समूहीकृत किया जाता है जैसे उदाहरण 3 में, वर्ग आवृत्ति का अर्थ है किसी विशेष वर्ग में मानों की संख्या। वर्ग आवृत्ति की गिनती संबंधित वर्ग के सामने टैली चिह्न लगाकर की जाती है।

टैली चिह्न लगाकर वर्ग आवृत्ति ज्ञात करना

प्रत्येक विद्यार्थी के लिए जिसके अंक किसी वर्ग में आते हैं, उस वर्ग के सामने एक टैली (/) लगाया जाता है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, तो हम वर्ग $50-60$ के सामने एक टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग $70-80$ के सामने टैली लगाई जाती है। यदि किसी को 40 अंक मिले हैं, तो वर्ग $40-50$ के सामने टैली लगाई जाती है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली गिनती दिखाती है।

TABLE 3.6 गणित में 100 विद्यार्थियों के अंकों की टैली गिनती

गिनती को आसान बनाने के लिए चार टैलियों को //// इस प्रकार लगाया जाता है और पाँचवीं टैली को उनके ऊपर | इस प्रकार लगाया जाता है। फिर टैलियों को पाँच-पाँच के समूहों में गिना जाता है। इसलिए यदि किसी वर्ग में 16 टैलियाँ हों, तो हम उन्हें सुविधा के लिए |||| | |||| | | इस प्रकार लगाते हैं। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने लगी टैलियों की संख्या के बराबर होती है।

सूचना की हानि

आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक अंतर्निहित कमी होती है। यद्यपि यह कच्चे आंकड़ों को संक्षेप और समझने योग्य बनाता है, पर इसमें वे विवरण नहीं दिखते जो कच्चे आंकड़ों में मौजूद होते हैं। कच्चे आंकड़ों को वर्गीकृत करने में सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़े के रूप में संक्षेपित करने से बहुत कुछ प्राप्त होता है। एक बार आंकड़ों को वर्गों में समूहबद्ध कर दिया जाता है, तो कोई भी व्यक्तिगत प्रेक्षण आगे की सांख्यिकीय गणनाओं में कोई महत्व नहीं रखता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहबद्ध किया जाता है, तो यह केवल उस वर्ग में रिकॉर्डों की संख्या देता है (अर्थात् बारंबारता = 6) पर उनके वास्तविक मान नहीं देता। इस वर्ग में सभी मानों को वर्ग अंतराल या वर्ग चिह्न के मध्य मान के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न के मानों पर आधारित होती हैं, न कि उस वर्ग में प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सच है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। फिर भी, कच्चे आंकड़ों को अधिक समझने योग्य बनाने की क्षमता इस हानि से कहीं अधिक लाभ देती है।

असमान वर्गों के साथ बारंबारता बंटन

अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि वे कच्चे आंकड़ों से कैसे बनाए जाते हैं। लेकिन कुछ मामलों में असमान वर्ग अंतरालों की बारंबारता बंटन अधिक उपयुक्त होती है। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 के रूप में देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संबंधित बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 छात्रों में से 63 $(21+23+19)$ छात्र इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 की मध्य सीमा में हैं। शेष 37 प्रतिशत आंकड़े वर्गों $0-10,10-20,20-30,30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। लेकिन यदि वर्ग इस प्रकार बनाए जाएं कि वर्ग चिह्न, जहाँ तक संभव हो, एक ऐसे मान से मेल खाएं जिसके आसपास वर्ग में प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त होता है।

तालिका 3.7 असमान वर्गों की बारंबारता बंटन

वर्गप्रेक्षणआवृत्तिवर्ग चिह्न
0-10015
10-2010,14,17,12,14,12,14,14815
20-3025,25,20,22,25,28625
30-4030,37,34,39,32,30,35735
40-4542,44,40,44,41,40,43,40,41942.5
45-5047,49,49,45,45,47,49,46,48,48,49,491247.5
50-5551,53,51,50,51,50,54752.5
55-6059,56,55,57,55,56,59,56,59,57,59,55,56,55,56,551657.5
60-6560,64,62,64,64,60,62,61,60,621062.5
65-7066,69,66,69,66,65,65,66,65967.5
70-8070,75,70,76,70,71675
80-9082,82,82,80,85585
90-10090,100,90,90495
योग100

तालिका 3.7 तालिका 3.6 की उसी बारंबारता बंटन को असमान वर्गों के रूप में दर्शाती है। प्रत्येक वर्ग 40-50, 50-60 और 60-70 को दो-दो में विभाजित किया गया है। वर्ग 40-50 को 40-45 और 45-50 में बाँटा गया है। वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है। और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है। नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 का वर्ग अंतराल 5 है। अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपना पुराना वर्ग अंतराल 10 बनाए रखते हैं। इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है। इन्हें तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से तुलना कीजिए। ध्यान दीजिए कि इन वर्गों में प्रेक्षण उनके पुराने वर्ग चिह्न मानों की अपेक्षा अपने नए वर्ग चिह्न मानों से अधिक विचलित होते हैं। इस प्रकार नए वर्ग चिह्न मान इन वर्गों में आँकड़ों के लिए पुराने मानों की अपेक्षा अधिक प्रतिनिधिक हैं।

आकृति 3.2 तालिका 3.7 के बंटन की बारंबारता वक्र दिखाती है।

आकृति 3.2: बारंबारता वक्र

तालिका के वर्ग चिह्नों को X-अक्ष पर और बारंबारताओं को Y-अक्ष पर आलेखित किया गया है।

गतिविधि

  • यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या देखते हैं? क्या आपको इनमें कोई अंतर दिखता है? क्या आप उस अंतर की व्याख्या कर सकते हैं?

बारंबारता सरणी

अब तक हमने गणित में 100 विद्यार्थियों के प्रतिशत अंकों के उदाहरण का उपयोग करके एक सतत चर के लिए आँकड़ों के वर्गीकरण पर चर्चा की है। एक विच्छिन्न चर के लिए उसके आँकड़ों का वर्गीकरण बारंबारता बंटन (Frequency Distribution) कहलाता है। चूँकि एक विच्छिन्न चर मान लेता है और दो पूर्णांक मानों के बीच की मध्यवर्ती भिन्नात्मक मान नहीं लेता, इसलिए हमारे पास प्रत्येक पूर्णांक मान से संगत बारंबारताएँ होती हैं।

तालिका 3.8 में दिया गया उदाहरण एक बारंबारता अभिकरण (Frequency Array) को दर्शाता है।

तालिका 3.8 परिवार के आकार का बारंबारता अभिकरण

परिवार का आकारपरिवारों की संख्या
15
215
325
435
510
65
73
82
योग100

चर “परिवार का आकार” एक विच्छिन्न चर है जो तालिका में दिखाए अनुसार केवल पूर्णांक मान ही लेता है।

6. द्विचर बारंबारता बंटन

अक्सर जब हम किसी जनसंख्या से एक नमूना लेते हैं तो नमूने के प्रत्येक तत्व से एक से अधिक प्रकार की सूचनाएँ एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का नमूना लिया है। मान लीजिए हमने प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र की है। इस स्थिति में हमारे पास द्विचर नमूना आँकड़े हैं। ऐसे द्विचर आँकड़ों को एक द्विचर बारंबारता बंटन का उपयोग करके संक्षेप में प्रस्तुत किया जा सकता है।

द्विचर बारंबारता बंटन को दो चरों के मानों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।

तालिका 3.9 में 20 कंपनियों की दो चरों—बिक्री और विज्ञापन व्यय (रुपये लाख में)—की आवृत्ति बंटन दिखाया गया है। बिक्री के मान विभिन्न स्तंभों में वर्गीकृत हैं और विज्ञापन व्यय के मान विभिन्न पंक्तियों में वर्गीकृत हैं। प्रत्येक कोष्ठक संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाता है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन के उपयोग को अध्याय 8—सहसंबंध—में लिया जाएगा।

7. निष्कर्ष

प्राथमिक और द्वितीय स्रोतों से एकत्रित आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े इकट्ठे हो जाने के बाद, अगला कदम उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना होता है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से व्यापक रूप से कैसे वर्गीकृत किया जा सकता है। एक बार जब आप वर्गीकरण की तकनीकों को जान लेते हैं, तो आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना आसान हो जाएगा।

तालिका 3.9 बिक्री (लाख रुपये में) और विज्ञापन व्यय (हजार रुपये में) का द्विचर आवृत्ति बंटन 20 फर्मों का

115–125125–135135–145145–155155–165165–175कुल
62-64213
64-66134
66-6811215
68-70224
70-7211114
कुल45631120

सारांश

  • वर्गीकरण कच्चे आँकड़ों में क्रम लाता है।
  • एक बारंबारता बंटन दिखाता है कि किसी चर के भिन्न-भिन्न मान किस प्रकार विभिन्न वर्गों में बँटे हैं तथा संगत वर्ग बारंबारताएँ क्या हैं।
  • विशिष्ट विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।
  • समावेशी विधि में ऊपरी और निचली दोनों वर्ग सीमाएँ शामिल की जाती हैं।
  • बारंबारता बंटन में आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों पर नहीं।
  • वर्गों को इस प्रकार बनाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न यथासंभव उस मान के निकट आए, जिसके आसपास वर्ग के प्रेक्षण एकत्रित होते हैं।

अभ्यास

1. निम्नलिखित में से कौन-सा विकल्प सही है?

(i) वर्ग मध्यबिंदु बराबर होता है:

(a) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के औसत का।

(b) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के गुणनफल का।

(c) ऊपरी वर्ग सीमा और निचली वर्ग सीमा के अनुपात का।

(d) उपर्युक्त में से कोई नहीं।

(ii) दो चरों की बारंबारता बंटन को द्विचर बारंबारता बंटन कहा जाता है

(a) एकचर बंटन
(b) द्विचर बंटन
(c) बहुचर बंटन
(d) उपर्युक्त में से कोई नहीं

(iii) वर्गीकृत आँकड़ों में सांख्यिकीय गणनाएँ सुरक्षित और मान्यताप्राप्त पद्धतियों पर आधारित होती हैं

(a) मापों के वास्तविक मानों पर
(b) उच्च वर्ग सीमा पर
(c) निम्न वर्ग सीमाओं पर
(d) वर्ग मध्य-बिंदुओं पर

(iv) परिसर विचरण का माप है

(a) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर
(b) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर
(c) सबसे बड़े और सबसे छोटे प्रेक्षणों का औसत
(d) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात

2. क्या चीज़ों को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के एक उदाहरण के साथ समझाइए।

3. चर क्या होता है? विचर और संचर चर के बीच अंतर बताइए।

4. आँकड़ों के वर्गीकरण में प्रयुक्त ‘अनन्य’ और ‘समावेशी’ पद्धतियों की व्याख्या कीजिए।

5. तालिका 3.2 में दिए गए 50 परिवारों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित आँकड़ों का प्रयोग कीजिए और

(i) भोजन पर मासिक घरेलू व्यय की परिसर प्राप्त कीजिए।

(ii) परिसर को उपयुक्त संख्या में वर्ग अंतरालों में बाँटिए और व्यय की बारंबारता बंटन प्राप्त कीजिए।

(iii) उन परिवारों की संख्या ज्ञात कीजिए जिनका मासिक भोजन व्यय

(a) रु 2000 से कम है
(b) रु 3000 से अधिक है
(c) रु 1500 और रु 2500 के बीच है

6. एक शहर में 45 परिवारों से उनके द्वारा उपयोग किए जाने वाले सेल फोन की संख्या के बारे में सर्वेक्षण किया गया। नीचे दर्ज उनकी प्रतिक्रियाओं के आधार पर एक आवृत्ति सरणी तैयार करें।

132222121223333
332322616215153
242742434203143

7. वर्गीकृत डेटा में ‘सूचना की हानि’ क्या है?

  1. क्या आप सहमत हैं कि वर्गीकृत डेटा कच्चे डेटा की तुलना में अधिक सुरक्षित है? क्यों?

9. एकचर और द्विचर आवृत्ति बंटन के बीच अंतर स्पष्ट कीजिए।

10. निम्नलिखित डेटा से 7 की वर्ग अंतराल लेते हुए समावेशी विधि द्वारा एक आवृत्ति बंटन तैयार कीजिए।

281715222921232718127294
1831052016128433272115
33627189246323129181413
151197153732282624201925
192069

11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से देखें और प्रत्येक शब्द में अक्षरों की संख्या को नोट करें। अक्षरों की संख्या को एक चर मानते हुए, इस डेटा के लिए एक आवृत्ति सरणी तैयार करें।

सुझाया गया गतिविधि

  • अपनी पुरानी अंकपत्रिकाओं से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित में प्राप्त अंक खोजें। उन्हें वर्षवार व्यवस्थित करें। जांचें कि क्या आपके द्वारा इस विषय में प्राप्त अंक एक चर हैं या नहीं। यह भी देखें कि क्या वर्षों के साथ आपने गणित में सुधार किया है।