अध्याय 13 सांख्यिकी
“सांख्यिकी को सही तौर पर औसत और उनके अनुमान की विज्ञान कहा जा सकता है।” - A.L.BOWLEY & A.L. BODDINGTON
परिचय
हम जानते हैं कि सांख्यिकी विशेष उद्देश्यों के लिए एकत्रित डेटा के साथ संबंधित होती है। हम डेटा के विश्लेषण और व्याख्या के माध्यम से डेटा के बारे में निर्णय ले सकते हैं। पिछली कक्षाओं में हमने डेटा के आरेखीय और सारणी रूप में प्रस्तुत करने के विधियों के अध्ययन किया है। इस प्रस्तुति द्वारा डेटा के कुछ महत्वपूर्ण विशेषताओं या गुणों को खुलासा किया जा सकता है। हमने डेटा के लिए प्रतिनिधि मूल्य खोजने के विधियों के अध्ययन भी किया है। इस मूल्य को केंद्रीय प्रवृत्ति का माप कहा जाता है। याद रखें, औसत (अंकगणितीय औसत), माध्यिका और बहुलक केंद्रीय प्रवृत्ति के तीन माप हैं। केंद्रीय प्रवृटि का माप हमें डेटा बिंदुओं के केंद्र के बारे में एक धुंआ धुंआ विचार देता है।
कार्ल पियरसन (1857-1936 ई.स.)
लेकिन, डेटा से बेहतर व्याख्या करने के लिए हमें डेटा कैसे फैले हुए हैं या केंद्रीय प्रवृत्ति के माप के आसपास वे कितने एकत्रित हैं, इसके बारे में भी एक धारणा होना चाहिए।
अब दो बल्लेबाजों द्वारा अपने अंतिम दस मैचों में बनाए गए रनों को निम्नलिखित तरह से विचार करें:
बल्लेबाज A : $30,91,0,64,42,80,3,5,117,71$
बैट्समैन B : $53,46,48,50,53,53,58,60,57,52$
स्पष्ट रूप से, डेटा का औसत और माध्यिका निम्नलिखित है
$ \begin{array}{|c|c|c|} \hline & \text{बैट्समैन A} & \text{बैट्समैन B} \ \hline \text{औसत} & 53 & 53 \ \hline \text{माध्यिका} & 53 & 53 \ \hline \end{array} $
याद रखें कि, हम डेटा के औसत की गणना (जिसे $\bar{x}$ से नोट किया जाता है) को अवलोकनों के योग को अवलोकनों की संख्या से विभाजित करके करते हैं, अर्थात,
$ \bar{x}=\dfrac{1}{n} \sum\limits_{i=1}^{n} x_i $
साथ ही, माध्यिका की गणना करने के लिए सबसे पहले डेटा को बढ़ते या घटते क्रम में व्यवस्थित कर दें और निम्नलिखित नियम को लागू करें।
यदि अवलोकनों की संख्या विषम हो, तो माध्यिका $\left(\dfrac{n+1}{2}\right)^{\text{th }}$ अवलोकन होता है।
यदि अवलोकनों की संख्या सम हो, तो माध्यिका $\left(\dfrac{n}{2}\right)^{\text{th }}$ और $\left(\dfrac{n}{2}+1\right)^{\text{th }}$ अवलोकनों के औसत होता है।
हम देखते हैं कि दोनों बल्लेबाज $A$ और B द्वारा बनाए गए रनों के माध्य और माध्यिका समान हैं, अर्थात 53 है। क्या हम कह सकते हैं कि दोनों खिलाड़ियों के प्रदर्शन समान है? स्पष्ट रूप से नहीं, क्योंकि बल्लेबाज $A$ के स्कोर में विचलन 0 (न्यूनतम) से 117 (अधिकतम) तक है। जबकि बल्लेबाज B द्वारा बनाए गए रनों की श्रेणी 46 से 60 तक है।
अब हम उपरोक्त अंकों को एक संख्या रेखा पर बिंदु के रूप में आलेखित करेंगे। हम निम्नलिखित आकृतियों को पाते हैं:
बट्समैन A के लिए
चित्र 13.1
बट्समैन B के लिए
चित्र 13.2
हम देख सकते हैं कि बट्समैन B के बिंदु एक दूसरे के पास हैं और मध्यमान माप (माध्य और माध्यिका) के आसपास एकत्रित हैं, जबकि बट्समैन A के बिंदु फैले हुए या अधिक फैले हुए हैं।
इस प्रकार, केंद्रीय प्रवृत्ति के माप एक दिए गए डेटा के बारे में पूरी जानकारी देने के लिए पर्याप्त नहीं होते हैं। विचलन एक अन्य कारक है जिसे सांख्यिकी में अध्ययन करना आवश्यक होता है। जैसे कि ‘केंद्रीय प्रवृत्ति के माप’ हम विचलन के बारे में एक अकेली संख्या की आवश्यकता रखते हैं। इस अकेली संख्या को ‘विचलन का माप’ कहते हैं। इस अध्याय में, हम अनेक महत्वपूर्ण विचलन के माप और उनके गणना के विधियों के बारे में सीखेंगे, जो असमूहित और समूहित डेटा के लिए होते हैं।
13.2 विचलन के माप
The dispersion or scatter in a data is measured on the basis of the observations and the types of the measure of central tendency, used there. There are following measures of dispersion:
(i) Range, (ii) Quartile deviation, (iii) Mean deviation, (iv) Standard deviation.
In this Chapter, we shall study all of these measures of dispersion except the quartile deviation.
13.3 Range
Recall that, in the example of runs scored by two batsmen A and B, we had some idea of variability in the scores on the basis of minimum and maximum runs in each series. To obtain a single number for this, we find the difference of maximum and minimum values of each series. This difference is called the ‘Range’ of the data.
अगर बैटमैन A के लिए, परिसर $=117-0=117$ है और बैटमैन B के लिए, परिसर $=60-46=14$ है। स्पष्ट रूप से, A के परिसर $>$ B के परिसर है। अतः, A के स्कोर विस्तार या विचलन में हैं जबकि B के स्कोर एक दूसरे के करीब हैं।
इसलिए, एक श्रेणी के परिसर $=$ अधिकतम मान - न्यूनतम मान।
डेटा के परिसर हमें विचलन या विस्तार के बारे में एक धुंआ धुंआ अंदाज देता है, लेकिन इससे डेटा के केंद्रीय प्रवृत्ति के संबंध में वितरण के बारे में कुछ नहीं कहा जा सकता। इसके लिए हमें कुछ अन्य विचलन के माप की आवश्यकता होती है। स्पष्ट रूप से, ऐसा माप केंद्रीय प्रवृत्ति से मानों के अंतर (या विचलन) पर निर्भर करना चाहिए।
$ \text{ M.D. }(a)=\dfrac{\text{ Sum of absolute values of deviations from ’ } a \text{ ’ }}{\text{ Number of observations }} . $
Remark माध्य विचलन को किसी भी केंद्रीय प्रवृत्ति के माप से प्राप्त किया जा सकता है। हालांकि, माध्य और माधिका के संबंध में माध्य विचलन का उपयोग सांख्यिकीय अध्ययनों में आमतौर पर किया जाता है।
13.4.1 असमूहित डेटा के लिए माध्य विचलन
मान लीजिए $n$ प्रेक्षण $x_1, x_2, x_3, \ldots ., x_n$ हैं। माध्य या माधिका के संबंध में माध्य विचलन की गणना के लिए निम्नलिखित कदम शामिल होते हैं:
स्टेप 1 केंद्रीय प्रवृत्ति के माप की गणना करें जिसके बारे में हम माध्य विचलन ज्ञात करेंगे। इसे ’ $a$ ’ कहें।
स्टेप 2 प्रत्येक $x_i$ को $a$ से विचलन ज्ञात करें, अर्थात, $x_1-a, x_2-a, x_3-a, \ldots, x_n-a$
स्टेप 3 विचलनों के अंतिम मान ज्ञात करें, अर्थात, यदि इसमें चिह्न (-) हो तो उसे छोड़ दें, अर्थात, $|x_1-a|,|x_2-a|,|x_3-a|, \ldots .,|x_n-a|$
स्टेप 4 विचलनों के अंतिम मान के औसत की गणना करें। इस औसत को $a$ के बारे में माध्य विचलन कहते हैं, अर्थात,
$ \text{ M.D. }(a)=\dfrac{\sum\limits_{i=1}^{n}|x_i-a|}{n} $
$
इसलिए $\quad\quad\quad$ M.D. $(\bar{x})=\dfrac{1}{n} \sum\limits_{i=1}^{n}|x_i-\bar{x}|$, जहाँ $\bar{x}=$ औसत
और $\quad\quad\quad$ M.D. $(M)=\dfrac{1}{n} \sum\limits_{i=1}^{n}|x_i-M|$, जहाँ $M=$ माध्यिका
नोट - इस अध्याय में, हम अपवाद के अतिरिक्त अपवाद के अतिरिक्त माध्यिका को संकेतक चिन्ह M के रूप में दर्शाएंगे। अब हम ऊपरी विधि के कदमों को निम्नलिखित उदाहरणों में दिखाएंगे।
उदाहरण 1 निम्नलिखित डेटा के लिए औसत के संबंध में औसत विचलन ज्ञात कीजिए:
$ 6,7,10,12,13,4,8,12 $
हल हम चरण-दर-चरण प्रक्रिया करते हैं और निम्नलिखित प्राप्त करते हैं:
स्टेप 1 दिए गए डेटा का औसत है
$ \bar{x}=\dfrac{6+7+10+12+13+4+8+12}{8}=\dfrac{72}{8}=9 $
स्टेप 2 औसत $\bar{x}$ से अलग अलग प्रेक्षणों के विचलन, अर्थात $x_i-\bar{x}$ हैं
$\quad\quad\quad\quad 6-9,7-9,10-9,12-9,13-9,4-9,8-9,12-9$,
या $ \quad\quad -3,-2,1,3,4,-5,-1,3 $
स्टेप 3 विचलन के अंतर्गत मान, अर्थात $|x_i-\bar{x}|$ हैं
$ 3,2,1,3,4,5,1,3 $
स्टेप 4 औसत के संबंध में आवश्यक माध्य विचलन है
$ \text{ M.D. } \begin{aligned} (\bar{x}) & =\dfrac{\sum\limits_{i=1}^{8}|x_i-\bar{x}|}{8} \\
& =\dfrac{3+2+1+3+4+5+1+3}{8}=\dfrac{22}{8}=2.75 \end{aligned} $
नोट - हमें प्रत्येक बार कदम कदम बताकर गणना करने की जरूरत नहीं है, हम गणना कदम-कदम कर सकते हैं बिना कदमों के संदर्भ लेने के।
उदाहरण 2 निम्नलिखित डेटा के लिए माध्य के संबंध में माध्य विचलन ज्ञात कीजिए :
$ 12,3,18,17,4,9,17,19,20,15,8,17,2,3,16,11,3,1,0,5 $
हल हमें सबसे पहले दिए गए डेटा का माध्य $(\bar{x})$ ज्ञात करना होगा
$ \bar{x}=\dfrac{1}{20} \sum\limits_{i=1}^{20} x_i=\dfrac{200}{20}=10 $
माध्य से विचलन के अपस्वरूप मान, अर्थात $|x_i-\bar{x}|$ हैं
$ 2,7,8,7,6,1,7,9,10,5,2,7,8,7,6,1,7,9,10,5 $
इसलिए $\quad \sum\limits_{i=1}^{20}|x_i-\bar{x}|=124$
और $ \quad\quad\quad \text{ M.D. }(\bar{x})=\dfrac{123}{20}=6.2 $
उदाहरण 3 निम्नलिखित डेटा के लिए माध्य के संबंध में माध्य विचलन ज्ञात कीजिए:
$ 3,9,5,3,12,10,18,4,7,19,21 $
हल यहाँ प्रेक्षणों की संख्या 11 है जो विषम है। डेटा को आरोही क्रम में व्यवस्थित करने पर, हमें $3,3,4,5,7,9,10,12,18,19,21$ मिलता है
अब $\qquad$ माध्य $ \quad =\left(\dfrac{11+1}{2}\right)^{\text{th }} \text{ या } 6^{\text{th }} \text{ प्रेक्षण }=9
$
(a) अपवर्ती आवृत्ति वितरण मान लीजिए कि दिए गए डेटा में $n$ अलग-अलग मान $x_1, x_2, \ldots, x_n$ हैं जो क्रमशः आवृत्तियों $f_1, f_2, \ldots, f_n$ से घटित होते हैं। इस डेटा को नीचे दिए गए तालिका रूप में प्रस्तुत किया जा सकता है और इसे अपवर्ती आवृत्ति वितरण कहा जाता है: $ \begin{matrix} x: x_1 & x_2 & x_3 \ldots x_n \\ f: f_1 & f_2 & f_3 \ldots f_n \end{matrix} $
(i) माध्य के संबंध में विचलन
पहले हम दिए गए डेटा के माध्य $\bar{x}$ की गणना निम्नलिखित सूत्र का उपयोग करके करते हैं
$ \bar{x}=\dfrac{\sum\limits_{i=1}^{n} x_i f_i}{\sum\limits_{i=1}^{n} f_i}=\dfrac{1}{N} \sum\limits_{i=1}^{n} x_i f_i $
जहाँ $\sum\limits_{i=1}^{n} x_i f_i$ प्रेक्षण $x_i$ के अपने संगत आवृत्तियों $f_i$ के गुणनफलों का योग दर्शाता है और $N=\sum\limits_{i=1}^{n} f_i$ आवृत्तियों का योग है।
फिर, हम प्रेक्षण $x_i$ के माध्य $\bar{x}$ से विचलन ज्ञात करते हैं और उनके अंतराल मान लेते हैं, अर्थात् $|x_i-\bar{x}|$ सभी $i=1,2, \ldots, n$ के लिए।
इसके बाद, विचलनों के अंतराल मानों का माध्य ज्ञात करें, जो माध्य के संबंध में आवश्यक माध्य विचलन है। इसलिए
$ \quad\quad\text{ M.D. }(\bar{x})=\dfrac{\sum\limits_{i=1}^{n} f_i|x_i-\bar{x}|}{\sum\limits_{i=1}^{n} f_i}=\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-\bar{x}| $
(ii) माध्य के संबंध में माध्य विचलन
माध्य के संबंध में माध्य विचलन ज्ञात करने के लिए, हम दी गई विस्तृत आवृत्ति बंटन के माध्य को ज्ञात करते हैं। इसके लिए अवलोकनों को बढ़ते क्रम में व्यवस्थित कर लिया जाता है। इसके बाद संकल्पन आवृत्तियाँ प्राप्त कर ली जाती हैं। फिर, हम उस अवलोकन की पहचान करते हैं जिसकी संकल्पन आवृत्ति $ \dfrac{N}{2} $ के बराबर या ठीक अधिक हो, जहाँ $ N $ आवृत्तियों के योग है। इस अवलोकन के मान डेटा के मध्य में होता है, इसलिए यह आवश्यक माध्य है। माध्य ज्ञात करने के बाद, हम माध्य से विचलन के अंतर के अंतर्गत मान के अंतर के अंतर के औसत को प्राप्त करते हैं। इसलिए,
$ \text{ M.D.(M) }=\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-M| $
उदाहरण 4 निम्नलिखित डेटा के लिए माध्य के संबंध में माध्य विचलन ज्ञात कीजिए :
$ \begin{array}{|c|c|c|c|c|c|c|} \hline x_i & 2 & 5 & 6 & 8 & 10 & 12 \ \hline f_i & 2 & 8 & 10 & 7 & 8 & 5 \ \hline \end{array} $
हल हम दिए गए डेटा की एक तालिका 13.1 बनाएं और गणना के बाद अन्य स्तम्भ जोड़ दें।
तालिका 13.1
$ \begin{array}{|c|c|c|c|c|} \hline x_i & f_i & f_i x_i & |x_i - \bar{x}| & f_i |x_i - \bar{x}| \ \hline
2 & 2 & 4 & 5.5 & 11 \ 5 & 8 & 40 & 2.5 & 20 \ 6 & 10 & 60 & 1.5 & 15 \ 8 & 7 & 56 & 0.5 & 3.5 \ 10 & 8 & 80 & 2.5 & 20 \ 12 & 5 & 60 & 4.5 & 22.5 \ \hline & 40 & 300 & & 92 \ \hline \end{array} $
$ N=\sum\limits_{i=1}^{6} f_i=40, \quad \sum\limits_{i=1}^{6} f_i x_i=300, \quad \sum\limits_{i=1}^{6} f_i|x_i-\bar{x}|=92 $
Therefore $ \quad \quad \quad\bar{x}=\dfrac{1}{N} \sum\limits_{i=1}^{6} f_i x_i=\dfrac{1}{40} \times 300=7.5 $
and $\quad \quad \quad$ M. D. $(\bar{x})=\dfrac{1}{N} \sum\limits_{i=1}^{6} f_i|x_i-\bar{x}|=\dfrac{1}{40} \times 92=2.3$
उदाहरण 5 निम्नलिखित आंकड़ों के लिए माध्य विचलन माध्यिका के संबंध में ज्ञात कीजिए:
$ \begin{array}{|c|c|c|c|c|c|c|c|c|} \hline x_i & 3 & 6 & 9 & 12 & 13 & 15 & 21 & 22 \ \hline f_i & 3 & 4 & 5 & 2 & 4 & 5 & 4 & 3 \ \hline \end{array} $
हल दिए गए अवलोकन पहले से ही आरोही क्रम में हैं। दिए गए आंकड़ों में एक पंक्ति जो चल आवृत्ति के संबंध में है, जोड़कर हम निम्नलिखित प्राप्त करते हैं (तालिका 13.2)।
तालिका 13.2
$ \begin{array}{|c|c|c|c|c|c|c|c|c|} \hline x_i & 3 & 6 & 9 & 12 & 13 & 15 & 21 & 22 \ \hline \end{array} $
\hline f_i & 3 & 4 & 5 & 2 & 4 & 5 & 4 & 3 \ \hline c \cdot f & 3 & 7 & 12 & 14 & 18 & 23 & 27 & 30 \ \hline \end{array} $
अब, $N=30$ जो कि सम संख्या है।
मध्यका $15^{\text{वें }}$ और $16^{\text{वें }}$ प्रेक्षण का औसत है। इन दोनों प्रेक्षणों के लिए संकलित आवृत्ति 18 है, जिसके संगत प्रेक्षण 13 है।
इसलिए, मध्यका $M=\dfrac{15^{\text{वें }} \text{ प्रेक्षण }+16^{\text{वें }} \text{ प्रेक्षण }}{2}=\dfrac{13+13}{2}=13$
अब, मध्यका से विचलन के अंतर्गत अचर मान, अर्थात् $|x_i-M|$ तालिका 13.3 में दिखाए गए हैं।
तालिका 13.3
$ \begin{array}{|c|c|c|c|c|c|c|c|c|} \hline |x_i - M| & 10 & 7 & 4 & 1 & 0 & 2 & 8 & 9 \ \hline f_i & 3 & 4 & 5 & 2 & 4 & 5 & 4 & 3 \ \hline f_i|x_i - M| & 30 & 28 & 20 & 2 & 0 & 10 & 32 & 27 \ \hline \end{array} $
हमारे पास $ \quad \quad \quad \sum\limits_{i=1}^{8} f_i=30 \text{ और } \sum\limits_{i=1}^{8} f_i|x_i-M|=149 $
इसलिए $\qquad \text{ M. D. }(M) =\dfrac{1}{N} \sum\limits_{i=1}^{8} f_i|x_i-M|$
$\qquad \qquad \qquad \qquad \qquad \quad =\dfrac{1}{30} \times 149=4.97$
(ब) अतिरिक्त आवृत्ति वितरण एक अतिरिक्त आवृत्ति वितरण एक श्रृंखला होती है जिसमें डेटा विभिन्न वर्ग-अंतराल में वर्गीकृत किया जाता है बिना कोई अंतर के, अपने संगत आवृत्तियों के साथ।
उदाहरण के लिए, 100 छात्रों द्वारा प्राप्त अंक निम्नलिखित अतिरिक्त आवृत्ति वितरण में प्रस्तुत किए जाते हैं :
$ \begin{array}{|c|c|c|c|c|c|c|} \hline \text{अंक प्राप्त} & 0-10 & 10-20 & 20-30 & 30-40 & 40-50 & 50-60 \ \hline \text{छात्रों की संख्या} & 12 & 18 & 27 & 20 & 17 & 6 \ \hline
\end{array} $
(i) औसत के संबंध में माध्य विचलन
एक लगातार आवृत्ति बंटन के माध्य की गणना करते समय, हमने मान लिया था कि प्रत्येक वर्ग की आवृत्ति उसके मध्य-बिंदु पर केंद्रित है। यहाँ भी, हम प्रत्येक दिए गए वर्ग के मध्य-बिंदु को लिखते हैं और फिर एक असतत आवृत्ति बंटन के लिए माध्य विचलन खोजने के लिए आगे बढ़ते हैं।
हम निम्नलिखित उदाहरण लेते हैं।
उदाहरण 6 निम्नलिखित डेटा के लिए माध्य के संबंध में माध्य विचलन ज्ञात कीजिए।
$ \begin{array}{|c|c|c|c|c|c|c|c|}
\hline \text{Marks obtained} & 10-20 & 20-30 & 30-40 & 40-50 & 50-60 & 60-70 & 70-80 \ \hline \text{Number of students} & 2 & 3 & 8 & 14 & 8 & 3 & 2 \ \hline \end{array} $
हल हम दिए गए डेटा से निम्नलिखित तालिका 13.4 बनाते हैं :
तालिका 13.4
$ \begin{array}{|c|c|c|c|c|c|} \hline \text{Marks obtained} & \text{Number of students } f_i & \text{Mid-points } x_i & f_i x_i & |x_i-\bar{x}| & f_i|x_i-\bar{x}| \ \hline 10-20 & 2 & 15 & 30 & 30 & 60 \ 20-30 & 3 & 25 & 75 & 20 & 60 \ 30-40 & 8 & 35 & 280 & 10 & 80 \
40-50 & 14 & 45 & 630 & 0 & 0 \ 50-60 & 8 & 55 & 440 & 10 & 80 \ 60-70 & 3 & 65 & 195 & 20 & 60 \ 70-80 & 2 & 75 & 150 & 30 & 60 \ \hline & 40 & & 1800 & 8 & 400 \ \hline \end{array} $
यहाँ $ \quad \quad \quad N=\sum\limits_{i=1}^{7} f_i=40, \sum\limits_{i=1}^{7} f_i x_i=1800, \sum\limits_{i=1}^{7} f_i|x_i-\bar{x}|=400 $
इसलिए $ \quad \quad \quad\bar{x}=\dfrac{1}{N} \sum\limits_{i=1}^{7} f_i x_i=\dfrac{1800}{40}=45 $
और $ \quad \quad \quad\text{ M.D. }(\bar{x})=\dfrac{1}{N} \sum\limits_{i=1}^{7} f_i|x_i-\bar{x}|=\dfrac{1}{40} \times 400=10
$
औसत विचलन के औसत के संबंध में गणना के शॉर्टकट विधि
हम औसत $\bar{x}$ की गणना के बेहद बोरिंग कार्य को बचाने के लिए निम्नलिखित चरण-विचलन विधि का उपयोग कर सकते हैं। याद रखें कि इस विधि में, हम डेटा में मध्य या उसके निकट वाले बिंदु को मान लेते हैं। फिर अवलोकनों (या वर्गों के मध्य बिंदुओं) के विचलनों को इस अनुमानित औसत से लिया जाता है। यह केवल संख्या रेखा पर शून्य से अनुमानित औसत तक अंतर के परिवर्तन के बराबर है, जैसा कि चित्र 13.3 में दिखाया गया है।
चित्र 13.3
यदि सभी विचलनों का एक सामान्य गुणक हो, तो हम इस सामान्य गुणक से विचलनों को भाग देकर विचलनों को और अधिक सरल बना देते हैं। ये चरण-विचलन कहलाते हैं। चरण-विचलन लेने की प्रक्रिया संख्या रेखा पर मापदंड के पैमाने के परिवर्तन के रूप में चित्र 13.4 में दिखाई गई है।
चित्र 13.4
विचलन और चरण-विचलन प्रेक्षणों के आकार को कम करते हैं, ताकि गणनाएँ जैसे गुणन, आदि सरल हो जाएँ। मान लीजिए, नए चर को $d_i=\dfrac{x_i-a}{h}$ से नोट किया जाता है, जहाँ ’ $a$ ’ अनुमानित माध्य है और $h$ सामान्य गुणक है। तब, चरण-विचलन विधि द्वारा माध्य $\bar{x}$ निम्नलिखित द्वारा दिया जाता है:
$ \bar{x}=a+\dfrac{\sum\limits_{i=1}^{n} f_i d_i}{N} \times h $
उदाहरण 6 के डेटा को लेते हुए, हम चरण विचलन विधि का उपयोग करके माध्य विचलन ज्ञात करें।
मान लीजिए अपस्थापित माध्य $a=45$ और $h=10$ है, और निम्नलिखित तालिका 13.5 बनाएँ।
तालिका 13.5
$ \begin{array}{|c|c|c|c|c|c|c|} \hline \text{प्राप्त अंक} & \text{छात्रों की संख्या } f_i & \text{मध्य-अंक } x_i & d_i = \dfrac{x_i - 45}{10} & f_i d_i & |x_i-\bar{x}| & f_i|x_i-\bar{x}| \ \hline & f_i & x_i & & & & \ \hline 10-20 & 2 & 15 & -3 & -6 & 30 & 60 \ \hline \end{array} $
20-30 & 3 & 25 & -2 & -6 & 20 & 60 \ 30-40 & 8 & 35 & -1 & -8 & 10 & 80 \ 40-50 & 14 & 45 & 0 & 0 & 0 & 0 \ 50-60 & 8 & 55 & 1 & 8 & 10 & 80 \ 60-70 & 3 & 65 & 2 & 6 & 20 & 60 \ 70-80 & 2 & 75 & 3 & 6 & 30 & 60 \ \hline & 40 & & & 0 & & 400 \ \hline \end{array} $
इसलिए $\quad \quad \qquad \bar{x}=a+\dfrac{\sum\limits_{i=1}^{7} f_i d_i}{N} \times h$
$\qquad \qquad \qquad \quad \quad =45+\dfrac{0}{40} \times 10=45$
और $ \quad \quad \quad \text{ M.D. }(\bar{x})=\dfrac{1}{N} \sum\limits_{i=1}^{7} f_i|x_i-\bar{x}|=\dfrac{400}{40}=10 $
$ \text{ माध्यिका }=l+\dfrac{\dfrac{N}{2}-C}{f} \times h $
जहाँ माध्यिका वर्ग वह वर्ग अंतराल है जिसकी चलोत्तर आवृत्ति $\dfrac{N}{2}$ से ठीक अधिक या बराबर होती है, $N$ आवृत्तियों के योग है, $l, f, h$ और $C$ क्रमशः निम्न सीमा, आवृत्ति, माध्यिका वर्ग की चौड़ाई और माध्यिका वर्ग के पहले वर्ग की चलोत्तर आवृत्ति है। माध्यिका के निर्धारण के बाद, प्रत्येक वर्ग के मध्य-बिंदु $x_i$ के माध्यिका से विचलन के अवयवी मानों के अवयवी मान, अर्थात $|x_i-M|$ के अवयवी मान प्राप्त किए जाते हैं।
फिर $ \quad \quad \quad \text{ M.D. }(M)=\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-M| $
इस प्रक्रिया को निम्नलिखित उदाहरण में दिखाया गया है:
उदाहरण 7 निम्नलिखित आंकड़ों के लिए मध्य बिंदु के संबंध में माध्य विचलन की गणना करें :
$ \begin{array}{|c|c|c|c|c|c|c|} \hline \text{कक्षा} & 0-10 & 10-20 & 20-30 & 30-40 & 40-50 & 50-60 \ \hline \text{आवृत्ति} & 6 & 7 & 15 & 16 & 4 & 2 \ \hline \end{array} $
हल दिए गए आंकड़ों से निम्नलिखित तालिका 13.6 बनाएं :
तालिका 13.6
$ \begin{array}{|c|c|c|c|c|c|}
\hline \text{कक्षा} & \text{आवृत्ति } f_i & \text{कुल आवृत्ति (क.आ.)} & \text{मध्य-बिंदु } x_i & \mid x_i - \text{माध्यांक} \mid & f_i \mid x_i - \text{माध्यांक} \mid \ \hline & f_i & (क.आ.) & & & \ \hline 0-10 & 6 & 6 & 5 & 23 & 138 \ 10-20 & 7 & 13 & 15 & 13 & 91 \ 20-30 & 15 & 28 & 25 & 3 & 45 \ 30-40 & 16 & 44 & 35 & 7 & 112 \ 40-50 & 4 & 48 & 45 & 17 & 68 \ 50-60 & 2 & 50 & 55 & 27 & 54 \ \hline & 50 & & & & 508 \ \hline \end{array} $
कक्षा अंतराल जो $\dfrac{N^{\text{th }}}{2}$ या $25^{\text{th }}$ आइटम को धारण करता है, $20-30$ है। अतः, $20-30$ माध्यांक कक्षा है। हम जानते हैं कि
$ \text{ माध्यिका }=l+\dfrac{\dfrac{N}{2}-C}{f} \times h $
यहाँ $l=20, C=13, f=15, h=10$ और $N=50$
इसलिए, $\quad$ माध्यिका $=20+\dfrac{25-13}{15} \times 10=20+8=28$
इसलिए, माध्यिका के संबंध में माध्य विचलन निम्नलिखित द्वारा दिया जाता है
$ \text{ M.D. }(M)=\dfrac{1}{N} \sum\limits_{i=1}^{6} f_i|x_i-M|=\dfrac{1}{50} \times 508=10.16 $
13.4.3 माध्य विचलन की सीमाएं
एक श्रेणी में, जहां विचलन की डिग्री बहुत अधिक होती है, माध्यिका एक प्रतिनिधि केंद्रीय प्रवृत्ति नहीं होती। इसलिए, ऐसी श्रेणी के लिए माध्यिका के संबंध में गणना किया गया माध्य विचलन पूरी तरह से विश्वास के योग्य नहीं होता। माध्य से विचलनों के योग (ऋणात्मक चिह्न नगण्य कर दिए गए हैं) माध्यिका से विचलनों के योग से अधिक होता है। इसलिए, माध्य के संबंध में माध्य विचलन बहुत वैज्ञानिक नहीं होता। इसलिए, कई मामलों में माध्य विचलन असंतोषजनक परिणाम दे सकता है। इसके अतिरिक्त, माध्य विचलन विचलनों के अंतर्गत मान के आधार पर गणना किया जाता है और इसलिए इसके आगे बीजगणितीय उपचार के लिए उपयोग नहीं किया जा सकता। इसका अर्थ है कि हमें कुछ अन्य विस्तार के माप की आवश्यकता होती है। मानक विचलन ऐसा एक विस्तार का माप है।
13.5 विचलन और मानक विचलन
याद रखें कि माध्य या माध्यिका के संदर्भ में माध्य विचलन की गणना करते समय विचलनों के अंतर्गत मान लिए जाते हैं। अंतर्गत मान लेने के कारण माध्य विचलन के अर्थ को दिया जाता है, अन्यथा विचलन आपस में विपरीत दिशा में निरस्त हो सकते हैं।
विचलनों के चिह्न के कारण उत्पन्न इस कठिनाई को दूर करने के एक अन्य तरीके के रूप में सभी विचलनों के वर्ग लेना है। स्पष्ट रूप से सभी विचलनों के वर्ग धनात्मक नहीं होते हैं।
मान लीजिए $x_1, x_2, x_3, \ldots, x_n$ $n$ अवलोकन हैं और $\bar{x}$ उनका माध्य है। तब
$ (x _ 1 - \bar {x}) ^ {2} + (x _ 2 - \bar {x} ) ^ {2} + \ldots \ldots . + (x _ {n} - \bar {x} ) ^ {2} = _ {i \neq 1} ^ {n}(x _ {i} - \bar{x})^{2} $
यदि यह योग शून्य हो, तो प्रत्येक $(x_i-\bar{x})$ शून्य होना आवश्यक होता है। इसका अर्थ है कि सभी प्रेक्षण अस्थिरता के बिना माध्य $\bar{x}$ के बराबर हैं।
यदि $\sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ छोटा हो, तो यह इंगित करता है कि प्रेक्षण $x_1, x_2, x_3, \ldots, x_n$ माध्य $\bar{x}$ के निकट हैं और अतः अस्थिरता की डिग्री कम है। विपरीत रूप से, यदि यह योग बड़ा हो, तो अस्थिरता की डिग्री अधिक होती है। इस प्रकार कह सकते हैं कि योग $\sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ अस्थिरता या विस्तार की डिग्री के एक उचित सूचक है?
चलो हम छह प्रेक्षणों के समुच्चय A 5, 15, 25, 35, 45, 55 लें। प्रेक्षणों का औसत $\bar{x}=30$ है। इस समुच्चय के $\bar{x}$ से विचलन के वर्गों का योग है
$ \begin{aligned} \sum\limits_{i=1}^{6}(x_i-\bar{x})^{2} & =(5-30)^{2}+(15-30)^{2}+(25-30)^{2}+(35-30)^{2}+(45-30)^{2}+(55-30)^{2} \\ & =625+225+25+25+225+625=1750 \end{aligned} $
अब हम एक अन्य समुच्चय $B$ लें जिसमें 31 प्रेक्षण $15,16,17,18,19,20,21,22,23$, $24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45$ हैं। इन प्रेक्षणों का औसत $\bar{y}=30$ है।
ध्यान दें कि प्रेक्षणों के दो समुच्चय A और B दोनों का औसत 30 है।
अब, समुच्चय $B$ के प्रेक्षणों के माध्य $\bar{y}$ से विचलन के वर्गों का योग निम्नलिखित द्वारा दिया जाता है
$ \begin{aligned} \sum\limits_{i=1}^{31}(y_i-\bar{y})^{2} & =(15-30)^{2}+(16-30)^{2}+(17-30)^{2}+\ldots+(44-30)^{2}+(45-30)^{2} \\ & =(-15)^{2}+(-14)^{2}+\ldots+(-1)^{2}+0^{2}+1^{2}+2^{2}+3^{2}+\ldots+14^{2}+15^{2} \\ & =2[15^{2}+14^{2}+\ldots+1^{2}] \\ & =2 \times \dfrac{15 \times(15+1)(30+1)}{6}=5 \times 16 \times 31=2480
\end{aligned} $
(क्योंकि पहले $n$ प्राकृतिक संख्याओं के वर्गों का योग $=\dfrac{n(n+1)(2 n+1)}{6}$. यहाँ $.n=15$)
यदि $\sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ हमारा माध्य के संदर्भ में विस्तार या बिखराव का माप है, तो हम कह सकते हैं कि छह अवलोकनों के समुच्चय A का माध्य के संदर्भ में विस्तार तीस अवलोकनों के समुच्चय B के विस्तार की तुलना में कम है, भले ही समुच्चय A के अवलोकन माध्य से अधिक बिखरे हों (विचलन की श्रेणी -25 से 2 तक हो) जबकि समुच्चय B में विचलन की श्रेणी -15 से 15 है।)
यह निम्नलिखित आरेखों से भी स्पष्ट है।
समुच्चय A के लिए हमारे पास है
चित्र 13.5
समुच्चय $B$ के लिए हमारे पास है
चित्र 13.6
इस प्रकार, हम कह सकते हैं कि माध्य से विचलन के वर्गों का योग विस्तार का एक उचित माप नहीं है। इस कठिनाई को दूर करने के लिए हम विचलन के वर्गों के औसत को लेते हैं, अर्थात हम $\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}$ लेते हैं। समुच्चय A के लिए हमारे पास माध्य $=\dfrac{1}{6} \times 1750=291.67$ है और समुच्चय B के लिए यह $\dfrac{1}{31} \times 2480=80$ है।
यह इंगित करता है कि समुच्चय A में विस्तार या बिखराव समुच्चय $B$ में विस्तार या बिखराव से अधिक है, जो दोनों समुच्चयों के ज्यामितीय प्रतिनिधित्व के साथ मेल खाता है।
इसलिए, हम $\dfrac{1}{n} \sum(x_i-\bar{x})^{2}$ को एक मात्रा के रूप में ले सकते हैं जो विस्तार के एक सही माप को दर्शाता है। इस संख्या, अर्थात् माध्य के संबंध में विचलन के वर्गों का औसत, को वैरिएंस कहा जाता है और इसे $\sigma^{2}$ (सिग्मा वर्ग के रूप में पढ़ा जाता है) से नोट किया जाता है। अतः, $n$ अवलोकनों $x_1, x_2, \ldots, x_n$ के वैरिएंस को निम्नलिखित द्वारा दिया जाता है
$ \sigma^{2}=\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2} $
13.5.1 मानक विचलन
विचलन के गणना में हम देखते हैं कि व्यक्तिगत अवलोकन $x_i$ और उनके औसत की इकाई $\bar{x}$ विचरण की इकाई से अलग होती है, क्योंकि विचरण $(x_i-\bar{x})$ के वर्गों के योग को शामिल करता है। इस कारण, एक संग्रह के अवलोकन के औसत के संदर्भ में विचलन का सही माप विचरण के धनात्मक वर्गमूल के रूप में व्यक्त किया जाता है और इसे मानक विचलन कहा जाता है। इसलिए, मानक विचलन, आमतौर पर $\sigma$ द्वारा नोट किया जाता है, जो द्वारा दिया जाता है
$ \sigma=\sqrt{\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}} \quad \quad \quad \quad \quad \ldots(1) $
हम विपरीत उदाहरण के माध्यम से विचलन और इसलिए असंगठित डेटा के मानक विचलन के गणना को दर्शाने के लिए निम्नलिखित उदाहरण लेंगे।
उदाहरण 8 निम्नलिखित डेटा के विचरण की गणना करें:
$ 6,8,10,12,14,16,18,20,22,24 $
हल दिए गए डेटा से हम निम्नलिखित तालिका 13.7 बना सकते हैं। माध्य की गणना के लिए 14 को मान लें और अवलोकनों की संख्या $n=10$ है।
तालिका 13.7
$ \begin{array}{|c|c|c|c|} \hline x_i & d_i = \dfrac{x_i - 14}{2} & \text{औसत से विचलन } (x_i-\bar{x}) & (x_i-\bar{x}) \ \hline 6 & -4 & -9 & 81 \ 8 & -3 & -7 & 49 \ 10 & -2 & -5 & 25 \ 12 & -1 & -3 & 9 \ 14 & 0 & -1 & 1 \ 16 & 1 & 1 & 1 \ 18 & 2 & 3 & 9 \ 20 & 3 & 5 & 25 \ 22 & 4 & 7 & 49 \ 24 & 5 & 9 & 81 \ \hline & 5 & & 330 \ \hline \end{array} $
इसलिए $ \qquad \text{ औसत } \bar{x}=\text{ मान्य औसत }+\dfrac{\sum\limits_{i=1}^{n} d_i}{n} \times h=14+\dfrac{5}{10} \times 2=15 $
$
और $ \qquad \text{ विचलन }(\sigma^{2})=\dfrac{1}{n} \sum\limits_{i=1}^{10}(x_i-\bar{x})^{2}=\dfrac{1}{10} \times 330=33 $
इसलिए मानक विचलन $(\sigma)=\sqrt{33}=5.74$
13.5.2 एक असतत आवृत्ति वितरण का मानक विचलन
मान लीजिए दिया गया असतत आवृत्ति वितरण निम्नलिखित है
$ \begin{matrix} x: & x_1, & x_2, \quad x_3, \ldots, x_n \\ \\ & f: & f_1, \quad f_2, \quad f_3, \ldots, f_n \end{matrix} $
इस स्थिति में मानक विचलन $(\sigma)=\sqrt{\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i(x_i-\bar{x})^{2}} \quad \quad \quad \quad \ldots(2)$
जहाँ $~N=\sum\limits_{i=1}^{n} f_i$.
हम निम्नलिखित उदाहरण के बारे में चर्चा करेंगे।
उदाहरण 9 निम्नलिखित डेटा के विचलन (variance) और मानक विचलन (standard deviation) ज्ञात कीजिए:
$ \begin{array}{|c|c|c|c|c|c|c|c|} \hline x_i & 4 & 8 & 11 & 17 & 20 & 24 & 32 \ \hline f_i & 3 & 5 & 9 & 5 & 4 & 3 & 1 \ \hline \end{array} $
हल डेटा को सारणी के रूप में प्रस्तुत करने पर (सारणी 13.8), हमें प्राप्त होता है:
सारणी 13.8
$ \begin{array}{|r|r|r|r|r|r|} \hline x_i & f_i & f_i x_i & x_i-\bar{x} & (x_i-\bar{x})^2 & f_i(x_i-\bar{x})^2 \ \hline \end{array} $
\hline 4 & 3 & 12 & -10 & 100 & 300 \ 8 & 5 & 40 & -6 & 36 & 180 \ 11 & 9 & 99 & -3 & 9 & 81 \ 17 & 5 & 85 & 3 & 9 & 45 \ 20 & 4 & 80 & 6 & 36 & 144 \ 24 & 3 & 72 & 10 & 100 & 300 \ 32 & 1 & 32 & 18 & 324 & 324 \ \hline & 30 & 420 & & & 1374 \ \hline \end{array} $
$ \begin{gathered} N=30, \sum\limits_ {i=1}^{7} f _ {i} x _ {i}=420, \sum\limits_ {i=1}^{7} f _ {i}(x _ {i}-\bar{x})^{2}=1374 \\ \text{इसलिए }\quad \quad \quad \quad \bar{x}=\dfrac{\sum\limits_ {i=1}^{7} f _ {i} x _ {i}}{N}=\dfrac{1}{30} \times 420=14 \\
\text{अतः }\quad \quad \quad \quad\text{ विचलन }(\sigma^{2})=\dfrac{1}{N} \sum\limits_ {i=1}^{7} f _ {i}(x _ {i}-\bar{x})^{2} \\ =\dfrac{1}{30} \times 1374=45.8 \end{gathered} $
$ \text{और }\quad \quad \quad \text{ मानक विचलन }(\sigma)=\sqrt{45.8}=6.77 $
13.5.3 एक सतत आवृत्ति वितरण का मानक विचलन
दिया गया सतत आवृत्ति वितरण एक असतत आवृत्ति वितरण के रूप में प्रस्तुत किया जा सकता है द्वारा प्रत्येक वर्ग को उसके मध्य बिंदु से बदल देना। फिर, एक असतत आवृत्ति वितरण के मामले में अपनाए गए तकनीक के द्वारा मानक विचलन की गणना की जाती है।
यदि $n$ वर्गों की आवृत्ति बंटन है, जिनमें से प्रत्येक वर्ग का मध्य-बिंदु $x_i$ है और आवृत्ति $f_i$ है, तो मानक विचलन को निम्नलिखित सूत्र द्वारा प्राप्त किया जा सकता है
$ \sigma=\sqrt{\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i(x_i-\bar{x})^{2}} $
जहाँ $\bar{x}$ बंटन का माध्य है और $N=\sum\limits_{i=1}^{n} f_i$ है।
मानक विचलन के एक अन्य सूत्र हम जानते हैं कि
विचलन $ (\sigma^{2})=\dfrac{1}{N} \sum\limits_ {i=1}^{n} f _ {i}(x _ {i} - \bar{x}) ^ {2} = \dfrac{1}{N} \sum\limits_{i = 1} ^ {n} f _ {i}(x _ i ^ {2} + \bar x ^{2} - 2 \bar {x} x _ {i}) $
$ \begin{aligned} =\dfrac{1}{N}\begin{bmatrix} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \sum\limits_ {i = 1} ^ {n} \bar x ^{2} f_i-\sum\limits_{i=1}^{n} 2 \bar{x} f_i x_i\end{bmatrix}\end{aligned} $
$ \begin{aligned} & =\dfrac{1}{N}\begin{bmatrix}\sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \bar x ^ {2} \sum\limits_ {i = 1} ^ {n} f _ {i} - 2 \bar{x} \sum\limits_ {i=1}^{n} x _{i} f _ {i} \end{bmatrix} \end{aligned} $
$ \begin{aligned} & =\dfrac {1}{N} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \bar x ^ {2} N - 2 \bar{x} . N \bar{x} \quad \left[\text{ Here } \dfrac {1}{N} \sum\limits_ {i = 1} ^ {n} x _ {i} f _ {i} = \bar{x} \text{ or } \sum\limits_ {i = 1} ^ {n} x _ {i} f _ {i}= N \bar{x}\right] \\
& =\dfrac {1}{N} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} + \bar x ^ {2} - 2 \bar x ^ {2}=\dfrac {1}{N} \sum\limits_ {i = 1} ^ {n} f _ {i} x _ i ^ {2} - \bar x^{2} \end{aligned} $
या $ \qquad \sigma^{2}=\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i x_i^{2}-\left(\dfrac{\sum\limits_{i=1}^{n} f_i x_i}{N}\right)^{2}=\dfrac{1}{N^{2}}\left[N \sum\limits_{i=1}^{n} f_i x_i^{2}-(\sum\limits_{i=1}^{n} f_i x_i)^{2}\right] $
इस प्रकार, मानक विचलन $(\sigma)=\dfrac{1}{N} \sqrt{N \sum\limits_{i=1}^{n} f_i x_i{ }^{2}-(\sum\limits_{i=1}^{n} f_i x_i)^{2}}\qquad \qquad \qquad ….(3)$
उदाहरण 10 निम्नलिखित वितरण के औसत, विचलन और मानक विचलन की गणना करें :
$ \begin{array}{|c|c|c|c|c|c|c|c|} \hline \text{कक्षा} & 30-40 & 40-50 & 50-60 & 60-70 & 70-80 & 80-90 & 90-100 \ \hline \text{आवृत्ति} & 3 & 7 & 12 & 15 & 8 & 3 & 2 \ \hline \end{array} $
हल दिए गए डेटा से हम निम्नलिखित तालिका 13.9 बनाते हैं।
तालिका 13.9
$ \begin{array}{|c|c|c|c|c|c|} \hline \text{कक्षा} & \text{आवृत्ति } (f_i) & \text{मध्य-बिंदु } (x_i) & f_i x_i & (x_i-\bar{x})^2 & f_i(x_i-\bar{x})^2 \ \hline \end{array} $
\hline 30-40 & 3 & 35 & 105 & 729 & 2187 \ 40-50 & 7 & 45 & 315 & 289 & 2023 \ 50-60 & 12 & 55 & 660 & 49 & 588 \ 60-70 & 15 & 65 & 975 & 9 & 135 \ 70-80 & 8 & 75 & 600 & 169 & 1352 \ 80-90 & 3 & 85 & 255 & 529 & 1587 \ 90-100 & 2 & 95 & 190 & 1089 & 2178 \ \hline & 50 & & 3100 & & 10050 \ \hline \end{array} $
तो $ \quad \quad \quad \quad \text{ माध्य } \bar{x}=\dfrac{1}{N} \sum\limits_{i=1}^{7} f_i x_i=\dfrac{3100}{50}=62 $
विचलन $(\sigma^{2})=\dfrac{1}{N} \sum\limits_{i=1}^{7} f_i(x_i-\bar{x})^{2}$
$ \quad \quad \quad \qquad=\dfrac{1}{50} \times 10050=201 $
और $ \quad \quad \quad \text{ मानक विचलन }(\sigma)=\sqrt{201}=14.18 $
उदाहरण 11 निम्नलिखित डेटा के लिए मानक विचलन ज्ञात कीजिए :
$ \begin{array}{|c|c|c|c|c|c|} \hline x_i & 3 & 8 & 13 & 18 & 23 \\ \hline f_i & 7 & 10 & 15 & 10 & 6 \\ \hline \end{array} $
हल हम निम्नलिखित तालिका 13.10 बनाएँगे:
तालिका 13.10
$ \begin{array}{|r|r|r|r|r|} \hline x_i & f_i & f_i x_i & x_i^2 & f_i x_i^2 \ \hline 3 & 7 & 21 & 9 & 63 \
8 & 10 & 80 & 64 & 640 \ 13 & 15 & 195 & 169 & 2535 \ 18 & 10 & 180 & 324 & 3240 \ 23 & 6 & 138 & 529 & 3174 \ \hline & 48 & 614 & & 9652 \ \hline \end{array} $
अब, सूत्र (3) के अनुसार हमें है
$ \begin{aligned} \sigma & =\dfrac{1}{N} \sqrt{N \sum{f_i x_i}^{2}-\left(\sum{f_i x_i}\right)^{2}} \\ \\ & =\dfrac{1}{48} \sqrt{48 \times 9652-(614)^{2}} \\ \\ & =\dfrac{1}{48} \sqrt{463296-376996} \end{aligned} $
$ \quad =\dfrac{1}{48} \times 293.77=6.12 $
इसलिए, $\quad$ मानक विचलन $(\sigma)=6.12$
13.5.4. वैकल्पिक विधि विचलन और मानक विचलन के अंकन के लिए
कभी-कभी एक असतत वितरण में $x_i$ के मूल्य या एक सतत वितरण में विभिन्न वर्गों के मध्य बिंदु $x_i$ बहुत बड़े होते हैं और इसलिए माध्य और विचलन की गणना बहुत कठिन और समय लेने वाली हो जाती है। चरण-विचलन विधि का उपयोग करके इस प्रक्रिया को सरल किया जा सकता है।
मान लीजिए अनुमानित माध्य ‘A’ है और अनुपात को $\dfrac{1}{h}$ गुना कर दिया जाता है ( $h$ वर्ग अंतराल की चौड़ाई है)। चरण-विचलन या नए मूल्य $y_i$ हैं।
i.e. $\quad y_i=\dfrac{x_i-A}{h}$ या $x_i=A+h y_i \quad \quad \quad \quad \quad \ldots(1)$
हम जानते हैं कि $ \quad \quad \quad \bar{x}=\dfrac{\sum\limits_{i=1}^{n} f_i x_i}{N} \quad \quad \quad \quad \quad \ldots(2) $
(1) में $x_i$ को (2) में प्रतिस्थापित करने पर हमें प्राप्त होता है
$ \begin{aligned} \bar{x} & =\dfrac{\sum\limits_{i=1}^{n} f_i(A+h y_i)}{N} \\ & =\dfrac{1}{N}\left(\sum\limits_{i=1}^{n} f_i A+\sum\limits_{i=1}^{n} h f_i y_i \right)=\dfrac{1}{N}\left(A \sum\limits_{i=1}^{n} f_i+h \sum\limits_{i=1}^{n} f_i y_i \right) \\
& =A \cdot \dfrac{N}{N}+h \dfrac{\sum\limits_{i=1}^{n} f_i y_i}{N} \quad\left(\text{ क्योंकि } \sum\limits_{i=1}^{n} f_i=N\right) \end{aligned} $
इसलिए $\quad \bar{x}=A+h \bar{y} \quad \quad \quad\quad \quad \ldots(3)$
अब चर $x$ के विचलन के वर्ग, $\sigma_x^{2}=\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i(x_i-\bar{x})^{2}$
$ =\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i(A+h y_i-A-h \bar{y})^{2} \quad \text{(1) और (3) का उपयोग करते हुए) } $
$ \begin{aligned} & =\dfrac{1}{N} \sum\limits_{i=1}^{n} f_i h^{2}(y_i-\bar{y})^{2} \\
& =\dfrac{h^{2}}{N} \sum\limits_{i=1}^{n} f_i(y_i-\bar{y})^{2}=h^{2} \times \text{ variable } y_i \text{ ka variance} \end{aligned} $
अर्थात $\quad \sigma_x^{2}=h^{2} \sigma_y^{2}$
या $\quad \sigma_x=h \sigma_y \quad \quad \quad \quad \quad \ldots(4)$
(3) और (4) से, हमें प्राप्त होता है
$ \sigma_x=\dfrac{h}{N} \sqrt{N \sum\limits_{i=1}^{n} f_i y_i^{2}-(\sum\limits_{i=1}^{n} f_i y_i)^{2}} \quad \quad \quad \quad \quad \ldots(5) $
उदाहरण 11 को छोटी विधि के द्वारा और सूत्र (5) का उपयोग करके हल करें।
उदाहरण 12 निम्नलिखित वितरण के लिए माध्य, विचलन और मानक विचलन की गणना करें।
$ \begin{array}{|c|c|c|c|c|c|c|c|} \hline \text{क्लासेज} & 30-40 & 40-50 & 50-60 & 60-70 & 70-80 & 80-90 & 90-100 \ \hline \text{आवृत्ति} & 3 & 7 & 12 & 15 & 8 & 3 & 2 \ \hline \end{array} $
हल मान लीजिए अनुमानित औसत A $=65$ है। यहाँ $h=10$
हमें दिए गए डेटा से निम्नलिखित तालिका 13.11 प्राप्त होती है :
तालिका 13.11
$ \begin{array}{|c|c|c|c|c|c|c|} \hline \text{क्लास} & \text{आवृत्ति } (f_i) & \text{मध्य-बिंदु } (x_i) & y_i=\dfrac{x_i-65}{10} & y_i^2 & f_i y_i & f_i y_i^2 \ \hline & f_i & x_i & & & & \ \hline \end{array} $
\hline 30-40 & 3 & 35 & -3 & 9 & -9 & 27 \ 40-50 & 7 & 45 & -2 & 4 & -14 & 28 \ 50-60 & 12 & 55 & -1 & 1 & -12 & 12 \ 60-70 & 15 & 65 & 0 & 0 & 0 & 0 \ 70-80 & 8 & 75 & 1 & 1 & 8 & 8 \ 80-90 & 3 & 85 & 2 & 4 & 6 & 12 \ 90-100 & 2 & 95 & 3 & 9 & 6 & 18 \ \hline & N=50 & & & & -15 & 105 \ \hline \end{array} $
इसलिए $\qquad \bar{x}=\mathrm{A}+\dfrac{\sum f _{i} y _{i}}{50} \times h=65-\dfrac{15}{50} \times 10=62$
विचलन $ \qquad\sigma^{2}=\dfrac{h^{2}}{\mathrm{~N}^{2}}\left[\mathrm{~N} \sum f _{i} y _{i}^{2}-\left(\sum f _{i} y _{i}\right)^{2}\right]
$
$ \begin{aligned} & =\dfrac{(10)^{2}}{(50)^{2}}\left[50 \times 105-(-15)^{2}\right] \\ & =\dfrac{1}{25}[5250-225]=201 \end{aligned} $
और मानक विचलन $(\sigma)=\sqrt{201}=14.18$
विविध उदाहरण
उदाहरण 13 20 प्रेक्षणों के विचरण 5 है। यदि प्रत्येक प्रेक्षण को 2 से गुणा कर दिया जाए, तो परिणामी प्रेक्षणों के नए विचरण क्या होगा?
हल मान लीजिए अवलोकन $x_1, x_2, \ldots, x_{20}$ हैं और $\bar{x}$ उनका औसत है। दिया गया है कि विचलन $=5$ और $n=20$। हम जानते हैं कि
$ \begin{aligned} & \text{ विचलन }(\sigma^{2})=\dfrac{1}{n} \sum\limits_{i=1}^{20}(x_i-\bar{x})^{2}, \text{ अर्थात् } 5=\dfrac{1}{20} \sum\limits_{i=1}^{20}(x_i-\bar{x})^{2} \\ & \text{या}\quad \quad \quad \quad \sum\limits_{i=1}^{20}(x_i-\bar{x})^{2}=100 \end{aligned} $
यदि प्रत्येक अवलोकन को 2 से गुणा कर दिया जाए, और नए परिणामी अवलोकन $y_i$ हों, तो
$ y_i=2 x_i \text{ अर्थात } x_i=\dfrac{1}{2} y_i \quad \quad \quad \quad \quad \quad \ldots(1) $
इसलिए $ \quad \quad \quad \quad\bar{y}=\dfrac{1}{n} \sum\limits_{i=1}^{20} y_i=\dfrac{1}{20} \sum\limits_{i=1}^{20} 2 x_i=2 \cdot \dfrac{1}{20} \sum\limits_{i=1}^{20} x_i $
अर्थात $\quad \quad \quad \quad\bar{y}=2 \bar{x}$ या $\bar{x}=\dfrac{1}{2} \bar{y}$
(1) में $x_i$ और $\bar{x}$ के मान को बदलकर, हम प्राप्त करते हैं
$ \sum\limits_{i=1}^{20}\left(\dfrac{1}{2} y_i-\dfrac{1}{2} \bar{y}\right)^{2}=100 \text{, अर्थात } \sum\limits_{i=1}^{20}(y_i-\bar{y})^{2}=400 $
$
अतः नए प्रेक्षणों के विचलन $=\dfrac{1}{20} \times 400=20=2^{2} \times 5$
नोट - पाठक ध्यान दे सकते हैं कि यदि प्रत्येक प्रेक्षण को एक नियतांक $k$ से गुणा किया जाता है, तो परिणामी प्रेक्षणों के विचलन मूल विचलन के $k^{2}$ गुना हो जाता है।
उदाहरण 14 5 प्रेक्षणों का औसत 4.4 है और उनका विचलन 8.24 है। यदि तीन प्रेक्षण 1, 2 और 6 हैं, तो दूसरे दो प्रेक्षण ज्ञात कीजिए।
हल मान लीजिए दूसरे दो प्रेक्षण $x$ और $y$ हैं।
इसलिए, श्रेणी $1,2,6, x, y$ है।
अब $ \quad \quad \quad \quad\text{माध्य} ~\bar{x}=4.4=\dfrac{1+2+6+x+y}{5} $
या $ \quad \quad \quad \quad 22=9+x+y $
इसलिए $\quad x+y=13\quad \quad \quad \quad\quad \quad \ldots(1)$
साथ ही $\quad$ विचलन $=8.24=\dfrac{1}{n} \sum\limits_{i=1}^{5}(x_i-\bar{x})^{2}$
अर्थात $\quad 8.24=\dfrac{1}{5}\left[(3.4)^{2}+(2.4)^{2}+(1.6)^{2}+x^{2}+y^{2}-2 \times 4.4(x+y)+2 \times(4.4)^{2}\right]$
या $\quad 41.20=11.56+5.76+2.56+x^{2}+y^{2}-8.8 \times 13+38.72$
इसलिए $\quad x^{2}+y^{2}=97\quad \quad \quad \quad\quad \quad \ldots(2)$
लेकिन (1) से, हमें प्राप्त होता है
$ x^{2}+y^{2}+2 x y=169 \quad \quad \quad \quad\quad \quad \ldots(3) $
(2) और (3) से, हमें प्राप्त होता है
$ 2 x y=72 \quad \quad \quad \quad\quad \quad \ldots(4) $
(4) को (2) से घटाने पर, हमें प्राप्त होता है
$ \begin{aligned} & x^{2}+y^{2}-2 x y=97-72 \quad \text{ अर्थात } \quad (x-y)^{2}=25 \\ & \text{या } \quad \quad \quad x-y= \pm 5 \quad \quad \quad \quad\quad \quad \ldots(5) \end{aligned} $
इसलिए, (1) और (5) से, हमें प्राप्त होता है
$ x=9, y=4 \text{ जब } x-y=5 $
या $\quad x=4, y=9$ जब $x-y=-5$
इसलिए, बचे हुए अवलोकन 4 और 9 हैं ।
उदाहरण 15 यदि प्रत्येक अवलोकन $x_1, x_2, \ldots, x_n$ में ’ $a$ ’ की वृद्धि कर दी जाए, जहाँ $a$ एक नकारात्मक या धनात्मक संख्या है, तो विचलन अपरिवर्तित रहता है दिखाइए।
हल मान लीजिए $\bar{x}$, $x_1, x_2, \ldots, x_n$ का औसत है। तब विचलन निम्नलिखित द्वारा दिया जाता है
$ \sigma_1^{2}=\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2} $
यदि ’ $a$ ’ प्रत्येक अवलोकन में जोड़ दिया जाए, तो नए अवलोकन होंगे
$ \begin{aligned} y _{i}=x _{i}+a \qquad \qquad \ldots(1)
\end{aligned} $
मान लीजिए नए प्रेक्षणों का औसत $\bar{y}$ है। तब
$ \begin{aligned} \bar{y} & =\dfrac{1}{n} \sum\limits_{i=1}^{n} y_i=\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i+a) \\ & =\dfrac{1}{n}\left[\sum\limits_{i=1}^{n} x_i+\sum\limits_{i=1}^{n} a \right]=\dfrac{1}{n} \sum\limits_{i=1}^{n} x_i+\dfrac{n a}{n}=\bar{x}+a \end{aligned} $
अर्थात $ \quad \quad \quad \bar{y}=\bar{x}+a \quad \quad \quad \quad\quad \quad \ldots(1) $
इस प्रकार, नए प्रेक्षणों के विचलन
$ \begin{aligned}
$$ \sigma_2^{2} & =\dfrac{1}{n} \sum\limits_{i=1}^{n}(y_i-\bar{y})^{2}=\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i+a-\bar{x}-a)^{2} \quad \text{ [Using (1) and (2)] } \\ & =\dfrac{1}{n} \sum\limits_{i=1}^{n}(x_i-\bar{x})^{2}=\sigma_1^{2} $$ $$ \end{aligned} $$
इसलिए, नए अवलोकनों के विचलन (variance) के मूल अवलोकनों के विचलन के समान होता है।
नोट - हम ध्यान दें कि एक समूह के प्रत्येक अवलोकन में एक धनात्मक संख्या को जोड़ना (या घटाना) विचलन को प्रभावित नहीं करता है।
उदाहरण 16 100 अवलोकनों के माध्य और मानक विचलन की गणना एक छात्र ने एक अवलोकन के लिए 40 के बजाय 50 के उपयोग करके की गई थी, जिसके कारण माध्य 40 और मानक विचलन 5.1 थे। सही माध्य और मानक विचलन क्या हैं?
हल दिया गया है कि प्रेक्षणों की संख्या $(n)=100$
गलत माध्य $(\bar{x})=40$,
गलत मानक विचलन $(\sigma)=5.1$
हम जानते हैं कि $\bar{x}=\dfrac{1}{n} \sum\limits_{i=1}^{n} x_i$
अर्थात $ \quad \quad \quad 40=\dfrac{1}{100} \sum\limits_{i=1}^{100} x_i \quad \text{ या } \quad \sum\limits_{i=1}^{100} x_i=4000 $
अर्थात $\quad$ गलत प्रेक्षणों का योग $=4000$
इसलिए $\quad \quad \quad$ सही प्रेक्षणों का योग $=$ गलत योग $-50+40$
$ \quad \qquad \qquad=4000-50+40=3990 $
$
अतः $\quad$ सही औसत $=\dfrac{\text{ सही योग }}{100}=\dfrac{3990}{100}=39.9$
साथ ही $\quad$ मानक विचलन $\sigma=\sqrt{\dfrac{1}{n} \sum\limits_{i=1}^{n} x_i^{2}-\dfrac{1}{n^{2}}(\sum\limits_{i=1}^{n} x_i)^{2}}$
$ \qquad \qquad \qquad \qquad \qquad=\sqrt{\dfrac{1}{n} \sum\limits_{i=1}^{n} x_i^{2}-(\bar{x})^{2}} $
अर्थात $ \quad \quad \quad\quad \quad \quad 5.1=\sqrt{\dfrac{1}{100} \times \text{गलत} \sum\limits_{i=1}^{n} x_i^{2}-(40)^{2}}$
या $ \quad \quad \quad\quad \quad \quad 26.01=\dfrac{1}{100} \times \text{ गलत } \sum\limits_{i=1}^{n} x_i^{2}-1600
$
अतः $\quad$ गलत $\sum\limits_{i=1}^{n} x_i{ }^{2}=100(26.01+1600)=162601$
अब $\quad \qquad $ सही $\sum\limits_{i=1}^{n} x_i^{2}=$ गलत $\sum\limits_{i=1}^{n} x_i{ }^{2}-(50)^{2}+(40)^{2}$
$ \qquad \qquad \qquad\qquad \qquad \quad=162601-2500+1600=161701 $
अतः सही मानक विचलन
$ \begin{aligned} & =\sqrt{\dfrac{\text{ सही } \sum x_i^{2}}{n}-(\text{ सही माध्य })^{2}} \\ & =\sqrt{\dfrac{161701}{100}-(39.9)^{2}} \\ & =\sqrt{1617.01-1592.01}=\sqrt{25}=5 \\
\end{aligned} $
सारांश
- विस्तार के माप विस्तार, चतुर्थक विचलन, माध्य विचलन, विचलन, मानक विचलन विस्तार के माप हैं।
$\qquad$ विस्तार $=$ अधिकतम मान - न्यूनतम मान
- असंगठित डेटा के लिए माध्य विचलन
$\qquad$ M.D. $(\bar{x})=\dfrac{\sum|x_i-\bar{x}|}{n}, \quad$ M.D. $(M)=\dfrac{\sum|x_i-M|}{ n}$
- समूहित डेटा के माध्य विचलन (Mean deviation for grouped data)
$\qquad$ M.D. $(\bar{x})=\dfrac{\sum f_i|x_i \quad \bar{x}|}{N}, \quad$ M.D. (M) $=\dfrac{\sum f_i \mid x_i}{N}$ M , जहाँ $N=\sum f_i$
- असमूहित डेटा के विचरण और मानक विचलन (Variance and standard deviation for ungrouped data)
$\qquad \sigma^{2}=\dfrac{1}{n} \sum(x_i-\bar{x})^{2}, \quad \sigma=\sqrt{\dfrac{1}{n} \sum(x_i-\bar{x})^{2}}$
- असतत आवृति बंटन के विचरण और मानक विचलन (Variance and standard deviation of a discrete frequency distribution)
$ \qquad \sigma^{2}=\dfrac{1}{N} \sum f_i(x_i-\bar{x})^{2}, \quad \sigma=\sqrt{\dfrac{1}{N} \sum f_i(x_i-\bar{x})^{2}}
$
- सतत आवृत्ति वितरण के अपवाद और मानक विचलन
$ \qquad \sigma^{2}=\dfrac{1}{N} \sum f_i(x_i-\bar{x})^{2}, \quad \sigma=\dfrac{1}{N} \sqrt{N \sum f_i x_i^{2}-(\sum f_i x_i)^{2}} $
- अपवाद और मानक विचलन के अपवाद खोजने के तेजी से तरीका।
$ \qquad \begin{aligned} & \sigma^{2}=\dfrac{h^{2}}{N^{2}}\left[N \sum f_i y_i^{2}-(\sum f_i y_i)^{2}\right], \sigma=\dfrac{h}{N} \sqrt{N \sum f_i y_i^{2}-(\sum f_i y_i)^{2}}, \\ \\ & \text{ where } y_i=\dfrac{x_i-A}{h}
\end{aligned} $
ऐतिहासिक टिप्पणी
“सांख्यिकी” शब्द लैटिन शब्द “status” से उत्पन्न हुआ है, जिसका अर्थ है राजनीतिक अवस्था। यह बताता है कि सांख्यिकी मानव सभ्यता के ऐतिहासिक रूप से बहुत पुरानी है। लगभग 3050 ई.पू. में, संभवतः मिस्र में पहला जनगणना की गई थी। भारत में भी, लगभग 2000 वर्ष पहले, हमारे पास एक कार्यपालन सांख्यिकी के संग्रह के लिए कुशल तंत्र था, विशेष रूप से चंद्रगुप्त मौर्य के शासनकाल में (324-300 ई.पू.)। जन्म और मृत्यु संबंधी डेटा संग्रह के तंत्र का उल्लेख कांटिल्य के अर्थशास्त्र (लगभग 300 ई.पू.) में किया गया है। अकबर के शासनकाल में आयोजित कार्यपालन सर्वेक्षण के विस्तृत विवरण अइन-ई-अकबरी में दिया गया है, जो अबुल फजल द्वारा लिखा गया है।
कैप्टन जॉन ग्रांट लंदन के (1620-1674) के कारण जनसंख्या आंकड़ों के पिता के रूप में जाने जाते हैं क्योंकि उन्होंने जन्म और मृत्यु के आंकड़ों पर अध्ययन किए। जैकब बर्नूली (1654-1705) ने अपनी किताब “अर्स कॉनजेक्टैंडी” में 1713 में प्रकाशित करके “बड़ी संख्या के नियम” को देखा।
सांख्यिकी के सिद्धांत का विकास मध्य सत्रहवीं शताब्दी के बीच हुआ और बाद में खेल और संभावना के सिद्धांत के प्रस्तुति के साथ जारी रहा। फ्रांसिस गैलटन (1822-1921), एक ब्रिटिश व्यक्ति, ने बायोमेट्री के क्षेत्र में सांख्यिकीय विधियों के उपयोग को शुरू किया। कार्ल पियर्सन (1857-1936) ने अपने काइ-स्क्वेयर टेस्ट की खोज और ब्रिटेन में सांख्यिकीय प्रयोगशाला की स्थापना (1911) के माध्यम से सांख्यिकीय अध्ययनों के विकास में बहुत योगदान दिया। सर रोनाल्ड ए. फिशर (1890-1962), आधुनिक सांख्यिकी के पिता के रूप में जाने जाते हैं, जिन्होंने जीनेटिक्स, बायोमेट्री, शिक्षा, कृषि आदि विविध क्षेत्रों में इसके अनुप्रयोग किए।