પ્રકરણ 02 ડેટા પ્રક્રિયા
તમે અગાઉના પ્રકરણમાં શીખ્યા છે કે ડેટાને સંસ્થાપિત કરવું અને તેને રજૂ કરવું તેમને સમજાયો તેવું બનાવે છે. તે ડેટા પ્રક્રિયામાં સહાય કરે છે. ડેટાનું વિશ્લેષણ કરવા માટે ઘણી આંકડક તત્વોનો ઉપયોગ થાય છે, ઉદાહરણ તરીકે:
- કેન્દ્રિય વિચરણની માપનીઓ
- વિસ્તરણની માપનીઓ
- સંબંધની માપનીઓ
જ્યારે કેન્દ્રિય વિચરણની માપનીઓ નિદર્શનોની સેટનું આદર્શ મૂલ્ય પૂરું પાડે છે, ત્યારે વિસ્તરણની માપનીઓ ડેટાના આંતરિક ફેરફારોને ધ્યાનમાં લેતી હોય છે, ચેક્યુઅલ માપનીઓ નજીક. બીજી બાજુએ, સંબંધની માપનીઓ કોઈપણ બે અથવા વધુ સંબંધિત વિકલ્પો વચ્ચેના સંબંધની પાત્રતા પૂરી પાડે છે, જેમ કે વરસાદ અને ભીંજાણની ઘટનાઓ અથવા ખેંચાણના ખાતરનો વપરાશ અને પાકની ઉત્પાદન. આ પ્રકરણમાં, તમે કેન્દ્રિય વિચરણની માપનીઓ શીખશો.
કેન્દ્રિય વિચરણની માપનીઓ
માપાયેલ લક્ષણો જેમ કે વરસાદ, ઉંચાઈ, જનસંખ્યાની ઘનતા, શિક્ષણ પ્રાપ્તિની સ્તરો અથવા વયની જૂથો ભિન્ન થાય છે. જો અમને તેમને સમજવાની જરૂર હોય, તો અમે શું કરીશું? કદાચ અમને બધી નિદર્શનોને સૌથી સારે રીતે રજૂ કરનારો એક મૂલ્ય અથવા નંબરની જરૂર પડી શકે છે. આ એક મૂલ્ય સામાન્ય રીતે વિતરણની કેન્દ્રભાગમાં હોય છે, નહીંતર એક અંતિમ મૂલ્યમાં. વિતરણોના કેન્દ્રને શોધવા માટે વપરાતી આંકડક તત્વોને કેન્દ્રિય વિચરણની માપનીઓ કહેવાય છે. કેન્દ્રિય વિચરણ દ્વારા દર્શાવેલ નંબર એ સમગ્ર ડેટા સેટ માટે રજૂ કરનાર આંકડ છે કારણ કે તે એવો બિંદુ છે જ્યાં વસ્તુઓનું એકત્રિત થવાનો પ્રવૃત્તિ હોય છે.
કેન્દ્રિય વિચરણની માપનીઓ આંકડિક સરેારો તરીકે પણ ઓળખાય છે. કેન્દ્રિય વિચરણની ઘણી માપનીઓ છે, જેમ કે સરેાર, મધ્યમ અને મોડો.
સરેાર
સરેાર એ મૂલ્ય છે જે બધા મૂલ્યોનો સરવાળો કરીને અને નિદર્શનોના નંબરથી ભાગીને મેળવવામાં આવે છે.
મધ્યમ
મધ્યમ એ ક્રમમાં રાખેલ શ્રેણીને બે સમાન નંબરોમાં વહેંચવાનું મૂલ્ય છે. તે સત્યાધિક મૂલ્યથી સ્વતંત્ર નથી. ડેટાને વધું અથવા ઓછું ક્રમમાં રાખીને પછી મધ્યભાગના ક્રમમાંના નંબરનું મૂલ્ય શોધવું મધ્યમની ગણતરીમાં સૌથી મહત્વપૂર્ણ છે. જો નંબરો બે હોય, તો બે મધ્યભાગના મૂલ્યોનો સરેાર મધ્યમ થશે.
મોડો
મોડો એ કોઈ પણ સ્થાન અથવા મૂલ્યમાં સામેલ થતા મહત્તમ ઘટના અથવા આવર્તન છે. તમે ધ્યાન આપી શકો છો કે આ ત્રણ માપનીઓ એક રજૂ કરનાર નંબરનું વિવિધ રીતે નક્કી કરવાની પદ્ધતિ છે જે વિવિધ પ્રકારના ડેટા સેટ્સ માટે યોગ્ય છે.
સરેાર
સરેાર એ વિકલ્પની વિવિધ મૂલ્યોનો સરળ આર્થિક સરેાર છે. ગ્રુપ કરેલ અને ગ્રુપ નહીં કરેલ ડેટા માટે, સરેારની ગણતરી માટેની પદ્ધતિઓ અનિશ્ચિત રીતે અલગ છે. ગ્રુપ કરેલ અને ગ્રુપ નહીં કરેલ ડેટા માટે સરેાર સીધી અથવા અસીધી પદ્ધતિથી ગણી શકાય છે.
ગ્રુપ કરેલ નહીં ડેટાથી સરેારની ગણતરી
સીધી પદ્ધતિ
ગ્રુપ કરેલ નહીં ડેટાથી સરેારની ગણતરી કરીને સીધી પદ્ધતિનો ઉપયોગ કરીને, દરેક નિદર્શન માટેના મૂલ્યોનો સરવાળો કરવામાં આવે છે અને ઘટનાઓના કુલ નંબરથી તેનો ભાગ કરવામાં આવે છે. સરેાર નીચેના સૂત્રથી ગણવામાં આવે છે:
$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$
જ્યાં,
$$ \begin{aligned} \overline{\mathrm{X}} & =\text { સરેાર }\ \sum\quad &\text { શ્રેણીના માપોનો }\ &\text { સરવાળો } \end{aligned} $$
$x\quad=$ શ્રેણીના માપોમાં એક કચરો ગુણોત્તર
$\sum\mathrm{x}=$ બધા માપોનો સરવાળો
$\mathrm{N}\quad$ = માપોનો નંબર
ઉદાહરણ 2.1: મેડહ્યા પ્રાંતમાં મલ્વા પ્લેટ્યુના જિલ્લાઓના વરસાદથી મલ્વા પ્લેટ્યુના વરસાદનો સરેાર ગણો કે જે કલમ 2.1માં આપેલ છે:
$\hspace{1cm}$ કલમ 2.1; સરેાર વરસાદની ગણતરી
| મલ્વા પ્લેટ્યુનાના જિલ્લાઓ | સામાન્ય વરસાદ મીમીમાં |
અસીધી પદ્ધતિ |
|---|---|---|
| x સીધી પદ્ધતિ | $d=x-800^{*}$ | |
| ઇંદોરે | 979 | 179 |
| દેવાસ | 1083 | 283 |
| ધાર | 833 | 33 |
| રતલામ | 896 | 96 |
| ઉજ્જૈન | 891 | 91 |
| મંદસૌર | 825 | 25 |
| શાજાપુર | 977 | 177 |
| $\sum x$ અને $\sum d$ | 6484 | 884 |
| $\frac{\sum x}{N}$ અને $\frac{\sum d}{N}$ | 926.29 | 126.29 |
- 800 એ ધારણ કરેલ સરેાર તરીકે લાગુ પડે છે.
$\mathrm{d}$ એ ધારણ કરેલ સરેારથી વિચ્છેદ છે.
કલમ 2.1માં આપેલ ડેટાનો સરેાર નીચે જુઓ રીતે ગણવામાં આવે છે:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N}\ & =\frac{6,484}{7}\ & =926.29 \end{aligned} $$
સરેારની ગણતરીમાં નોંધી શકાય છે કે કચરો વરસાદ ડેટા સીધી રીતે સરવાળામાં આવ્યા છે અને તેનો સરવાળો નિદર્શનોના નંબર દ્વારા ભાગાયો છે, એટલે કે જિલ્લાઓ. તેથી, તે સીધી પદ્ધતિ તરીકે ઓળખાય છે.
અસીધી પદ્ધતિ
ઘણા નિદર્શનો માટે, સરેારની ગણતરી કરવા માટે સામાન્ય રીતે અસીધી પદ્ધતિનો ઉપયોગ થાય છે. તે નિદર્શનોના મૂલ્યોને એક સામાન્ય મૂલ્યથી ઓછા નંબરોમાં ઘટાડવામાં મદદ કરે છે. ઉદાહરણ તરીકે, જેમ કે કલમ 2.1માં દર્શાવ્યું છે, વરસાદના મૂલ્યો 800 અને $1100 \mathrm{~mm}$ વચ્ચે હોય છે. અમે આ મૂલ્યોને ‘ધારણ કરેલ સરેાર’ પસંદ કરીને અને દરેક મૂલ્યમાંથી પસંદ કરેલ નંબર કાઢીને ઘટાડી શકીએ છીએ. આ વર્તમાન કેસમાં, અમે 800 ને ધારણ કરેલ સરેાર તરીકે લાગુ પડ્યું છે. આ પ્રક્રિયાને કોડિંગ કહેવાય છે. પછી સરેાર આ ઘટાડેલ નંબરોથી (કલમ 2.1નો કોલમ 3) ગણવામાં આવે છે.
અસીધી પદ્ધતિથી સરેારની ગણતરી કરવા માટે નીચેનું સૂત્રનો ઉપયોગ થાય છે:
$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$
જ્યાં,
$$ \begin{aligned} A & =\text { કાઢેલો સામાન્ય }\ \sum d & =\text { કોડ કરેલ ગુણોત્તરોનો સરવાળો }\ N & =\text { શ્રેણીમાં વ્યક્તિગત નિદર્શનોનો નંબર } \end{aligned} $$
કલમ 2.1માં દર્શાવેલ ડેટાનો સરેાર નીચેની રીતે અસીધી પદ્ધતિથી ગણી શકાય છે:
$$ \begin{aligned} \overline{\mathrm{X}} & =800 +\frac{884}{7}\ & =800 +\frac{884}{7}\ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$
નોંધો કે ક્યારેય બે પદ્ધતિઓમાંથી એક પણ ગણાય છે, ત્યારે સરેારનો મૂલ્ય એક જ આવે છે.
ગ્રુપ કરેલ ડેટાથી સરેારની ગણતરી
ગ્રુપ કરેલ ડેટા માટે સરેાર સીધી અથવા અસીધી પદ્ધતિથી પણ ગણવામાં આવે છે.
સીધી પદ્ધતિ
જ્યારે ગુણોત્તરો આવર્તન વિતરણમાં ગ્રુપ કરેલ હોય, ત્યારે વ્યક્તિગત મૂલ્યો તેમની ઓળખનું નુકસાન પામે છે. આ મૂલ્યો તેમને રાખેલ વર્ગના ક્લાસ ઇન્ટરવ્યુના મધ્યબિંદુઓ દ્વારા રજૂ કરવામાં આવે છે. ગ્રુપ કરેલ ડેટાથી સરેારની ગણતરી કરીને સીધી પદ્ધતિનો ઉપયોગ કરીને, દરેક વર્ગ ઇન્ટરવ્યુના મધ્યબિંદુ તેના સંબંધિત આવર્તન $(f)$ સાથે ગુણાવવામાં આવે છે; બધા $f x$ મૂલ્યોનો સરવાળો (એટલે કે $\mathrm{X}$ એ મધ્યબિંદુઓ છે) મેળવવામાં આવે છે અને છેલ્લે નિદર્શનોના નંબર દ્વારા ભાગવામાં આવે છે, એટલે કે $\mathrm{N}$. તેથી, સરેાર નીચેના સૂત્રથી ગણવામાં આવે છે:
$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$
જ્યાં: $$ \begin{aligned} \overline{\mathrm{X}} & =\text { સરેાર }\ f & =\text { આવર્તનો }\ x & =\text { વર્ગ ઇન્ટરવ્યુના મધ્યબિંદુઓ }\ N &\left.=\text { નિદર્શનોનો નંબર (તે પણ }\sum f\text { તરીકે વ્યાખ્યાયિત થઈ શકે છે) } \end{aligned} $$
ઉદાહરણ 2.2: કલમ 2.2માં આપેલ ડેટાનો ઉપયોગ કરીને ફેક્ટરી કામગીરોનો સરેાર દર ગણો:
કલમ 2.2; ફેક્ટરી કામગીરોનો દર
| દર (રૂપિયા/દિવસ) | કામગીરોનો નંબર () |
|---|---|
| વર્ગો | $\boldsymbol{f}$ |
| $50-70$ | 10 |
| $70-90$ | 20 |
| $90-110$ | 25 |
| $110-130$ | 35 |
| $130-150$ | 9 |
કલમ 2.3; સરેારની ગણતરી
| વર્ગો | આવર્તન (f) |
મધ્ય- બિંદુઓ $(x)$ |
$f x x$ | $d=x-100$ | $f d$ | $U=$ $(x-100)$ 20 |
$f u$ |
|---|---|---|---|---|---|---|---|
| $50-70$ | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
| $70-90$ | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
| $\mathbf{90 - 110}$ | $\mathbf{25}$ | $\mathbf{1 0 0}$ | 2,500 | $\mathbf{0}$ | 0 | 0 | 0 |
| $110-130$ | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
| $130-150$ | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
| $\sum f x$ | |||||||
| અને | $\sum f=99$ | $\sum f x=$ | $\sum f d=$ | $\sum f u=$ | |||
| $\sum f x$ | 10,160 | 260 | 13 |
જ્યાં $\mathrm{N}=\sum f=99$
કલમ 2.3 ગ્રુપ કરેલ ડેટા માટે સરેારની ગણતરી કરવાની પદ્ધતિ આપે છે. આપેલ આવર્તન વિતરણમાં નોનેટ કામગીરોને દર દરમિયાન માટે પાઁચ વર્ગોમાં ગ્રુપ કરેલ છે. આ જૂથોના મધ્યબિંદુઓ ત્રીજા કોલમમાં યાદ કરેલ છે. સરેારની ગણતરી કરવા માટે, દરેક મધ્યબિંદુ $(\mathrm{X})$ તેના આવર્તન $(f)$ સાથે ગુણાવવામાં આવ્યો છે અને તેમના સરવાળા ( $\sum f_{x}$ ) ને $N$ થી ભાગાયો છે.
આપેલ સૂત્રનો ઉપયોગ કરીને સરેાર નીચે જુઓ રીતે ગણી શકાય છે:
$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N}\ & =\frac{10,160}{99}\ & =102.6 \end{aligned} $$
અસીધી પદ્ધતિ
ગ્રુપ કરેલ ડેટા માટે અસીધી પદ્ધતિ માટે નીચેનું સૂત્રનો ઉપયોગ થઈ શકે છે. આ સૂત્રના તત્વો ગ્રુપ કરેલ નહીં ડેટા માટે આપેલ અસીધી પદ્ધતિના તરીકે જોડાયા છે. તે નીચે રૂપાંતરિત થયું છે
$$ \bar{x}=A\pm\frac{\sum f d}{N} $$
જ્યાં,
= ધારણ કરેલ સરેાર જૂથના મધ્યબિંદુ (કલમ 2.3માં ધારણ કરેલ સરેાર જૂથ 90 – 110 છે જેનો મધ્યબિંદુ 100 છે.) f = આવર્તન d = ધારણ કરેલ સરેાર જૂથની (A) તફાવત N = કેસોનો સરવાળો અથવા ∑ f i = ઇન્ટરવ્યુ (આ કેસમાં, તે 20 છે)
કલમ 2.3માંથી સીધી પદ્ધતિનો ઉપયોગ કરીને સરેારની ગણતરી કરવામાં થતા નીચેના પગલાં ઉકેલાય છે:
(i) સરેાર 90 - 110 જૂથમાં ધારણ કરેલ હતો. તે શ્રેણીના મધ્યમાં સૌથી નજીકના વર્ગમાંથી ધારણ કરવો તેનું ઉપયોગ કરીને ગણતરીનું કદ ઘટાડે છે. કલમ 2.3માં, A (ધારણ કરેલ સરેાર) 100 છે, વર્ગ $90-110$ના મધ્યબિંદુ.
(ii) પાઁચમો કોલમ (u) દરેક વર્ગના મધ્યબિંદુની ધારણ કરેલ સરેાર જૂથના મધ્યબિંદુ (90-110) થી વિચ્છેદો યાદ કરાય છે.
(iii) છેલ્લા કોલમ દરેક $f$ ને તેના સંબંધિત $d$ સાથે ગુણાવેલા મૂલ્યો $f d$ ને દર્શાવે છે. પછી, $f d$ના સકારી અને ઋણાં મૂલ્યોનો અલગ અલગ સરવાળો કરવામાં આવે છે અને તેમની પ્રાકૃતિક તફાવત શોધવામાં આવે છે ( $\sum f d$ ). નોંધો કે $\sum f d$ ની ચિહ્ન સૂત્રમાં A પછી આપવામાં આવે છે, જ્યાં $\pm$ આપવામાં આવે છે.
અસીધી પદ્ધતિનો ઉપયોગ કરીને સરેાર નીચે જુઓ રીતે ગણવામાં આવે છે:
$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A}\pm\frac{\sum\boldsymbol{f}\boldsymbol{d}}{\boldsymbol{N}}\ & =100 +\frac{260}{99}\ & =100 +2.6 \ & =102.6 \end{aligned} $$
નોંધ: અસીધી સરેાર પદ્ધતિ સમાન અને અસમાન વર્ગ ઇન્ટરવ્યુઓ માટે કામ કરશે.
મધ્યમ
મધ્યમ એ સ્થાનિક સરેાર છે. તેને વ્યાખ્યાયિત કરી શકાય છે “એવા બિંદુ તરીકે જે વિતરણમાં તેની બાજુમાં બે સમાન નંબરના કેસો હોય”. મધ્યમ ચિહ્ન $\mathrm{M}$ દ્વારા રજૂ કરવામાં આવે છે.
ગ્રુપ કરેલ નહીં ડેટા માટે મધ્યમની ગણતરી
જ્યારે ગુણોત્તરો ગ્રુપ કરેલ નહીં હોય, ત્યારે તેમને વધું અથવા ઓછું ક્રમમાં રાખવામાં આવે છે. મધ્યમ શોધવા માટે કેન્દ્રભાગના નિદર્શન અથવા મૂલ્યને રાખેલ શ્રેણીમાં શોધવામાં આવે છે. કેન્દ્રભાગનું મૂલ્ય શ્રેણીના ક્યારેય એક અંતિમ મૂલ્યથી શોધી શકાય છે કે જે વધું અથવા ઓછું ક્રમમાં રાખેલ હોય. મધ્યમની ગણતરી કરવા માટે નીચેનો સમીકરણનો ઉપયોગ થાય છે:
વાંચનાત્મક $(\frac{\mathrm{N}+1}{2})$ આઇટમનું મૂલ્ય
ઉદાહરણ 2.3: નીચેના માટે પર્વતીય તરફના પર્વતોના ઉંચાઈનો મધ્યમ ગણો:
$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.
ગણતરી: મધ્યમ (M) નીચેના પગલાંમાં ગણી શકાય છે:
(i) આપેલ ડેટાને વધું અથવા ઓછું ક્રમમાં રાખો.
(ii) શ્રેણીમાં કેન્દ્રભાગનું મૂલ્ય શોધવા માટે સૂત્રનો ઉપયોગ કરો. તેથી:
વાંચનાત્મક $(\frac{\mathrm{N}+1}{2})$ આઇટમનું મૂલ્ય
$=\left(\frac{7 +1}{2}\right)$ આઇટમ
$=\left(\frac{8}{2}\right)$ આઇટમ
રાખેલ શ્રેણીમાં ચોથો આઇટમ મધ્યમ હશે.
ડેટાને વધું ક્રમમાં રાખો -
7,$817; 8,076; 8,126; 8,172; 8,598; 8,611; 8,848$
તેથી,
ચોથો