પ્રકરણ 02 ડેટા પ્રક્રિયા

તમે અગાઉના પ્રકરણમાં શીખ્યા છે કે ડેટાને સંસ્થાપિત કરવું અને તેને રજૂ કરવું તેમને સમજાયો તેવું બનાવે છે. તે ડેટા પ્રક્રિયામાં સહાય કરે છે. ડેટાનું વિશ્લેષણ કરવા માટે ઘણી આંકડક તત્વોનો ઉપયોગ થાય છે, ઉદાહરણ તરીકે:

  1. કેન્દ્રિય વિચરણની માપનીઓ
  2. વિસ્તરણની માપનીઓ
  3. સંબંધની માપનીઓ

જ્યારે કેન્દ્રિય વિચરણની માપનીઓ નિદર્શનોની સેટનું આદર્શ મૂલ્ય પૂરું પાડે છે, ત્યારે વિસ્તરણની માપનીઓ ડેટાના આંતરિક ફેરફારોને ધ્યાનમાં લેતી હોય છે, ચેક્યુઅલ માપનીઓ નજીક. બીજી બાજુએ, સંબંધની માપનીઓ કોઈપણ બે અથવા વધુ સંબંધિત વિકલ્પો વચ્ચેના સંબંધની પાત્રતા પૂરી પાડે છે, જેમ કે વરસાદ અને ભીંજાણની ઘટનાઓ અથવા ખેંચાણના ખાતરનો વપરાશ અને પાકની ઉત્પાદન. આ પ્રકરણમાં, તમે કેન્દ્રિય વિચરણની માપનીઓ શીખશો.

કેન્દ્રિય વિચરણની માપનીઓ

માપાયેલ લક્ષણો જેમ કે વરસાદ, ઉંચાઈ, જનસંખ્યાની ઘનતા, શિક્ષણ પ્રાપ્તિની સ્તરો અથવા વયની જૂથો ભિન્ન થાય છે. જો અમને તેમને સમજવાની જરૂર હોય, તો અમે શું કરીશું? કદાચ અમને બધી નિદર્શનોને સૌથી સારે રીતે રજૂ કરનારો એક મૂલ્ય અથવા નંબરની જરૂર પડી શકે છે. આ એક મૂલ્ય સામાન્ય રીતે વિતરણની કેન્દ્રભાગમાં હોય છે, નહીંતર એક અંતિમ મૂલ્યમાં. વિતરણોના કેન્દ્રને શોધવા માટે વપરાતી આંકડક તત્વોને કેન્દ્રિય વિચરણની માપનીઓ કહેવાય છે. કેન્દ્રિય વિચરણ દ્વારા દર્શાવેલ નંબર એ સમગ્ર ડેટા સેટ માટે રજૂ કરનાર આંકડ છે કારણ કે તે એવો બિંદુ છે જ્યાં વસ્તુઓનું એકત્રિત થવાનો પ્રવૃત્તિ હોય છે.

કેન્દ્રિય વિચરણની માપનીઓ આંકડિક સરેારો તરીકે પણ ઓળખાય છે. કેન્દ્રિય વિચરણની ઘણી માપનીઓ છે, જેમ કે સરેાર, મધ્યમ અને મોડો.

સરેાર

સરેાર એ મૂલ્ય છે જે બધા મૂલ્યોનો સરવાળો કરીને અને નિદર્શનોના નંબરથી ભાગીને મેળવવામાં આવે છે.

મધ્યમ

મધ્યમ એ ક્રમમાં રાખેલ શ્રેણીને બે સમાન નંબરોમાં વહેંચવાનું મૂલ્ય છે. તે સત્યાધિક મૂલ્યથી સ્વતંત્ર નથી. ડેટાને વધું અથવા ઓછું ક્રમમાં રાખીને પછી મધ્યભાગના ક્રમમાંના નંબરનું મૂલ્ય શોધવું મધ્યમની ગણતરીમાં સૌથી મહત્વપૂર્ણ છે. જો નંબરો બે હોય, તો બે મધ્યભાગના મૂલ્યોનો સરેાર મધ્યમ થશે.

મોડો

મોડો એ કોઈ પણ સ્થાન અથવા મૂલ્યમાં સામેલ થતા મહત્તમ ઘટના અથવા આવર્તન છે. તમે ધ્યાન આપી શકો છો કે આ ત્રણ માપનીઓ એક રજૂ કરનાર નંબરનું વિવિધ રીતે નક્કી કરવાની પદ્ધતિ છે જે વિવિધ પ્રકારના ડેટા સેટ્સ માટે યોગ્ય છે.

સરેાર

સરેાર એ વિકલ્પની વિવિધ મૂલ્યોનો સરળ આર્થિક સરેાર છે. ગ્રુપ કરેલ અને ગ્રુપ નહીં કરેલ ડેટા માટે, સરેારની ગણતરી માટેની પદ્ધતિઓ અનિશ્ચિત રીતે અલગ છે. ગ્રુપ કરેલ અને ગ્રુપ નહીં કરેલ ડેટા માટે સરેાર સીધી અથવા અસીધી પદ્ધતિથી ગણી શકાય છે.

ગ્રુપ કરેલ નહીં ડેટાથી સરેારની ગણતરી

સીધી પદ્ધતિ

ગ્રુપ કરેલ નહીં ડેટાથી સરેારની ગણતરી કરીને સીધી પદ્ધતિનો ઉપયોગ કરીને, દરેક નિદર્શન માટેના મૂલ્યોનો સરવાળો કરવામાં આવે છે અને ઘટનાઓના કુલ નંબરથી તેનો ભાગ કરવામાં આવે છે. સરેાર નીચેના સૂત્રથી ગણવામાં આવે છે:

$$ \overline{\mathrm{X}}=\frac{\sum x}{\mathrm{~N}} $$

જ્યાં,

$$ \begin{aligned} \overline{\mathrm{X}} & =\text { સરેાર }\ \sum\quad &\text { શ્રેણીના માપોનો }\ &\text { સરવાળો } \end{aligned} $$

$x\quad=$ શ્રેણીના માપોમાં એક કચરો ગુણોત્તર

$\sum\mathrm{x}=$ બધા માપોનો સરવાળો

$\mathrm{N}\quad$ = માપોનો નંબર

ઉદાહરણ 2.1: મેડહ્યા પ્રાંતમાં મલ્વા પ્લેટ્યુના જિલ્લાઓના વરસાદથી મલ્વા પ્લેટ્યુના વરસાદનો સરેાર ગણો કે જે કલમ 2.1માં આપેલ છે:

$\hspace{1cm}$ કલમ 2.1; સરેાર વરસાદની ગણતરી

મલ્વા પ્લેટ્યુનાના જિલ્લાઓ સામાન્ય વરસાદ
મીમીમાં
અસીધી પદ્ધતિ
x સીધી પદ્ધતિ $d=x-800^{*}$
ઇંદોરે 979 179
દેવાસ 1083 283
ધાર 833 33
રતલામ 896 96
ઉજ્જૈન 891 91
મંદસૌર 825 25
શાજાપુર 977 177
$\sum x$ અને $\sum d$ 6484 884
$\frac{\sum x}{N}$ અને $\frac{\sum d}{N}$ 926.29 126.29
  • 800 એ ધારણ કરેલ સરેાર તરીકે લાગુ પડે છે.
    $\mathrm{d}$ એ ધારણ કરેલ સરેારથી વિચ્છેદ છે.

કલમ 2.1માં આપેલ ડેટાનો સરેાર નીચે જુઓ રીતે ગણવામાં આવે છે:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum x}{N}\ & =\frac{6,484}{7}\ & =926.29 \end{aligned} $$

સરેારની ગણતરીમાં નોંધી શકાય છે કે કચરો વરસાદ ડેટા સીધી રીતે સરવાળામાં આવ્યા છે અને તેનો સરવાળો નિદર્શનોના નંબર દ્વારા ભાગાયો છે, એટલે કે જિલ્લાઓ. તેથી, તે સીધી પદ્ધતિ તરીકે ઓળખાય છે.

અસીધી પદ્ધતિ

ઘણા નિદર્શનો માટે, સરેારની ગણતરી કરવા માટે સામાન્ય રીતે અસીધી પદ્ધતિનો ઉપયોગ થાય છે. તે નિદર્શનોના મૂલ્યોને એક સામાન્ય મૂલ્યથી ઓછા નંબરોમાં ઘટાડવામાં મદદ કરે છે. ઉદાહરણ તરીકે, જેમ કે કલમ 2.1માં દર્શાવ્યું છે, વરસાદના મૂલ્યો 800 અને $1100 \mathrm{~mm}$ વચ્ચે હોય છે. અમે આ મૂલ્યોને ‘ધારણ કરેલ સરેાર’ પસંદ કરીને અને દરેક મૂલ્યમાંથી પસંદ કરેલ નંબર કાઢીને ઘટાડી શકીએ છીએ. આ વર્તમાન કેસમાં, અમે 800 ને ધારણ કરેલ સરેાર તરીકે લાગુ પડ્યું છે. આ પ્રક્રિયાને કોડિંગ કહેવાય છે. પછી સરેાર આ ઘટાડેલ નંબરોથી (કલમ 2.1નો કોલમ 3) ગણવામાં આવે છે.

અસીધી પદ્ધતિથી સરેારની ગણતરી કરવા માટે નીચેનું સૂત્રનો ઉપયોગ થાય છે:

$$ \overline{\mathrm{X}}=A+\frac{\sum d}{N} $$

જ્યાં,

$$ \begin{aligned} A & =\text { કાઢેલો સામાન્ય }\ \sum d & =\text { કોડ કરેલ ગુણોત્તરોનો સરવાળો }\ N & =\text { શ્રેણીમાં વ્યક્તિગત નિદર્શનોનો નંબર } \end{aligned} $$

કલમ 2.1માં દર્શાવેલ ડેટાનો સરેાર નીચેની રીતે અસીધી પદ્ધતિથી ગણી શકાય છે:

$$ \begin{aligned} \overline{\mathrm{X}} & =800 +\frac{884}{7}\ & =800 +\frac{884}{7}\ \overline{\mathrm{X}} & =926.29 \mathrm{~mm} \end{aligned} $$

નોંધો કે ક્યારેય બે પદ્ધતિઓમાંથી એક પણ ગણાય છે, ત્યારે સરેારનો મૂલ્ય એક જ આવે છે.

ગ્રુપ કરેલ ડેટાથી સરેારની ગણતરી

ગ્રુપ કરેલ ડેટા માટે સરેાર સીધી અથવા અસીધી પદ્ધતિથી પણ ગણવામાં આવે છે.

સીધી પદ્ધતિ

જ્યારે ગુણોત્તરો આવર્તન વિતરણમાં ગ્રુપ કરેલ હોય, ત્યારે વ્યક્તિગત મૂલ્યો તેમની ઓળખનું નુકસાન પામે છે. આ મૂલ્યો તેમને રાખેલ વર્ગના ક્લાસ ઇન્ટરવ્યુના મધ્યબિંદુઓ દ્વારા રજૂ કરવામાં આવે છે. ગ્રુપ કરેલ ડેટાથી સરેારની ગણતરી કરીને સીધી પદ્ધતિનો ઉપયોગ કરીને, દરેક વર્ગ ઇન્ટરવ્યુના મધ્યબિંદુ તેના સંબંધિત આવર્તન $(f)$ સાથે ગુણાવવામાં આવે છે; બધા $f x$ મૂલ્યોનો સરવાળો (એટલે કે $\mathrm{X}$ એ મધ્યબિંદુઓ છે) મેળવવામાં આવે છે અને છેલ્લે નિદર્શનોના નંબર દ્વારા ભાગવામાં આવે છે, એટલે કે $\mathrm{N}$. તેથી, સરેાર નીચેના સૂત્રથી ગણવામાં આવે છે:

$$ \overline{\mathrm{X}}=\frac{\sum f x}{N} $$

જ્યાં: $$ \begin{aligned} \overline{\mathrm{X}} & =\text { સરેાર }\ f & =\text { આવર્તનો }\ x & =\text { વર્ગ ઇન્ટરવ્યુના મધ્યબિંદુઓ }\ N &\left.=\text { નિદર્શનોનો નંબર (તે પણ }\sum f\text { તરીકે વ્યાખ્યાયિત થઈ શકે છે) } \end{aligned} $$

ઉદાહરણ 2.2: કલમ 2.2માં આપેલ ડેટાનો ઉપયોગ કરીને ફેક્ટરી કામગીરોનો સરેાર દર ગણો:

કલમ 2.2; ફેક્ટરી કામગીરોનો દર

દર (રૂપિયા/દિવસ) કામગીરોનો નંબર ()
વર્ગો $\boldsymbol{f}$
$50-70$ 10
$70-90$ 20
$90-110$ 25
$110-130$ 35
$130-150$ 9

કલમ 2.3; સરેારની ગણતરી

વર્ગો આવર્તન
(f)
મધ્ય-
બિંદુઓ
$(x)$
$f x x$ $d=x-100$ $f d$ $U=$
$(x-100)$
20
$f u$
$50-70$ 10 60 600 -40 -400 -2 -20
$70-90$ 20 80 1,600 -20 -400 -1 -20
$\mathbf{90 - 110}$ $\mathbf{25}$ $\mathbf{1 0 0}$ 2,500 $\mathbf{0}$ 0 0 0
$110-130$ 35 120 4,200 20 700 1 35
$130-150$ 9 140 1,260 40 360 2 18
$\sum f x$
અને $\sum f=99$ $\sum f x=$ $\sum f d=$ $\sum f u=$
$\sum f x$ 10,160 260 13

જ્યાં $\mathrm{N}=\sum f=99$

કલમ 2.3 ગ્રુપ કરેલ ડેટા માટે સરેારની ગણતરી કરવાની પદ્ધતિ આપે છે. આપેલ આવર્તન વિતરણમાં નોનેટ કામગીરોને દર દરમિયાન માટે પાઁચ વર્ગોમાં ગ્રુપ કરેલ છે. આ જૂથોના મધ્યબિંદુઓ ત્રીજા કોલમમાં યાદ કરેલ છે. સરેારની ગણતરી કરવા માટે, દરેક મધ્યબિંદુ $(\mathrm{X})$ તેના આવર્તન $(f)$ સાથે ગુણાવવામાં આવ્યો છે અને તેમના સરવાળા ( $\sum f_{x}$ ) ને $N$ થી ભાગાયો છે.

આપેલ સૂત્રનો ઉપયોગ કરીને સરેાર નીચે જુઓ રીતે ગણી શકાય છે:

$$ \begin{aligned} \overline{\mathrm{X}} & =\frac{\sum f x}{N}\ & =\frac{10,160}{99}\ & =102.6 \end{aligned} $$

અસીધી પદ્ધતિ

ગ્રુપ કરેલ ડેટા માટે અસીધી પદ્ધતિ માટે નીચેનું સૂત્રનો ઉપયોગ થઈ શકે છે. આ સૂત્રના તત્વો ગ્રુપ કરેલ નહીં ડેટા માટે આપેલ અસીધી પદ્ધતિના તરીકે જોડાયા છે. તે નીચે રૂપાંતરિત થયું છે

$$ \bar{x}=A\pm\frac{\sum f d}{N} $$

જ્યાં,

= ધારણ કરેલ સરેાર જૂથના મધ્યબિંદુ (કલમ 2.3માં ધારણ કરેલ સરેાર જૂથ 90 – 110 છે જેનો મધ્યબિંદુ 100 છે.) f = આવર્તન d = ધારણ કરેલ સરેાર જૂથની (A) તફાવત N = કેસોનો સરવાળો અથવા ∑ f i = ઇન્ટરવ્યુ (આ કેસમાં, તે 20 છે)

કલમ 2.3માંથી સીધી પદ્ધતિનો ઉપયોગ કરીને સરેારની ગણતરી કરવામાં થતા નીચેના પગલાં ઉકેલાય છે:

(i) સરેાર 90 - 110 જૂથમાં ધારણ કરેલ હતો. તે શ્રેણીના મધ્યમાં સૌથી નજીકના વર્ગમાંથી ધારણ કરવો તેનું ઉપયોગ કરીને ગણતરીનું કદ ઘટાડે છે. કલમ 2.3માં, A (ધારણ કરેલ સરેાર) 100 છે, વર્ગ $90-110$ના મધ્યબિંદુ.

(ii) પાઁચમો કોલમ (u) દરેક વર્ગના મધ્યબિંદુની ધારણ કરેલ સરેાર જૂથના મધ્યબિંદુ (90-110) થી વિચ્છેદો યાદ કરાય છે.

(iii) છેલ્લા કોલમ દરેક $f$ ને તેના સંબંધિત $d$ સાથે ગુણાવેલા મૂલ્યો $f d$ ને દર્શાવે છે. પછી, $f d$ના સકારી અને ઋણાં મૂલ્યોનો અલગ અલગ સરવાળો કરવામાં આવે છે અને તેમની પ્રાકૃતિક તફાવત શોધવામાં આવે છે ( $\sum f d$ ). નોંધો કે $\sum f d$ ની ચિહ્ન સૂત્રમાં A પછી આપવામાં આવે છે, જ્યાં $\pm$ આપવામાં આવે છે.

અસીધી પદ્ધતિનો ઉપયોગ કરીને સરેાર નીચે જુઓ રીતે ગણવામાં આવે છે:

$$ \begin{aligned} \overline{\boldsymbol{x}} & =\boldsymbol{A}\pm\frac{\sum\boldsymbol{f}\boldsymbol{d}}{\boldsymbol{N}}\ & =100 +\frac{260}{99}\ & =100 +2.6 \ & =102.6 \end{aligned} $$

નોંધ: અસીધી સરેાર પદ્ધતિ સમાન અને અસમાન વર્ગ ઇન્ટરવ્યુઓ માટે કામ કરશે.

મધ્યમ

મધ્યમ એ સ્થાનિક સરેાર છે. તેને વ્યાખ્યાયિત કરી શકાય છે “એવા બિંદુ તરીકે જે વિતરણમાં તેની બાજુમાં બે સમાન નંબરના કેસો હોય”. મધ્યમ ચિહ્ન $\mathrm{M}$ દ્વારા રજૂ કરવામાં આવે છે.

ગ્રુપ કરેલ નહીં ડેટા માટે મધ્યમની ગણતરી

જ્યારે ગુણોત્તરો ગ્રુપ કરેલ નહીં હોય, ત્યારે તેમને વધું અથવા ઓછું ક્રમમાં રાખવામાં આવે છે. મધ્યમ શોધવા માટે કેન્દ્રભાગના નિદર્શન અથવા મૂલ્યને રાખેલ શ્રેણીમાં શોધવામાં આવે છે. કેન્દ્રભાગનું મૂલ્ય શ્રેણીના ક્યારેય એક અંતિમ મૂલ્યથી શોધી શકાય છે કે જે વધું અથવા ઓછું ક્રમમાં રાખેલ હોય. મધ્યમની ગણતરી કરવા માટે નીચેનો સમીકરણનો ઉપયોગ થાય છે:

વાંચનાત્મક $(\frac{\mathrm{N}+1}{2})$ આઇટમનું મૂલ્ય

ઉદાહરણ 2.3: નીચેના માટે પર્વતીય તરફના પર્વતોના ઉંચાઈનો મધ્યમ ગણો:

$8,126 \mathrm{~m}, 8,611 \mathrm{~m}, 7,817 \mathrm{~m}, 8,172 \mathrm{~m}, 8,076 \mathrm{~m}, 8,848 \mathrm{~m}, 8,598 \mathrm{~m}$.

ગણતરી: મધ્યમ (M) નીચેના પગલાંમાં ગણી શકાય છે:

(i) આપેલ ડેટાને વધું અથવા ઓછું ક્રમમાં રાખો.

(ii) શ્રેણીમાં કેન્દ્રભાગનું મૂલ્ય શોધવા માટે સૂત્રનો ઉપયોગ કરો. તેથી:

વાંચનાત્મક $(\frac{\mathrm{N}+1}{2})$ આઇટમનું મૂલ્ય

$=\left(\frac{7 +1}{2}\right)$ આઇટમ

$=\left(\frac{8}{2}\right)$ આઇટમ

રાખેલ શ્રેણીમાં ચોથો આઇટમ મધ્યમ હશે.

ડેટાને વધું ક્રમમાં રાખો -

7,$817; 8,076; 8,126; 8,172; 8,598; 8,611; 8,848$

તેથી,

ચોથો