അദ്ധ്യായം 13 സ്ഥിതിവിവരക്കണക്ക്

“ശരാശരികളുടെയും അവയുടെ കണക്കുകൂട്ടലുകളുടെയും ശാസ്ത്രമെന്ന് നിങ്ങൾക്ക് സ്ഥിതിവിവരക്കണക്കിനെ വിളിക്കാം.” - എ.എൽ.ബോളി & എ.എൽ. ബോഡിംഗ്ടൺ

പരിചയം

നിർദ്ദിഷ്ട ആവശ്യങ്ങൾക്കായി ശേഖരിച്ച ഡാറ്റയുമായാണ് സ്ഥിതിവിവരക്കണക്ക് ഇടപെടുന്നതെന്ന് നമുക്കറിയാം. അത് വിശകലനം ചെയ്ത് വ്യാഖ്യാനിക്കുന്നതിലൂടെ നമുക്ക് ഡാറ്റയെക്കുറിച്ച് തീരുമാനങ്ങൾ എടുക്കാനാകും. മുമ്പത്തെ ക്ലാസുകളിൽ, ഡാറ്റ ഗ്രാഫിക്കലായും ടാബുലാർ രൂപത്തിലും പ്രതിനിധീകരിക്കുന്നതിനുള്ള രീതികൾ നമ്മൾ പഠിച്ചിട്ടുണ്ട്. ഈ പ്രതിനിധാനം ഡാറ്റയുടെ ചില പ്രധാന സവിശേഷതകളോ സ്വഭാവങ്ങളോ വെളിപ്പെടുത്തുന്നു. നൽകിയിരിക്കുന്ന ഡാറ്റയ്ക്ക് ഒരു പ്രതിനിധി മൂല്യം കണ്ടെത്തുന്നതിനുള്ള രീതികളും നമ്മൾ പഠിച്ചിട്ടുണ്ട്. ഈ മൂല്യത്തെ കേന്ദ്രീയ പ്രവണതയുടെ അളവ് എന്ന് വിളിക്കുന്നു. ശരാശരി (അങ്കശാസ്ത്ര ശരാശരി), മധ്യമം, ബഹുതമം എന്നിവ മൂന്ന് കേന്ദ്രീയ പ്രവണത അളവുകളാണെന്ന് ഓർക്കുക. ഒരു കേന്ദ്രീയ പ്രവണത അളവ് ഡാറ്റാ പോയിന്റുകൾ എവിടെ കേന്ദ്രീകരിച്ചിരിക്കുന്നു എന്നതിനെക്കുറിച്ച് ഒരു പരുക്കൻ ധാരണ നൽകുന്നു. എന്നാൽ, അതിൽ നിന്ന് മികച്ച വ്യാഖ്യാനം നടത്തുന്നതിന്

കാൾ പിയേഴ്സൺ (1857-1936 എ.ഡി.)

ഡാറ്റ, ഡാറ്റ എങ്ങനെ ചിതറിക്കിടക്കുന്നു അല്ലെങ്കിൽ ഒരു കേന്ദ്രീയ പ്രവണത അളവിന് ചുറ്റും അവ എത്രമാത്രം കൂട്ടമായി കിടക്കുന്നു എന്നതിനെക്കുറിച്ചും നമുക്ക് ഒരു ധാരണ ഉണ്ടായിരിക്കണം.

ഇപ്പോൾ അവസാനത്തെ പത്ത് മത്സരങ്ങളിൽ രണ്ട് ബാറ്റ്സ്മാൻമാർ നേടിയ റൺസ് ഇനിപ്പറയുന്ന രീതിയിൽ പരിഗണിക്കുക:

ബാറ്റ്സ്മാൻ A : $30,91,0,64,42,80,30,5,117,71$

ബാറ്റ്സ്മാൻ B : $53,46,48,50,53,53,58,60,57,52$

വ്യക്തമായും, ഡാറ്റയുടെ ശരാശരിയും മധ്യമവും

	ബാറ്റ്സ്മാൻ A	ബാറ്റ്സ്മാൻ B
ശരാശരി	53	53
മധ്യമം	53	53

ഓർക്കുക, നിരീക്ഷണങ്ങളുടെ എണ്ണം കൊണ്ട് നിരീക്ഷണങ്ങളുടെ ആകെത്തുക വിഭജിച്ചാണ് ഞങ്ങൾ ഒരു ഡാറ്റയുടെ ശരാശരി ($\bar{x}$ കൊണ്ട് സൂചിപ്പിക്കുന്നു) കണക്കാക്കുന്നത്, അതായത്,

$ \bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i $

കൂടാതെ, ഡാറ്റ ആരോഹണ ക്രമത്തിലോ അവരോഹണ ക്രമത്തിലോ ക്രമീകരിച്ച് ഇനിപ്പറയുന്ന നിയമം പ്രയോഗിച്ചാണ് മധ്യമം ലഭിക്കുന്നത്.

നിരീക്ഷണങ്ങളുടെ എണ്ണം ഒറ്റസംഖ്യയാണെങ്കിൽ, മധ്യമം $(\frac{n+1}{2})^{\text{th }}$ നിരീക്ഷണമാണ്.

നിരീക്ഷണങ്ങളുടെ എണ്ണം ഇരട്ടസംഖ്യയാണെങ്കിൽ, മധ്യമം $(\frac{n}{2})^{\text{th }}$, $(\frac{n}{2}+1)^{\text{th }}$ നിരീക്ഷണങ്ങളുടെ ശരാശരിയാണ്.

രണ്ട് ബാറ്റ്സ്മാൻമാരും $A$ നേടിയ റൺസിന്റെ ശരാശരിയും മധ്യമവും ഒന്നുതന്നെയാണെന്ന് നമ്മൾ കണ്ടെത്തുന്നു, അതായത്, 53. രണ്ട് കളിക്കാരുടെ പ്രകടനവും ഒന്നുതന്നെയാണെന്ന് നമുക്ക് പറയാമോ? വ്യക്തമായും ഇല്ല, കാരണം ബാറ്റ്സ്മാൻ A യുടെ സ്കോറുകളിലെ വ്യതിയാനം 0 (കുറഞ്ഞത്) മുതൽ 117 (കൂടിയത്) വരെയാണ്. അതേസമയം, ബാറ്റ്സ്മാൻ B നേടിയ റൺസിന്റെ പരിധി 46 മുതൽ 60 വരെയാണ്.

ഇനി നമുക്ക് മുകളിലെ സ്കോറുകൾ ഒരു നമ്പർ ലൈനിൽ ഡോട്ടുകളായി പ്ലോട്ട് ചെയ്യാം. ഇനിപ്പറയുന്ന ഡയഗ്രമുകൾ നമുക്ക് കണ്ടെത്താം:

ബാറ്റ്സ്മാൻ A യ്ക്ക്

ചിത്രം 13.1

ബാറ്റ്സ്മാൻ B യ്ക്ക്

ചിത്രം 13.2

ബാറ്റ്സ്മാൻ B യുമായി ബന്ധപ്പെട്ട ഡോട്ടുകൾ പരസ്പരം അടുത്താണെന്നും കേന്ദ്രീയ പ്രവണത അളവിന് (ശരാശരിയും മധ്യമവും) ചുറ്റും കൂട്ടമായി കിടക്കുന്നുവെന്നും, അതേസമയം ബാറ്റ്സ്മാൻ A യുമായി ബന്ധപ്പെട്ടവ ചിതറിക്കിടക്കുന്നുവെന്നോ കൂടുതൽ വ്യാപിച്ചുകിടക്കുന്നുവെന്നോ നമുക്ക് കാണാം.

അങ്ങനെ, ഒരു നൽകിയ ഡാറ്റയെക്കുറിച്ചുള്ള സമ്പൂർണ്ണ വിവരങ്ങൾ നൽകാൻ കേന്ദ്രീയ പ്രവണത അളവുകൾ മാത്രം പര്യാപ്തമല്ല. വ്യതിയാനം സ്ഥിതിവിവരക്കണക്കിന് കീഴിൽ പഠിക്കേണ്ട മറ്റൊരു ഘടകമാണ്. ‘കേന്ദ്രീയ പ്രവണത അളവുകൾ’ പോലെ തന്നെ വ്യതിയാനത്തിന് വിവരിക്കാൻ ഞങ്ങൾക്ക് ഒരൊറ്റ സംഖ്യ വേണം. ഈ ഒറ്റ സംഖ്യയെ ‘വിസരണ അളവ്’ എന്ന് വിളിക്കുന്നു. ഈ അദ്ധ്യായത്തിൽ, ഗ്രൂപ്പ് ചെയ്യാത്തതും ഗ്രൂപ്പ് ചെയ്തതുമായ ഡാറ്റയ്ക്കുള്ള വിസരണത്തിന്റെ ചില പ്രധാനപ്പെട്ട അളവുകളും അവയുടെ കണക്കുകൂട്ടൽ രീതികളും നമ്മൾ പഠിക്കും.

13.2 വിസരണ അളവുകൾ

ഒരു ഡാറ്റയിലെ വിസരണം അല്ലെങ്കിൽ ചിതറിക്കിടക്കൽ അവിടെ ഉപയോഗിക്കുന്ന നിരീക്ഷണങ്ങളുടെയും കേന്ദ്രീയ പ്രവണത അളവിന്റെ തരങ്ങളുടെയും അടിസ്ഥാനത്തിലാണ് അളക്കുന്നത്. ഇനിപ്പറയുന്ന വിസരണ അളവുകൾ ഉണ്ട്:

(i) പരിധി, (ii) ചതുര്ഥക വ്യതിയാനം, (iii) മാധ്യ വ്യതിയാനം, (iv) സ്റ്റാൻഡേർഡ് ഡീവിയേഷൻ.

ഈ അദ്ധ്യായത്തിൽ, ചതുര്ഥക വ്യതിയാനം ഒഴികെയുള്ള ഈ വിസരണ അളവുകളെല്ലാം നമ്മൾ പഠിക്കും.

13.3 പരിധി

രണ്ട് ബാറ്റ്സ്മാൻമാരായ A യും B യും നേടിയ റൺസിന്റെ ഉദാഹരണത്തിൽ, ഓരോ സീരീസിലെയും ഏറ്റവും കുറഞ്ഞതും കൂടിയതുമായ റൺസിന്റെ അടിസ്ഥാനത്തിൽ സ്കോറുകളിലെ വ്യതിയാനത്തെക്കുറിച്ച് ഞങ്ങൾക്ക് ചില ധാരണ ഉണ്ടായിരുന്നുവെന്ന് ഓർക്കുക. ഇതിനായി ഒരൊറ്റ സംഖ്യ ലഭിക്കുന്നതിന്, ഓരോ സീരീസിലെയും പരമാവധി, കുറഞ്ഞ മൂല്യങ്ങളുടെ വ്യത്യാസം ഞങ്ങൾ കണ്ടെത്തുന്നു. ഈ വ്യത്യാസത്തെ ഡാറ്റയുടെ ‘പരിധി’ എന്ന് വിളിക്കുന്നു.

ബാറ്റ്സ്മാൻ A യുടെ കാര്യത്തിൽ, പരിധി $=117-0=117$, ബാറ്റ്സ്മാൻ B യുടെ കാര്യത്തിൽ, പരിധി $=60-46=14$. വ്യക്തമായും, A യുടെ പരിധി $>$ $B$ ന്റെ പരിധി. അതിനാൽ, A യുടെ കാര്യത്തിൽ സ്കോറുകൾ ചിതറിക്കിടക്കുന്നു അല്ലെങ്കിൽ വിസരിച്ചുകിടക്കുന്നു, അതേസമയം B യുടെ കാര്യത്തിൽ ഇവ പരസ്പരം അടുത്താണ്.

അങ്ങനെ, ഒരു സീരീസിന്റെ പരിധി $=$ പരമാവധി മൂല്യം - കുറഞ്ഞ മൂല്യം.

ഡാറ്റയുടെ പരിധി വ്യതിയാനത്തെക്കുറിച്ചോ ചിതറിക്കിടക്കലിനെക്കുറിച്ചോ ഞങ്ങൾക്ക് ഒരു പരുക്കൻ ധാരണ നൽകുന്നു, പക്ഷേ ഒരു കേന്ദ്രീയ പ്രവണതയിൽ നിന്നുള്ള ഡാറ്റയുടെ വിസരണത്തെക്കുറിച്ച് പറയുന്നില്ല. ഈ ആവശ്യത്തിനായി, വ്യതിയാനത്തിന്റെ മറ്റ് ചില അളവുകൾ ഞങ്ങൾക്ക് ആവശ്യമാണ്. വ്യക്തമായും, അത്തരം അളവ് കേന്ദ്രീയ പ്രവണതയിൽ നിന്നുള്ള മൂല്യങ്ങളുടെ വ്യത്യാസത്തെ (അല്ലെങ്കിൽ വ്യതിയാനം) ആശ്രയിച്ചിരിക്കണം.

കേന്ദ്രീയ പ്രവണതയിൽ നിന്നുള്ള നിരീക്ഷണങ്ങളുടെ വ്യതിയാനങ്ങളെ ആശ്രയിക്കുന്ന വിസരണത്തിന്റെ പ്രധാനപ്പെട്ട അളവുകൾ മാധ്യ വ്യതിയാനവും സ്റ്റാൻഡേർഡ് ഡീവിയേഷനുമാണ്. നമുക്ക് അവ വിശദമായി ചർച്ച ചെയ്യാം.

13.4 മാധ്യ വ്യതിയാനം

ഒരു നിരീക്ഷണത്തിന്റെ $x$ ഒരു നിശ്ചിത മൂല്യമായ ‘$a$’ ൽ നിന്നുള്ള വ്യതിയാനം $x-a$ വ്യത്യാസമാണെന്ന് ഓർക്കുക. $x$ ന്റെ മൂല്യങ്ങളുടെ ഒരു കേന്ദ്രീയ മൂല്യമായ ‘$a$’ ൽ നിന്നുള്ള വിസരണം കണ്ടെത്തുന്നതിന്, $a$ നെക്കുറിച്ചുള്ള വ്യതിയാനങ്ങൾ ഞങ്ങൾ കണ്ടെത്തുന്നു. വിസരണത്തിന്റെ ഒരു കേവല അളവ് ഈ വ്യതിയാനങ്ങളുടെ ശരാശരിയാണ്. ശരാശരി കണ്ടെത്തുന്നതിന്, വ്യതിയാനങ്ങളുടെ ആകെത്തുക നമ്മൾ നേടണം. എന്നാൽ, നിരീക്ഷണങ്ങളുടെ കൂട്ടത്തിന്റെ പരമാവധി, കുറഞ്ഞ മൂല്യങ്ങൾക്കിടയിലാണ് ഒരു കേന്ദ്രീയ പ്രവണത അളവ് കിടക്കുന്നതെന്ന് നമുക്കറിയാം. അതിനാൽ, ചില വ്യതിയാനങ്ങൾ നെഗറ്റീവ് ആയിരിക്കും, ചിലത് പോസിറ്റീവ് ആയിരിക്കും. അങ്ങനെ, വ്യതിയാനങ്ങളുടെ ആകെത്തുക അപ്രത്യക്ഷമാകാം. മാത്രമല്ല, ശരാശരിയിൽ നിന്നുള്ള വ്യതിയാനങ്ങളുടെ ആകെത്തുക $(\bar{x})$ പൂജ്യമാണ്.

കൂടാതെ $\quad \quad \quad $ വ്യതിയാനങ്ങളുടെ ശരാശരി $=\frac{\text{ Sum of deviations }}{\text{ Number of observations }}=\frac{0}{n}=0$

അങ്ങനെ, വിസരണത്തിന്റെ അളവുമായി ബന്ധപ്പെട്ടിടത്തോളം, ശരാശരിയെക്കുറിച്ചുള്ള വ്യതിയാനങ്ങളുടെ ശരാശരി കണ്ടെത്തുന്നത് ഞങ്ങൾക്ക് ഒരു പ്രയോജനവുമില്ല.

ഒരു കേന്ദ്രീയ പ്രവണതയിൽ നിന്നോ ഒരു നിശ്ചിത സംഖ്യയായ ‘$a$’ ൽ നിന്നോ ഓരോ മൂല്യത്തിന്റെയും ദൂരം ആവശ്യമുള്ള ഒരു ഉചിതമായ വിസരണ അളവ് കണ്ടെത്തുന്നതിൽ, ഓർക്കുക, രണ്ട് സംഖ്യകളുടെ വ്യത്യാസത്തിന്റെ കേവല മൂല്യം ഒരു നമ്പർ ലൈനിൽ പ്രതിനിധീകരിക്കുമ്പോൾ സംഖ്യകൾ തമ്മിലുള്ള ദൂരം നൽകുന്നു. അങ്ങനെ, ഒരു നിശ്ചിത സംഖ്യയായ ‘$a$’ ൽ നിന്നുള്ള വിസരണത്തിന്റെ അളവ് കണ്ടെത്തുന്നതിന്, കേന്ദ്രീയ മൂല്യത്തിൽ നിന്നുള്ള വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങളുടെ ശരാശരി ഞങ്ങൾ എടുക്കാം. ഈ ശരാശരിയെ ‘മാധ്യ വ്യതിയാനം’ എന്ന് വിളിക്കുന്നു. അങ്ങനെ ഒരു കേന്ദ്രീയ മൂല്യമായ ‘$a$’ നെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനം ‘$a$’ ൽ നിന്നുള്ള നിരീക്ഷണങ്ങളുടെ വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങളുടെ ശരാശരിയാണ്. ‘$a$’ ൽ നിന്നുള്ള മാധ്യ വ്യതിയാനം M.D. (a) എന്ന് സൂചിപ്പിക്കുന്നു. അതിനാൽ,

$ \text{ M.D. }(a)=\frac{\text{ Sum of absolute values of deviations from ’ } a \text{ ’ }}{\text{ Number of observations }} . $

ശ്രദ്ധിക്കുക ഏത് കേന്ദ്രീയ പ്രവണത അളവിൽ നിന്നും മാധ്യ വ്യതിയാനം ലഭിക്കും. എന്നിരുന്നാലും, സ്ഥിതിവിവരക്കണക്ക് പഠനങ്ങളിൽ ശരാശരിയിൽ നിന്നും മധ്യമത്തിൽ നിന്നുമുള്ള മാധ്യ വ്യതിയാനം സാധാരണയായി ഉപയോഗിക്കുന്നു.

13.4.1 ഗ്രൂപ്പ് ചെയ്യാത്ത ഡാറ്റയ്ക്കുള്ള മാധ്യ വ്യതിയാനം

$n$ നിരീക്ഷണങ്ങൾ $x_1, x_2, x_3, \ldots ., x_n$ ആയിരിക്കട്ടെ. ശരാശരിയെക്കുറിച്ചോ മധ്യമത്തെക്കുറിച്ചോ മാധ്യ വ്യതിയാനം കണക്കാക്കുന്നതിൽ ഇനിപ്പറയുന്ന ഘട്ടങ്ങൾ ഉൾപ്പെടുന്നു:

ഘട്ടം 1 ഞങ്ങൾ മാധ്യ വ്യതിയാനം കണ്ടെത്തേണ്ട കേന്ദ്രീയ പ്രവണത അളവ് കണക്കാക്കുക. അത് ‘$a$’ ആയിരിക്കട്ടെ.

ഘട്ടം 2 ഓരോ $x_i$ ന്റെയും $a$ ൽ നിന്നുള്ള വ്യതിയാനം കണ്ടെത്തുക, അതായത്, $x_1-a, x_2-a, x_3-a, \ldots, x_n-a$

ഘട്ടം 3 വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങൾ കണ്ടെത്തുക, അതായത്, മൈനസ് ചിഹ്നം (-) ഉണ്ടെങ്കിൽ ഉപേക്ഷിക്കുക, അതായത്, $|x_1-a|,|x_2-a|,|x_3-a|, \ldots .,|x_n-a|$

ഘട്ടം 4 വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങളുടെ ശരാശരി കണ്ടെത്തുക. ഈ ശരാശരി $a$ നെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനമാണ്, അതായത്,

$ \text{ M.D. }(a)=\frac{\sum\limits_{i=1}^{n}|x_i-a|}{n} $

അങ്ങനെ $\quad\quad\quad$ M.D. $(\bar{x})=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-\bar{x}|$, ഇവിടെ $\bar{x}=$ ശരാശരി

കൂടാതെ $\quad\quad\quad$ M.D. $(M)=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-M|$, ഇവിടെ $M=$ മധ്യമം

കുറിപ്പ് - ഈ അദ്ധ്യായത്തിൽ, മറ്റൊന്ന് പറയാത്തപക്ഷം മധ്യമം സൂചിപ്പിക്കാൻ M എന്ന ചിഹ്നം ഞങ്ങൾ ഉപയോഗിക്കും.ഇനി നമുക്ക് മുകളിലെ രീതിയുടെ ഘട്ടങ്ങൾ ഇനിപ്പറയുന്ന ഉദാഹരണങ്ങളിൽ ചിത്രീകരിക്കാം.

ഉദാഹരണം 1 ഇനിപ്പറയുന്ന ഡാറ്റയ്ക്ക് ശരാശരിയെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനം കണ്ടെത്തുക:

$ 6,7,10,12,13,4,8,12 $

പരിഹാരം ഞങ്ങൾ ഘട്ടം ഘട്ടമായി മുന്നോട്ട് പോയി ഇനിപ്പറയുന്നവ നേടുന്നു:

ഘട്ടം 1 നൽകിയിരിക്കുന്ന ഡാറ്റയുടെ ശരാശരി

$ \bar{x}=\frac{6+7+10+12+13+4+8+12}{8}=\frac{72}{8}=9 $

ഘട്ടം 2 ശരാശരിയിൽ നിന്നുള്ള യഥാക്രമം നിരീക്ഷണങ്ങളുടെ വ്യതിയാനം $\bar{x}$, അതായത്, $x_i-\bar{x}$ ആണ്

$\quad\quad\quad\quad 6-9,7-9,10-9,12-9,13-9,4-9,8-9,12-9$,

അല്ലെങ്കിൽ $ \quad\quad\quad\quad -3,-2,1,3,4,-5,-1,3 $

ഘട്ടം 3 വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങൾ, അതായത്, $|x_i-\bar{x}|$ ആണ്

$ 3,2,1,3,4,5,1,3 $

ഘട്ടം 4 ആവശ്യമായ ശരാശരിയെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനം

$ \text{ M.D. } \begin{aligned} (\bar{x}) & =\frac{\sum\limits_{i=1}^{8}|x_i-\bar{x}|}{8} \\ & =\frac{3+2+1+3+4+5+1+3}{8}=\frac{22}{8}=2.75 \end{aligned} $

കുറിപ്പ് - ഓരോ തവണയും ഘട്ടങ്ങൾ നടപ്പിലാക്കുന്നതിന് പകരം, ഘട്ടങ്ങളെ സൂചിപ്പിക്കാതെ തന്നെ ഘട്ടം ഘട്ടമായി കണക്കുകൂട്ടൽ തുടരാം.

ഉദാഹരണം 2 ഇനിപ്പറയുന്ന ഡാറ്റയ്ക്ക് ശരാശരിയെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനം കണ്ടെത്തുക:

$ 12,3,18,17,4,9,17,19,20,15,8,17,2,3,16,11,3,1,0,5 $

പരിഹാരം ആദ്യം നൽകിയിരിക്കുന്ന ഡാറ്റയുടെ ശരാശരി $(\bar{x})$ കണ്ടെത്തണം

$ \bar{x}=\frac{1}{20} \sum\limits_{i=1}^{20} x_i=\frac{200}{20}=10 $

ശരാശരിയിൽ നിന്നുള്ള യഥാക്രമം വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങൾ, അതായത്, $|x_i-\bar{x}|$ ആണ്

$ 2,7,8,7,6,1,7,9,10,5,2,7,8,7,6,1,7,9,10,5 $

അതിനാൽ $\quad \sum\limits_{i=1}^{20}|x_i-\bar{x}|=124$

കൂടാതെ $ \quad\quad\quad\quad\text{ M.D. }(\bar{x})=\frac{124}{20}=6.2 $

ഉദാഹരണം 3 ഇനിപ്പറയുന്ന ഡാറ്റയ്ക്ക് മധ്യമത്തെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനം കണ്ടെത്തുക:

$ 3,9,5,3,12,10,18,4,7,19,21 \text{. } $

പരിഹാരം ഇവിടെ നിരീക്ഷണങ്ങളുടെ എണ്ണം 11 ആണ്, അത് ഒറ്റസംഖ്യയാണ്. ഡാറ്റ ആരോഹണ ക്രമത്തിൽ ക്രമീകരിച്ച്, നമുക്ക് $3,3,4,5,7,9,10,12,18,19,21$ ഉണ്ട്

ഇപ്പോൾ

$ \text{ Median }=(\frac{11+1}{2})^{\text{th }} \text{ or } 6^{\text{th }} \text{ observation }=9 $

മധ്യമത്തിൽ നിന്നുള്ള യഥാക്രമം വ്യതിയാനങ്ങളുടെ കേവല മൂല്യങ്ങൾ, അതായത്, $|x_i-\mathbf{M}|$ ആണ് $6,6,5,4,2,0,1,3,9,10,12$

അതിനാൽ $ \quad\quad\quad\quad\quad \sum\limits_{i=1}^{11}|x_i-M|=58 $

കൂടാതെ $ \quad\quad\quad\text{ M.D. }(M)=\frac{1}{11} \sum\limits_{i=1}^{11}|x_i-M|=\frac{1}{11} \times 58=5.27 $

13.4.2 ഗ്രൂപ്പ് ചെയ്ത ഡാറ്റയ്ക്കുള്ള മാധ്യ വ്യതിയാനം

ഡാറ്റ രണ്ട് രീതിയിൽ ഗ്രൂപ്പ് ചെയ്യാമെന്ന് നമുക്കറിയാം:

(a) വിവേചനാത്മക ആവൃത്തി വിതരണം,

(b) തുടർച്ചയായ ആവൃത്തി വിതരണം.

രണ്ട് തരം ഡാറ്റയ്ക്കും മാധ്യ വ്യതിയാനം കണ്ടെത്തുന്നതിനുള്ള രീതി നമുക്ക് ചർച്ച ചെയ്യാം.

(a) വിവേചനാത്മക ആവൃത്തി വിതരണം നൽകിയിരിക്കുന്ന ഡാറ്റയിൽ $n$ വ്യത്യസ്ത മൂല്യങ്ങൾ $x_1, x_2, \ldots, x_n$ യഥാക്രമം $f_1, f_2, \ldots, f_n$ ആവൃത്തികളോടെ സംഭവിക്കുന്നുവെന്ന് കരുതുക. ഈ ഡാറ്റ ചുവടെ നൽകിയിരിക്കുന്ന പട്ടിക രൂപത്തിൽ പ്രതിനിധീകരിക്കാം, ഇതിനെ വിവേചനാത്മക ആവൃത്തി വിതരണം എന്ന് വിളിക്കുന്നു:

$ \begin{matrix} x: x_1 & x_2 & x_3 \ldots x_n \\ f: f_1 & f_2 & f_3 \ldots f_n \end{matrix} $

(i) ശരാശരിയെക്കുറിച്ചുള്ള മാധ്യ വ്യതിയാനം

ആദ്യം ഞങ്ങൾ സൂത്രവാക്യം ഉപയോഗിച്ച് നൽകിയിരിക്കുന്ന ഡാറ്റയുടെ ശരാശരി $\bar{x}$ കണ്ടെത്തുന്നു

$ \bar{x}=\frac{\sum\limits_{i=1}^{n} x_i f_i}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} x_i f_i $

ഇവിടെ $\sum\limits_{i=1}^{n} x_i f_i$ നിരീക്ഷണങ്ങളുടെ $x_i$ അവയുടെ യഥാക്രമം ആവൃത്തികളായ $f_i$ ഉപയോഗിച്ചുള്ള ഉൽപ്പന്നങ്ങളുടെ ആകെത്തുകയെ സൂചിപ്പിക്കുന്നു, കൂടാതെ $N=\sum\limits_{i=1}^{n} f_i$ ആവൃത്തികളുടെ ആകെത്തുകയാണ്.

പിന്നെ, നിരീക്ഷണങ്ങളുടെ $x_i$ ശരാശരിയിൽ നിന്നുള്ള വ്യതിയാനങ്ങൾ $\bar{x}$ ഞങ്ങൾ കണ്ടെത്തുകയും അവയുടെ കേവല മൂല്യങ്ങൾ എട