ಅಧ್ಯಾಯ 13 ಅಂಕಿಅಂಶಗಳು
“ಸಂಖ್ಯಾಶಾಸ್ತ್ರವನ್ನು ಸರಾಸರಿಗಳು ಮತ್ತು ಅವುಗಳ ಅಂದಾಜುಗಳ ವಿಜ್ಞಾನ ಎಂದು ಸರಿಯಾಗಿ ಕರೆಯಬಹುದು.” - ಎ.ಎಲ್.ಬೌಲಿ & ಎ.ಎಲ್. ಬಾಡಿಂಗ್ಟನ್
ಪರಿಚಯ
ಸಂಖ್ಯಾಶಾಸ್ತ್ರವು ನಿರ್ದಿಷ್ಟ ಉದ್ದೇಶಗಳಿಗಾಗಿ ಸಂಗ್ರಹಿಸಿದ ದತ್ತಾಂಶದೊಂದಿಗೆ ವ್ಯವಹರಿಸುತ್ತದೆ ಎಂದು ನಮಗೆ ತಿಳಿದಿದೆ. ಅದನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಕ ಮತ್ತು ಅರ್ಥೈಸುವ ಮೂಲಕ ನಾವು ದತ್ತಾಂಶದ ಬಗ್ಗೆ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಹಿಂದಿನ ತರಗತಿಗಳಲ್ಲಿ, ನಾವು ದತ್ತಾಂಶವನ್ನು ಚಿತ್ರಾತ್ಮಕವಾಗಿ ಮತ್ತು ಕೋಷ್ಟಕ ರೂಪದಲ್ಲಿ ಪ್ರತಿನಿಧಿಸುವ ವಿಧಾನಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಿದ್ದೇವೆ. ಈ ಪ್ರತಿನಿಧಾನವು ದತ್ತಾಂಶದ ಕೆಲವು ಪ್ರಮುಖ ಲಕ್ಷಣಗಳು ಅಥವಾ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ. ನೀಡಲಾದ ದತ್ತಾಂಶಕ್ಕೆ ಪ್ರತಿನಿಧಿ ಮೌಲ್ಯವನ್ನು ಕಂಡುಹಿಡಿಯುವ ವಿಧಾನಗಳನ್ನು ಸಹ ನಾವು ಅಧ್ಯಯನ ಮಾಡಿದ್ದೇವೆ. ಈ ಮೌಲ್ಯವನ್ನು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಸರಾಸರಿ (ಅಂಕಗಣಿತದ ಸರಾಸರಿ), ಮಧ್ಯಾಂಕ ಮತ್ತು ಬಹುಲಕವು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮೂರು ಮಾಪನಗಳಾಗಿವೆ ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ. ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನವು ದತ್ತಾಂಶ ಬಿಂದುಗಳು ಎಲ್ಲಿ ಕೇಂದ್ರೀಕೃತವಾಗಿವೆ ಎಂಬುದರ ಬಗ್ಗೆ ನಮಗೆ ಒಂದು ಒರಟು ಕಲ್ಪನೆಯನ್ನು ನೀಡುತ್ತದೆ. ಆದರೆ, ಉತ್ತಮ ವ್ಯಾಖ್ಯಾನವನ್ನು ಮಾಡಲು

ಕಾರ್ಲ್ ಪಿಯರ್ಸನ್ (1857-1936 A.D.)
ದತ್ತಾಂಶದಿಂದ, ದತ್ತಾಂಶವು ಹೇಗೆ ಚದುರಿದೆ ಅಥವಾ ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನದ ಸುತ್ತ ಎಷ್ಟು ಗುಂಪಾಗಿದೆ ಎಂಬುದರ ಬಗ್ಗೆ ಸಹ ನಾವು ಕಲ್ಪನೆಯನ್ನು ಹೊಂದಿರಬೇಕು.
ಈಗ ಕೊನೆಯ ಹತ್ತು ಪಂದ್ಯಗಳಲ್ಲಿ ಎರಡು ಬ್ಯಾಟ್ಸ್ಮನ್ನರು ಗಳಿಸಿದ ರನ್ಗಳನ್ನು ಪರಿಗಣಿಸಿ:
ಬ್ಯಾಟ್ಸ್ಮನ್ A : $30,91,0,64,42,80,30,5,117,71$
ಬ್ಯಾಟ್ಸ್ಮನ್ B : $53,46,48,50,53,53,58,60,57,52$
ಸ್ಪಷ್ಟವಾಗಿ, ದತ್ತಾಂಶದ ಸರಾಸರಿ ಮತ್ತು ಮಧ್ಯಾಂಕ
| ಬ್ಯಾಟ್ಸ್ಮನ್ A | ಬ್ಯಾಟ್ಸ್ಮನ್ B | |
|---|---|---|
| ಸರಾಸರಿ | 53 | 53 |
| ಮಧ್ಯಾಂಕ | 53 | 53 |
ನೆನಪಿಸಿಕೊಳ್ಳಿ, ನಾವು ದತ್ತಾಂಶದ ಸರಾಸರಿಯನ್ನು ($\bar{x}$ ನಿಂದ ಸೂಚಿಸಲಾಗಿದೆ) ಅವಲೋಕನಗಳ ಮೊತ್ತವನ್ನು ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆಯಿಂದ ಭಾಗಿಸುವ ಮೂಲಕ ಲೆಕ್ಕಾಚಾರ ಮಾಡುತ್ತೇವೆ, ಅಂದರೆ,
$ \bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i $
ಅಲ್ಲದೆ, ಮಧ್ಯಾಂಕವನ್ನು ಮೊದಲು ದತ್ತಾಂಶವನ್ನು ಆರೋಹಣ ಅಥವಾ ಅವರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸುವ ಮೂಲಕ ಮತ್ತು ಈ ಕೆಳಗಿನ ನಿಯಮವನ್ನು ಅನ್ವಯಿಸುವ ಮೂಲಕ ಪಡೆಯಲಾಗುತ್ತದೆ.
ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆ ಬೆಸವಾಗಿದ್ದರೆ, ಮಧ್ಯಾಂಕವು $(\frac{n+1}{2})^{\text{th }}$ ನೇ ಅವಲೋಕನವಾಗಿದೆ.
ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆ ಸಮವಾಗಿದ್ದರೆ, ಮಧ್ಯಾಂಕವು $(\frac{n}{2})^{\text{th }}$ ಮತ್ತು $(\frac{n}{2}+1)^{\text{th }}$ ನೇ ಅವಲೋಕನಗಳ ಸರಾಸರಿಯಾಗಿದೆ.
ಎರಡೂ ಬ್ಯಾಟ್ಸ್ಮನ್ನರು $A$ ಮತ್ತು B ಗಳಿಸಿದ ರನ್ಗಳ ಸರಾಸರಿ ಮತ್ತು ಮಧ್ಯಾಂಕವು ಒಂದೇ ಆಗಿದೆ ಎಂದು ನಾವು ಕಂಡುಕೊಳ್ಳುತ್ತೇವೆ, ಅಂದರೆ, 53. ಎರಡು ಆಟಗಾರರ ಪ್ರದರ್ಶನವು ಒಂದೇ ಆಗಿದೆ ಎಂದು ನಾವು ಹೇಳಬಹುದೇ? ಸ್ಪಷ್ಟವಾಗಿ ಇಲ್ಲ, ಏಕೆಂದರೆ ಬ್ಯಾಟ್ಸ್ಮನ್ A ರ ಸ್ಕೋರ್ಗಳಲ್ಲಿನ ವ್ಯತ್ಯಾಸವು 0 (ಕನಿಷ್ಠ) ರಿಂದ 117 (ಗರಿಷ್ಠ) ವರೆಗೆ ಇದೆ. ಆದರೆ, ಬ್ಯಾಟ್ಸ್ಮನ್ B ಗಳಿಸಿದ ರನ್ಗಳ ವ್ಯಾಪ್ತಿಯು 46 ರಿಂದ 60 ರವರೆಗೆ ಇದೆ.
ಈಗ ಮೇಲಿನ ಸ್ಕೋರ್ಗಳನ್ನು ಸಂಖ್ಯಾ ರೇಖೆಯ ಮೇಲೆ ಚುಕ್ಕೆಗಳಾಗಿ ಗುರುತಿಸೋಣ. ನಾವು ಈ ಕೆಳಗಿನ ರೇಖಾಚಿತ್ರಗಳನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತೇವೆ:
ಬ್ಯಾಟ್ಸ್ಮನ್ A ಗಾಗಿ

ಚಿತ್ರ 13.1
ಬ್ಯಾಟ್ಸ್ಮನ್ B ಗಾಗಿ

ಚಿತ್ರ 13.2
ಬ್ಯಾಟ್ಸ್ಮನ್ B ಗೆ ಅನುರೂಪವಾದ ಚುಕ್ಕೆಗಳು ಪರಸ್ಪರ ಹತ್ತಿರದಲ್ಲಿವೆ ಮತ್ತು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನ (ಸರಾಸರಿ ಮತ್ತು ಮಧ್ಯಾಂಕ) ಸುತ್ತ ಗುಂಪಾಗಿವೆ, ಆದರೆ ಬ್ಯಾಟ್ಸ್ಮನ್ A ಗೆ ಅನುರೂಪವಾದವುಗಳು ಚದುರಿಹೋಗಿವೆ ಅಥವಾ ಹೆಚ್ಚು ಹರಡಿವೆ.
ಹೀಗಾಗಿ, ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನಗಳು ನೀಡಲಾದ ದತ್ತಾಂಶದ ಬಗ್ಗೆ ಸಂಪೂರ್ಣ ಮಾಹಿತಿಯನ್ನು ನೀಡಲು ಸಾಕಾಗುವುದಿಲ್ಲ. ವ್ಯತ್ಯಾಸವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಅಡಿಯಲ್ಲಿ ಅಧ್ಯಯನ ಮಾಡಬೇಕಾದ ಮತ್ತೊಂದು ಅಂಶವಾಗಿದೆ. ‘ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನಗಳು’ ನಂತೆ, ವ್ಯತ್ಯಾಸವನ್ನು ವಿವರಿಸಲು ನಮಗೆ ಒಂದೇ ಸಂಖ್ಯೆಯನ್ನು ಬಯಸುತ್ತೇವೆ. ಈ ಒಂದೇ ಸಂಖ್ಯೆಯನ್ನು ‘ವಿಚಲನದ ಮಾಪನ’ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನಾವು ವಿಚಲನದ ಕೆಲವು ಪ್ರಮುಖ ಮಾಪನಗಳು ಮತ್ತು ಅವುಗಳ ಲೆಕ್ಕಾಚಾರದ ವಿಧಾನಗಳನ್ನು ಅಸಮೂಹಿತ ಮತ್ತು ಸಮೂಹಿತ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಕಲಿಯುತ್ತೇವೆ.
13.2 ವಿಚಲನದ ಮಾಪನಗಳು
ದತ್ತಾಂಶದಲ್ಲಿನ ವಿಚಲನ ಅಥವಾ ಚದುರುವಿಕೆಯನ್ನು ಅವಲೋಕನಗಳ ಆಧಾರದ ಮೇಲೆ ಮತ್ತು ಅಲ್ಲಿ ಬಳಸಲಾದ ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನದ ಪ್ರಕಾರಗಳ ಆಧಾರದ ಮೇಲೆ ಅಳೆಯಲಾಗುತ್ತದೆ. ವಿಚಲನದ ಕೆಳಗಿನ ಮಾಪನಗಳಿವೆ:
(i) ವ್ಯಾಪ್ತಿ, (ii) ಚತುರ್ಥಕ ವಿಚಲನ, (iii) ಸರಾಸರಿ ವಿಚಲನ, (iv) ಪ್ರಮಾಣಿತ ವಿಚಲನ.
ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನಾವು ಚತುರ್ಥಕ ವಿಚಲನವನ್ನು ಹೊರತುಪಡಿಸಿ ಈ ಎಲ್ಲಾ ವಿಚಲನದ ಮಾಪನಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡುತ್ತೇವೆ.
13.3 ವ್ಯಾಪ್ತಿ
ಎರಡು ಬ್ಯಾಟ್ಸ್ಮನ್ನರು A ಮತ್ತು B ಗಳಿಸಿದ ರನ್ಗಳ ಉದಾಹರಣೆಯಲ್ಲಿ, ಪ್ರತಿ ಸರಣಿಯಲ್ಲಿ ಕನಿಷ್ಠ ಮತ್ತು ಗರಿಷ್ಠ ರನ್ಗಳ ಆಧಾರದ ಮೇಲೆ ಸ್ಕೋರ್ಗಳಲ್ಲಿನ ವ್ಯತ್ಯಾಸದ ಕೆಲವು ಕಲ್ಪನೆಯನ್ನು ನಾವು ಹೊಂದಿದ್ದೇವೆ ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ. ಇದಕ್ಕಾಗಿ ಒಂದೇ ಸಂಖ್ಯೆಯನ್ನು ಪಡೆಯಲು, ನಾವು ಪ್ರತಿ ಸರಣಿಯ ಗರಿಷ್ಠ ಮತ್ತು ಕನಿಷ್ಠ ಮೌಲ್ಯಗಳ ವ್ಯತ್ಯಾಸವನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ. ಈ ವ್ಯತ್ಯಾಸವನ್ನು ದತ್ತಾಂಶದ ‘ವ್ಯಾಪ್ತಿ’ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಬ್ಯಾಟ್ಸ್ಮನ್ A ರ ಸಂದರ್ಭದಲ್ಲಿ, ವ್ಯಾಪ್ತಿ $=117-0=117$ ಮತ್ತು ಬ್ಯಾಟ್ಸ್ಮನ್ B ಗಾಗಿ, ವ್ಯಾಪ್ತಿ $=60-46=14$. ಸ್ಪಷ್ಟವಾಗಿ, A ರ ವ್ಯಾಪ್ತಿ $>$ $B$ ರ ವ್ಯಾಪ್ತಿ. ಆದ್ದರಿಂದ, A ರ ಸಂದರ್ಭದಲ್ಲಿ ಸ್ಕೋರ್ಗಳು ಚದುರಿಹೋಗಿವೆ ಅಥವಾ ವಿಚಲಿತವಾಗಿವೆ ಆದರೆ B ಗಾಗಿ ಇವು ಪರಸ್ಪರ ಹತ್ತಿರದಲ್ಲಿವೆ.
ಹೀಗಾಗಿ, ಒಂದು ಸರಣಿಯ ವ್ಯಾಪ್ತಿ $=$ ಗರಿಷ್ಠ ಮೌಲ್ಯ - ಕನಿಷ್ಠ ಮೌಲ್ಯ.
ದತ್ತಾಂಶದ ವ್ಯಾಪ್ತಿಯು ನಮಗೆ ವ್ಯತ್ಯಾಸ ಅಥವಾ ಚದುರುವಿಕೆಯ ಒಂದು ಒರಟು ಕಲ್ಪನೆಯನ್ನು ನೀಡುತ್ತದೆ ಆದರೆ ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯಿಂದ ದತ್ತಾಂಶದ ವಿಚಲನದ ಬಗ್ಗೆ ಹೇಳುವುದಿಲ್ಲ. ಈ ಉದ್ದೇಶಕ್ಕಾಗಿ, ನಮಗೆ ವ್ಯತ್ಯಾಸದ ಇತರ ಕೆಲವು ಮಾಪನಗಳು ಬೇಕಾಗುತ್ತವೆ. ಸ್ಪಷ್ಟವಾಗಿ, ಅಂತಹ ಮಾಪನವು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯಿಂದ ಮೌಲ್ಯಗಳ ವ್ಯತ್ಯಾಸ (ಅಥವಾ ವಿಚಲನ) ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರಬೇಕು.
ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯಿಂದ ಅವಲೋಕನಗಳ ವಿಚಲನಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುವ ವಿಚಲನದ ಪ್ರಮುಖ ಮಾಪನಗಳೆಂದರೆ ಸರಾಸರಿ ವಿಚಲನ ಮತ್ತು ಪ್ರಮಾಣಿತ ವಿಚಲನ. ಅವುಗಳನ್ನು ವಿವರವಾಗಿ ಚರ್ಚಿಸೋಣ.
13.4 ಸರಾಸರಿ ವಿಚಲನ
ಒಂದು ಅವಲೋಕನ $x$ ನ ಸ್ಥಿರ ಮೌಲ್ಯ ‘$a$’ ನಿಂದ ವಿಚಲನವು ವ್ಯತ್ಯಾಸ $x-a$ ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ. $x$ ನ ಮೌಲ್ಯಗಳ ವಿಚಲನವನ್ನು ಕೇಂದ್ರೀಯ ಮೌಲ್ಯ ‘$a$’ ನಿಂದ ಕಂಡುಹಿಡಿಯಲು, ನಾವು $a$ ಬಗ್ಗೆ ವಿಚಲನಗಳನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ. ವಿಚಲನದ ಒಂದು ಸಂಪೂರ್ಣ ಮಾಪನವು ಈ ವಿಚಲನಗಳ ಸರಾಸರಿಯಾಗಿದೆ. ಸರಾಸರಿಯನ್ನು ಕಂಡುಹಿಡಿಯಲು, ನಾವು ವಿಚಲನಗಳ ಮೊತ್ತವನ್ನು ಪಡೆಯಬೇಕು. ಆದರೆ, ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನವು ಅವಲೋಕನಗಳ ಗುಂಪಿನ ಗರಿಷ್ಠ ಮತ್ತು ಕನಿಷ್ಠ ಮೌಲ್ಯಗಳ ನಡುವೆ ಇರುತ್ತದೆ ಎಂದು ನಮಗೆ ತಿಳಿದಿದೆ. ಆದ್ದರಿಂದ, ಕೆಲವು ವಿಚಲನಗಳು ಋಣಾತ್ಮಕವಾಗಿರುತ್ತವೆ ಮತ್ತು ಕೆಲವು ಧನಾತ್ಮಕವಾಗಿರುತ್ತವೆ. ಹೀಗಾಗಿ, ವಿಚಲನಗಳ ಮೊತ್ತವು ಅದೃಶ್ಯವಾಗಬಹುದು. ಇದಲ್ಲದೆ, ಸರಾಸರಿ $(\bar{x})$ ನಿಂದ ವಿಚಲನಗಳ ಮೊತ್ತವು ಶೂನ್ಯವಾಗಿರುತ್ತದೆ.
ಅಲ್ಲದೆ $\quad \quad \quad $ ವಿಚಲನಗಳ ಸರಾಸರಿ $=\frac{\text{ Sum of deviations }}{\text{ Number of observations }}=\frac{0}{n}=0$
ಹೀಗಾಗಿ, ವಿಚಲನದ ಮಾಪನಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ, ಸರಾಸರಿಯ ಬಗ್ಗೆ ವಿಚಲನಗಳ ಸರಾಸರಿಯನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ನಮಗೆ ಯಾವುದೇ ಉಪಯೋಗವಿಲ್ಲ.
ವಿಚಲನದ ಸೂಕ್ತ ಮಾಪನವನ್ನು ಕಂಡುಹಿಡಿಯುವಲ್ಲಿ, ನಮಗೆ ಪ್ರತಿ ಮೌಲ್ಯದ ದೂರವು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿ ಅಥವಾ ಸ್ಥಿರ ಸಂಖ್ಯೆ ‘$a$’ ನಿಂದ ಬೇಕಾಗುತ್ತದೆ ಎಂದು ನೆನಪಿಡಿ. ಎರಡು ಸಂಖ್ಯೆಗಳ ವ್ಯತ್ಯಾಸದ ಸಂಪೂರ್ಣ ಮೌಲ್ಯವು ಸಂಖ್ಯಾ ರೇಖೆಯಲ್ಲಿ ಪ್ರತಿನಿಧಿಸಿದಾಗ ಸಂಖ್ಯೆಗಳ ನಡುವಿನ ದೂರವನ್ನು ನೀಡುತ್ತದೆ ಎಂದು ನೆನಪಿಸಿಕೊಳ್ಳಿ. ಹೀಗಾಗಿ, ಸ್ಥಿರ ಸಂಖ್ಯೆ ‘$a$’ ನಿಂದ ವಿಚಲನದ ಮಾಪನವನ್ನು ಕಂಡುಹಿಡಿಯಲು, ನಾವು ಕೇಂದ್ರೀಯ ಮೌಲ್ಯ ‘$a$’ ನಿಂದ ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳ ಸರಾಸರಿಯನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಈ ಸರಾಸರಿಯನ್ನು ‘ಸರಾಸರಿ ವಿಚಲನ’ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಹೀಗಾಗಿ ಕೇಂದ್ರೀಯ ಮೌಲ್ಯ ‘$a$’ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವು ‘$a$’ ನಿಂದ ಅವಲೋಕನಗಳ ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳ ಸರಾಸರಿಯಾಗಿದೆ. ‘$a$’ ನಿಂದ ಸರಾಸರಿ ವಿಚಲನವನ್ನು M.D. (a) ಎಂದು ಸೂಚಿಸಲಾಗುತ್ತದೆ. ಆದ್ದರಿಂದ,
$ \text{ M.D. }(a)=\frac{\text{ ’ } a \text{ ’ ನಿಂದ ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳ ಮೊತ್ತ }}{\text{ ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆ }} . $
ಟಿಪ್ಪಣಿ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಯಾವುದೇ ಮಾಪನದಿಂದ ಪಡೆಯಬಹುದು. ಆದಾಗ್ಯೂ, ಸರಾಸರಿ ಮತ್ತು ಮಧ್ಯಾಂಕದಿಂದ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಅಧ್ಯಯನಗಳಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
13.4.1 ಅಸಮೂಹಿತ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಸರಾಸರಿ ವಿಚಲನ
$n$ ಅವಲೋಕನಗಳು $x_1, x_2, x_3, \ldots ., x_n$ ಆಗಿರಲಿ. ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಲು ನಾವು ಯಾವ ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಬಗ್ಗೆ ಲೆಕ್ಕಾಚಾರ ಮಾಡಬೇಕಾದ ಹಂತಗಳು ಈ ಕೆಳಗಿನಂತಿವೆ:
ಹಂತ 1 ನಾವು ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಬೇಕಾದ ಕೇಂದ್ರೀಯ ಪ್ರವೃತ್ತಿಯ ಮಾಪನವನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿ. ಅದು ‘$a$’ ಆಗಿರಲಿ.
ಹಂತ 2 ಪ್ರತಿ $x_i$ ನ ವಿಚಲನವನ್ನು $a$ ನಿಂದ ಕಂಡುಹಿಡಿಯಿರಿ, ಅಂದರೆ, $x_1-a, x_2-a, x_3-a, \ldots, x_n-a$
ಹಂತ 3 ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ, ಅಂದರೆ, ಮೈನಸ್ ಚಿಹ್ನೆ (-) ಇದ್ದರೆ ಅದನ್ನು ಬಿಟ್ಟುಬಿಡಿ, ಅಂದರೆ, $|x_1-a|,|x_2-a|,|x_3-a|, \ldots .,|x_n-a|$
ಹಂತ 4 ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳ ಸರಾಸರಿಯನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ. ಈ ಸರಾಸರಿಯು $a$ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವಾಗಿದೆ, ಅಂದರೆ,
$ \text{ M.D. }(a)=\frac{\sum\limits_{i=1}^{n}|x_i-a|}{n} $
ಹೀಗಾಗಿ $\quad\quad\quad$ M.D. $(\bar{x})=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-\bar{x}|$, ಇಲ್ಲಿ $\bar{x}=$ ಸರಾಸರಿ
ಮತ್ತು $\quad\quad\quad$ M.D. $(M)=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-M|$, ಇಲ್ಲಿ $M=$ ಮಧ್ಯಾಂಕ
ಗಮನಿಸಿ - ಈ ಅಧ್ಯಾಯದಲ್ಲಿ, ನಾವು ಮಧ್ಯಾಂಕವನ್ನು ಸೂಚಿಸಲು M ಚಿಹ್ನೆಯನ್ನು ಬಳಸುತ್ತೇವೆ, ಇಲ್ಲದಿದ್ದರೆ ಹೇಳಿದಂತೆ.ಈಗ ಮೇಲಿನ ವಿಧಾನದ ಹಂತಗಳನ್ನು ಈ ಕೆಳಗಿನ ಉದಾಹರಣೆಗಳಲ್ಲಿ ವಿವರಿಸೋಣ.
ಉದಾಹರಣೆ 1 ಕೆಳಗಿನ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಸರಾಸರಿಯ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ:
$ 6,7,10,12,13,4,8,12 $
ಪರಿಹಾರ ನಾವು ಹಂತ-ಹಂತವಾಗಿ ಮುಂದುವರಿಯುತ್ತೇವೆ ಮತ್ತು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ಪಡೆಯುತ್ತೇವೆ:
ಹಂತ 1 ನೀಡಲಾದ ದತ್ತಾಂಶದ ಸರಾಸರಿ
$ \bar{x}=\frac{6+7+10+12+13+4+8+12}{8}=\frac{72}{8}=9 $
ಹಂತ 2 ಸರಾಸರಿ $\bar{x}$, ಅಂದರೆ, $x_i-\bar{x}$ ನಿಂದ ಅನುರೂಪವಾದ ಅವಲೋಕನಗಳ ವಿಚಲನಗಳು
$\quad\quad\quad\quad 6-9,7-9,10-9,12-9,13-9,4-9,8-9,12-9$,
ಅಥವಾ $ \quad\quad\quad\quad -3,-2,1,3,4,-5,-1,3 $
ಹಂತ 3 ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳು, ಅಂದರೆ, $|x_i-\bar{x}|$
$ 3,2,1,3,4,5,1,3 $
ಹಂತ 4 ಸರಾಸರಿಯ ಬಗ್ಗೆ ಅಗತ್ಯವಿರುವ ಸರಾಸರಿ ವಿಚಲನ
$ \text{ M.D. } \begin{aligned} (\bar{x}) & =\frac{\sum\limits_{i=1}^{8}|x_i-\bar{x}|}{8} \\ & =\frac{3+2+1+3+4+5+1+3}{8}=\frac{22}{8}=2.75 \end{aligned} $
ಗಮನಿಸಿ - ಪ್ರತಿ ಬಾರಿಯೂ ಹಂತಗಳನ್ನು ಕೈಗೊಳ್ಳುವ ಬದಲು, ನಾವು ಹಂತಗಳನ್ನು ಉಲ್ಲೇಖಿಸದೆ ಹಂತ-ಹಂತವಾಗಿ ಲೆಕ್ಕಾಚಾರವನ್ನು ಮುಂದುವರಿಸಬಹುದು.
ಉದಾಹರಣೆ 2 ಕೆಳಗಿನ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಸರಾಸರಿಯ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ:
$ 12,3,18,17,4,9,17,19,20,15,8,17,2,3,16,11,3,1,0,5 $
ಪರಿಹಾರ ನಾವು ಮೊದಲು ನೀಡಲಾದ ದತ್ತಾಂಶದ ಸರಾಸರಿ $(\bar{x})$ ಅನ್ನು ಕಂಡುಹಿಡಿಯಬೇಕು
$ \bar{x}=\frac{1}{20} \sum\limits_{i=1}^{20} x_i=\frac{200}{20}=10 $
ಸರಾಸರಿಯಿಂದ ವಿಚಲನಗಳ ಅನುರೂಪವಾದ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳು, ಅಂದರೆ, $|x_i-\bar{x}|$
$ 2,7,8,7,6,1,7,9,10,5,2,7,8,7,6,1,7,9,10,5 $
ಆದ್ದರಿಂದ $\quad \sum\limits_{i=1}^{20}|x_i-\bar{x}|=124$
ಮತ್ತು $ \quad\quad\quad\quad\text{ M.D. }(\bar{x})=\frac{124}{20}=6.2 $
ಉದಾಹರಣೆ 3 ಕೆಳಗಿನ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಮಧ್ಯಾಂಕದ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ:
$ 3,9,5,3,12,10,18,4,7,19,21 \text{. } $
ಪರಿಹಾರ ಇಲ್ಲಿ ಅವಲೋಕನಗಳ ಸಂಖ್ಯೆ 11 ಆಗಿದೆ, ಅದು ಬೆಸವಾಗಿದೆ. ದತ್ತಾಂಶವನ್ನು ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸುವುದರಿಂದ, ನಾವು $3,3,4,5,7,9,10,12,18,19,21$ ಅನ್ನು ಹೊಂದಿದ್ದೇವೆ
ಈಗ
$ \text{ ಮಧ್ಯಾಂಕ }=(\frac{11+1}{2})^{\text{ನೇ }} \text{ ಅಥವಾ } 6^{\text{ನೇ }} \text{ ಅವಲೋಕನ }=9 $
ಮಧ್ಯಾಂಕದಿಂದ ಅನುರೂಪವಾದ ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳು, ಅಂದರೆ, $|x_i-\mathbf{M}|$ $6,6,5,4,2,0,1,3,9,10,12$
ಆದ್ದರಿಂದ $ \quad\quad\quad\quad\quad \sum\limits_{i=1}^{11}|x_i-M|=58 $
ಮತ್ತು $ \quad\quad\quad\text{ M.D. }(M)=\frac{1}{11} \sum\limits_{i=1}^{11}|x_i-M|=\frac{1}{11} \times 58=5.27 $
13.4.2 ಸಮೂಹಿತ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಸರಾಸರಿ ವಿಚಲನ
ದತ್ತಾಂಶವನ್ನು ಎರಡು ರೀತಿಯಲ್ಲಿ ಗುಂಪು ಮಾಡಬಹುದು ಎಂದು ನಮಗೆ ತಿಳಿದಿದೆ:
(a) ವಿವಿಕ್ತ ಆವೃತ್ತಿ ವಿತರಣೆ,
(b) ಸತತ ಆವೃತ್ತಿ ವಿತರಣೆ.
ದತ್ತಾಂಶದ ಎರಡೂ ಪ್ರಕಾರಗಳಿಗೆ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯುವ ವಿಧಾನವನ್ನು ಚರ್ಚಿಸೋಣ.
(a) ವಿವಿಕ್ತ ಆವೃತ್ತಿ ವಿತರಣೆ ನೀಡಲಾದ ದತ್ತಾಂಶವು $n$ ವಿಭಿನ್ನ ಮೌಲ್ಯಗಳನ್ನು $x_1, x_2, \ldots, x_n$ ಒಳಗೊಂಡಿರಲಿ, ಅವು ಕ್ರಮವಾಗಿ $f_1, f_2, \ldots, f_n$ ಆವೃತ್ತಿಗಳೊಂದಿಗೆ ಸಂಭವಿಸುತ್ತವೆ. ಈ ದತ್ತಾಂಶವನ್ನು ಕೆಳಗೆ ನೀಡಿರುವಂತೆ ಕೋಷ್ಟಕ ರೂಪದಲ್ಲಿ ಪ್ರತಿನಿಧಿಸಬಹುದು, ಮತ್ತು ಇದನ್ನು ವಿವಿಕ್ತ ಆವೃತ್ತಿ ವಿತರಣೆ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ:
$ \begin{matrix} x: x_1 & x_2 & x_3 \ldots x_n \\ f: f_1 & f_2 & f_3 \ldots f_n \end{matrix} $
(i) ಸರಾಸರಿಯ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನ
ಮೊದಲಿಗೆ ನಾವು ಸೂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ನೀಡಲಾದ ದತ್ತಾಂಶದ ಸರಾಸರಿ $\bar{x}$ ಅನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ
$ \bar{x}=\frac{\sum\limits_{i=1}^{n} x_i f_i}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} x_i f_i $
ಇಲ್ಲಿ $\sum\limits_{i=1}^{n} x_i f_i$ ಅವಲೋಕನಗಳು $x_i$ ಮತ್ತು ಅವುಗಳ ಅನುರೂಪವಾದ ಆವೃತ್ತಿಗಳು $f_i$ ನ ಉತ್ಪನ್ನಗಳ ಮೊತ್ತವನ್ನು ಸೂಚಿಸುತ್ತದೆ ಮತ್ತು $N=\sum\limits_{i=1}^{n} f_i$ ಆವೃತ್ತಿಗಳ ಮೊತ್ತವಾಗಿದೆ.
ನಂತರ, ನಾವು ಅವಲೋಕನಗಳ $x_i$ ವಿಚಲನಗಳನ್ನು ಸರಾಸರಿ $\bar{x}$ ನಿಂದ ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ ಮತ್ತು ಅವುಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತೇವೆ, ಅಂದರೆ, ಎಲ್ಲಾ $i=1,2, \ldots, n$ ಗೆ $|x_i-\bar{x}|$.
ಇದರ ನಂತರ, ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳ ಸರಾಸರಿಯನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ, ಅದು ಸರಾಸರಿಯ ಬಗ್ಗೆ ಅಗತ್ಯವಿರುವ ಸರಾಸರಿ ವಿಚಲನವಾಗಿದೆ. ಹೀಗಾಗಿ
$ \quad\quad\text{ M.D. }(\bar{x})=\frac{\sum\limits_{i=1}^{n} f_i|x_i-\bar{x}|}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-\bar{x}| $
(ii) ಮಧ್ಯಾಂಕದ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನ ಮಧ್ಯಾಂಕದ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಲು, ನಾವು ನೀಡಲಾದ ವಿವಿಕ್ತ ಆವೃತ್ತಿ ವಿತರಣೆಯ ಮಧ್ಯಾಂಕವನ್ನು ಕಂಡುಹಿಡಿಯುತ್ತೇವೆ. ಇದಕ್ಕಾಗಿ ಅವಲೋಕನಗಳನ್ನು ಆರೋಹಣ ಕ್ರಮದಲ್ಲಿ ಜೋಡಿಸಲಾಗಿದೆ. ಇದರ ನಂತರ ಸಂಚಿತ ಆವೃತ್ತಿಗಳನ್ನು ಪಡೆಯಲಾಗುತ್ತದೆ. ನಂತರ, ನಾವು ಯಾವ ಅವಲೋಕನದ ಸಂಚಿತ ಆವೃತ್ತಿಯು $\frac{N}{2}$ ಗೆ ಸಮನಾಗಿರುತ್ತದೆ ಅಥವಾ ಅದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿರುತ್ತದೆ ಎಂಬುದನ್ನು ಗುರುತಿಸುತ್ತೇವೆ, ಇಲ್ಲಿ $N$ ಆವೃತ್ತಿಗಳ ಮೊತ್ತವಾಗಿದೆ. ಅವಲೋಕನದ ಈ ಮೌಲ್ಯವು ದತ್ತಾಂಶದ ಮಧ್ಯದಲ್ಲಿದೆ, ಆದ್ದರಿಂದ, ಇದು ಅಗತ್ಯವಿರುವ ಮಧ್ಯಾಂಕವಾಗಿದೆ. ಮಧ್ಯಾಂಕವನ್ನು ಕಂಡುಹಿಡಿದ ನಂತರ, ನಾವು ಮಧ್ಯಾಂಕದಿಂದ ವಿಚಲನಗಳ ಸಂಪೂರ್ಣ ಮೌಲ್ಯಗಳ ಸರಾಸರಿಯನ್ನು ಪಡೆಯುತ್ತೇವೆ.ಹೀಗಾಗಿ,
$ \text{ M.D.(M) }=\frac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-M| $
ಉದಾಹರಣೆ 4 ಕೆಳಗಿನ ದತ್ತಾಂಶಕ್ಕಾಗಿ ಸರಾಸರಿಯ ಬಗ್ಗೆ ಸರಾಸರಿ ವಿಚಲನವನ್ನು ಕಂಡುಹಿಡಿಯಿರಿ:
| $x_i$ | 2 | 5 | 6 | 8 | 10 | 12 |
|---|---|---|---|---|---|---|
| $f_i$ | 2 | 8 | 10 | 7 | 8 | 5 |
ಪರಿಹಾರ ನೀಡಲಾದ ದತ್ತಾಂಶದ ಕೋಷ್ಟಕ 13.1 ಅನ್ನು ಮಾಡೋಣ ಮತ್ತು ಲೆಕ್ಕಾಚಾರಗಳ ನಂತರ ಇತರ ಕಾಲಮ್ಗಳನ್ನು ಸೇರಿಸೋಣ.
ಕೋಷ್ಟಕ 13.1
| $x_i$ | $f_i$ | $f_i x_i$ | $|x_i-\bar{x}|$ | $f_i|x_i-\bar{x}|$ |
|---|---|---|---|---|
| 2 | 2 | 4 | 5.5 | 11 |
| 5 | 8 | 40 | 2.5 | 20 |
| 6 | 10 | 60 | 1.5 | 15 |
| 8 | 7 | 56 | 0.5 | 3.5 |
| 10 | 8 | 80 | 2.5 | 20 |
| 12 | 5 | 60 | 4.5 | 22.5 |
| 40 | 300 | 92 |
$ N=\sum\limits_{i=1}^{6} f_i=40, \quad \sum\limits_{i=1}^{6} f_i x_i=300, \quad \sum\limits_{i=1}^{6} f_i|x_i-\bar{x}|=92 $
ಆದ್ದರಿಂದ $ \quad \quad \quad\bar{x}=\frac{1}{N} \sum\limits_{i=1}^{6} f_i x_i=\frac{1}{40} \times 300=7.5