ਅਧਿਆਏ 13 ਅੰਕੜਾ ਵਿਗਿਆਨ
“ਅੰਕੜਾ ਵਿਗਿਆਨ ਨੂੰ ਔਸਤਾਂ ਅਤੇ ਉਹਨਾਂ ਦੇ ਅੰਦਾਜ਼ਿਆਂ ਦੇ ਵਿਗਿਆਨ ਦੇ ਰੂਪ ਵਿੱਚ ਸਹੀ ਢੰਗ ਨਾਲ ਕਿਹਾ ਜਾ ਸਕਦਾ ਹੈ।” - A.L.BOWLEY & A.L. BODDINGTON
ਜਾਣ-ਪਛਾਣ
ਅਸੀਂ ਜਾਣਦੇ ਹਾਂ ਕਿ ਅੰਕੜਾ ਵਿਗਿਆਨ ਖਾਸ ਉਦੇਸ਼ਾਂ ਲਈ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਡੇਟਾ ਨਾਲ ਸੰਬੰਧਿਤ ਹੈ। ਅਸੀਂ ਇਸਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਵਿਆਖਿਆ ਕਰਕੇ ਡੇਟਾ ਬਾਰੇ ਫੈਸਲੇ ਲੈ ਸਕਦੇ ਹਾਂ। ਪਿਛਲੀਆਂ ਕਲਾਸਾਂ ਵਿੱਚ, ਅਸੀਂ ਡੇਟਾ ਨੂੰ ਗ੍ਰਾਫਿਕਲ ਅਤੇ ਸਾਰਣੀ ਰੂਪ ਵਿੱਚ ਪੇਸ਼ ਕਰਨ ਦੇ ਤਰੀਕਿਆਂ ਦਾ ਅਧਿਐਨ ਕੀਤਾ ਹੈ। ਇਹ ਪ੍ਰਸਤੁਤੀ ਡੇਟਾ ਦੀਆਂ ਕੁਝ ਮੁੱਖ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਜਾਂ ਗੁਣਾਂ ਨੂੰ ਪ੍ਰਗਟ ਕਰਦੀ ਹੈ। ਅਸੀਂ ਦਿੱਤੇ ਗਏ ਡੇਟਾ ਲਈ ਇੱਕ ਪ੍ਰਤੀਨਿਧੀ ਮੁੱਲ ਲੱਭਣ ਦੇ ਤਰੀਕਿਆਂ ਦਾ ਵੀ ਅਧਿਐਨ ਕੀਤਾ ਹੈ। ਇਸ ਮੁੱਲ ਨੂੰ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦਾ ਮਾਪ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਯਾਦ ਰੱਖੋ ਕਿ ਮੱਧਮਾਨ (ਅੰਕਗਣਿਤੀ ਮੱਧਮਾਨ), ਮੱਧਿਕਾ ਅਤੇ ਬਹੁਲਕ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਤਿੰਨ ਮਾਪ ਹਨ। ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦਾ ਇੱਕ ਮਾਪ ਸਾਨੂੰ ਇੱਕ ਖੁਰਦਰਾ ਵਿਚਾਰ ਦਿੰਦਾ ਹੈ ਕਿ ਡੇਟਾ ਬਿੰਦੂ ਕਿੱਥੇ ਕੇਂਦਰਿਤ ਹਨ। ਪਰ, ਇਸ ਤੋਂ ਬਿਹਤਰ ਵਿਆਖਿਆ ਕਰਨ ਲਈ

ਕਾਰਲ ਪੀਅਰਸਨ (1857-1936 ਈ.)
ਡੇਟਾ, ਸਾਨੂੰ ਇਹ ਵੀ ਇੱਕ ਵਿਚਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਡੇਟਾ ਕਿੰਨਾ ਫੈਲਿਆ ਹੋਇਆ ਹੈ ਜਾਂ ਇਹ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਮਾਪ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਕਿੰਨਾ ਇਕੱਠਾ ਹੋਇਆ ਹੈ।
ਹੁਣ ਦੋ ਬੱਲੇਬਾਜ਼ਾਂ ਦੁਆਰਾ ਆਪਣੇ ਆਖਰੀ ਦਸ ਮੈਚਾਂ ਵਿੱਚ ਬਣਾਏ ਗਏ ਰਨਾਂ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ:
ਬੱਲੇਬਾਜ਼ A : $30,91,0,64,42,80,30,5,117,71$
ਬੱਲੇਬਾਜ਼ B : $53,46,48,50,53,53,58,60,57,52$
ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ, ਡੇਟਾ ਦਾ ਮੱਧਮਾਨ ਅਤੇ ਮੱਧਿਕਾ ਹਨ
| ਬੱਲੇਬਾਜ਼ A | ਬੱਲੇਬਾਜ਼ B | |
|---|---|---|
| ਮੱਧਮਾਨ | 53 | 53 |
| ਮੱਧਿਕਾ | 53 | 53 |
ਯਾਦ ਰੱਖੋ ਕਿ, ਅਸੀਂ ਡੇਟਾ ਦੇ ਮੱਧਮਾਨ (ਦੁਆਰਾ ਦਰਸਾਇਆ ਗਿਆ $\bar{x}$) ਦੀ ਗਣਨਾ ਪ੍ਰੇਖਣਾਂ ਦੀ ਗਿਣਤੀ ਨਾਲ ਪ੍ਰੇਖਣਾਂ ਦੇ ਜੋੜ ਨੂੰ ਵੰਡ ਕੇ ਕਰਦੇ ਹਾਂ, ਯਾਨੀ,
$ \bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i $
ਇਸ ਤੋਂ ਇਲਾਵਾ, ਮੱਧਿਕਾ ਪਹਿਲਾਂ ਡੇਟਾ ਨੂੰ ਚੜ੍ਹਦੇ ਜਾਂ ਉਤਰਦੇ ਕ੍ਰਮ ਵਿੱਚ ਵਿਵਸਥਿਤ ਕਰਕੇ ਅਤੇ ਹੇਠ ਲਿਖੇ ਨਿਯਮ ਨੂੰ ਲਾਗੂ ਕਰਕੇ ਪ੍ਰਾਪਤ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।
ਜੇਕਰ ਪ੍ਰੇਖਣਾਂ ਦੀ ਗਿਣਤੀ ਵਿਸਮ ਹੈ, ਤਾਂ ਮੱਧਿਕਾ $(\frac{n+1}{2})^{\text{th }}$ ਪ੍ਰੇਖਣ ਹੈ।
ਜੇਕਰ ਪ੍ਰੇਖਣਾਂ ਦੀ ਗਿਣਤੀ ਸਮ ਹੈ, ਤਾਂ ਮੱਧਿਕਾ $(\frac{n}{2})^{\text{th }}$ ਅਤੇ $(\frac{n}{2}+1)^{\text{th }}$ ਪ੍ਰੇਖਣਾਂ ਦਾ ਮੱਧਮਾਨ ਹੈ।
ਅਸੀਂ ਪਾਉਂਦੇ ਹਾਂ ਕਿ ਦੋਵਾਂ ਬੱਲੇਬਾਜ਼ਾਂ $A$ ਅਤੇ B ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਰਨਾਂ ਦਾ ਮੱਧਮਾਨ ਅਤੇ ਮੱਧਿਕਾ ਇੱਕੋ ਜਿਹਾ ਹੈ ਯਾਨੀ 53। ਕੀ ਅਸੀਂ ਕਹਿ ਸਕਦੇ ਹਾਂ ਕਿ ਦੋਵਾਂ ਖਿਡਾਰੀਆਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਇੱਕੋ ਜਿਹਾ ਹੈ? ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਨਹੀਂ, ਕਿਉਂਕਿ ਬੱਲੇਬਾਜ਼ A ਦੇ ਸਕੋਰਾਂ ਵਿੱਚ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ 0 (ਘੱਟੋ-ਘੱਟ) ਤੋਂ 117 (ਵੱਧ ਤੋਂ ਵੱਧ) ਤੱਕ ਹੈ। ਜਦਕਿ, ਬੱਲੇਬਾਜ਼ B ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਰਨਾਂ ਦੀ ਸੀਮਾ 46 ਤੋਂ 60 ਤੱਕ ਹੈ।
ਆਓ ਹੁਣ ਉਪਰੋਕਤ ਸਕੋਰਾਂ ਨੂੰ ਇੱਕ ਨੰਬਰ ਲਾਈਨ ‘ਤੇ ਬਿੰਦੂਆਂ ਦੇ ਰੂਪ ਵਿੱਚ ਪਲਾਟ ਕਰੀਏ। ਅਸੀਂ ਹੇਠ ਲਿਖੇ ਚਿੱਤਰ ਪਾਉਂਦੇ ਹਾਂ:
ਬੱਲੇਬਾਜ਼ A ਲਈ

ਚਿੱਤਰ 13.1
ਬੱਲੇਬਾਜ਼ B ਲਈ

ਚਿੱਤਰ 13.2
ਅਸੀਂ ਦੇਖ ਸਕਦੇ ਹਾਂ ਕਿ ਬੱਲੇਬਾਜ਼ B ਨਾਲ ਸੰਬੰਧਿਤ ਬਿੰਦੂ ਇੱਕ-ਦੂਜੇ ਦੇ ਨੇੜੇ ਹਨ ਅਤੇ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ (ਮੱਧਮਾਨ ਅਤੇ ਮੱਧਿਕਾ) ਦੇ ਮਾਪ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਇਕੱਠੇ ਹੋ ਰਹੇ ਹਨ, ਜਦਕਿ ਬੱਲੇਬਾਜ਼ A ਨਾਲ ਸੰਬੰਧਿਤ ਬਿੰਦੂ ਫੈਲੇ ਹੋਏ ਜਾਂ ਵਧੇਰੇ ਫੈਲੇ ਹੋਏ ਹਨ।
ਇਸ ਤਰ੍ਹਾਂ, ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਮਾਪ ਕਿਸੇ ਦਿੱਤੇ ਗਏ ਡੇਟਾ ਬਾਰੇ ਪੂਰੀ ਜਾਣਕਾਰੀ ਦੇਣ ਲਈ ਪਰਿਪੱਕ ਨਹੀਂ ਹਨ। ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ ਇੱਕ ਹੋਰ ਕਾਰਕ ਹੈ ਜਿਸਦਾ ਅੰਕੜਾ ਵਿਗਿਆਨ ਅਧੀਨ ਅਧਿਐਨ ਕਰਨ ਦੀ ਲੋੜ ਹੈ। ‘ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਮਾਪਾਂ’ ਵਾਂਗ, ਅਸੀਂ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ ਦਾ ਵਰਣਨ ਕਰਨ ਲਈ ਇੱਕ ਹੀ ਨੰਬਰ ਚਾਹੁੰਦੇ ਹਾਂ। ਇਸ ਇੱਕਲੇ ਨੰਬਰ ਨੂੰ ‘ਫੈਲਾਅ ਦਾ ਮਾਪ’ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਅਧਿਆਏ ਵਿੱਚ, ਅਸੀਂ ਫੈਲਾਅ ਦੇ ਕੁਝ ਮਹੱਤਵਪੂਰਨ ਮਾਪਾਂ ਅਤੇ ਅਣਸਮੂਹਿਤ ਅਤੇ ਸਮੂਹਿਤ ਡੇਟਾ ਲਈ ਉਹਨਾਂ ਦੀ ਗਣਨਾ ਦੇ ਤਰੀਕਿਆਂ ਬਾਰੇ ਸਿੱਖਾਂਗੇ।
13.2 ਫੈਲਾਅ ਦੇ ਮਾਪ
ਡੇਟਾ ਵਿੱਚ ਫੈਲਾਅ ਜਾਂ ਬਿਖਰਾਅ ਦਾ ਮਾਪ ਪ੍ਰੇਖਣਾਂ ਅਤੇ ਉੱਥੇ ਵਰਤੇ ਗਏ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਮਾਪ ਦੀਆਂ ਕਿਸਮਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਫੈਲਾਅ ਦੇ ਹੇਠ ਲਿਖੇ ਮਾਪ ਹਨ:
(i) ਸੀਮਾ, (ii) ਚਤੁਰਥਕ ਵਿਚਲਨ, (iii) ਮੱਧ ਵਿਚਲਨ, (iv) ਮਾਨਕ ਵਿਚਲਨ।
ਇਸ ਅਧਿਆਏ ਵਿੱਚ, ਅਸੀਂ ਚਤੁਰਥਕ ਵਿਚਲਨ ਨੂੰ ਛੱਡ ਕੇ ਫੈਲਾਅ ਦੇ ਇਨ੍ਹਾਂ ਸਾਰੇ ਮਾਪਾਂ ਦਾ ਅਧਿਐਨ ਕਰਾਂਗੇ।
13.3 ਸੀਮਾ
ਯਾਦ ਰੱਖੋ ਕਿ, ਦੋ ਬੱਲੇਬਾਜ਼ਾਂ A ਅਤੇ B ਦੁਆਰਾ ਬਣਾਏ ਗਏ ਰਨਾਂ ਦੀ ਉਦਾਹਰਣ ਵਿੱਚ, ਸਾਨੂੰ ਹਰ ਲੜੀ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ ਅਤੇ ਵੱਧ ਤੋਂ ਵੱਧ ਰਨਾਂ ਦੇ ਆਧਾਰ ‘ਤੇ ਸਕੋਰਾਂ ਵਿੱਚ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ ਬਾਰੇ ਕੁਝ ਵਿਚਾਰ ਸੀ। ਇਸ ਲਈ ਇੱਕ ਇਕੱਲਾ ਨੰਬਰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ, ਅਸੀਂ ਹਰ ਲੜੀ ਦੇ ਵੱਧ ਤੋਂ ਵੱਧ ਅਤੇ ਘੱਟੋ-ਘੱਟ ਮੁੱਲਾਂ ਦਾ ਅੰਤਰ ਲੱਭਦੇ ਹਾਂ। ਇਸ ਅੰਤਰ ਨੂੰ ਡੇਟਾ ਦੀ ‘ਸੀਮਾ’ ਕਿਹਾ ਜਾਂਦਾ ਹੈ।
ਬੱਲੇਬਾਜ਼ A ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਸੀਮਾ $=117-0=117$ ਅਤੇ ਬੱਲੇਬਾਜ਼ B ਲਈ, ਸੀਮਾ $=60-46=14$। ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ, A ਦੀ ਸੀਮਾ $>$ $B$ ਦੀ ਸੀਮਾ। ਇਸ ਲਈ, ਸਕੋਰ A ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਫੈਲੇ ਜਾਂ ਬਿਖਰੇ ਹੋਏ ਹਨ ਜਦਕਿ B ਲਈ ਇਹ ਇੱਕ-ਦੂਜੇ ਦੇ ਨੇੜੇ ਹਨ।
ਇਸ ਤਰ੍ਹਾਂ, ਇੱਕ ਲੜੀ ਦੀ ਸੀਮਾ $=$ ਵੱਧ ਤੋਂ ਵੱਧ ਮੁੱਲ - ਘੱਟੋ-ਘੱਟ ਮੁੱਲ।
ਡੇਟਾ ਦੀ ਸੀਮਾ ਸਾਨੂੰ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ ਜਾਂ ਬਿਖਰਾਅ ਬਾਰੇ ਇੱਕ ਖੁਰਦਰਾ ਵਿਚਾਰ ਦਿੰਦੀ ਹੈ ਪਰ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਤੋਂ ਡੇਟਾ ਦੇ ਫੈਲਾਅ ਬਾਰੇ ਨਹੀਂ ਦੱਸਦੀ। ਇਸ ਉਦੇਸ਼ ਲਈ, ਸਾਨੂੰ ਪਰਿਵਰਤਨਸ਼ੀਲਤਾ ਦੇ ਕੁਝ ਹੋਰ ਮਾਪਾਂ ਦੀ ਲੋੜ ਹੈ। ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ, ਅਜਿਹੇ ਮਾਪ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਤੋਂ ਮੁੱਲਾਂ ਦੇ ਅੰਤਰ (ਜਾਂ ਵਿਚਲਨ) ‘ਤੇ ਨਿਰਭਰ ਕਰਨੇ ਚਾਹੀਦੇ ਹਨ।
ਫੈਲਾਅ ਦੇ ਮਹੱਤਵਪੂਰਨ ਮਾਪ, ਜੋ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਤੋਂ ਪ੍ਰੇਖਣਾਂ ਦੇ ਵਿਚਲਨਾਂ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ, ਮੱਧ ਵਿਚਲਨ ਅਤੇ ਮਾਨਕ ਵਿਚਲਨ ਹਨ। ਆਓ ਉਹਨਾਂ ਬਾਰੇ ਵਿਸਤਾਰ ਵਿੱਚ ਚਰਚਾ ਕਰੀਏ।
13.4 ਮੱਧ ਵਿਚਲਨ
ਯਾਦ ਰੱਖੋ ਕਿ ਇੱਕ ਪ੍ਰੇਖਣ $x$ ਦਾ ਇੱਕ ਨਿਸ਼ਚਿਤ ਮੁੱਲ ’ $a$ ’ ਤੋਂ ਵਿਚਲਨ ਅੰਤਰ $x-a$ ਹੈ। $x$ ਦੇ ਮੁੱਲਾਂ ਦਾ ਕੇਂਦਰੀ ਮੁੱਲ ’ $a$ ’ ਤੋਂ ਫੈਲਾਅ ਲੱਭਣ ਲਈ, ਅਸੀਂ $a$ ਬਾਰੇ ਵਿਚਲਨ ਲੱਭਦੇ ਹਾਂ। ਫੈਲਾਅ ਦਾ ਇੱਕ ਨਿਰਪੇਖ ਮਾਪ ਇਨ੍ਹਾਂ ਵਿਚਲਨਾਂ ਦਾ ਮੱਧਮਾਨ ਹੈ। ਮੱਧਮਾਨ ਲੱਭਣ ਲਈ, ਸਾਨੂੰ ਵਿਚਲਨਾਂ ਦਾ ਜੋੜ ਪ੍ਰਾਪਤ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਪਰ, ਅਸੀਂ ਜਾਣਦੇ ਹਾਂ ਕਿ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦਾ ਇੱਕ ਮਾਪ ਪ੍ਰੇਖਣਾਂ ਦੇ ਸਮੂਹ ਦੇ ਵੱਧ ਤੋਂ ਵੱਧ ਅਤੇ ਘੱਟੋ-ਘੱਟ ਮੁੱਲਾਂ ਦੇ ਵਿਚਕਾਰ ਹੁੰਦਾ ਹੈ। ਇਸ ਲਈ, ਕੁਝ ਵਿਚਲਨ ਨਕਾਰਾਤਮਕ ਅਤੇ ਕੁਝ ਸਕਾਰਾਤਮਕ ਹੋਣਗੇ। ਇਸ ਤਰ੍ਹਾਂ, ਵਿਚਲਨਾਂ ਦਾ ਜੋੜ ਖਤਮ ਹੋ ਸਕਦਾ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਮੱਧਮਾਨ ਤੋਂ ਵਿਚਲਨਾਂ ਦਾ ਜੋੜ $(\bar{x})$ ਸਿਫ਼ਰ ਹੈ।
ਇਸ ਤੋਂ ਇਲਾਵਾ $\quad \quad \quad $ ਵਿਚਲਨਾਂ ਦਾ ਮੱਧਮਾਨ $=\frac{\text{ Sum of deviations }}{\text{ Number of observations }}=\frac{0}{n}=0$
ਇਸ ਤਰ੍ਹਾਂ, ਫੈਲਾਅ ਦੇ ਮਾਪ ਦੇ ਸੰਬੰਧ ਵਿੱਚ, ਮੱਧਮਾਨ ਬਾਰੇ ਵਿਚਲਨਾਂ ਦਾ ਮੱਧਮਾਨ ਲੱਭਣਾ ਸਾਡੇ ਲਈ ਕਿਸੇ ਕੰਮ ਦਾ ਨਹੀਂ ਹੈ।
ਯਾਦ ਰੱਖੋ ਕਿ, ਫੈਲਾਅ ਦਾ ਇੱਕ ਢੁਕਵਾਂ ਮਾਪ ਲੱਭਣ ਵਿੱਚ, ਸਾਨੂੰ ਹਰੇਕ ਮੁੱਲ ਦੀ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਜਾਂ ਇੱਕ ਨਿਸ਼ਚਿਤ ਨੰਬਰ ’ $a$ ’ ਤੋਂ ਦੂਰੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਯਾਦ ਰੱਖੋ, ਕਿ ਦੋ ਨੰਬਰਾਂ ਦੇ ਅੰਤਰ ਦਾ ਨਿਰਪੇਖ ਮੁੱਲ ਨੰਬਰ ਲਾਈਨ ‘ਤੇ ਪ੍ਰਸਤੁਤ ਕਰਨ ‘ਤੇ ਨੰਬਰਾਂ ਵਿਚਕਾਰ ਦੀ ਦੂਰੀ ਦਿੰਦਾ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ, ਇੱਕ ਨਿਸ਼ਚਿਤ ਨੰਬਰ ’ $a$ ’ ਤੋਂ ਫੈਲਾਅ ਦਾ ਮਾਪ ਲੱਭਣ ਲਈ ਅਸੀਂ ਕੇਂਦਰੀ ਮੁੱਲ ਤੋਂ ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲਾਂ ਦਾ ਮੱਧਮਾਨ ਲੈ ਸਕਦੇ ਹਾਂ। ਇਸ ਮੱਧਮਾਨ ਨੂੰ ‘ਮੱਧ ਵਿਚਲਨ’ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ ਕੇਂਦਰੀ ਮੁੱਲ ’ $a$ ’ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ’ $a$ ’ ਤੋਂ ਪ੍ਰੇਖਣਾਂ ਦੇ ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲਾਂ ਦਾ ਮੱਧਮਾਨ ਹੈ। ’ $a$ ’ ਤੋਂ ਮੱਧ ਵਿਚਲਨ ਨੂੰ M.D. (a) ਦੇ ਰੂਪ ਵਿੱਚ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ। ਇਸ ਲਈ,
$ \text{ M.D. }(a)=\frac{\text{ Sum of absolute values of deviations from ’ } a \text{ ’ }}{\text{ Number of observations }} . $
ਟਿੱਪਣੀ ਮੱਧ ਵਿਚਲਨ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਕਿਸੇ ਵੀ ਮਾਪ ਤੋਂ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਮੱਧਮਾਨ ਅਤੇ ਮੱਧਿਕਾ ਤੋਂ ਮੱਧ ਵਿਚਲਨ ਅੰਕੜਾਕੀ ਅਧਿਐਨਾਂ ਵਿੱਚ ਆਮ ਤੌਰ ‘ਤੇ ਵਰਤੇ ਜਾਂਦੇ ਹਨ।
13.4.1 ਅਣਸਮੂਹਿਤ ਡੇਟਾ ਲਈ ਮੱਧ ਵਿਚਲਨ
ਮੰਨ ਲਓ $n$ ਪ੍ਰੇਖਣ $x_1, x_2, x_3, \ldots ., x_n$ ਹਨ। ਮੱਧਮਾਨ ਜਾਂ ਮੱਧਿਕਾ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਦੀ ਗਣਨਾ ਵਿੱਚ ਹੇਠ ਲਿਖੇ ਕਦਮ ਸ਼ਾਮਲ ਹਨ:
ਕਦਮ 1 ਉਸ ਕੇਂਦਰੀ ਪ੍ਰਵਿਰਤੀ ਦੇ ਮਾਪ ਦੀ ਗਣਨਾ ਕਰੋ ਜਿਸ ਬਾਰੇ ਸਾਨੂੰ ਮੱਧ ਵਿਚਲਨ ਲੱਭਣਾ ਹੈ। ਇਸਨੂੰ ’ $a$ ’ ਮੰਨ ਲਓ।
ਕਦਮ 2 ਹਰੇਕ $x_i$ ਦਾ $a$ ਤੋਂ ਵਿਚਲਨ ਲੱਭੋ, ਯਾਨੀ, $x_1-a, x_2-a, x_3-a, \ldots, x_n-a$
ਕਦਮ 3 ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲ ਲੱਭੋ, ਯਾਨੀ, ਮਾਈਨਸ ਚਿੰਨ੍ਹ (-) ਨੂੰ ਹਟਾ ਦਿਓ, ਜੇਕਰ ਇਹ ਉੱਥੇ ਹੈ, ਯਾਨੀ, $|x_1-a|,|x_2-a|,|x_3-a|, \ldots .,|x_n-a|$
ਕਦਮ 4 ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲਾਂ ਦਾ ਮੱਧਮਾਨ ਲੱਭੋ। ਇਹ ਮੱਧਮਾਨ $a$ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਹੈ, ਯਾਨੀ,
$ \text{ M.D. }(a)=\frac{\sum\limits_{i=1}^{n}|x_i-a|}{n} $
ਇਸ ਤਰ੍ਹਾਂ $\quad\quad\quad$ M.D. $(\bar{x})=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-\bar{x}|$, ਜਿੱਥੇ $\bar{x}=$ ਮੱਧਮਾਨ
ਅਤੇ $\quad\quad\quad$ M.D. $(M)=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-M|$, ਜਿੱਥੇ $M=$ ਮੱਧਿਕਾ
ਨੋਟ - ਇਸ ਅਧਿਆਏ ਵਿੱਚ, ਜਦ ਤੱਕ ਹੋਰ ਨਾ ਕਿਹਾ ਜਾਵੇ, ਅਸੀਂ ਮੱਧਿਕਾ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਪ੍ਰਤੀਕ M ਦੀ ਵਰਤੋਂ ਕਰਾਂਗੇ।ਆਓ ਹੁਣ ਉਪਰੋਕਤ ਵਿਧੀ ਦੇ ਕਦਮਾਂ ਨੂੰ ਹੇਠ ਲਿਖੀਆਂ ਉਦਾਹਰਣਾਂ ਵਿੱਚ ਸਮਝਾਈਏ।
ਉਦਾਹਰਣ 1 ਹੇਠ ਲਿਖੇ ਡੇਟਾ ਲਈ ਮੱਧਮਾਨ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਲੱਭੋ:
$ 6,7,10,12,13,4,8,12 $
ਹੱਲ ਅਸੀਂ ਕਦਮ-ਦਰ-ਕਦਮ ਅੱਗੇ ਵਧਦੇ ਹਾਂ ਅਤੇ ਹੇਠ ਲਿਖੇ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਾਂ:
ਕਦਮ 1 ਦਿੱਤੇ ਗਏ ਡੇਟਾ ਦਾ ਮੱਧਮਾਨ ਹੈ
$ \bar{x}=\frac{6+7+10+12+13+4+8+12}{8}=\frac{72}{8}=9 $
ਕਦਮ 2 ਸੰਬੰਧਿਤ ਪ੍ਰੇਖਣਾਂ ਦਾ ਮੱਧਮਾਨ $\bar{x}$ ਤੋਂ ਵਿਚਲਨ, ਯਾਨੀ, $x_i-\bar{x}$ ਹਨ
$\quad\quad\quad\quad 6-9,7-9,10-9,12-9,13-9,4-9,8-9,12-9$,
ਜਾਂ $ \quad\quad\quad\quad -3,-2,1,3,4,-5,-1,3 $
ਕਦਮ 3 ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲ, ਯਾਨੀ, $|x_i-\bar{x}|$ ਹਨ
$ 3,2,1,3,4,5,1,3 $
ਕਦਮ 4 ਮੱਧਮਾਨ ਬਾਰੇ ਲੋੜੀਂਦਾ ਮੱਧ ਵਿਚਲਨ ਹੈ
$ \text{ M.D. } \begin{aligned} (\bar{x}) & =\frac{\sum\limits_{i=1}^{8}|x_i-\bar{x}|}{8} \\ & =\frac{3+2+1+3+4+5+1+3}{8}=\frac{22}{8}=2.75 \end{aligned} $
ਨੋਟ - ਹਰ ਵਾਰ ਕਦਮ ਚੁੱਕਣ ਦੀ ਬਜਾਏ, ਅਸੀਂ ਕਦਮਾਂ ਦਾ ਹਵਾਲਾ ਦਿੱਤੇ ਬਿਨਾਂ ਕਦਮ-ਦਰ-ਕਦਮ ਗਣਨਾ ਕਰ ਸਕਦੇ ਹਾਂ।
ਉਦਾਹਰਣ 2 ਹੇਠ ਲਿਖੇ ਡੇਟਾ ਲਈ ਮੱਧਮਾਨ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਲੱਭੋ :
$ 12,3,18,17,4,9,17,19,20,15,8,17,2,3,16,11,3,1,0,5 $
ਹੱਲ ਸਾਨੂੰ ਪਹਿਲਾਂ ਦਿੱਤੇ ਗਏ ਡੇਟਾ ਦਾ ਮੱਧਮਾਨ $(\bar{x})$ ਲੱਭਣਾ ਹੈ
$ \bar{x}=\frac{1}{20} \sum\limits_{i=1}^{20} x_i=\frac{200}{20}=10 $
ਮੱਧਮਾਨ ਤੋਂ ਸੰਬੰਧਿਤ ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲ, ਯਾਨੀ, $|x_i-\bar{x}|$ ਹਨ
$ 2,7,8,7,6,1,7,9,10,5,2,7,8,7,6,1,7,9,10,5 $
ਇਸ ਲਈ $\quad \sum\limits_{i=1}^{20}|x_i-\bar{x}|=124$
ਅਤੇ $ \quad\quad\quad\quad\text{ M.D. }(\bar{x})=\frac{124}{20}=6.2 $
ਉਦਾਹਰਣ 3 ਹੇਠ ਲਿਖੇ ਡੇਟਾ ਲਈ ਮੱਧਿਕਾ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਲੱਭੋ:
$ 3,9,5,3,12,10,18,4,7,19,21 \text{. } $
ਹੱਲ ਇੱਥੇ ਪ੍ਰੇਖਣਾਂ ਦੀ ਗਿਣਤੀ 11 ਹੈ ਜੋ ਕਿ ਵਿਸਮ ਹੈ। ਡੇਟਾ ਨੂੰ ਚੜ੍ਹਦੇ ਕ੍ਰਮ ਵਿੱਚ ਵਿਵਸਥਿਤ ਕਰਕੇ, ਸਾਡੇ ਕੋਲ $3,3,4,5,7,9,10,12,18,19,21$ ਹੈ
ਹੁਣ
$ \text{ Median }=(\frac{11+1}{2})^{\text{th }} \text{ or } 6^{\text{th }} \text{ observation }=9 $
ਮੱਧਿਕਾ ਤੋਂ ਸੰਬੰਧਿਤ ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲ, ਯਾਨੀ, $|x_i-\mathbf{M}|$ ਹਨ $6,6,5,4,2,0,1,3,9,10,12$
ਇਸ ਲਈ $ \quad\quad\quad\quad\quad \sum\limits_{i=1}^{11}|x_i-M|=58 $
ਅਤੇ $ \quad\quad\quad\text{ M.D. }(M)=\frac{1}{11} \sum\limits_{i=1}^{11}|x_i-M|=\frac{1}{11} \times 58=5.27 $
13.4.2 ਸਮੂਹਿਤ ਡੇਟਾ ਲਈ ਮੱਧ ਵਿਚਲਨ
ਅਸੀਂ ਜਾਣਦੇ ਹਾਂ ਕਿ ਡੇਟਾ ਨੂੰ ਦੋ ਤਰੀਕਿਆਂ ਨਾਲ ਸਮੂਹਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ :
(a) ਅਸਤੱਤਰ ਬਾਰੰਬਾਰਤਾ ਵੰਡ,
(b) ਸਤੱਤਰ ਬਾਰੰਬਾਰਤਾ ਵੰਡ।
ਆਓ ਦੋਨੋਂ ਕਿਸਮਾਂ ਦੇ ਡੇਟਾ ਲਈ ਮੱਧ ਵਿਚਲਨ ਲੱਭਣ ਦੀ ਵਿਧੀ ਬਾਰੇ ਚਰਚਾ ਕਰੀਏ।
(a) ਅਸਤੱਤਰ ਬਾਰੰਬਾਰਤਾ ਵੰਡ ਮੰਨ ਲਓ ਕਿ ਦਿੱਤਾ ਗਿਆ ਡੇਟਾ $n$ ਵੱਖਰੇ ਮੁੱਲਾਂ $x_1, x_2, \ldots, x_n$ ਤੋਂ ਬਣਿਆ ਹੈ ਜੋ ਕ੍ਰਮਵਾਰ ਬਾਰੰਬਾਰਤਾਵਾਂ $f_1, f_2, \ldots, f_n$ ਨਾਲ ਵਾਪਰਦੇ ਹਨ। ਇਸ ਡੇਟਾ ਨੂੰ ਹੇਠਾਂ ਦਿੱਤੇ ਅਨੁਸਾਰ ਸਾਰਣੀ ਰੂਪ ਵਿੱਚ ਪ੍ਰਸਤੁਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਅਤੇ ਇਸਨੂੰ ਅਸਤੱਤਰ ਬਾਰੰਬਾਰਤਾ ਵੰਡ ਕਿਹਾ ਜਾਂਦਾ ਹੈ:
$ \begin{matrix} x: x_1 & x_2 & x_3 \ldots x_n \\ f: f_1 & f_2 & f_3 \ldots f_n \end{matrix} $
(i) ਮੱਧਮਾਨ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ
ਸਭ ਤੋਂ ਪਹਿਲਾਂ ਅਸੀਂ ਦਿੱਤੇ ਗਏ ਡੇਟਾ ਦਾ ਮੱਧਮਾਨ $\bar{x}$ ਸੂਤਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਲੱਭਦੇ ਹਾਂ
$ \bar{x}=\frac{\sum\limits_{i=1}^{n} x_i f_i}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} x_i f_i $
ਜਿੱਥੇ $\sum\limits_{i=1}^{n} x_i f_i$ ਪ੍ਰੇਖਣਾਂ $x_i$ ਦੇ ਉਹਨਾਂ ਦੀਆਂ ਸੰਬੰਧਿਤ ਬਾਰੰਬਾਰਤਾਵਾਂ $f_i$ ਨਾਲ ਗੁਣਨਫਲਾਂ ਦੇ ਜੋੜ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਅਤੇ $N=\sum\limits_{i=1}^{n} f_i$ ਬਾਰੰਬਾਰਤਾਵਾਂ ਦਾ ਜੋੜ ਹੈ।
ਫਿਰ, ਅਸੀਂ ਪ੍ਰੇਖਣਾਂ $x_i$ ਦੇ ਮੱਧਮਾਨ $\bar{x}$ ਤੋਂ ਵਿਚਲਨ ਲੱਭਦੇ ਹਾਂ ਅਤੇ ਉਹਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲ ਲੈਂਦੇ ਹਾਂ, ਯਾਨੀ, $|x_i-\bar{x}|$ ਸਾਰੇ $i=1,2, \ldots, n$ ਲਈ।
ਇਸ ਤੋਂ ਬਾਅਦ, ਵਿਚਲਨਾਂ ਦੇ ਨਿਰਪੇਖ ਮੁੱਲਾਂ ਦਾ ਮੱਧਮਾਨ ਲੱਭੋ, ਜੋ ਕਿ ਮੱਧਮਾਨ ਬਾਰੇ ਲੋੜੀਂਦਾ ਮੱਧ ਵਿਚਲਨ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ
$ \quad\quad\text{ M.D. }(\bar{x})=\frac{\sum\limits_{i=1}^{n} f_i|x_i-\bar{x}|}{\sum\limits_{i=1}^{n} f_i}=\frac{1}{N} \sum\limits_{i=1}^{n} f_i|x_i-\bar{x}| $
(ii) ਮੱਧਿਕਾ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਮੱਧਿਕਾ ਬਾਰੇ ਮੱਧ ਵਿਚਲਨ ਲੱਭਣ ਲਈ, ਅਸੀਂ ਦਿੱਤੀ ਗਈ ਅਸਤੱਤਰ ਬਾਰੰਬਾਰਤਾ ਵੰਡ ਦੀ ਮੱਧਿਕਾ ਲੱਭਦੇ ਹਾਂ। ਇਸ ਲਈ ਪ੍ਰੇਖਣਾਂ ਨੂੰ ਚੜ੍ਹਦੇ ਕ੍ਰਮ ਵਿੱਚ ਵਿਵਸਥਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਤੋਂ ਬਾਅਦ ਸੰਚਿਤ ਬਾਰੰਬਾਰਤਾਵਾਂ ਪ੍ਰਾਪਤ ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ। ਫਿਰ, ਅਸੀਂ ਉਸ ਪ੍ਰੇਖਣ ਦੀ ਪਛਾਣ ਕਰਦੇ ਹਾਂ ਜਿਸਦੀ ਸੰਚਿਤ ਬਾਰੰਬਾਰਤਾ $\frac{N}{2}$ ਦੇ ਬਰਾਬਰ ਜਾਂ ਇਸ ਤੋਂ ਥੋੜ੍ਹੀ ਜਿਹੀ ਵੱਧ ਹੈ, ਜਿੱਥੇ $N$ ਬਾਰੰਬਾਰਤਾਵਾਂ