অধ্যায় 13 পরিসংখ্যান

“পরিসংখ্যান হয়তো শত্রুতার বা গড়ের পরিমাপ ও তাদের আনুমানিক মানের বিজ্ঞান হিসেবে সঠিকভাবে ডাকা যেতে পারে।” - এ. এল. বাউলি ও এ. এল. বড্ডিংটন

পরিচিতি

আমরা জানি যে পরিসংখ্যান নির্দিষ্ট উদ্দেশ্যে সংগৃহীত তথ্যের সাথে যুক্ত। আমরা তথ্যের উপর ভিত্তি করে তার বিশ্লেষণ ও ব্যাখ্যা করে সিদ্ধান্ত নিতে পারি। আগের শ্রেণিতে আমরা তথ্যকে গ্রাফিক আকার ও টেবিল আকারে উপস্থাপনের পদ্ধতি নিয়ে পর্যালোচনা করেছি। এই উপস্থাপন তথ্যের কিছু সংক্ষিপ্ত বৈশিষ্ট্য বা বৈশিষ্ট্যগুলি প্রকাশ করে। আমরা আগের শ্রেণিতেও দেওয়া তথ্যের জন্য একটি প্রতিনিধি মান নির্ণয়ের পদ্ধতি নিয়ে পর্যালোচনা করেছি। এই মানটি কেন্দ্রীয় প্রবণতার পরিমাপ বলে উল্লেখ করা হয়। কেন্দ্রীয় প্রবণতার পরিমাপ আমাদের তথ্যের বিন্দুগুলি কোথায় কেন্দ্রীভূত হয়েছে তা একটি সংক্ষিপ্ত ধারণা দেয়। কিন্তু, তথ্য থেকে আরও ভাল ব্যাখ্যা করার জন্য

কার্ল পিয়ার্সন (1857-1936 খ্রিষ্টাব্দ)

তথ্যের উপর আমাদের তথ্যগুলি কীভাবে ছড়িয়ে পড়েছে বা কেন্দ্রীয় প্রবণতার পরিমাপের আসার নিকটবর্তী কতটা তাদের ভিন্নতা সম্পর্কে একটি ধারণা থাকা উচিত।

এখন চিন্তা করুন দুটি ব্যাটসম্যানের তাদের শেষ দশটি ম্যাচে স্কোর করেছেন নিম্নরূপ:

ব্যাটসম্যান এ : $30,91,0,64,42,80,30,5,117,71$

ব্যাটসম্যান বি : $53,46,48,50,53,53,58,60,57,52$

স্পষ্টভাবে, তথ্যের গড় ও মধ্যমা

ব্যাটসম্যান এব্যাটসম্যান বি
গড়5353
মধ্যমা5353

স্মরণ করুন যে, আমরা একটি তথ্যের গড় ($\bar{x}$ দ্বারা চিহ্নিত) গণনা করি যা প্রতিবেদনগুলির যোগফলকে প্রবেদনগুলির সংখ্যাকে ভাগ করে, অর্থাৎ

$ \bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i $

এছাড়াও, মধ্যমা প্রাপ্ত হয় প্রথমে তথ্যগুলি আর্ডিনাল বা অবর্তমান ক্রমে সাজানো হয় এবং নিম্নলিখিত নিয়ম প্রয়োগ করা হয়।

যদি প্রবেদনগুলির সংখ্যা বিজোড় হয়, তবে মধ্যমা $(\frac{n+1}{2})^{\text{th }}$ প্রবেদনটি।

যদি প্রবেদনগুলির সংখ্যা জোড় হয়, তবে মধ্যমা $(\frac{n}{2})^{\text{th }}$ ও $(\frac{n}{2}+1)^{\text{th }}$ প্রবেদনগুলির গড়।

আমরা দেখতে পাই যে উভয় ব্যাটসম্যানের দ্বারা স্কোর করা তথ্যের গড় ও মধ্যমা $A$ এবং বি একই অর্থাৎ 53। আমরা কি বলতে পারি যে দুটি খেলোয়াড়ের কর্মকাণ্ড একই? স্পষ্টভাবে না, কারণ ব্যাটসম্যান এর স্কোরে পরিবর্তন 0 (সর্বনিম্ন) থেকে 117 (সর্বোচ্চ) পর্যন্ত। এদিকে, ব্যাটসম্যান বি দ্বারা স্কোর করা গড় 46 থেকে 60 পর্যন্ত।

এখন আসুন উপরের স্কোরগুলিকে একটি সংখ্যার রেখায় ডট হিসাবে প্লট করি। আমরা নিম্নলিখিত আলোকচিত্র পাই:

ব্যাটসম্যান এর জন্য

আকৃতি 13.1

ব্যাটসম্যান বির জন্য

আকৃতি 13.2

আমরা দেখতে পাই যে ব্যাটসম্যান বির সাথে সম্পর্কিত ডটগুলি একে অপরের কাছাকাছি আছে এবং কেন্দ্রীয় প্রবণতার পরিমাপ (গড় ও মধ্যমা) এর আসার নিকটবর্তী ক্লাসিফাই হয়েছে, যদিও ব্যাটসম্যান এর সাথে সম্পর্কিত ডটগুলি ছড়িয়ে পড়ে অথবা আরও ছড়িয়ে পড়েছে।

সুতরাং, কেন্দ্রীয় প্রবণতার পরিমাপগুলি দেওয়া তথ্যের সম্পর্কে সম্পূর্ণ তথ্য দেওয়া উচিত নয়। পরিবর্তনশীলতা হল অন্যতম একটি কারণ যা পরিসংখ্যানের অধীনে অধ্যয়ন করা প্রয়োজন। যেমন ‘কেন্দ্রীয় প্রবণতার পরিমাপ’ আমাদের একটি একক সংখ্যা দরকার যা পরিবর্তনশীলতা বর্ণনা করে। এই একক সংখ্যাকে ‘পরিবর্তনশীলতার পরিমাপ’ বলে উল্লেখ করা হয়। এই অধ্যায়ে আমরা ছড়িয়ে পড়ার কিছু গুরুত্বপূর্ণ পরিমাপ ও তাদের অপরিগণিত ও গ্রুপড তথ্যের জন্য তাদের গণনার পদ্ধতি নিয়ে আলোচনা করব।

13.2 পরিবর্তনশীলতার পরিমাপ

একটি তথ্যের পরিবর্তনশীলতা বা ছড়িয়ে পড়া প্রবেদনগুলি ও কেন্দ্রীয় প্রবণতার পরিমাপের ধরনের উপর ভিত্তি করে পরিমাপ করা হয়। পরিবর্তনশীলতার পরিমাপ নিম্নরূপ রয়েছে:

(i) পরিসীমা, (ii) চতুর্থাংশ বিচ্ছিন্নতা, (iii) গড় বিচ্ছিন্নতা, (iv) স্ট্যান্ডার্ড ডিভিয়েশন।

এই অধ্যায়ে আমরা চতুর্থাংশ বিচ্ছিন্নতা ব্যতীত এই সব পরিবর্তনশীলতার পরিমাপ নিয়ে আলোচনা করব।

13.3 পরিসীমা

বিশ্রাম নিন, দুটি ব্যাটসম্যান এ ও বি দ্বারা স্কোর করা গড়ের উদাহরণে, আমরা প্রতিটি শিরিস্তের সর্বনিম্ন ও সর্বোচ্চ গড়ের উপর ভিত্তি করে স্কোরের কিছু পরিবর্তনশীলতা সম্পর্কে কিছু ধারণা পেয়েছি। এই একক সংখ্যা পেতে, আমরা প্রতিটি শিরিস্তের সর্বোচ্চ ও সর্বনিম্ন মানের পার্থক্য নির্ণয় করি। এই পার্থক্যকে তথ্যের ‘পরিসীমা’ বলে উল্লেখ করা হয়।

ব্যাটসম্যান এ এ পরিসীমা $=117-0=117$ এবং ব্যাটসম্যান বি এ পরিসীমা $=60-46=14$। স্পষ্টভাবে, এর পরিসীমা $>$ বির পরিসীমা $B$। সুতরাং, এর ক্ষেত্রে স্কোরগুলি ছড়িয়ে পড়ে অথবা বিচ্ছিন্ন হয়েছে যদিও বির ক্ষেত্রে এগুলি একে অপরের কাছাকাছি আছে।

সুতরাং, একটি শিরিস্তের পরিসীমা পরিবর্তনশীলতা বা ছড়িয়ে পড়ার একটি সংক্ষিপ্ত ধারণা দেয় কিন্তু কেন্দ্রীয় প্রবণতার পরিমাপ থেকে তথ্যের বিচ্ছিন্নতা সম্পর্কে কিছু বলে দেয় না। এই উদ্দেশ্যে, আমাদের অন্য কোনো পরিবর্তনশীলতার পরিমাপ প্রয়োজন। স্পষ্টভাবে, এই ধরনের পরিমাপ কেন্দ্রীয় প্রবণতার পার্থক্য (অথবা বিচ্ছিন্নতা) থেকে মানগুলির উপর নির্ভর করবে।

পরিবর্তনশীলতার গুরুত্বপূর্ণ পরিমাপগুলি, যা প্রবেদনগুলির বিচ্ছিন্নতা থেকে কেন্দ্রীয় প্রবণতাকে নির্ভর করে, হল গড় বিচ্ছিন্নতা ও স্ট্যান্ডার্ড ডিভিয়েশন। আমরা এগুলি বিস্তারিত আলোচনা করি।

13.4 গড় বিচ্ছিন্নতা

স্মরণ করুন যে, একটি প্রবেদনের বিচ্ছিন্নতা $x$ থেকে একটি স্থির মান ‘$a$’ এর পার্থক্য হল পার্থক্য $x-a$। মানগুলি $x$ থেকে একটি কেন্দ্রীয় মান ‘$a$’ এর পরিবর্তনশীলতা নির্ণয় করতে, আমরা $a$ থেকে বিচ্ছিন্নতা নির্ণয় করি। পরিবর্তনশীলতার একটি পরম পরিমাপ হল এই বিচ্ছিন্নতাগুলির গড়। গড় নির্ণয় করতে, আমাদের প্রথমে বিচ্ছিন্নতাগুলির যোগফল নির্ণয় করতে হবে। কিন্তু, আমরা জানি যে কেন্দ্রীয় প্রবণতা সমাহারের সর্বোচ্চ ও সর্বনিম্ন মানগুলির মধ্যে থাকে। সুতরাং, কিছু বিচ্ছিন্নতা ঋণাত্মক হবে এবং কিছু ধনাত্মক হবে। সুতরাং, বিচ্ছিন্নতাগুলির যোগফল শূন্য হতে পারে। এছাড়াও, গড় $(\bar{x})$ থেকে বিচ্ছিন্নতাগুলির যোগফল শূন্য।

এছাড়াও $\quad \quad \quad $ গড় বিচ্ছিন্নতা $=\frac{\text{ Sum of deviations }}{\text{ Number of observations }}=\frac{0}{n}=0$

সুতরাং, পরিবর্তনশীলতার পরিমাপের ক্ষেত্রে গড় থেকে বিচ্ছিন্নতাগুলির গড় নির্ণয় করা আমাদের কাজে লাগে না, কারণ কেন্দ্রীয় প্রবণতা থেকে পরিবর্তনশীলতার পরিমাপের ক্ষেত্রে এটি কোনো উপযোগী নয়।

মনে রাখুন যে, একটি উপযুক্ত পরিবর্তনশীলতার পরিমাপ নির্ণয় করার জন্য, আমাদের প্রতিটি মানের কেন্দ্রীয় প্রবণতা বা একটি স্থির সংখ্যা ‘$a$’ থেকে দূরত্ব প্রয়োজন। স্মরণ করুন, দুটি সংখ্যার পার্থক্যের পরম মান সংখ্যার রেখায় উপস্থাপন করা হয়লে দুটি সংখ্যার মধ্যে দূরত্ব দেয়। সুতরাং, একটি স্থির সংখ্যা ‘$a$’ থেকে পরিবর্তনশীলতার পরিমাপ নির্ণয় করতে আমরা কেন্দ্রীয় মান থেকে বিচ্ছিন্নতাগুলির পরম মানগুলির গড় নির্ণয় করতে পারি। এই গড়কে ‘গড় বিচ্ছিন্নতা’ বলে উল্লেখ করা হয়। সুতরাং, একটি কেন্দ্রীয় মান ‘$a$’ থেকে গড় বিচ্ছিন্নতা হল প্রবেদনগুলির থেকে ‘$a$’ থেকে বিচ্ছিন্নতাগুলির পরম মানগুলির গড়। গড় থেকে ‘$a$’ বিচ্ছিন্নতা দ্বারা M.D. (a) চিহ্নিত করা হয়। সুতরাং,

$ \text{ M.D. }(a)=\frac{\text{ Sum of absolute values of deviations from ’ } a \text{ ’ }}{\text{ Number of observations }} . $

মন্তব্য গড় বিচ্ছিন্নতা যেকোনো কেন্দ্র