অধ্যায় ০৯ বায়ইনফৰমেটিক্সৰ পৰিচয়

৯.১ জীৱপ্ৰণালী আৰু প্ৰক্ৰিয়াসমূহ বুজিবলৈ মৌলিক গাণিতিক আৰু পৰিসংখ্যামূলক ধাৰণাসমূহৰ উপযোগিতা

এই অধ্যায়টোৰ উদ্দেশ্য হৈছে আপোনাক জনোৱা কিয় গণিত আৰু পৰিসংখ্যাৰ মৌলিক ধাৰণাসমূহৰ বুজ লোৱা এজন জীৱবিজ্ঞানীৰ বাবে গুৰুত্বপূৰ্ণ।

যিকোনো জৈৱিক পৰীক্ষাৰ ফলাফল হৈছে তথ্য। আগতে, জীৱবিজ্ঞানীসকলে অত্যাধুনিক ছফ্টৱেৰ, গণনামূলক সঁজুলি, আৰু পৰিসংখ্যামূলক পৰীক্ষাৰ সহায় নোলোৱাকৈয়ে তথ্য সৃষ্টি আৰু বিশ্লেষণ কৰিছিল। কিন্তু এতিয়া আৰু তেনে নহয়। উচ্চ-উৎপাদনক্ষম DNA ছিকুৱেন্সাৰ, শক্তিশালী মাইক্ৰস্কোপ, আৰু অন্যান্য ইমেজিং প্ৰণালী, আৰু বৃহৎ পৰিমাণৰ তথ্য সৃষ্টি কৰিবলৈ সক্ষম বিশ্লেষণাত্মক সঁজুলিৰ দৰে যন্ত্ৰৰ আবিৰ্ভাৱৰ সৈতে, জীৱবিজ্ঞানীসকলে আৰু তেওঁলোকৰ নোটবুক আৰু এক্সেল শ্বিট ব্যৱহাৰ কৰি তথ্যৰ সৈতে ব্যৱহাৰ কৰিব নোৱাৰে। ইয়াৰ সলনি, তথ্য পৰিচালনা কৰিবলৈ তেওঁলোকৰ গণনামূলক আৰু পৰিসংখ্যামূলক সঁজুলিৰ প্ৰয়োজন। বৃহৎ পৰিমাণৰ তথ্যৰ প্ৰায়ে জৈৱিক অৰ্থ ব্যাখ্যা কৰিবলৈ আৰু সৃষ্টি কৰিবলৈ পৰিমাণগত বিশ্লেষণৰ প্ৰয়োজন হয়। এনে বিশ্লেষণসমূহ কৰিবলৈ এজনৰ গণনামূলক আৰু পৰিসংখ্যামূলক ধাৰণাসমূহৰ ভাল কামৰ জ্ঞান থাকিব লাগিব, উদাহৰণস্বৰূপে; মেচিন লাৰ্নিং প্ৰযুক্তি, ৰিগ্ৰেছন, ভেৰিয়েন্স, আৰু ক’ৰিলেচন, ইত্যাদি। গাণিতিক আৰু পৰিসংখ্যামূলক ধাৰণাসমূহে কেৱল জীৱবিজ্ঞানীসকলক তেওঁলোকৰ তথ্য ব্যাখ্যা কৰাত সহায় কৰিব পাৰে আৰু সঠিক প্ৰশ্ন সুধা আৰু জৈৱিক বিচক্ষণতাৰ প্ৰতিস্থাপন নহয়। জীৱবিজ্ঞানত ব্যৱহৃত কিছুমান সাধাৰণ পৰিসংখ্যামূলক পৰিভাষাৰ নাম বক্স ১ত দিয়া হৈছে।

বক্স ১

বক্স ১: জীৱবিজ্ঞানত সাধাৰণতে ব্যৱহৃত পৰিসংখ্যামূলক পৰিভাষাৰ শব্দকোষ

শূন্য প্ৰকল্প- দুটা জোখা পৰিঘটনাৰ মাজত কোনো সম্পৰ্ক নাই বুলি এটা বিবৃতি।

পৰিসংখ্যামূলক তাৎপৰ্য- এটা ফলাফলৰ পৰিসংখ্যামূলক তাৎপৰ্য থাকে যেতিয়া ই সংঘটিত হোৱাটো অতি সম্ভাৱনা নথকা।

p-মান- এটা অধ্যয়নৰ প্ৰশ্নৰ শূন্য প্ৰকল্প সত্য হ’লে পোৱা পৰ্যবেক্ষণ কৰা ফলাফলৰ সম্ভাৱনা।

t-পৰীক্ষা- পৰিসংখ্যামূলক পৰীক্ষাৰ জৰিয়তে দুটা জনসংখ্যাৰ গড়ৰ বিশ্লেষণ।

বহুচলীয় বিশ্লেষণ: এটাৰ অধিক চলক থকা তথ্যৰ বিশ্লেষণৰ বাবে ব্যৱহৃত কৌশলৰ এটা সংহতি।

ৰিগ্ৰেছন বিশ্লেষণ- এটা নিৰ্ভৰশীল আৰু এটা স্বাধীন চলকৰ মাজৰ সম্পৰ্কৰ তদন্ত কৰা এটা কৌশল।

বহু পৰীক্ষা সংশোধন- সামগ্ৰিক ত্ৰুটিৰ হাৰক ব্যৱহাৰকাৰী-নিৰ্দিষ্ট P-মান কাটঅফতকৈ কম বা সমান ৰাখিবলৈ বহু পৰীক্ষাৰ বাবে সংশোধন কৰা এটা পৰিসংখ্যামূলক পৰীক্ষা।

ভেৰিয়েন্স বিশ্লেষণ বা ANOVA- এটা নমুনাত গোটৰ গড়সমূহৰ মাজৰ পাৰ্থক্য বিশ্লেষণ কৰিবলৈ ব্যৱহৃত পৰিসংখ্যামূলক মডেলৰ সংগ্ৰহ।

আমি বিশেষ উদাহৰণৰ সৈতে পৰীক্ষা কৰোঁ য’ত গণনা আৰু পৰিসংখ্যা উভয়ৰ জ্ঞানই জৈৱিক পৰিঘটনাসমূহ ভালদৰে বুজাত সহায় কৰিব পাৰে। উদাহৰণস্বৰূপে, আমি দহজন ৰোগীত (তালিকা ৯.১) ৰক্তচাপ আৰু হৃদযন্ত্ৰৰ হাৰৰ মাজত যদি কোনো সম্পৰ্ক থাকে তাক বুজিব বিচাৰোঁ। তলৰ তালিকাত দিয়াৰ দৰে, দুটা চলকৰ মাজৰ সম্পৰ্ক (ক’ৰিলেচন) সঠিকভাৱে নিৰ্ধাৰণ কৰিবলৈ এটা সাধাৰণ দৃশ্যমান অনুমান (চিত্ৰ ৯.১) পৰ্যাপ্ত নহয়। তাৰ বাবে, এজনৰ ৰিগ্ৰেছন ৰেখা অংকন কৰিব লাগিব। ক’ৰিলেচন আৰু ৰিগ্ৰেছন পৃথক, তথাপি সম্পৰ্কিত। ক’ৰিলেচনে চলকসমূহ কেনেদৰে সংযুক্ত হৈছে তাক পৰিমাণগতভাৱে নিৰ্ধাৰণ কৰে, কিন্তু ৰিগ্ৰেছনে দুটা বা ততোধিক চলকৰ মাজত এটা পৰিসংখ্যামূলক সম্পৰ্ক সংজ্ঞায়িত কৰে য’ত এটা চলকত পৰিৱৰ্তন আন এটা চলকত পৰিৱৰ্তনৰ সৈতে জড়িত। গতিকে, ওপৰৰ উদাহৰণটোত এটা সাধাৰণ ৰিগ্ৰেছন পৰীক্ষাই আমাক ক’ব যে হৃদযন্ত্ৰৰ হাৰ আৰু ৰক্তচাপৰ মাজত প্ৰত্যক্ষ সম্পৰ্ক আছে নে নাই। এটা ৰৈখিক ৰিগ্ৰেছন বিশ্লেষণৰ আউটপুট হৈছে $\mathrm{R}^{2}$-মান, তথ্যই ফিট কৰা ৰিগ্ৰেছন ৰেখাৰ কিমান ওচৰত আছে তাক দেখুৱাবলৈ এটা পৰিসংখ্যামূলক জোখ। $R^{2}$ মান ০ (চলকসমূহৰ মাজত কোনো ক’ৰিলেচন নাই) আৰু ১ (চলকসমূহৰ মাজত সম্পূৰ্ণ ক’ৰিলেচন)ৰ মাজত থাকে। চিত্ৰ ৯.১ত দেখুওৱাৰ দৰে, $R^{2}$ মানে সূচায় যে দুয়োটা চলকৰ মাজত এটা ভাল ক’ৰিলেচন আছে। গতিকে, এই ক্ষেত্ৰত শূন্য প্ৰকল্প প্ৰত্যাখ্যান কৰা হয়।

তালিকা ৯.১: দহজন ৰোগীত পঞ্জীয়ন কৰা হৃদযন্ত্ৰৰ হাৰ আৰু ৰক্তচাপ

ৰোগীহৃদযন্ত্ৰৰ হাৰৰক্তচাপ (চিষ্টোলিক)
1112189
283140
392153
4121192
585147
6111178
794135
888143
9102177
10111189

চিত্ৰ ৯.১: এটা সাধাৰণ ৰৈখিক ৰিগ্ৰেছন ৰেখাৰ সৈতে দুটা চলকৰ মাজৰ ক’ৰিলেচন

জীৱবিজ্ঞানৰ বহু ক্ষেত্ৰৰ সম্ভাৱনাৰ মৌলিক বুজৰ প্ৰয়োজন। কোষীয় কাৰ্যপ্ৰণালীৰ দৰে জটিল প্ৰণালীগত পৰিঘটনাসমূহৰ গাণিতিক মডেলিংয়ে এজনক প্ৰণালীটোৰ গুৰুত্বপূৰ্ণ পৰামিতিসমূহ আৰু ইয়াৰ গতিবিজ্ঞান বুজিবলৈ অনুমতি দিয়ে। ফাইল’জেনেটিক পুনৰ্নিৰ্মাণ, পূৰ্বপুৰুষৰ ক্ৰম নিৰ্ধাৰণ কৰা আৰু বৰ্তমানৰ ক্ৰমৰ এটা গুচ্ছৰ পৰা বিবৰ্তনৰ হাৰ মডেলিং কৰিবলৈ সম্ভাৱনাৰ জ্ঞানৰ প্ৰয়োজন। জীৱবিজ্ঞানীসকলে পৰীক্ষা এটা কৰাৰ আগতে পৰিসংখ্যামূলক বিষয়সমূহ মনত ৰাখিব লাগিব। উদাহৰণস্বৰূপে, পৰীক্ষাৰ বাবে পৰ্যাপ্ত সংখ্যক নমুনা আৰু পুনৰাবৃত্তি, জৈৱিক আৰু কাৰিকৰী উভয়েই, বাছনি কৰিবলৈ পৰিসংখ্যাৰ জ্ঞানৰ প্ৰয়োজন। ফলাফলসমূহৰ ওপৰত আস্থা স্থাপন কৰিবলৈ আৰু জানিবলৈ যে সেয়া প্ৰকৃত নে ভুৱা, এটা পৰীক্ষা বহুবাৰ স্বাধীনভাৱে পুনৰাবৃত্তি কৰিব লাগিব। পৰিসংখ্যামূলক অনিয়মিততা আৰু বৃহৎ সংখ্যাৰ নিয়মৰ এটা প্ৰয়োজনীয় পটভূমিয়ে এজনক এই সমস্যাৰ সৈতে মোকাবিলা কৰিবলৈ সজ্জিত কৰে। বৃহৎ সংখ্যাৰ পৰা অনিয়মিত নমুনা লোৱাই পক্ষপাতদুষ্ট ফলাফল পোৱাৰ সম্ভাৱনা হ্ৰাস কৰে। জীৱবিজ্ঞানীজনে নিশ্চিত কৰিব লাগিব যে ফলাফলসমূহ পৰিসংখ্যামূলকভাৱে তাৎপৰ্যপূৰ্ণ। এই পদক্ষেপটোৰ বাবে বিভিন্ন পৰীক্ষা আৰু পৰিসংখ্যামূলক তাৎপৰ্যৰ জোখৰ সৈতে পৰিচিত হ’ব লাগিব আৰু প্ৰশ্ন থকা সমস্যাৰ বাবে শুদ্ধ পৰীক্ষা(সমূহ) প্ৰয়োগ কৰিব লাগিব। সমস্যাটোৰ ওপৰত নিৰ্ভৰ কৰি, জীৱবিজ্ঞানীজনে বহু পৰীক্ষাৰ বাবে তাৎপৰ্যৰ জোখ সংশোধন আৰু সমন্বয় কৰিব লগা হ’ব পাৰে।

উচ্চ স্তৰৰ গণনা, বিশ্লেষণ, আৰু দৃশ্যায়নৰ বাবে, এজন জীৱবিজ্ঞানীয়ে অন্তৰ্নিৰ্মিত ফ্ৰেমৱৰ্কসমূহ ব্যৱহাৰ কৰিব পাৰে। যেনে MATLAB (বাণিজ্যিক) আৰু R (মুক্ত উৎস), ইত্যাদি।

জীৱবিজ্ঞানীসকলৰ বাবে, ব্যৱহৃত পৰিসংখ্যামূলক বিশ্লেষণৰ পছন্দ হৈছে শুদ্ধ উত্তৰ নিৰ্ধাৰণ কৰাৰ চাবিকাঠি। এটা দুৰ্বল বা ভুল পৰিসংখ্যামূলক মানদণ্ডে ভুল ধাৰণালৈ নিয়ে আৰু সেয়েহে পুনৰুৎপাদনযোগ্য নোহোৱা ফলাফললৈ নিব পাৰে। উদাহৰণস্বৰূপে, পৰিসংখ্যাত সাধাৰণতে ব্যৱহৃত ধাৰণাটো হৈছে $\mathrm{P}$ মান এটা প্ৰকল্পৰ সমৰ্থনৰ প্ৰমাণ হিচাপে। $\mathrm{P}$ মান যিমানেই সৰু হয়, পৰীক্ষাৰ ফলাফল তাৎপৰ্যপূৰ্ণ হোৱাৰ সম্ভাৱনা সিমানেই বেছি। ০.০৫ (৯৫% তাৎপৰ্য) বা তাতকৈ কমৰ এটা P মান কাটঅফক তাৎপৰ্যপূৰ্ণ বুলি গণ্য কৰা হয়। কিন্তু, ০.০৫ৰ সীমাই বৈজ্ঞানিক সাহিত্যত বহু ভুল ধনাত্মক ফলাফল দেখা দিয়াত অৰিহণা যোগাইছে। গতিকে, $P$ মান কাটঅফ ০.০৫ পুনৰীক্ষণ কৰাৰ প্ৰয়োজন। সৰু নমুনাৰ আকাৰৰ সৈতে, এটা ভ্ৰান্তিমূলক গড় আৰু মানক বিচ্যুতিৰে দৃশ্যায়ন বিকৃত কৰাৰ সলনি সকলো স্বাধীন তথ্য বিন্দু দেখুওৱাটো ভাল। এটা ঋণাত্মক ফলাফলৰ সন্মুখীন হ’লে এজনে বিবেচনা কৰিবলৈ আৰম্ভ কৰা পৰিসংখ্যামূলক শক্তিও ধনাত্মক ফলাফলৰ ক্ষেত্ৰত বিবেচনা কৰিব লাগিব। সেয়েহে, ভুল ধৰণৰ তথ্যলৈ কিছুমান স্থাপিত পৰিসংখ্যামূলক মডেল আৰু বিতৰণৰ ধাৰণা কৰাটো এটা সাধাৰণ অপব্যৱহাৰ। উদাহৰণস্বৰূপে, অৰৈখিক গতিশীল প্ৰণালীসমূহলৈ গাউছিয়ান বিতৰণৰ এটা ধাৰণা, যিয়ে ভুল ধনাত্মক ফলাফল দিয়ে। অবাস্তৱ পৰামিতিৰ ওজনৰ সৈতে নিৰ্মাণ কৰা অসন্তুলিত গাণিতিক মডেল আৰু এটা সাধাৰণ অপব্যৱহাৰ আৰু যাক চিনাক্ত কৰাটো কঠিন। এই সতৰ্কতাসমূহৰ প্ৰয়োজনীয় বিবেচনাৰ সৈতে, গণিত আৰু পৰিসংখ্যা জীৱবিজ্ঞানলৈ প্ৰয়োগ কৰাটোৱে অধিক জটিল জৈৱিক সমস্যাসমূহৰ সৈতে মোকাবিলা কৰিবলৈ আন্তঃশাখামূলক প্ৰকৃতিৰ গৱেষণাৰ নতুন ক্ষেত্ৰসমূহ খোলাৰ দিশে লৈ যাব পাৰে।

৯.২ পৰিচয়

বায়ইনফৰমেটিক্স হৈছে এটা আন্তঃশাখামূলক ক্ষেত্ৰ যিয়ে জৈৱিক সমস্যাসমূহ সমাধান কৰিবলৈ জৈৱিক তথ্য বিশ্লেষণ কৰাত গণনামূলক, গাণিতিক, পৰিসংখ্যামূলক আৰু কেতিয়াবা অভিযান্ত্ৰিক দৃষ্টিভংগী ব্যৱহাৰ কৰে (চিত্ৰ ৯.২)। এইদৰে, বায়ইনফৰমেটিক্সে কম্পিউটাৰ ভিত্তিক ছফ্টৱেৰ আৰু সঁজুলি ব্যৱহাৰ কৰি জৈৱিক তথ্যৰ সংৰক্ষণ, পুনৰুদ্ধাৰ, বিশ্লেষণ আৰু ব্যাখ্যাৰ সৈতে জড়িত। যদিও পাৰ্থক্য আছে, ইয়াক ‘কম্পিউটেচনেল বায়’লজি,’ ‘মেথেমেটিকেল বায়’লজি,’ ‘কোৱাণ্টিটেটিভ বায়’লজি’ আৰু ‘বায়’-ষ্টেটিষ্টিক্স’ৰ দৰে অন্যান্য পৰিভাষাৰ সৈতে বিকল্পভাৱে আৰু পৰিবৰ্তনীয়ভাৱে ব্যৱহাৰ কৰা হয়, প্ৰাধান্য দিয়া শাখাগত উপাদানসমূহৰ ওপৰত নিৰ্ভৰ কৰি। কিন্তু, লক্ষ্য কৰিব লাগিব যে এই সংজ্ঞাসমূহৰ ব্যৱহাৰ বিশেষজ্ঞ আৰু অনুশীলনকাৰীসকলৰ মাজত ভিন্ন হয়, আৰু সময়ৰ সৈতে সলনি হৈছে।

চিত্ৰ ৯.২: বায়ইনফৰমেটিক্সৰ আন্তঃশাখামূলক প্ৰকৃতি: কম্পিউটাৰ বিজ্ঞান, গণিত, অভিযান্ত্ৰিক বিদ্যা, আৰু পৰিসংখ্যাৰ দৰে এক বা ততোধিক অন্যান্য শাখাৰ সৈতে জীৱবিজ্ঞানৰ ছেদ

৯.২.১. ঐতিহাসিক দৃষ্টিভংগী

বায়ইনফৰমেটিক্সে তথ্য খননৰ জৰিয়তে নতুন আৱিষ্কাৰ আৰু নতুন প্ৰকল্পৰ সৃষ্টিত সহায় কৰে। ইয়াক আণৱিক তথ্যৰ মডেলিং বা বিশ্লেষণৰ জৰিয়তে কৰা হয়। বেছিভাগ বায়ইনফৰমেটিক্স সঁজুলিয়ে হয় ক্ৰম আৰু গঠন ডাটাবেছৰ পৰা আগৰে পৰা থকা নিউক্লিয়টাইড আৰু প্ৰ’টিন তথ্য, বা নেক্স্ট-জেনেৰেচন ছিকুৱেন্সাৰ আৰু DNA মাইক্ৰ’এৰেৰ দৰে উচ্চ-উৎপাদনক্ষম যন্ত্ৰ ব্যৱহাৰ কৰি সৃষ্টি কৰা নতুন তথ্য ব্যৱহাৰ কৰে। আমেৰিকাৰ ৰাষ্ট্ৰীয় জৈৱপ্ৰযুক্তি তথ্য কেন্দ্ৰ (NCBI) বায়ইনফৰমেটিক্স সঁজুলি আৰু সেৱাৰ সম্পদ হিচাপে সৃষ্টি কৰা হৈছিল। ই নিউক্লিয়টাইড আৰু গ্ৰন্থপঞ্জী ডাটাবেছৰ আধাৰ। GenBank, এটা বহুলভাৱে ব্যৱহৃত ডাটাবেছে সকলো ৰাজহুৱাভাৱে উপলব্ধ DNA ক্ৰম সংৰক্ষণ কৰে, ১৯৮২ চনত আৰম্ভ কৰা হৈছিল। যদিও বায়ইনফৰমেটিক্স পৰিভাষাটোৰ ব্যাপক ব্যৱহাৰৰ বহু আগৰে পৰা অনুশীলন কৰা হৈছিল, ১৯৯১ চনলৈকে ই সাহিত্যত দেখা দিয়া আৰম্ভ কৰা নাছিল। মানৱ জিন’ম প্ৰকল্প আৰম্ভ হোৱাৰ পিছত নামটোৱে ব্যাপক স্বীকৃতি লাভ কৰিলে আৰু ক্ৰম তথ্যৰ বিশ্লেষণৰ বাবে বায়ইনফৰমেটিক্স সঁজুলি ব্যাপকভাৱে ব্যৱহাৰ কৰা হৈছিল। গতিকে, সাহিত্যত বায়ইনফৰমেটিক্স পৰিভাষাৰ ব্যৱহাৰ ৩০ বছৰতকৈ অধিক পুৰণি নহয়। জৈৱপ্ৰযুক্তি আৰু গণনা প্ৰযুক্তিৰ উন্নতি আৰু প্ৰৱেশযোগ্যতাৰ পিছত, জিন’ম ছিকুৱেন্সিং আৰু উচ্চ-কাৰ্যক্ষমতা গণনাৰ যুগৰ পিছত বায়ইনফৰমেটিক্সই ব্যাপক আকৰ্ষণ লাভ কৰিছে। ইয়াৰ আগতে, যেতিয়া নিম্ন উৎপাদনক্ষমতাৰ পৰীক্ষাৰ ওপৰত গুৰুত্ব আছিল, যেনে এটা মাত্ৰ জিনৰ ক্ৰিয়া অধ্যয়ন কৰা বা মাইক্ৰস্কোপৰ তলত ৰূপবিদ্যা অধ্যয়ন কৰা, বায়ইনফৰমেটিক্স তেতিয়াও ব্যৱহাৰ কৰা হৈছিল কিন্তু সৰু পৰিসৰত।

গঠনমূলক বায়ইনফৰমেটিক্সে ছিকুৱেন্সিং আৰু DNA মাইক্ৰ’এৰেৰ দৰে উচ্চ-উৎপাদনক্ষম জিন’ম-ব্যাপী পৰীক্ষাৰ ওপৰত ভিত্তি কৰা তথ্যবিজ্ঞানৰ আগতীয়া। কাৰণ ১৯০০ চনৰ আৰম্ভণিতে NMR স্পেকট্ৰস্কপি আৰু X-ৰে ক্ৰিষ্টেল’গ্ৰাফি ব্যৱহাৰ কৰি প্ৰ’টিনৰ ত্ৰিমাত্ৰিক গঠনৰ অধ্যয়নসমূহ, কেৱল ২০০০ চনৰ আৰম্ভণিত আৰু এতিয়ালৈকে চলি থকা জিন’ম আৰু অন্যান্য -‘ম তথ্যবিজ্ঞানৰ আগৰ। প্ৰ’টিন ডাটা বেংক (PDB) গঠন আৰু GenBank ভৰ্তিসমূহৰ সংখ্যা প্ৰতি বছৰে বৃদ্ধি পাই আছে। বায়ইনফৰমেটিক্সত প্ৰাথমিক চিন্তা হৈছে ডাটাবেছৰ ৰূপত ক্ৰম আৰু গঠনমূলক তথ্য পৰিচালনা কৰা, আৰু জৈৱিক অৰ্থ পাবলৈ এই ডাটাবেছসমূহৰ পৰা তথ্য খনন কৰা। NCBIয়ে বিভিন্ন শ্ৰেণীৰ অধীনত নিউক্লিয়টাইড আৰু প্ৰ’টিন তথ্য আধাৰ কৰে (জিন, জিন’ম, গঠন, ক্ৰম, ইত্যাদি)। বৰ্তমান, অভূতপূৰ্ব হাৰত উৎপাদিত জৈৱিক তথ্য, আৰু ইয়াৰ বিশ্লেষণ আৰু ব্যাখ্যাৰ সৈতে গুৰুত্বপূৰ্ণ জৈৱিক অন্তৰ্দৃষ্টিলৈ নিয়ে উচ্চ অগ্ৰাধিকাৰ লৈছে। ইয়াক সফল কৰিবলৈ পৰিসংখ্যামূলক অভিযোজন আৰু একাধিক ক্ষেত্ৰৰ সংশ্লেষণৰ সৈতে নতুন, অপ্টিমাইজড আৰু উচ্চতৰ এলগৰিদম আৰু সঁজুলি বিকশিত আৰু কাৰ্যকৰী কৰা হয়। দ্বিতীয় আৰু তৃতীয় স্তৰৰ তথ্য যেনে আণৱিক পথ, জিন অভিব্যক্তি, প্ৰ’টিন গঠন আৰু কাৰ্য, আন্তঃক্ৰিয়া নেটৱৰ্ক, ৰোগ-সংলগ্ন পৰিৱৰ্তন, জীৱৰ নিৰ্দিষ্টতা আৰু নিয়ন্ত্ৰক নেটৱৰ্কৰ ওপৰত ভিত্তি কৰি ডাটাবেছসমূহ ইতিমধ্যে বিকশিত আৰু ব্যৱহাৰ কৰা হৈছে। বায়ইনফৰমেটিক্স হৈছে এটা বিকশিত ক্ষেত্ৰ। জৈৱিক তথ্যৰ গতিশীল প্ৰকৃতিৰ বাবে, জিন আৰু এক্সন-ইনট্ৰন সীমা, ক্ৰমত দূষণ আৰু অসামঞ্জস্যতা, ইন ছিলিক’ অনুবাদ ত্ৰুটি যেনে ফ্ৰেমশ্বিফ্ট ত্ৰুটি, টীকা ত্ৰুটি, সংযোজন ত্ৰুটি, আৰু সাধাৰণ বানান ভুল সঘনাই আপডেট কৰা হৈ আছে।

আমি এতিয়া বিভিন্ন ধৰণৰ জৈৱিক অণু, এই কৌশলসমূহৰ দ্বাৰা উৎপাদিত তথ্যৰ ধৰণ, আৰু তথ্য ব্যাখ্যা আৰু দৃশ্যায়ন কৰিবলৈ সাধাৰণতে ব্যৱহৃত বিশ্লেষণাত্মক আৰু পৰিসংখ্যামূলক কৰ্মপ্ৰবাহৰ বিষয়ে শিকিম (চিত্ৰ ৯.৩)। জিন’মিক তথ্য উৎপাদনৰ বাবে ব্যৱহৃত পৰীক্ষামূলক কৌশলসমূহৰ বিৱৰণ একক Vত বৰ্ণনা কৰা হৈছে।

চিত্ৰ ৯.৩. জৈৱিক অণুৰ পৰা কাৰ্যলৈ

৯.২.২. জৈৱিক অণু বিশ্লেষণ কৰাৰ বাবে পৰীক্ষামূলক প্ৰযুক্তিৰ প্ৰকাৰসমূহ

জৈৱিক অণু চিনাক্ত কৰাৰ আৰু/বা পৰিমাণ নিৰ্ধাৰণ কৰাৰ বাবে ব্যৱহৃত কেইটামান গুৰুত্বপূৰ্ণ পৰীক্ষামূলক প্ৰযুক্তি তালিকা ৯.২ত দিয়া হৈছে। এই কৌশলসমূহৰ কিছুমানৰ বিৱৰণ একক Vত বৰ্ণনা কৰা হৈছে।

তালিকা ৯.২: প্ৰযুক্তিৰ নাম, জৈৱিক অণু পৰীক্ষা কৰা আৰু প্ৰযুক্তিৰ উদ্দেশ্য

প্ৰযুক্তিজৈৱিক অণুউদ্দেশ্য
PCR (পলিমেৰেজ চেইন ৰিঅেকচন)DNAএটা আগ্রহৰ অঞ্চল বিবৰ্ধন কৰা
RT (ৰিয়েল-টাইম)-PCR/qPCR (কোৱাণ্টিটেটিভ PCR)RNARNA অভিব্যক্তি চিনাক্ত কৰা
নেক্স্ট-জেনেৰেচন ছিকুৱেন্সিংDNA/RNAজিন/জিন’ম আৰু RNA ছিকুৱেন্স কৰিবলৈ
জেল ইলেক্ট্ৰ’ফ’ৰেছিছDNA, RNA আৰু প্ৰ’টিনখণ্ডসমূহৰ আকাৰ আৰু আধানৰ ওপৰত ভিত্তি কৰি পৃথকীকৰণ
HPLC (হাই-পাৰফৰমেন্স লিকুইড ক্ৰমেট’গ্ৰাফী)মেটাব’লাইটমেটাব’লাইটৰ পৃথকীকৰণ, চিনাক্তকৰণ আৰু পৰিমাণ নিৰ্ধাৰণ
MS (মেছ স্পেকট্ৰ’মেট্ৰি)DNA, প্ৰ’টিন, মেটাব’লাইট,খণ্ডীকৰণ, আইছ’ট’পিক গঠন জোখা আৰু ভৰ নিৰ্ধাৰণ
EM (ইলেক্ট্ৰন মাইক্ৰস্কোপ)DNA, RNA বা প্ৰ’টিনগঠন, আৰু ক্ৰম নিৰ্ধাৰণ
৯.২.৩ আণৱিক তথ্যৰ প্ৰকাৰসমূহ

বিভিন্ন প্ৰযুক্তিয়ে বিভিন্ন জৈৱিক অণু পৰীক্ষা কৰে আৰু বিভিন্ন ফৰ্মেটত বিভিন্ন ধৰণৰ তথ্য আউটপুট উৎপাদন কৰে (তালিকা ৯.৩)। দুটা সাধাৰণতে ব্যৱহৃত DNA তথ্য ফৰ্মেট (FASTQ আৰু FASTA)ৰ বিৱৰণ পিছত অধ্যায়ত দিয়া হৈছে (জিন’ম তথ্যবিজ্ঞান)।

৯.২.৪ সাধাৰণতে ব্যৱহৃত বিশ্লেষণাত্মক আৰু পৰিসংখ্যামূলক কৰ্মপ্ৰবাহ

মুক্ত উৎস বা অন্যান্য মালিকানাধীন সঁজুলি কাৰ্যকৰী কৰাৰ বাবে জৈৱিক জ্ঞান বাধ্যতামূলক হ’ব পাৰে বা নহ’ব পাৰে। কিন্তু, এই অধ্যায়ৰ আৰম্ভণিতে উল্লেখ কৰাৰ দৰে প্ৰাসংগিক প্ৰশ্ন সুধা আৰু জৈৱিক ফলাফল ব্যাখ্যা কৰাৰ বাবে ইয়াৰ প্ৰয়োজন। যিকোনো সঁজুলিৰ কাম কৰাৰ পিছফালৰ যুক্তি আৰু নীতি বুজিব লাগিব, আৰু অন্তৰ্নিহিত ধাৰণাসমূহৰ বিষয়ে সচেতন হ’ব লাগিব।

তালিকা ৯.৩: আণৱিক তথ্যৰ প্ৰকাৰসমূহ আৰু ইয়াৰ ফৰ্মেটসমূহ

কিছুমান সাধাৰণতে ব্যৱহৃত বিশ্লেষণ সঁজুলি হৈছে:

  • হ’ম’লজি অনুসন্ধান (বেচিক লোকেল এলাইনমেণ্ট চাৰ্চ টুল (BLAST) - blastn, blastp)

  • ক্ৰম এলাইনমেণ্ট (CLUSTAL, MAFFT, MUSCLE)

  • ফাইল’জেনেটিক্স (PHYLIP, PAUP)

  • জিন ভৱিষ্যদ্বাণী (GlimmerHMM, GenScan)

  • কাৰ্যকৰী হ’ম’লজি অনুসন্ধান (HMMER)

  • RNA গঠন (mfold, sFold, uniFold)

  • নিয়ন্ত্ৰক অঞ্চল বিশ্লেষণ (MatInspector, BEARR, RSAT)

  • প্ৰ’টিন গঠন (Phyre2, Jpred)

বায়ইনফৰমেটিক্স সঁজুলিয়ে বিভিন্ন পৰিসংখ্যামূলক আৰু গণনামূলক এলগৰিদম আৰু দৃষ্টিভংগী ব্যৱহাৰ কৰে। কিছুমান সাধাৰণতে ব্যৱহৃত পৰিসংখ্যা পেকেজ হৈছে:

  • Statistical Package for the Social Sciences (SPSS)

  • Statistical Analysis System (SAS)

  • $\mathrm{R}$

  • Microsoft Excel

জৈৱিক তথ্য বিশ্লেষণৰ অন্তিম পৰ্যায়সমূহত, জিন আৰু প্ৰ’টিন স্তৰৰ আৱিষ্কাৰসমূহ কিছুমান নিৰ্দিষ্ট কাৰ্যৰ সৈতে সংযুক্ত কৰা হয়। এই কাৰ্যকৰী ব্যাখ্যাসমূহ সাধাৰণতে ব্যৱহৃত জৈৱিক পৰীক্ষা যেনে কাৰ্য হেৰুওৱা বা লাভ কৰাৰ পৰীক্ষা, জিন নকআউট আৰু জিন সম্পাদনা ব্যৱহাৰ কৰি কৰিব পাৰি। ইয়াৰ উপৰি, গণনামূলক সঁজুলি ব্যৱহাৰ কৰি প্ৰভাৱিত নেটৱৰ্ক আৰু পথ অনুমান কৰি, এটা জিন আৰু ইয়াৰ প্ৰ’টিন উৎপাদনলৈ কাৰ্যকৰী তাৎপৰ্য নিয়োজিত কৰিব পাৰি।

৯.৩ জৈৱিক ডাটাবেছ

এটা জৈৱিক ডাটাবেছ হৈছে এটা ভঁৰাল য’ত জৈৱিক তথ্যৰ সংগঠিত, গঠনমূলক আৰু অনুসন্ধানযোগ্য সংগ্ৰহ থাকে। অন্য কথাত, ই হৈছে জৈৱিক তথ্যৰ এটা লাইব্ৰেৰী, সহজে প্ৰৱেশযোগ্য আৰু অনুসন্ধানযোগ্য। এটা জৈৱিক ডাটাবেছে সকলো প্ৰাসংগিক তথ্য ইয়াৰ মূল সৃষ্টিকাৰী বা অন্তৰ্নিহিত তথ্য বৰ্ণনা কৰা এটা উল্লেখৰ সৈতে সংযোগ কৰে। ডাটাবেছত থকা তথ্য পৰীক্ষা আৰু গণনামূলক দৃষ্টিভংগীৰ জৰিয়তে সংগ্ৰহ কৰা হয়। উদাহৰণস্বৰূপে, মানৱ জিনৰ এটা ডাটাবেছত সকলো জিনৰ প্ৰকৃত নিউক্লিয়টাইড ক্ৰম আৰু ইয়াৰ বৈশিষ্ট্যসমূহ উভয়েই থাকে। ডাটাবেছটো এটা গোটৰ গৱেষকসকলে বিভিন্ন ৰাজহুৱা সম্পদৰ পৰা তথ্য সংগ্ৰহ কৰি বা একাধিক দলৰ গৱেষকসকলে যিয়ে এটা মাত্ৰ ভঁৰাললৈ তথ্য যোগ কৰিব পাৰে তেওঁলোকৰ দ্বাৰা তৈয়াৰ কৰিব পাৰি। এটা জৈৱিক ডাটাবেছে কেৱল এটা ধৰণৰ তথ্য সংৰক্ষণ কৰিব পাৰে, উদাহৰণস্বৰূপে, DNA ক্ৰম তথ্য, বা একাধিক ধৰণৰ তথ্য, উদাহৰণস্বৰূপে, এটা জিনৰ প্ৰাথমিক নিউক্লিয়টাইড ক্ৰম; এটা ৰোগৰ বাবে নিৰ্দিষ্ট এটা জিনত মিউটেচন আৰু বিভিন্ন জনসংখ্যাত একক নিউক্লিয়টাইড পলিমৰ্ফিজম (SNP)ৰ প্ৰাচুৰ্য;