ಅಧ್ಯಾಯ 09 ಬಯೋಇನ್ಫರ್ಮ್ಯಾಟಿಕ್ಸ್ ಪರಿಚಯ
9.1 ಜೈವಿಕ ವ್ಯವಸ್ಥೆಗಳು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಮೂಲ ಗಣಿತ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಪರಿಕಲ್ಪನೆಗಳ ಉಪಯುಕ್ತತೆ
ಈ ಅಧ್ಯಾಯದ ಉದ್ದೇಶವೆಂದರೆ, ಜೀವಶಾಸ್ತ್ರಜ್ಞನಿಗೆ ಗಣಿತ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಮೂಲ ಪರಿಕಲ್ಪನೆಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಏಕೆ ಮುಖ್ಯ ಎಂಬುದನ್ನು ನಿಮಗೆ ತಿಳಿಸುವುದು.
ಯಾವುದೇ ಜೈವಿಕ ಪ್ರಯೋಗದ ಫಲಿತಾಂಶವೆಂದರೆ ದತ್ತಾಂಶ. ಹಿಂದೆ, ಜೀವಶಾಸ್ತ್ರಜ್ಞರು ಅತ್ಯಾಧುನಿಕ ಸಾಫ್ಟ್ವೇರ್, ಗಣನಾ ಸಾಧನಗಳು ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪರೀಕ್ಷೆಗಳ ಸಹಾಯವಿಲ್ಲದೆ ದತ್ತಾಂಶವನ್ನು ಉತ್ಪಾದಿಸುತ್ತಿದ್ದರು ಮತ್ತು ವಿಶ್ಲೇಷಿಸುತ್ತಿದ್ದರು. ಆದರೆ, ಈಗ ಹಾಗಲ್ಲ. ಹೆಚ್ಚಿನ-ಪ್ರಮಾಣದ ಡಿಎನ್ಎ ಅನುಕ್ರಮಣಕಾರಿಗಳು, ಶಕ್ತಿಶಾಲಿ ಸೂಕ್ಷ್ಮದರ್ಶಕಗಳು, ಇತರ ಚಿತ್ರೀಕರಣ ವ್ಯವಸ್ಥೆಗಳು ಮತ್ತು ದೊಡ್ಡ ಪ್ರಮಾಣದ ದತ್ತಾಂಶವನ್ನು ಉತ್ಪಾದಿಸಲು ಸಮರ್ಥವಾದ ವಿಶ್ಲೇಷಣಾತ್ಮಕ ಸಾಧನಗಳಂತಹ ಉಪಕರಣಗಳ ಆಗಮನದೊಂದಿಗೆ, ಜೀವಶಾಸ್ತ್ರಜ್ಞರು ಇನ್ನು ಮುಂದೆ ತಮ್ಮ ನೋಟ್ಬುಕ್ಗಳು ಮತ್ತು ಎಕ್ಸೆಲ್ ಶೀಟ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ದತ್ತಾಂಶವನ್ನು ನಿಭಾಯಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಬದಲಿಗೆ, ದತ್ತಾಂಶವನ್ನು ನಿಭಾಯಿಸಲು ಅವರಿಗೆ ಗಣನಾ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಸಾಧನಗಳ ಅಗತ್ಯವಿದೆ. ದೊಡ್ಡ ಪ್ರಮಾಣದ ದತ್ತಾಂಶವು ಸಾಮಾನ್ಯವಾಗಿ ಜೈವಿಕ ಅರ್ಥವನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಲು ಮತ್ತು ಉತ್ಪಾದಿಸಲು ಪರಿಮಾಣಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆಗಳ ಅಗತ್ಯವಿರುತ್ತದೆ. ಅಂತಹ ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ನಡೆಸಲು ಒಬ್ಬರು ಉತ್ತಮವಾದ ಕಾರ್ಯನಿರ್ವಹಣಾ ಜ್ಞಾನವನ್ನು ಹೊಂದಿರಬೇಕು ಗಣನಾ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪರಿಕಲ್ಪನೆಗಳ, ಉದಾಹರಣೆಗೆ; ಯಂತ್ರ ಕಲಿಕಾ ತಂತ್ರಜ್ಞಾನಗಳು, ಹಿಂಜರಿತ, ವ್ಯತ್ಯಾಸ ಮತ್ತು ಸಹಸಂಬಂಧ, ಇತ್ಯಾದಿ. ಗಣಿತ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಪರಿಕಲ್ಪನೆಗಳು ಜೀವಶಾಸ್ತ್ರಜ್ಞರಿಗೆ ಅವರ ದತ್ತಾಂಶವನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಲು ಸಹಾಯ ಮಾತ್ರ ಮಾಡಬಲ್ಲವು ಮತ್ತು ಸರಿಯಾದ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವುದು ಮತ್ತು ಜೈವಿಕ ಜ್ಞಾನಕ್ಕೆ ಬದಲಿಯಲ್ಲ. ಜೀವಶಾಸ್ತ್ರದಲ್ಲಿ ಬಳಸಲಾಗುವ ಕೆಲವು ಸಾಮಾನ್ಯ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪದಗಳ ಹೆಸರುಗಳನ್ನು ಪೆಟ್ಟಿಗೆ 1 ರಲ್ಲಿ ನೀಡಲಾಗಿದೆ.
ಪೆಟ್ಟಿಗೆ 1
ಪೆಟ್ಟಿಗೆ 1: ಜೀವಶಾಸ್ತ್ರದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪದಗಳ ಗ್ಲಾಸರಿ
ಶೂನ್ಯ ಕಲ್ಪನೆ- ಎರಡು ಅಳೆಯಲಾದ ವಿದ್ಯಮಾನಗಳ ನಡುವೆ ಯಾವುದೇ ಸಂಬಂಧವಿಲ್ಲ ಎಂಬ ಹೇಳಿಕೆ.
ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಹತ್ವ- ಒಂದು ಫಲಿತಾಂಶವು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಹತ್ವವನ್ನು ಹೊಂದಿರುತ್ತದೆ ಅದು ಸಂಭವಿಸಿರುವುದು ತುಂಬಾ ಅಸಂಭವವಾದಾಗ.
p-ಮೌಲ್ಯ- ಅಧ್ಯಯನದ ಪ್ರಶ್ನೆಯ ಶೂನ್ಯ ಕಲ್ಪನೆಯು ನಿಜವಾಗಿರುವಾಗ ಗಮನಿಸಿದ ಫಲಿತಾಂಶಗಳನ್ನು ಕಂಡುಹಿಡಿಯುವ ಸಂಭವನೀಯತೆ.
t-ಪರೀಕ್ಷೆ- ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪರೀಕ್ಷೆಯ ಮೂಲಕ ಎರಡು ಜನಸಂಖ್ಯೆಯ ಸರಾಸರಿಗಳ ವಿಶ್ಲೇಷಣೆ.
ಬಹುಚರ ವಿಶ್ಲೇಷಣೆ: ಒಂದಕ್ಕಿಂತ ಹೆಚ್ಚು ವೇರಿಯಬಲ್ ಹೊಂದಿರುವ ದತ್ತಾಂಶದ ವಿಶ್ಲೇಷಣೆಗಾಗಿ ಬಳಸುವ ತಂತ್ರಗಳ ಸಮೂಹ.
ಹಿಂಜರಿತ ವಿಶ್ಲೇಷಣೆ- ಅವಲಂಬಿತ ಮತ್ತು ಸ್ವತಂತ್ರ ವೇರಿಯಬಲ್ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ತನಿಖೆ ಮಾಡಲು ಒಂದು ತಂತ್ರ.
ಬಹು ಪರೀಕ್ಷಾ ತಿದ್ದುಪಡಿ- ಒಟ್ಟಾರೆ ದೋಷ ದರವನ್ನು ಬಳಕೆದಾರ-ನಿರ್ದಿಷ್ಟಪಡಿಸಿದ P-ಮೌಲ್ಯದ ಕಟ್ಆಫ್ಗಿಂತ ಕಡಿಮೆ ಅಥವಾ ಸಮಾನವಾಗಿ ಇರಿಸಲು ಬಹು ಪರೀಕ್ಷೆಗಳಿಗೆ ತಿದ್ದುಪಡಿ ಮಾಡುವ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಪರೀಕ್ಷೆ
ವ್ಯತ್ಯಾಸದ ವಿಶ್ಲೇಷಣೆ ಅಥವಾ ANOVA- ಮಾದರಿಯಲ್ಲಿನ ಗುಂಪು ಸರಾಸರಿಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಬಳಸುವ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಗಳ ಸಂಗ್ರಹ.
ನಿರ್ದಿಷ್ಟ ಉದಾಹರಣೆಗಳೊಂದಿಗೆ ಪರಿಶೀಲಿಸೋಣ, ಅಲ್ಲಿ ಗಣನೆ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರ ಎರಡರ ಜ್ಞಾನವು ಜೈವಿಕ ವಿದ್ಯಮಾನಗಳನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡಬಹುದು. ಉದಾಹರಣೆಗೆ, ನಾವು ಹತ್ತು ರೋಗಿಗಳಲ್ಲಿ ರಕ್ತದೊತ್ತಡ ಮತ್ತು ಹೃದಯ ಬಡಿತದ ನಡುವೆ ಯಾವುದೇ ಸಂಬಂಧವಿದೆಯೇ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಬಯಸುತ್ತೇವೆ (ಟೇಬಲ್ 9.1). ಕೆಳಗಿನ ಕೋಷ್ಟಕದಲ್ಲಿ ನೀಡಿರುವಂತೆ, ಸರಳ ದೃಶ್ಯ ಅಂದಾಜು (ಚಿತ್ರ 9.1) ಎರಡು ವೇರಿಯಬಲ್ಗಳ ನಡುವಿನ ಸಂಬಂಧ (ಸಹಸಂಬಂಧ)ವನ್ನು ನಿಖರವಾಗಿ ನಿರ್ಧರಿಸಲು ಸಾಕಾಗುವುದಿಲ್ಲ. ಅದಕ್ಕಾಗಿ, ಒಬ್ಬರು ಹಿಂಜರಿತ ರೇಖೆಯನ್ನು ಎಳೆಯಬೇಕಾಗುತ್ತದೆ. ಸಹಸಂಬಂಧ ಮತ್ತು ಹಿಂಜರಿತವು ವಿಭಿನ್ನವಾಗಿವೆ, ಆದರೆ ಸಂಬಂಧಿತವಾಗಿವೆ. ಸಹಸಂಬಂಧವು ವೇರಿಯಬಲ್ಗಳು ಹೇಗೆ ಸಂಪರ್ಕ ಹೊಂದಿವೆ ಎಂಬುದನ್ನು ಪರಿಮಾಣಾತ್ಮಕವಾಗಿ ನಿರೂಪಿಸುತ್ತದೆ, ಆದರೆ ಹಿಂಜರಿತವು ಎರಡು ಅಥವಾ ಹೆಚ್ಚಿನ ವೇರಿಯಬಲ್ಗಳ ನಡುವಿನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಸಂಬಂಧವನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುತ್ತದೆ, ಅಲ್ಲಿ ಒಂದು ವೇರಿಯಬಲ್ನಲ್ಲಿನ ಬದಲಾವಣೆಯು ಸಂಬಂಧಿಸಿದೆ ಮತ್ತೊಂದರಲ್ಲಿನ ಬದಲಾವಣೆಯೊಂದಿಗೆ. ಆದ್ದರಿಂದ, ಮೇಲಿನ ಉದಾಹರಣೆಯಲ್ಲಿ ಸರಳ ಹಿಂಜರಿತ ಪರೀಕ್ಷೆಯು ಹೃದಯ ಬಡಿತ ಮತ್ತು ರಕ್ತದೊತ್ತಡದ ನಡುವೆ ನೇರ ಸಂಬಂಧವಿದೆಯೇ ಎಂದು ನಮಗೆ ತಿಳಿಸುತ್ತದೆ. ರೇಖೀಯ ಹಿಂಜರಿತ ವಿಶ್ಲೇಷಣೆಯ ಫಲಿತಾಂಶವು $\mathrm{R}^{2}$-ಮೌಲ್ಯವಾಗಿದೆ, ದತ್ತಾಂಶವು ಹೊಂದಿಕೊಂಡ ಹಿಂಜರಿತ ರೇಖೆಗೆ ಎಷ್ಟು ಹತ್ತಿರದಲ್ಲಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸಲು ಒಂದು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಅಳತೆ. $R^{2}$ ಮೌಲ್ಯವು 0 (ವೇರಿಯಬಲ್ಗಳ ನಡುವೆ ಯಾವುದೇ ಸಹಸಂಬಂಧವಿಲ್ಲ) ಮತ್ತು 1 (ವೇರಿಯಬಲ್ಗಳ ನಡುವೆ ಪರಿಪೂರ್ಣ ಸಹಸಂಬಂಧ) ನಡುವೆ ಇರುತ್ತದೆ. ಚಿತ್ರ 9.1 ರಲ್ಲಿ ತೋರಿಸಿರುವಂತೆ, $R^{2}$ ಮೌಲ್ಯವು ಎರಡು ವೇರಿಯಬಲ್ಗಳ ನಡುವೆ ಉತ್ತಮ ಸಹಸಂಬಂಧವಿದೆ ಎಂದು ಸೂಚಿಸುತ್ತದೆ. ಆದ್ದರಿಂದ, ಈ ಸಂದರ್ಭದಲ್ಲಿ ಶೂನ್ಯ ಕಲ್ಪನೆಯನ್ನು ತಿರಸ್ಕರಿಸಲಾಗಿದೆ.
ಕೋಷ್ಟಕ 9.1: ಹತ್ತು ರೋಗಿಗಳಲ್ಲಿ ದಾಖಲಾದ ಹೃದಯ ಬಡಿತ ಮತ್ತು ರಕ್ತದೊತ್ತಡ
| ರೋಗಿ | ಹೃದಯ ಬಡಿತ | ರಕ್ತದೊತ್ತಡ (ಸಿಸ್ಟೋಲಿಕ್) |
|---|---|---|
| 1 | 112 | 189 |
| 2 | 83 | 140 |
| 3 | 92 | 153 |
| 4 | 121 | 192 |
| 5 | 85 | 147 |
| 6 | 111 | 178 |
| 7 | 94 | 135 |
| 8 | 88 | 143 |
| 9 | 102 | 177 |
| 10 | 111 | 189 |

ಚಿತ್ರ 9.1: ಸರಳ ರೇಖೀಯ ಹಿಂಜರಿತ ರೇಖೆಯೊಂದಿಗೆ ಎರಡು ವೇರಿಯಬಲ್ಗಳ ನಡುವಿನ ಸಹಸಂಬಂಧ
ಜೀವಶಾಸ್ತ್ರದ ಅನೇಕ ಕ್ಷೇತ್ರಗಳಿಗೆ ಸಂಭವನೀಯತೆಯ ಮೂಲ ತಿಳುವಳಿಕೆ ಅಗತ್ಯವಿದೆ. ಕೋಶೀಯ ಕಾರ್ಯವಿಧಾನಗಳಂತಹ ಸಂಕೀರ್ಣ ವ್ಯವಸ್ಥಾಪಕ ವಿದ್ಯಮಾನಗಳ ಗಣಿತೀಯ ಮಾಡೆಲಿಂಗ್ ವ್ಯವಸ್ಥೆಯ ಪ್ರಮುಖ ನಿಯತಾಂಕಗಳು ಮತ್ತು ಅದರ ಚಲನಶಾಸ್ತ್ರವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ಫೈಲೋಜೆನೆಟಿಕ್ ಪುನರ್ನಿರ್ಮಾಣ, ಪೂರ್ವಜ ಅನುಕ್ರಮಗಳನ್ನು ನಿರ್ಧರಿಸುವುದು ಮತ್ತು ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಅನುಕ್ರಮಗಳ ಗುಂಪಿನಿಂದ ವಿಕಾಸದ ದರಗಳನ್ನು ಮಾಡೆಲಿಂಗ್ ಮಾಡುವುದು ಸಂಭವನೀಯತೆಯ ಜ್ಞಾನದ ಅಗತ್ಯವಿರುತ್ತದೆ. ಜೀವಶಾಸ್ತ್ರಜ್ಞರು ಪ್ರಯೋಗವನ್ನು ನಡೆಸುವ ಮೊದಲು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಸಮಸ್ಯೆಗಳನ್ನು ಗಮನದಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕು. ಉದಾಹರಣೆಗೆ, ಪ್ರಯೋಗಕ್ಕೆ ಸಾಕಷ್ಟು ಸಂಖ್ಯೆಯ ಮಾದರಿಗಳು ಮತ್ತು ಪುನರಾವರ್ತನೆಗಳು, ಜೈವಿಕ ಮತ್ತು ತಾಂತ್ರಿಕ ಎರಡನ್ನೂ ಆಯ್ಕೆ ಮಾಡುವುದು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಜ್ಞಾನದ ಅಗತ್ಯವಿರುತ್ತದೆ. ಫಲಿತಾಂಶಗಳಲ್ಲಿ ವಿಶ್ವಾಸವನ್ನು ದೃಢಪಡಿಸಿಕೊಳ್ಳಲು ಮತ್ತು ಅವು ನಿಜವಾದವು ಅಥವಾ ನಕಲಿ ಎಂದು ತಿಳಿಯಲು ಪ್ರಯೋಗವನ್ನು ಅನೇಕ ಬಾರಿ ಸ್ವತಂತ್ರವಾಗಿ ಪುನರಾವರ್ತಿಸಬೇಕು. ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಯಾದೃಚ್ಛಿಕತೆ ಮತ್ತು ದೊಡ್ಡ ಸಂಖ್ಯೆಗಳ ನಿಯಮದಲ್ಲಿ ಅಗತ್ಯವಾದ ಹಿನ್ನೆಲೆಯು ಈ ಸಮಸ್ಯೆಯನ್ನು ನಿಭಾಯಿಸಲು ಸಜ್ಜುಗೊಳಿಸುತ್ತದೆ. ದೊಡ್ಡ ಸಂಖ್ಯೆಯಿಂದ ಯಾದೃಚ್ಛಿಕ ಮಾದರಿ ಪಡೆಯುವುದು ಪಕ್ಷಪಾತದ ಫಲಿತಾಂಶಗಳನ್ನು ಪಡೆಯುವ ಅವಕಾಶವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ. ಫಲಿತಾಂಶಗಳು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯವಾಗಿ ಮಹತ್ವದ್ದಾಗಿವೆ ಎಂದು ಜೀವಶಾಸ್ತ್ರಜ್ಞರು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಬೇಕು. ಈ ಹಂತಕ್ಕೆ ವಿವಿಧ ಪರೀಕ್ಷೆಗಳು ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಹತ್ವದ ಅಳತೆಗಳ ಪರಿಚಯ ಮತ್ತು ಪ್ರಶ್ನೆಯಲ್ಲಿರುವ ಸಮಸ್ಯೆಗೆ ಸರಿಯಾದ ಪರೀಕ್ಷೆ(ಗಳನ್ನು) ಅನ್ವಯಿಸುವುದು ಅಗತ್ಯವಿದೆ. ಸಮಸ್ಯೆಯನ್ನು ಅವಲಂಬಿಸಿ, ಜೀವಶಾಸ್ತ್ರಜ್ಞರು ಬಹು ಪರೀಕ್ಷೆಗಳಿಗೆ ಮಹತ್ವದ ಅಳತೆಯನ್ನು ತಿದ್ದುಪಡಿ ಮಾಡಬೇಕು ಮತ್ತು ಸರಿಹೊಂದಿಸಬೇಕು.
ಹೆಚ್ಚಿನ ಮಟ್ಟದ ಗಣನೆ, ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ದೃಶ್ಯೀಕರಣಕ್ಕಾಗಿ, ಜೀವಶಾಸ್ತ್ರಜ್ಞರು ಅಂತರ್ನಿರ್ಮಿತ ಚೌಕಟ್ಟುಗಳನ್ನು ಬಳಸಬಹುದು. MATLAB (ವಾಣಿಜ್ಯ) ಮತ್ತು R (ಮುಕ್ತ ಮೂಲ) ಇತ್ಯಾದಿ.
ಜೀವಶಾಸ್ತ್ರಜ್ಞರಿಗೆ, ಬಳಸಲಾದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ವಿಶ್ಲೇಷಣೆಯ ಆಯ್ಕೆಯು ಸರಿಯಾದ ಉತ್ತರವನ್ನು ನಿರ್ಧರಿಸುವ ಕೀಲಿಯಾಗಿದೆ. ದುರ್ಬಲ ಅಥವಾ ತಪ್ಪಾದ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾನದಂಡಗಳು ತಪ್ಪು ಊಹೆಗಳಿಗೆ ಕಾರಣವಾಗುತ್ತವೆ ಮತ್ತು ಆದ್ದರಿಂದ ಪುನರುತ್ಪಾದಿಸಲಾಗದ ಫಲಿತಾಂಶಗಳಿಗೆ ಕಾರಣವಾಗಬಹುದು. ಉದಾಹರಣೆಗೆ, ಸಂಖ್ಯಾಶಾಸ್ತ್ರದಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸುವ ಪರಿಕಲ್ಪನೆಯೆಂದರೆ $\mathrm{P}$ ಮೌಲ್ಯವು ಕಲ್ಪನೆಗೆ ಬೆಂಬಲದ ಪುರಾವೆಯಾಗಿ. $\mathrm{P}$ ಮೌಲ್ಯವು ಚಿಕ್ಕದಾಗಿದ್ದರೆ, ಪರೀಕ್ಷೆಯ ಫಲಿತಾಂಶವು ಮಹತ್ವದ್ದಾಗಿರುವ ಸಾಧ್ಯತೆ ಹೆಚ್ಚು. 0.05 (95% ಮಹತ್ವ) ಅಥವಾ ಅದಕ್ಕಿಂತ ಕಡಿಮೆ P ಮೌಲ್ಯದ ಕಟ್ಆಫ್ ಅನ್ನು ಮಹತ್ವದ್ದೆಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ. ಆದರೆ, 0.05 ಮಿತಿಯು ವೈಜ್ಞಾನಿಕ ಸಾಹಿತ್ಯದಲ್ಲಿ ಹಲವಾರು ತಪ್ಪು ಧನಾತ್ಮಕಗಳನ್ನು ಕಾಣಿಸಿಕೊಳ್ಳುವಂತೆ ಮಾಡಿದೆ. ಆದ್ದರಿಂದ, $P$ ಮೌಲ್ಯದ ಕಟ್ಆಫ್ 0.05 ಅನ್ನು ಮರುಪರಿಶೀಲಿಸಬೇಕಾಗಿದೆ. ಸಣ್ಣ ಮಾದರಿ ಗಾತ್ರಗಳೊಂದಿಗೆ, ತಪ್ಪು ಮಾರ್ಗದರ್ಶನದ ಸರಾಸರಿ ಮತ್ತು ಪ್ರಮಾಣಿತ ವಿಚಲನದೊಂದಿಗೆ ದೃಶ್ಯೀಕರಣವನ್ನು ವಿರೂಪಗೊಳಿಸುವ ಬದಲು ಎಲ್ಲಾ ಸ್ವತಂತ್ರ ದತ್ತಾಂಶ ಬಿಂದುಗಳನ್ನು ತೋರಿಸುವುದು ಉತ್ತಮ. ನಕಾರಾತ್ಮಕ ಫಲಿತಾಂಶದೊಂದಿಗೆ ಎದುರಿಸಿದಾಗ ಒಬ್ಬರು ಪರಿಗಣಿಸಲು ಪ್ರಾರಂಭಿಸುವ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಶಕ್ತಿಯನ್ನು ಧನಾತ್ಮಕ ಫಲಿತಾಂಶಗಳ ಸಂದರ್ಭದಲ್ಲಿಯೂ ಪರಿಗಣಿಸಬೇಕು. ಆದ್ದರಿಂದ, ಕೆಲವು ಸ್ಥಾಪಿತ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಗಳು ಮತ್ತು ವಿತರಣೆಗಳ ಊಹೆಗಳನ್ನು ತಪ್ಪು ರೀತಿಯ ದತ್ತಾಂಶಕ್ಕೆ ಅನ್ವಯಿಸುವುದು ಸಾಮಾನ್ಯ ದುರುಪಯೋಗವಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, ರೇಖಾತ್ಮಕವಲ್ಲದ ಡೈನಾಮಿಕಲ್ ವ್ಯವಸ್ಥೆಗಳಿಗೆ ಗಾಸಿಯನ್ ವಿತರಣೆಯ ಊಹೆ, ಇದು ತಪ್ಪು ಧನಾತ್ಮಕಗಳಿಗೆ ಕಾರಣವಾಗುತ್ತದೆ. ಅವಾಸ್ತವಿಕ ನಿಯತಾಂಕ ತೂಕಗಳೊಂದಿಗೆ ನಿರ್ಮಿಸಲಾದ ಅಸಮತೋಲಿತ ಗಣಿತೀಯ ಮಾದರಿಗಳು ಇನ್ನೊಂದು ಸಾಮಾನ್ಯ ದುರುಪಯೋಗ ಮತ್ತು ಪತ್ತೆಹಚ್ಚಲು ಕಷ್ಟಕರವಾದದ್ದು. ಈ ಎಚ್ಚರಿಕೆಗಳಿಗೆ ಸೂಕ್ತ ಪರಿಗಣನೆಯೊಂದಿಗೆ, ಗಣಿತ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರವನ್ನು ಜೀವಶಾಸ್ತ್ರಕ್ಕೆ ಅನ್ವಯಿಸುವುದು ಹೆಚ್ಚು ಸಂಕೀರ್ಣ ಜೈವಿಕ ಸಮಸ್ಯೆಗಳನ್ನು ನಿಭಾಯಿಸಲು ಅಂತರ-ಶಿಸ್ತಿನ ಸ್ವರೂಪದ ಹೊಸ ಸಂಶೋಧನಾ ಕ್ಷೇತ್ರಗಳನ್ನು ತೆರೆಯಲು ಕಾರಣವಾಗಬಹುದು.
9.2 ಪರಿಚಯ
ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವು ಒಂದು ಅಂತರಶಿಸ್ತಿನ ಕ್ಷೇತ್ರವಾಗಿದ್ದು, ಜೈವಿಕ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಜೈವಿಕ ಮಾಹಿತಿಯನ್ನು ವಿಶ್ಲೇಷಿಸುವಲ್ಲಿ ಗಣನಾ, ಗಣಿತೀಯ, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮತ್ತು ಕೆಲವೊಮ್ಮೆ, ಎಂಜಿನಿಯರಿಂಗ್ ವಿಧಾನಗಳನ್ನು ಬಳಸುತ್ತದೆ (ಚಿತ್ರ 9.2). ಹೀಗಾಗಿ, ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವು ಕಂಪ್ಯೂಟರ್ ಆಧಾರಿತ ಸಾಫ್ಟ್ವೇರ್ ಮತ್ತು ಸಾಧನಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಜೈವಿಕ ದತ್ತಾಂಶದ ಸಂಗ್ರಹಣೆ, ಮರುಪಡೆಯುವಿಕೆ, ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ವ್ಯಾಖ್ಯಾನದೊಂದಿಗೆ ವ್ಯವಹರಿಸುತ್ತದೆ. ವ್ಯತ್ಯಾಸಗಳಿದ್ದರೂ, ಇದನ್ನು ‘ಗಣನಾ ಜೀವಶಾಸ್ತ್ರ,’ ‘ಗಣಿತೀಯ ಜೀವಶಾಸ್ತ್ರ,’ ‘ಪರಿಮಾಣಾತ್ಮಕ ಜೀವಶಾಸ್ತ್ರ’ ಮತ್ತು ‘ಜೀವ-ಸಂಖ್ಯಾಶಾಸ್ತ್ರ’ ಇತ್ಯಾದಿ ಪದಗಳೊಂದಿಗೆ ಪರ್ಯಾಯವಾಗಿ ಮತ್ತು ಪರಸ್ಪರ ಬದಲಾಯಿಸಿ ಬಳಸಲಾಗುತ್ತದೆ, ಪ್ರಬಲವಾದ ಶಿಸ್ತಿನ ಘಟಕಗಳನ್ನು ಅವಲಂಬಿಸಿ. ಆದಾಗ್ಯೂ, ಈ ವ್ಯಾಖ್ಯಾನಗಳ ಬಳಕೆಯು ತಜ್ಞರು ಮತ್ತು ಆಚರಣೆಕಾರರ ನಡುವೆ ಬದಲಾಗುತ್ತದೆ ಮತ್ತು ಕಾಲಾನಂತರದಲ್ಲಿ ಬದಲಾಗಿದೆ ಎಂಬುದನ್ನು ಗಮನಿಸಬೇಕು.

ಚಿತ್ರ 9.2: ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನದ ಅಂತರಶಿಸ್ತಿನ ಸ್ವರೂಪ: ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನ, ಗಣಿತ, ಎಂಜಿನಿಯರಿಂಗ್ ಮತ್ತು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದಂತಹ ಒಂದು ಅಥವಾ ಹೆಚ್ಚಿನ ಇತರ ಶಿಸ್ತುಗಳೊಂದಿಗೆ ಜೀವಶಾಸ್ತ್ರದ ಛೇದಕ
9.2.1. ಐತಿಹಾಸಿಕ ದೃಷ್ಟಿಕೋನ
ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವು ದತ್ತಾಂಶ ಗಣಿಗಾರಿಕೆಯ ಮೂಲಕ ಹೊಸ ಕಂಡುಹಿಡಿವುಗಳನ್ನು ಮತ್ತು ಹೊಸ ಕಲ್ಪನೆಯ ಉತ್ಪಾದನೆಯಲ್ಲಿ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದನ್ನು ಮಾಡೆಲಿಂಗ್ ಅಥವಾ ಆಣ್ವಿಕ ದತ್ತಾಂಶದ ವಿಶ್ಲೇಷಣೆಯ ಮೂಲಕ ಮಾಡಲಾಗುತ್ತದೆ. ಹೆಚ್ಚಿನ ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನದ ಸಾಧನಗಳು ಅನುಕ್ರಮ ಮತ್ತು ರಚನೆ ಡೇಟಾಬೇಸ್ಗಳಿಂದ ಪೂರ್ವ-ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ನ್ಯೂಕ್ಲಿಯೋಟೈಡ್ ಮತ್ತು ಪ್ರೋಟೀನ್ ದತ್ತಾಂಶವನ್ನು ಅಥವಾ ನ್ಯೂ-ಜನರೇಶನ್ ಅನುಕ್ರಮಣಕಾರಿಗಳು ಮತ್ತು ಡಿಎನ್ಎ ಮೈಕ್ರೋಅರೇಗಳಂತಹ ಹೆಚ್ಚಿನ-ಪ್ರಮಾಣದ ಉಪಕರಣಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಹೊಸದಾಗಿ ರಚಿಸಲಾದ ದತ್ತಾಂಶವನ್ನು ಬಳಸುತ್ತವೆ. ಯುಎಸ್ಎನಲ್ಲಿ ನ್ಯಾಶನಲ್ ಸೆಂಟರ್ ಫಾರ್ ಬಯೋಟೆಕ್ನಾಲಜಿ ಇನ್ಫರ್ಮೇಶನ್ (ಎನ್ಸಿಬಿಐ) ಅನ್ನು ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನದ ಸಾಧನಗಳು ಮತ್ತು ಸೇವೆಗಳಿಗೆ ಸಂಪನ್ಮೂಲವಾಗಿ ರಚಿಸಲಾಯಿತು. ಇದು ನ್ಯೂಕ್ಲಿಯೋಟೈಡ್ ಮತ್ತು ಗ್ರಂಥಸೂಚಿ ಡೇಟಾಬೇಸ್ಗಳನ್ನು ಹೊಂದಿದೆ. ಜೆನ್ಬ್ಯಾಂಕ್, ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುವ ಡೇಟಾಬೇಸ್ ಎಲ್ಲಾ ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಿರುವ ಡಿಎನ್ಎ ಅನುಕ್ರಮಗಳನ್ನು ಸಂಗ್ರಹಿಸುತ್ತದೆ, ಅದನ್ನು 1982 ರಲ್ಲಿ ಪ್ರಾರಂಭಿಸಲಾಯಿತು. ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವು ಪದದ ವ್ಯಾಪಕ ಬಳಕೆಗಿಂತ ಮುಂಚೆಯೇ ಅಭ್ಯಾಸ ಮಾಡಲ್ಪಟ್ಟರೂ, 1991 ರವರೆಗೆ ಅದು ಸಾಹಿತ್ಯದಲ್ಲಿ ಕಾಣಿಸಿಕೊಳ್ಳಲು ಪ್ರಾರಂಭಿಸಿತು. ಮಾನವ ಜೀನೋಮ್ ಯೋಜನೆಯ ಪ್ರಾರಂಭದ ನಂತರ ಮತ್ತು ಅನುಕ್ರಮ ದತ್ತಾಂಶದ ವಿಶ್ಲೇಷಣೆಗೆ ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನದ ಸಾಧನಗಳನ್ನು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಿದ ನಂತರ ಹೆಸರು ವ್ಯಾಪಕವಾದ ಸ್ವೀಕಾರವನ್ನು ಪಡೆಯಿತು. ಆದ್ದರಿಂದ, ಸಾಹಿತ್ಯದಲ್ಲಿ ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನ ಪದದ ಬಳಕೆಯು 30 ವರ್ಷಗಳಿಗಿಂತ ಹೆಚ್ಚಿಲ್ಲ. ಜೈವಿಕ ತಂತ್ರಜ್ಞಾನ ಮತ್ತು ಗಣನಾ ತಂತ್ರಜ್ಞಾನದಲ್ಲಿ ಮುನ್ನಡೆಗಳು ಮತ್ತು ಪ್ರವೇಶ್ಯತೆಯನ್ನು ಅನುಸರಿಸಿ, ಜೀನೋಮ್ ಅನುಕ್ರಮಣ ಮತ್ತು ಹೆಚ್ಚಿನ-ಪ್ರದರ್ಶನದ ಗಣನಾ ಯುಗದ ನಂತರ ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವು ವಿಶಾಲ ಆಕರ್ಷಣೆಯನ್ನು ಪಡೆದುಕೊಂಡಿದೆ. ಇದಕ್ಕಿಂತ ಮುಂಚೆ, ಕಡಿಮೆ ಪ್ರಮಾಣದ ಪರೀಕ್ಷೆಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದಾಗ, ಉದಾಹರಣೆಗೆ ಒಂದೇ ಜೀನ್ ಅಥವಾ ಸೂಕ್ಷ್ಮದರ್ಶಕದ ಅಡಿಯಲ್ಲಿ ರೂಪವಿಜ್ಞಾನವನ್ನು ಅಧ್ಯಯನ ಮಾಡುವ ಕ್ರಿಯೆಯನ್ನು ಅಧ್ಯಯನ ಮಾಡುವಾಗ, ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವನ್ನು ಇನ್ನೂ ಬಳಸಲಾಗುತ್ತಿತ್ತು ಆದರೆ ಸಣ್ಣ ಪ್ರಮಾಣದಲ್ಲಿ.
ರಚನಾತ್ಮಕ ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನವು ಅನುಕ್ರಮಣ ಮತ್ತು ಡಿಎನ್ಎ ಮೈಕ್ರೋಅರೇಗಳಂತಹ ಹೆಚ್ಚಿನ-ಪ್ರಮಾಣದ ಜೀನೋಮ್-ವ್ಯಾಪಕ ಪರೀಕ್ಷೆಗಳ ಆಧಾರದ ಮಾಹಿತಿ ವಿಜ್ಞಾನಕ್ಕಿಂತ ಮುಂಚಿತವಾಗಿದೆ. ಇದಕ್ಕೆ ಕಾರಣ, 1900 ರ ದಶಕದ ಆರಂಭದಲ್ಲಿ ಎನ್ಎಂಆರ್ ಸ್ಪೆಕ್ಟ್ರೋಸ್ಕೋಪಿ ಮತ್ತು ಎಕ್ಸ್-ರೇ ಸ್ಫಟಿಕಶಾಸ್ತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರೋಟೀನ್ಗಳ ಮೂರು-ಆಯಾಮದ ರಚನೆಗಳ ಅಧ್ಯಯನಗಳು, 2000 ರ ದಶಕದ ಆರಂಭದಲ್ಲಿ ಮಾತ್ರ ಪರಿಚಯಿಸಲಾದ ಜೀನೋಮ್ ಮತ್ತು ಇತರ -ಓಮ್ ಮಾಹಿತಿ ವಿಜ್ಞಾನಕ್ಕಿಂತ ಮುಂಚಿತವಾಗಿವೆ ಮತ್ತು ಇಂದಿನವರೆಗೆ ಮುಂದುವರೆದಿವೆ. ಪ್ರೋಟೀನ್ ಡೇಟಾ ಬ್ಯಾಂಕ್ (ಪಿಡಿಬಿ) ರಚನೆಗಳು ಮತ್ತು ಜೆನ್ಬ್ಯಾಂಕ್ ನಮೂದುಗಳ ಸಂಖ್ಯೆ ಪ್ರತಿ ವರ್ಷ ಬೆಳೆಯುತ್ತಿದೆ. ಜೀವ ಮಾಹಿತಿ ವಿಜ್ಞಾನದಲ್ಲಿ ಪ್ರಾಥಮಿಕ ಕಾಳಜಿಯೆಂದರೆ ಅನುಕ್ರಮ ಮತ್ತು ರಚನಾತ್ಮಕ ದತ್ತಾಂಶವನ್ನು ಡೇಟಾಬೇಸ್ಗಳ ರೂಪದಲ್ಲಿ ನಿರ್ವಹಿಸುವುದು ಮತ್ತು ಈ ಡೇಟಾಬೇಸ್ಗಳಿಂದ ದತ್ತಾಂಶವನ್ನು ಗಣಿಗಾರಿಕೆ ಮಾಡಿ ಜೈವಿಕ ಅರ್ಥಗಳನ್ನು ಪಡೆಯುವುದು. ಎನ್ಸಿಬಿಐ ವಿವಿಧ ವರ್ಗಗಳ ಅಡಿಯಲ್ಲಿ ನ್ಯೂಕ್ಲಿಯೋಟೈಡ್ ಮತ್ತು ಪ್ರೋಟೀನ್ ದತ್ತಾಂಶವನ್ನು ಹೋಸ್ಟ್ ಮಾಡುತ್ತದೆ (ಜೀನ್, ಜೀನೋಮ್, ರಚನೆ, ಅನುಕ್ರಮ, ಇತ್ಯಾದಿ). ಪ್ರಸ್ತುತ, ಅಪೂರ್ವ ದರದಲ್ಲಿ ಉತ್ಪಾದಿಸಲಾದ ಜೈವಿಕ ದತ್ತಾಂಶ, ಮತ್ತು ಅವುಗಳ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ವ್ಯಾಖ್ಯಾನದೊಂದಿಗೆ ನಿರ್ಣಾಯಕ ಜೈವಿಕ ಒಳನೋಟಗಳಿಗೆ ಕಾರಣವಾಗುತ್ತದೆ, ಹೆಚ್ಚಿನ ಆದ್ಯತೆಯನ್ನು ಪಡೆದುಕೊಂಡಿದೆ. ಹೊಸ, ಅತ್ಯುತ್ತಮ ಮತ್ತು ಉತ್ತಮ ಕ್ರಮಾವಳಿಗಳು ಮತ್ತು ಸಾಧನಗಳು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಹೊಂದಾಣಿಕೆಗಳು ಮತ್ತು ಬಹು ಕ್ಷೇತ್ರಗಳಿಂದ ಸಂಶ್ಲೇಷಣೆಯನ್ನು ಇದನ್ನು ಸಾಧಿಸಲು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗಿದೆ ಮತ್ತು ಅನುಷ್ಠಾನಗೊಳಿಸಲಾಗಿದೆ. ಆಣ್ವಿಕ ಮಾರ್ಗಗಳು, ಜೀನ್ ಅಭಿವ್ಯಕ್ತಿ, ಪ್ರೋಟೀನ್ ರಚನೆ ಮತ್ತು ಕಾರ್ಯ, ಸಂವಹನ ಜಾಲಗಳು, ರೋಗ-ಸಂಬಂಧಿತ ಬದಲಾವಣೆಗಳು, ಜೀವಿ ನಿರ್ದಿಷ್ಟತೆ ಮತ್ತು ನಿಯಂತ್ರಕ ಜಾಲಗಳಂತಹ ದ್ವಿತೀಯ ಮತ್ತು ತೃತೀಯ ಮಟ್ಟದ ಮಾಹಿತಿಯ ಆಧಾರದ ಡೇಟಾಬೇಸ್ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗಿದೆ