అధ్యాయం 11 ప్రోగ్రామింగ్ మరియు సిస్టమ్స్ బయాలజీ
11.1 జీవశాస్త్రంలో ప్రోగ్రామింగ్
మాన్యువల్ గణన యుగం నుండి, మనం ప్రస్తుతం పెద్ద స్థాయి (అనగా, హై-థ్రూపుట్) డేటా ఉత్పత్తి, ఆటోమేటెడ్ విశ్లేషణ మరియు అంచనా దశలో ఉన్నాము. సాంకేతిక పురోగతులు భారీ డేటాను ఉత్పత్తి చేయడానికి వరంగా నిరూపించబడ్డాయి, ఇది కొన్ని దశాబ్దాల క్రితం ఊహించలేనిది మరియు మరింత కష్టమైన ప్రశ్నలను నిర్వహిస్తుంది. అయితే, భారీ డేటా రావడం డేటా నిల్వ, విజువలైజేషన్, బదిలీ, విశ్లేషణ మరియు వివరణలో కూడా భారీ సవాళ్లను విసిరింది. ఒక దశాబ్దం క్రితం భారీగా కనిపించిన పని ఇప్పుడు చిన్నదిగా అనిపిస్తుంది.
కృత్రిమ మేధస్సు మరియు యంత్ర అభ్యాస పద్ధతుల ఆవిర్భావం దాదాపు ప్రతి రంగంలోనూ పరిశోధన పద్ధతులను మార్చివేసింది. భవిష్యత్తులో, సైన్స్ యొక్క అత్యాధునిక అంచున పనిచేస్తున్న యువ బయోటెక్నాలజీ విద్యార్థులకు ప్రాథమిక ప్రోగ్రామింగ్ జ్ఞానం మరియు రసాయన శాస్త్రం మరియు గణాంక పద్ధతులతో సౌకర్యం అవసరం కావచ్చని ఇప్పుడు స్పష్టంగా తెలుస్తోంది.
ఈ అధ్యాయం యొక్క ఉద్దేశ్యం ప్రోగ్రామింగ్ భాషలను సమగ్రంగా వివరించడం కాదు, కానీ జీవశాస్త్రవేత్తలకు సంబంధించిన కొన్ని అత్యంత ప్రసిద్ధ హై లెవెల్ భాషలకు సున్నితమైన పరిచయాన్ని అందించడం.
బయోఇన్ఫర్మాటిక్స్ సాఫ్ట్వేర్ అందుబాటులో ఉన్న అన్ని ఆపరేటింగ్ సిస్టమ్ (OS) ప్లాట్ఫారమ్ల కోసం అభివృద్ధి చేయబడుతున్నప్పటికీ, విజయవంతమైన అప్లికేషన్లలో ఎక్కువ భాగం లైనక్స్ ప్లాట్ఫారమ్లో అభివృద్ధి చేయబడ్డాయి. బయోఇన్ఫర్మాటిక్స్ ప్రారంభం నుండి, PERL ఎల్లప్పుడూ సీక్వెన్స్ ఆధారిత పెద్ద డేటా నిర్వహణ కేంద్రంలో ఉంది. ఈ రోజుల్లో ఈ ప్లాట్ఫారమ్లు అధునాతన పనితీరు భాషతో సమృద్ధి చేయబడుతున్నాయి, సాధారణంగా పైథాన్ మరియు $R$ జీవసంబంధ సమస్యలను పరిష్కరించడానికి గణాంక ప్యాకేజీల బలమైన సౌకర్యాలను అందిస్తుంది. అదేవిధంగా, పైథాన్ మాడ్యూల్స్ స్టాండ్ అలోన్, వెబ్ సర్వర్ మరియు క్లౌడ్ కంప్యూటింగ్లో పెద్ద డేటా సెట్ను నిర్వహించడానికి విజువలైజేషన్ మరియు విశ్లేషణ మాడ్యూళ్ళతో నిరంతరం సమృద్ధి చేయబడుతున్నాయి. వీటికి మించి, MATLAB కూడా బయోఇన్ఫర్మాటిక్స్ డేటా విశ్లేషణ కోసం చాలా మంచి ప్లాట్ఫారమ్ను కలిగి ఉంది. బయోఇన్ఫర్మాటిక్స్ ప్రాంతంలో చురుకుగా ఉన్న కొన్ని అత్యంత అధునాతన భాషల వివరణ క్రింద ఇవ్వబడింది:
పైథాన్: ఇది గైడో వాన్ రోసమ్ (1991) సృష్టించిన హై లెవెల్ ప్రోగ్రామింగ్ జనరల్ పర్పస్ భాష. ఇది యునిక్స్, మాక్ మరియు విండోస్లో నడిచే ఆబ్జెక్ట్ ఓరియెంటెడ్ ప్రోగ్రామింగ్ ఇంటరాక్టివ్ భాష. పైథాన్ బయోఇన్ఫర్మాటిక్స్ సమాజంలో చాలా ప్రాచుర్యం పొందింది, ప్రధానంగా ఎందుకంటే: (i) ఉపయోగించిన పదాల స్పష్టమైన అర్థం మరియు స్టేట్మెంట్ల నిర్మాణం (ii) దాని వ్యక్తీకరణ మరియు ఆబ్జెక్ట్-ఓరియెంటెడ్ ప్రోగ్రామింగ్కు సమలేఖనం, మరియు (iii) లైబ్రరీలు మరియు మూడవ పక్ష టూల్కిట్ల లభ్యత. పైథాన్ సీక్వెన్స్ మరియు నిర్మాణ విశ్లేషణలు, ఫైలోజెనెటిక్స్ మొదలైన వాటికి విజయవంతంగా ఉపయోగించబడింది.
$\mathbf{R}$ : $\mathrm{R}$ అనే పేరు దాని ఆవిష్కర్తలైన రాబర్ట్ జెంటిల్మాన్ మరియు రాబర్ట్ ఇహకా నుండి ఉద్భవించింది, వారు ఈ భాషను అభివృద్ధి చేశారు. $\mathrm{R}$ భాష జీవసంబంధ డేటా యొక్క హై వాల్యూమ్ విశ్లేషణ, విజువలైజేషన్ మరియు సిమ్యులేషన్కు అనువైన శీఘ్ర మరియు నమ్మదగిన ఫంక్షనల్ ప్రోగ్రామింగ్ భాషగా విస్తృతమైన అంగీకారాన్ని పొందింది. ఈ సాఫ్ట్వేర్ ఉచితం మరియు ఓపెన్ సోర్స్. $\mathrm{R}$ భాష జీనోమ్ సీక్వెన్స్ మరియు బయోమాలిక్యులర్ మార్గాల విశ్లేషణ కోసం ఉపయోగించబడింది.
డేటా విశ్లేషణ నుండి సిస్టమ్లను రూపకల్పన చేయడానికి వెళ్లడంతో, కొత్త ప్రోగ్రామింగ్ భాషలు ఉద్భవించాయి. వాటిలో- GEC (జెనెటిక్ ఇంజనీరింగ్ ఆఫ్ లివింగ్ సెల్స్), మైక్రోసాఫ్ట్ చే అభివృద్ధి చేయబడిన రూల్-బేస్డ్ భాష మరియు కేర, కేరళ విశ్వవిద్యాలయం యొక్క డాక్టర్ ఉమేష్ పి చే అభివృద్ధి చేయబడిన ఆబ్జెక్ట్ ఓరియెంటెడ్ నాలెడ్జ్ బేస్డ్ ప్రోగ్రామింగ్ భాష. కేర (కేరళ యొక్క సంక్షిప్త రూపం, కొబ్బరి అని కూడా అర్థం) జీనోమ్, ప్రోటీన్లు మరియు కణం గురించిన సమాచారాన్ని సంహిత అనే వినియోగదారు సవరించిన జీవశాస్త్ర గ్రంథాలయాన్ని ఉపయోగించి సంగ్రహిస్తుంది.
11.2 సిస్టమ్స్ బయాలజీ
11.2.1 పరిచయం
మీకు తెలిసినట్లుగా, ప్రకృతి యొక్క రహస్యాలను అర్థం చేసుకోవడానికి, శాస్త్రవేత్తలు ప్రాచీన కాలం నుండి ప్రయోగాలు చేస్తున్నారు. ఈ ప్రయోగాల ఫలితాలు సాహిత్యంలో డేటా రూపంలో నమోదు చేయబడతాయి. చిన్న డేటా బిట్ల నుండి పెద్ద వాటి వరకు, దశాబ్దాల ప్రయోగాత్మక ప్రయత్నాల నుండి డేటా సేకరించబడుతోంది. ప్రస్తుతం, పెద్ద పరిమాణంలో జీవశాస్త్ర డేటా ఉత్పత్తి చేయబడుతుంది మరియు డేటాబేస్లు అని పిలువబడే వివిధ రకాల నిల్వ గదులలో డిజిటల్ ఫార్మాట్లో నిల్వ చేయబడుతుంది. ఈ డిజిటల్ డేటా వనరులు, ఇవి పరిశోధకులు మన సంక్లిష్టమైన జీవ వ్యవస్థల వలె పనులు చేయగల కంప్యూటేషనల్ మోడల్లను అభివృద్ధి చేయడానికి పునాదిగా ఉంటాయి, అనగా వాస్తవ ఇన్-విట్రో/ఇన్-వివో ప్రయోగాలు లేదా వాస్తవ జీవితంలో మనం గమనించేవి. అటువంటి ఆలోచనల అమలు సంక్లిష్టమైన జీవ వ్యవస్థలను అనుకరించడానికి గణిత మరియు కంప్యూటేషనల్ మోడల్లతో నిర్వహించబడుతోంది. ఈ మోడల్లను సిస్టమ్ మోడల్లు అంటారు. అందువల్ల, మీరు సిస్టమ్స్ బయాలజీని సిస్టమ్ మోడల్ల ప్రాతినిధ్యంగా ఊహించవచ్చు. ఈ రోజుల్లో సిస్టమ్స్ బయాలజీ శక్తివంతమైన అనువర్తనంతో తీవ్ర పరిశోధనల ప్రాంతంగా మారింది. ఈ విధంగా, ఇది జీవ వ్యవస్థల్లోని సంక్లిష్టమైన జీవసంబంధ పరస్పర చర్యలపై దృష్టి సారించే అంతరశాఖా అధ్యయన రంగం (Fig. 11. 1). సిస్టమ్స్ బయాలజీ యొక్క భావన వివిధ రకాల జీవశాస్త్ర సందర్భాలలో, ప్రత్యేకించి గత రెండు దశాబ్దాల నుండి స్వీకరించబడుతోంది. మానవ జీనోమ్ ప్రాజెక్ట్ సిస్టమ్స్ బయాలజీ యొక్క ఆలోచన యొక్క అత్యంత గొప్ప విత్తనాలలో ఒకటి, ఇది నేటి రూపం యొక్క సిస్టమ్స్ బయాలజీకి కొత్త మార్గాలకు దారితీసింది. ప్రస్తుతం, సిస్టమ్స్ బయాలజీ మోడల్లు కణాలు, కణజాలాలు మరియు జీవుల యొక్క ఉద్భవించే క్రియాత్మక లక్షణాల కనుగొనడానికి సైద్ధాంతిక వివరణను అందించగలవు, ఇవి ప్రయోగాల ద్వారా మాత్రమే సాధ్యమయ్యేవి. అత్యంత సమర్థవంతమైన సిస్టమ్ మోడల్ల ఉదాహరణలు మెటబాలిక్ లేదా సిగ్నలింగ్ నెట్వర్క్. జీవ వ్యవస్థల చర్య యొక్క యాంత్రికత యొక్క ప్రాథమిక అవగాహనతో పాటు, సిస్టమ్స్ బయాలజీ శక్తివంతమైన అనువర్తనీయత కోసం తీవ్రంగా ఉపయోగించబడుతోంది, ఉదాహరణకు, ఆరోగ్యం మరియు వ్యాధుల ప్రాంతాలలో జీవ నెట్వర్క్ల నుండి ఆధునిక చికిత్సా పద్ధతుల వరకు.
11.2.2 చారిత్రక దృక్పథం
సిస్టమ్స్ బయాలజీ ఆవిర్భావానికి ముందు, జీవశాస్త్రాలలో పరిశోధన దృశ్యం (ఉదా., 1900 - 1970) ఫిజియాలజీ, జనాభా డైనమిక్స్, ఎంజైమ్ కైనెటిక్స్, కంట్రోల్ థియరీ, సైబర్నెటిక్స్ మొదలైన వాటి చుట్టూ పరిశోధన యొక్క విభాగాల భాగాలుగా తిరుగుతూ ఉండేది. సిస్టమ్స్ బయాలజీ ఒక ఫిజియాలజికల్ వివరణ నుండి పరిణామం చెందిందని మ్యాప్ చేయబడింది, 1952లో అలాన్ లాయిడ్ హాడ్జ్కిన్ మరియు ఆండ్రూ ఫీల్డింగ్ హక్స్లీ (నోబెల్ బహుమతి గ్రహీతలు) న్యూరోనల్ కణం యొక్క అక్షాంశం వెంట యాక్షన్ పొటెన్షియల్ ప్రచారానికి గణిత మోడల్ను వివరించినప్పుడు. 1960లో సిద్ధాంతం యొక్క మరింత పరిణతి చెందిన అమలు ఎదురైంది, డెనిస్ నోబుల్ [PMID 13729365] చే హృదయ పేస్మేకర్ యొక్క మొదటి కంప్యూటర్ మోడల్ అభివృద్ధి చేయబడినప్పుడు. సిస్టమ్స్ బయాలజీని సిస్టమ్స్ థియరిస్ట్ మిహాజ్లో మెసరోవిక్ 1966లో క్లీవ్లాండ్, ఓహియోలోని కేస్ ఇన్స్టిట్యూట్ ఆఫ్ టెక్నాలజీలో “సిస్టమ్స్ థియరీ అండ్ బయాలజీ” అనే శీర్షికతో అధికారికంగా ప్రారంభించారు. 1968లో, లుడ్విగ్ వాన్ బెర్టలాన్ఫీ చే సిస్టమ్స్ బయాలజీపై మొదటి సిద్ధాంతం ప్రచురించబడింది, ఇది ఈ విభాగానికి పూర్వగామిగా పరిగణించబడుతుంది. 1960లు మరియు 1970ల మధ్య కాలం మెటబాలిక్ కంట్రోల్ అనాలిసిస్ మరియు బయోకెమికల్ సిస్టమ్స్ థియరీ వంటి సంక్లిష్టమైన మాలిక్యులర్ సిస్టమ్ల బహుళ అంశాల అభివృద్ధి దశాబ్దం. ఇంకా, మాలిక్యులర్ బయాలజీతో సిస్టమ్స్ థియరీ యొక్క సంశయవాదం థియరెటికల్ బయాలజీ అభివృద్ధి ద్వారా విచ్ఛిన్నమైంది, ఇందులో జీవ ప్రక్రియల పరిమాణాత్మక మోడలింగ్ ఉంటుంది. 1990ల నుండి, ఫంక్షనల్ జెనోమిక్స్ అధిక-నాణ్యత జీవశాస్త్ర డేటాను పెద్ద మొత్తంలో ఉత్పత్తి చేస్తోంది, ఇవి మరింత వాస్తవిక మోడల్ల అభివృద్ధికి సహాయపడుతున్నాయి. సిస్టమ్స్ బయాలజీ ప్రాంతంలో ఈ అభివృద్ధుల కొనసాగింపులో, నేషనల్ సైన్స్ ఫౌండేషన్ (NSF) మొత్తం కణాన్ని గణితశాస్త్రపరంగా మోడల్ చేయడానికి ఒక సవాళ్ళను ముందుకు తెచ్చింది. ఈ దిశలో, 2003లో, మసాచుసెట్స్ ఇన్స్టిట్యూట్ ఆఫ్ టెక్నాలజీ సైటోసాల్వ్తో సహకారంలో ఈ సవాళ్ళకు పరిష్కారం కోసం శోధన ప్రారంభించింది. చివరకు, 2012లో మైకోప్లాస్మా జెనిటాలియం (కణ గోడ లేని బ్యాక్టీరియం) యొక్క మొత్తం కణ మోడల్, జన్యు మ్యుటేషన్లకు ప్రతిస్పందనగా కణ వైజీవ్యాన్ని అంచనా వేయడానికి, న్యూయార్క్లోని మౌంట్ సినాయ్ స్కూల్ ఆఫ్ మెడిసిన్ చే అభివృద్ధి చేయబడింది. ప్రస్తుతం, ఒక పెద్ద సిస్టమ్స్ బయాలజీ ప్రాజెక్ట్, అనగా ‘ఫిజియోమ్’ నడుస్తోంది (http:/physiomeproject.org/). ఈ ప్రాజెక్ట్ ఫిజియాలజికల్ ఫంక్షన్ను అర్థం చేసుకోవడానికి ఒక మల్టీ-స్కేల్ మోడలింగ్ ఫ్రేమ్వర్క్ను అభివృద్ధి చేయడాన్ని లక్ష్యంగా పెట్టుకుంది, ఇది మోడల్లను హైరార్కికల్ ఫ్యాషన్లో కలపడానికి మరియు లింక్ చేయడానికి అనుమతిస్తుంది. ఉదాహరణకు, గుండె యొక్క ఎలక్ట్రోమెకానికల్ మోడల్లు, అయాన్ ఛానల్స్, మయోఫిలమెంట్ మెకానిక్స్ మరియు సబ్సెల్యులర్ స్థాయిలో సిగ్నల్ ట్రాన్స్డక్షన్ మార్గాల మోడల్లతో కలపడం అవసరం మరియు తరువాత ఈ ప్రక్రియలను కణజాల యాంత్రికత, వేవ్ఫ్రంట్ ప్రచారం మరియు కరోనరీ రక్త ప్రవాహం యొక్క మోడల్లకు లింక్ చేయడం - వీటిలో ప్రతి ఒక్కటి వేర్వేరు పరిశోధకుల సమూహం ద్వారా అభివృద్ధి చేయబడి ఉండవచ్చు.
11.2.3 సిస్టమ్స్ బయాలజీ వెనుక ఉన్న థీమ్
జీవశాస్త్రం యొక్క వివిధ విభాగాలను కవర్ చేయడానికి, సిస్టమ్స్ బయాలజీని వివిధ కోణాల నుండి గమనించారు. రిడక్షనిస్ట్ వ్యవస్థ యొక్క భాగాలు మరియు పరస్పర చర్యల గుర్తింపుపై పని చేశారు

Fig. 11.1: సిస్టమ్స్ బయాలజీని జీవ వ్యవస్థల్లోని సంక్లిష్టమైన జీవసంబంధ పరస్పర చర్యలపై దృష్టి సారించే అంతరశాఖా అధ్యయన రంగంగా చిత్రీకరణ
కానీ వ్యవస్థ యొక్క బహుళత్వాన్ని వివరించడానికి ఎటువంటి ఒప్పించే పద్ధతి పరిణామం చెందలేదు. బహుళత్వాన్ని బహుళ భాగాల పరిమాణాత్మక కొలతల ద్వారా మెరుగ్గా గమనించవచ్చు మరియు ఇది కఠినమైన డేటా ఇంటిగ్రేషన్ను కలిగి ఉన్న గణిత మోడల్ల ద్వారా మాత్రమే సాధ్యమవుతుంది. ఈ విధంగా సిస్టమ్స్ బయాలజీ అనేది వేర్వేరు భాగాలను ఇంటిగ్రేట్ చేయడం ద్వారా వ్యవస్థను గమనించడం అని చెప్పవచ్చు (Fig.11.1). సిస్టమ్స్ బయాలజీ యొక్క థీమ్ యొక్క కేంద్రంలో అన్ని వ్యక్తిగత భాగాలను కలిపి కవర్ చేయడం: ‘ఆబ్జెక్ట్ నెట్వర్క్ మ్యాపింగ్ మరియు పార్షియల్ డిఫరెన్షియల్ ఈక్వేషన్లతో అన్యోన్య ఆధారిత డైనమిక్ ఈవెంట్-కైనెటిక్స్తో దాని ఇంటిగ్రేషన్’.
11.2.4 సిస్టమ్స్ బయాలజీ ప్రయోగాల ప్రోటోకాల్
ఒక ప్రామాణిక సిస్టమ్స్ బయాలజీ ప్రయోగాన్ని నిర్వహించడానికి, Fig.11.2లో చూపిన విధంగా వివిక్త దశలు అనుసరించబడతాయి.
మొత్తం ప్రోటోకాల్ ప్రాథమికంగా సమస్య యొక్క నిర్వచనం, ప్రయోగం యొక్క రూపకల్పన, డేటాను ఉత్పత్తి చేయడానికి ప్రయోగాల అమలు, ఫలిత డేటా సేకరణ మరియు వాటి అమరికను తగిన ఫైల్ ఫార్మాట్లలో చేయడం మరియు తరువాత నెట్వర్క్ ఇన్ఫరెన్స్ అభివృద్ధిని కలిగి ఉంటుంది. దీనిని ఈ నెట్వర్క్ ఇంటర్ఫేస్ బదిలీ అనుసరిస్తుంది, ఇది ఖచ్చితమైనదిగా మరియు మెకానిజం ఆధారితంగా ఉండాలి, తద్వారా మోడల్ దానికి అనుగుణంగా అభివృద్ధి చేయబడుతుంది. ఇది మరింత మోడల్ ఆధారిత సిమ్యులేషన్ ఫలితాలు మరియు ప్రయోగాత్మక డేటా మధ్య వ్యత్యాసాల విశ్లేషణను అనుసరిస్తుంది మరియు దానికి అనుగుణంగా గమనించిన వ్యత్యాసాలను సూచిస్తూ పరికల్పనను మోడల్ చేస్తుంది. చివరగా, సిమ్యులేషన్ పునరావృతం చేయబడుతుంది మరియు మళ్లీ మళ్లీ పరీక్షించబడుతుంది మరియు కొత్త పరికల్పనలు మోడల్లోకి సమీకరించబడతాయి.
ఈ విధంగా, సిస్టమ్స్ బయాలజీ కోసం గణన యొక్క వర్క్ ఫ్లో (Fig. 11.2లో చూపిన విధంగా) డేటా-నిర్వహణ, నెట్వర్క్ అభివృద్ధి పారామితుల ఆప్టిమైజేషన్, పనితీరు విశ్లేషణ మరియు మూల్యాంకనం అవసరం.

Fig. 11.2: సిస్టమ్స్ బయాలజీ ప్రయోగం అమలు కోసం వర్క్ఫ్లో
సిస్టమ్స్ బయాలజీ కోసం నిర్మాణ డేటా సేకరణ కోసం డేటా నిర్వహణ ప్రమాణాలు నిర్వచించబడ్డాయి. దీని ప్రకారం, డేటా నిర్వహణ కోసం మూడు ప్రాథమిక అంశాలు పరిగణించబడతాయి, అవి క్రింద వివరించబడ్డాయి-
(i) కనీస సమాచారం
కనీస సమాచారం మైక్రోఅరే, ప్రోటియోమిక్, జీవశాస్త్ర మరియు జీవవైద్య పరిశోధనల నుండి అవసరమైన మద్దతు సమాచారం యొక్క సమితిని సూచిస్తుంది. ఈ సేకరించిన డేటా గురించి మెటాడేటాను ఇంటిగ్రేట్ చేయడం శ్రద్ధ వహించాల్సిన ముఖ్యమైన విషయం.
(ii) ఫైల్ ఫార్మాట్లు
కనీస సమాచారం కోసం సేకరించిన డేటా నిర్దిష్ట ఫైల్ ఫార్మాట్లల