અધ્યાય 11 પ્રોગ્રામિંગ અને સિસ્ટમ બાયોલોજી

11.1 બાયોલોજીમાં પ્રોગ્રામિંગ

મેન્યુઅલ કોમ્પ્યુટેશનના યુગમાંથી, આપણે હાલમાં મોટા પાયે (એટલે કે, હાઇ-થ્રુપુટ) ડેટા જનરેશન, સ્વચાલિત વિશ્લેષણ અને આગાહીના દોરમાં છીએ. તકનીકી પ્રગતિએ વિશાળ ડેટા જનરેટ કરવા માટે વરદાન સાબિત થઈ છે, જે થોડા દાયકા પહેલા અકલ્પનીય હતી અને જે વધુ મુશ્કેલ પ્રશ્નો સંભાળે છે. જોકે, વિશાળ ડેટાના આગમનથી ડેટાના સંગ્રહ, વિઝ્યુલાઇઝેશન, ટ્રાન્સફર, વિશ્લેષણ અને અર્થઘટનમાં પણ મોટા પડકારો ઊભા થયા છે. એક દાયકા પહેલા જે કાર્ય વિશાળ લાગતું હતું તે હવે તુચ્છ લાગે છે.

કૃત્રિમ બુદ્ધિ અને મશીન લર્નિંગ તકનીકોના ઉદયે લગભગ દરેક ક્ષેત્રમાં સંશોધન પ્રથાઓ બદલી નાખી છે. તે વધુને વધુ સ્પષ્ટ થઈ રહ્યું છે કે, ભવિષ્યમાં, વિજ્ઞાનની અગ્રણી ધાર પર કામ કરતા યુવા બાયોટેકનોલોજીના વિદ્યાર્થીઓને મૂળભૂત પ્રોગ્રામિંગ જ્ઞાન અને રસાયણશાસ્ત્ર અને આંકડાશાસ્ત્રીય પદ્ધતિઓ સાથે સગવડની જરૂર પડશે.

આ અધ્યાયનો હેતુ પ્રોગ્રામિંગ ભાષાઓનું વિસ્તૃત વર્ણન આપવાનો નથી, પરંતુ બાયોલોજિસ્ટો માટે સંબંધિત કેટલીક સૌથી લોકપ્રિય હાઇ લેવલ ભાષાઓનો સૌમ્ય પરિચય આપવાનો છે.

જોકે બાયોઇન્ફોર્મેટિક્સ સોફ્ટવેર ઉપલબ્ધ તમામ ઓપરેટિંગ સિસ્ટમ (OS) પ્લેટફોર્મ માટે વિકસાવવામાં આવી રહ્યું છે, પરંતુ મોટાભાગના સફળ એપ્લિકેશન Linux પ્લેટફોર્મ પર વિકસાવવામાં આવ્યા છે. બાયોઇન્ફોર્મેટિક્સની શરૂઆતથી, PERL હંમેશા સિક્વન્સ આધારિત મોટા ડેટા હેન્ડલિંગના કેન્દ્રમાં રહ્યું છે. આજકાલ આ પ્લેટફોર્મ એડવાન્સ પરફોર્મિંગ ભાષા, સામાન્ય રીતે Python અને $R$ દ્વારા સમૃદ્ધ બનાવવામાં આવી રહ્યા છે જે બાયોલોજિકલ સમસ્યાઓ ઉકેલવા માટે આંકડાકીય પેકેજોની મજબૂત સુવિધાઓ પૂરી પાડે છે. તે જ રીતે, Python મોડ્યુલો સ્ટેન્ડએલોન, વેબ સર્વર તેમજ ક્લાઉડ કોમ્પ્યુટિંગ પર મોટા ડેટા સેટના હેન્ડલિંગ માટે વિઝ્યુલાઇઝેશન અને વિશ્લેષણ મોડ્યુલો દ્વારા સતત સમૃદ્ધ બનાવવામાં આવી રહ્યા છે. આ ઉપરાંત, MATLAB પણ બાયોઇન્ફોર્મેટિક્સ ડેટા વિશ્લેષણ માટે ખૂબ સારું પ્લેટફોર્મ ધરાવે છે. બાયોઇન્ફોર્મેટિક્સના ક્ષેત્રમાં સક્રિય, સૌથી અદ્યતન ભાષાઓમાંથી થોડીકનું વર્ણન નીચે આપેલું છે:

Python: તે ગુઇડો વાન રોસમ (1991) દ્વારા રચિત એક હાઇ લેવલ પ્રોગ્રામિંગ જનરલ પરપઝ ભાષા છે. તે ઑબ્જેક્ટ ઓરિએન્ટેડ પ્રોગ્રામિંગ ઇન્ટરએક્ટિવ ભાષા છે જે unix, mac અને windows પર ચાલી શકે છે. Python બાયોઇન્ફોર્મેટિક્સ સમુદાયમાં ખૂબ લોકપ્રિય છે મુખ્યત્વે કારણ કે: (i) વપરાયેલ શબ્દોના સ્પષ્ટ અર્થ અને સ્ટેટમેન્ટ્સની રચના (ii) તેની અભિવ્યક્તિ અને ઑબ્જેક્ટ-ઓરિએન્ટેડ પ્રોગ્રામિંગ સાથે સંરેખણ, અને (iii) લાઇબ્રેરીઓ અને તૃતીય-પક્ષ ટૂલકીટ્સની ઉપલબ્ધતા. Python નો સફળતાપૂર્વક સિક્વન્સ અને સ્ટ્રક્ચર એનાલિસિસ, ફાયલોજેનેટિક્સ વગેરે માટે ઉપયોગ થયો છે.

$\mathbf{R}$ : નામ $\mathrm{R}$ તેના શોધકો, રોબર્ટ જેન્ટલમેન અને રોબર્ટ ઇહાકા પરથી લેવામાં આવ્યું છે, જેમણે આ ભાષા વિકસાવી હતી. $\mathrm{R}$ ભાષાએ બાયોલોજિકલ ડેટાના હાઇ વોલ્યુમ એનાલિસિસ, વિઝ્યુલાઇઝેશન અને સિમ્યુલેશન માટે આદર્શ એવી ઝડપી અને વિશ્વસનીય ફંક્શનલ પ્રોગ્રામિંગ ભાષા તરીકે વ્યાપક સ્વીકૃતિ મેળવી છે. સોફ્ટવેર મફત અને ઓપન સોર્સ છે. $\mathrm{R}$ ભાષાનો ઉપયોગ જીનોમ સિક્વન્સ અને બાયોમોલેક્યુલર પાથવેનું વિશ્લેષણ કરવા માટે થયો છે.

ડેટા એનાલિસિસથી સિસ્ટમ્સ ડિઝાઇનિંગ તરફ જતાં, નવી પ્રોગ્રામિંગ ભાષાઓ ઉભી થઈ છે. તેમાંના છે- GEC (જેનેટિક એન્જિનિયરિંગ ઑફ લિવિંગ સેલ્સ), Microsoft દ્વારા વિકસાવેલી રૂલ-બેસ્ડ ભાષા અને કેરા, યુનિવર્સિટી ઑફ કેરળના ડૉ. ઉમેશ પી દ્વારા વિકસાવેલી ઑબ્જેક્ટ ઓરિએન્ટેડ નોલેજ બેસ્ડ પ્રોગ્રામિંગ ભાષા. કેરા (કેરળનું ટૂંકું રૂપ, જેનો અર્થ નારિયેલ પણ થાય છે) સંહિતા નામની વપરાશકર્તા-સંપાદિત બાયોલોજિકલ લાઇબ્રેરીનો ઉપયોગ કરીને જીનોમ, પ્રોટીન્સ અને સેલ વિશેની માહિતી કેપ્ચર કરે છે.

11.2 સિસ્ટમ્સ બાયોલોજી

11.2.1 પરિચય

જેમ તમે જાણો છો, પ્રકૃતિના રહસ્યો સમજવા માટે, વૈજ્ઞાનિકો પ્રાચીન સમયથી પ્રયોગો કરી રહ્યા છે. આ પ્રયોગોના નિષ્કર્ષો સાહિત્યમાં ડેટાના રૂપમાં રેકોર્ડ કરવામાં આવે છે. નાના બીટ ડેટાથી લઈને મોટા ડેટા સુધી, દાયકાઓના પ્રયોગાત્મક પ્રયાસોથી ડેટા એકત્રિત કરવામાં આવી રહ્યા છે. હાલમાં, બાયોલોજી ડેટાનો મોટો જથ્થો જનરેટ થઈ રહ્યો છે અને ડેટાબેઝ તરીકે ઓળખાતા વિવિધ સ્ટોરહાઉસમાં ડિજિટલ ફોર્મેટમાં સંગ્રહિત થઈ રહ્યો છે. આ ડિજિટલ ડેટા એવા સંશોધન સ્રોતો છે જે સંશોધકો માટે આવા કોમ્પ્યુટેશનલ મોડલ્સ વિકસાવવાનો પાયો બનાવે છે જે આપણી જટિલ બાયોલોજિકલ સિસ્ટમ્સ જેવા કાર્યો કરી શકે, એટલે કે, જે આપણે વાસ્તવિક ઇન-વિટ્રો/ઇન-વિવો પ્રયોગો અથવા વાસ્તવિક જીવનમાં અવલોકન કરીએ છીએ. આવા વિચારોનું અમલીકરણ જટિલ બાયોલોજિકલ સિસ્ટમ્સની નકલ કરવા માટે ગાણિતિક અને કોમ્પ્યુટેશનલ મોડલ્સ સાથે કરવામાં આવી રહ્યું છે. આ મોડલ્સને સિસ્ટમ મોડલ્સ કહેવામાં આવે છે. તેથી, તમે સિસ્ટમ્સ બાયોલોજીને સિસ્ટમ મોડલ્સના પ્રતિનિધિત્વ તરીકે વિઝ્યુઅલાઇઝ કરી શકો છો. આજકાલ સિસ્ટમ્સ બાયોલોજી ગહન સંશોધન અને શક્તિશાળી એપ્લિકેશન સાથેનું ક્ષેત્ર બની ગઈ છે. આમ, તે અભ્યાસનું આંતરશાખાકીય ક્ષેત્ર છે જે બાયોલોજિકલ સિસ્ટમ્સની અંદર જટિલ બાયોલોજિકલ ક્રિયાપ્રતિક્રિયાઓ પર ધ્યાન કેન્દ્રિત કરે છે (ફિગ. 11. 1). સિસ્ટમ્સ બાયોલોજીની વિભાવના છેલ્લા બે દાયકાથી, વિવિધ બાયોલોજિકલ સંદર્ભોમાં અપનાવવામાં આવી રહી છે. માનવ જીનોમ પ્રોજેક્ટ સિસ્ટમ્સ બાયોલોજીના વિચારની સૌથી ગૌરવશાળી બીજારોપણીમાંની એક છે, જેણે આજની સિસ્ટમ્સ બાયોલોજીના નવા માર્ગો ખોલ્યા છે. હાલમાં, સિસ્ટમ્સ બાયોલોજી મોડલ્સ કોષો, પેશીઓ અને જીવોના ઉદ્ભવતા કાર્યાત્મક ગુણધર્મોની શોધ માટે સૈદ્ધાંતિક વર્ણન પૂરું પાડી શકે છે, જે પ્રયોગો દ્વારા જ શક્ય હતા. સૌથી કાર્યક્ષમ સિસ્ટમ મોડલ્સના ઉદાહરણો મેટાબોલિક અથવા સિગ્નલિંગ નેટવર્ક છે. બાયોલોજિકલ સિસ્ટમ્સની ક્રિયાની કાર્યપદ્ધતિની મૂળભૂત સમજ સાથે, સિસ્ટમ્સ બાયોલોજીનો ઉપયોગ શક્તિશાળી લાગુક્ષમતા માટે ગહન રીતે થઈ રહ્યો છે, ઉદાહરણ તરીકે, બાયોલોજિકલ નેટવર્કથી આધુનિક ઉપચારો સુધીના આરોગ્ય અને રોગોના ક્ષેત્રોમાં.

11.2.2 ઐતિહાસિક પરિપ્રેક્ષ્ય

સિસ્ટમ્સ બાયોલોજીના ઉદય પહેલાં, બાયોલોજિકલ સાયન્સમાં સંશોધનનું દૃશ્ય (ઉદા. 1900 - 1970) ફિઝિયોલોજી, પોપ્યુલેશન ડાયનેમિક્સ, એન્ઝાઇમ કાઇનેટિક્સ, કંટ્રોલ થિયરી, સાઇબરનેટિક્સ વગેરેની આસપાસ ફરતું હતું, જે સંશોધનના વિભાગીય ઘટકો તરીકે હતા. સિસ્ટમ્સ બાયોલોજી ફિઝિયોલોજિકલ વર્ણનમાંથી વિકસિત થઈ હોવાનું નકશાબદ્ધ કરવામાં આવી છે, જ્યારે 1952માં એલન લોયડ હોડ્જકિન અને એન્ડ્રુ ફીલ્ડિંગ હક્સલી (નોબેલ પુરસ્કાર વિજેતાઓ)એ ન્યુરોનલ સેલના એક્સોન સાથે એક્શન પોટેન્શિયલ પ્રોપેગેશન માટે ગાણિતિક મોડલ વર્ણવ્યો હતો. 1960માં સિદ્ધાંતનું વધુ વિકસિત અમલીકરણ સામે આવ્યું જ્યારે હૃદય પેસમેકરનું પ્રથમ કોમ્પ્યુટર મોડલ ડેનિસ નોબલ દ્વારા વિકસાવવામાં આવ્યું હતો [PMID 13729365]. સિસ્ટમ્સ બાયોલોજીને ઔપચારિક રીતે સિસ્ટમ થિયોરિસ્ટ મિહાજ્લો મેસારોવિક દ્વારા 1966માં કેસ ઇન્સ્ટિટ્યૂટ ઑફ ટેકનોલોજી, ક્લીવલેન્ડ, ઓહાયોમાં લોન્ચ કરવામાં આવી હતી, જેનું શીર્ષક “સિસ્ટમ્સ થિયરી એન્ડ બાયોલોજી” હતું. 1968માં, સિસ્ટમ્સ બાયોલોજી વિશેનો પ્રથમ સિદ્ધાંત લુડવિગ વોન બર્ટલાન્ફી દ્વારા પ્રકાશિત કરવામાં આવ્યો હતો, જેને આ શાખાનો પૂર્વગામી ગણવામાં આવે છે. 1960 અને 1970 ની વચ્ચેનો સમયગાળો જટિલ મોલેક્યુલર સિસ્ટમ્સના બહુવિધ પાસાઓના વિકાસનો દાયકો હતો, જેમ કે મેટાબોલિક કંટ્રોલ એનાલિસિસ અને બાયોકેમિકલ સિસ્ટમ્સ થિયરી. તદુપરાંત, સિસ્ટમ્સ થિયરી અને મોલેક્યુલર બાયોલોજી વચ્ચેની સંશયવાદીતા થિયોરેટિકલ બાયોલોજીના વિકાસથી તૂટી ગઈ, જેમાં બાયોલોજિકલ પ્રક્રિયાઓના માત્રાત્મક મોડલિંગનો સમાવેશ થાય છે. 1990 ના દાયકાથી, ફંક્શનલ જીનોમિક્સ મોટી માત્રામાં ઉચ્ચ-ગુણવત્તાના બાયોલોજિકલ ડેટા જનરેટ કરી રહી છે, જે વધુ વાસ્તવિક મોડલ્સના વિકાસમાં મદદ કરી રહ્યા છે. સિસ્ટમ્સ બાયોલોજીના ક્ષેત્રમાં આ વિકાસની ચાલુ રહેતી શ્રેણીમાં, નેશનલ સાયન્સ ફાઉન્ડેશન (NSF)એ સંપૂર્ણ કોષને ગાણિતિક રીતે મોડલ કરવાની પડકાર રજૂ કરી. આ દિશામાં, 2003માં, મેસાચ્યુસેટ્સ ઇન્સ્ટિટ્યૂટ ઑફ ટેકનોલોજીએ સાયટોસોલ્વ સાથે મળીને આ પડકારનો ઉકેલ શોધવાનું શરૂ કર્યું. છેવટે, 2012માં માઉન્ટ સિનાઈ સ્કૂલ ઑફ મેડિસિન, ન્યૂ યોર્ક દ્વારા જનીનિક મ્યુટેશનના પ્રતિસાદમાં કોષ વિયબિલિટીની આગાહી માટે માયકોપ્લાઝ્મા જેનિટાલિયમ (કોષ દીવાલ વગરના બેક્ટેરિયા)નું સંપૂર્ણ કોષ મોડલ વિકસાવવામાં આવ્યું હતું. હાલમાં, એક મોટો સિસ્ટમ્સ બાયોલોજી પ્રોજેક્ટ, એટલે કે ‘ફિઝિઓમ’ ચાલી રહ્યો છે (http:/physiomeproject.org/). આ પ્રોજેક્ટનો ધ્યેય ફિઝિયોલોજિકલ ફંક્શનને સમજવા માટે મલ્ટી-સ્કેલ મોડલિંગ ફ્રેમવર્ક વિકસાવવાનો છે જે મોડલ્સને હાયરાર્કિકલ ફેશનમાં જોડવા અને સંયોજિત કરવાની મંજૂરી આપે છે. ઉદાહરણ તરીકે, હૃદયના ઇલેક્ટ્રોમેકેનિકલ મોડલ્સને સબસેલ્યુલર સ્તરે આયન ચેનલ્સ, માયોફિલામેન્ટ મિકેનિક્સ અને સિગ્નલ ટ્રાન્સડક્શન પાથવેના મોડલ્સ સાથે જોડવાની જરૂર છે અને પછી આ પ્રક્રિયાઓને પેશી મિકેનિક્સ, વેવફ્રન્ટ પ્રોપેગેશન અને કોરોનરી બ્લડ ફ્લોના મોડલ્સ સાથે જોડવાની જરૂર છે-જેમાંથી દરેક સંભવતઃ સંશોધકોના વિવિધ જૂથો દ્વારા વિકસાવવામાં આવ્યા હોય.

11.2.3 સિસ્ટમ્સ બાયોલોજી પાછળનો થીમ

બાયોલોજીના વિવિધ શાખાઓને આવરી લેવા માટે, સિસ્ટમ્સ બાયોલોજીને વિવિધ પાસાઓમાંથી અવલોકન કરવામાં આવી છે. રિડક્શનિસ્ટોએ સિસ્ટમના ઘટકો અને ક્રિયાપ્રતિક્રિયાઓની ઓળખ પર કામ કર્યું

ફિગ. 11.1: સિસ્ટમ્સ બાયોલોજીનું ચિત્રણ એક આંતરશાખાકીય અભ્યાસ ક્ષેત્ર તરીકે કે જે બાયોલોજિકલ સિસ્ટમ્સની અંદર જટિલ બાયોલોજિકલ ક્રિયાપ્રતિક્રિયાઓ પર ધ્યાન કેન્દ્રિત કરે છે

પરંતુ સિસ્ટમના બહુવિધતાનું વર્ણન કરવા માટે કોઈ પ્રભાવશાળી પદ્ધતિ વિકસિત થઈ શકી નહીં. બહુવિધતાને એકસાથે બહુવિધ ઘટકોના માત્રાત્મક માપ દ્વારા વધુ સારી રીતે અવલોકન કરી શકાય છે અને આ ફક્ત કડક ડેટા ઇન્ટિગ્રેશન ધરાવતા ગાણિતિક મોડલ્સ દ્વારા જ શક્ય છે. આ રીતે એમ કહી શકાય કે સિસ્ટમ્સ બાયોલોજી એ સિસ્ટમનું અવલોકન છે જે વિવિધ ઘટકોને એકસાથે એકીકૃત કરીને કરવામાં આવે છે (ફિગ.11.1). સિસ્ટમ્સ બાયોલોજીના થીમના કેન્દ્રમાં તમામ વ્યક્તિગત ઘટકોને એકસાથે આવરી લેવું છે: ‘ઑબ્જેક્ટ નેટવર્ક મેપિંગ અને તેનું આંતર-આશ્રિત ગતિશીલ ઇવેન્ટ-કાઇનેટિક્સ સાથે આંશિક વિભેદક સમીકરણો દ્વારા એકીકરણ’.

11.2.4 સિસ્ટમ્સ બાયોલોજી પ્રયોગો માટે પ્રોટોકોલ

એક પ્રમાણભૂત સિસ્ટમ્સ બાયોલોજી પ્રયોગ કરવા માટે, ફિગ.11.2 માં બતાવ્યા પ્રમાણે, અલગ પગલાં અનુસરવામાં આવે છે.

સમગ્ર પ્રોટોકોલમાં મૂળભૂત રીતે સમસ્યાની વ્યાખ્યા, પ્રયોગની રચના, ડેટા જનરેટ કરવા માટે પ્રયોગોનું અમલીકરણ, પરિણામી ડેટાનો સંગ્રહ અને તેમની ગોઠવણી યોગ્ય ફાઇલ ફોર્મેટમાં અને તે પછી નેટવર્ક ઇન્ફરન્સનો વિકાસ સામેલ છે. આ પછી આ નેટવર્ક ઇન્ટરફેસનું ટ્રાન્સફર થાય છે જે ચોક્કસ તેમજ મિકેનિઝમ આધારિત હોવું જોઈએ જેથી મોડલ તે મુજબ વિકસાવી શકાય. આ પછી મોડલ આધારિત સિમ્યુલેશન પરિણામો અને પ્રયોગાત્મક ડેટા વચ્ચેના તફાવતોનું વિશ્લેષણ અને તે મુજબ અવલોકન કરાયેલા તફાવતોના સંદર્ભમાં પૂર્વધારણાનું મોડલિંગ કરવામાં આવે છે. છેવટે, સિમ્યુલેશનનું પુનરાવર્તન કરવામાં આવે છે અને ફરીથી અને ફરીથી પરીક્ષણ કરવામાં આવે છે, અને નવી પૂર્વધારણાઓ મોડલમાં સામેલ કરવામાં આવે છે.

આમ, સિસ્ટમ્સ બાયોલોજી માટે કોમ્પ્યુટેશનનું વર્ક ફ્લો (ફિગ. 11.2 માં દર્શાવ્યા પ્રમાણે) ડેટા-મેનેજમેન્ટ, નેટવર્ક વિકાસ પરિમાણોનું ઑપ્ટિમાઇઝેશન, પરફોર્મન્સ એનાલિસિસ અને મૂલ્યાંકનની જરૂરિયાત રાખે છે.

ફિગ. 11.2: સિસ્ટમ્સ બાયોલોજી પ્રયોગના અમલીકરણ માટે વર્કફ્લો

સિસ્ટમ્સ બાયોલોજી માટે સ્ટ્રક્ચર ડેટ