அத்தியாயம் 10 புரதத் தகவலியல் மற்றும் வேதித் தகவலியல்

10.1 புரதத் தகவல்

10.1.1 அறிமுகம்

எந்தவொரு புரதத்தைப் பற்றிய தகவல்களைத் தகவல் தொழில்நுட்ப நுட்பங்களைப் பயன்படுத்தி சேகரிப்பது புரதத் தகவலியலின் கீழ் வருகிறது. புரதத் தகவலியல், கருதுகோள் புரதங்களின் செயல்பாட்டுத் தளத்தின் வடிவியல் இடம், உயிர்வேதியியல் செயல்பாடு மற்றும் உயிரியல் செயல்பாடு ஆகியவற்றைப் பெறுவதில் மிகப்பெரும் உதவியாக இருந்துள்ளது. கூடுதலாக, இது பல கருதுகோள் புரதங்களின் மூன்றாம் நிலை கட்டமைப்புகளைத் தீர்மானிக்க வழிவகுத்தது, இவற்றின் மூலக்கூறு செயல்பாடுகளை வழக்கமான முறைகளைப் பயன்படுத்தி புரிந்துகொள்ள முடியவில்லை. புரதத்தொகுதி அளவில் அமினோ அமில வரிசைகள், மூன்றாம் நிலை கட்டமைப்புகள் மற்றும் பாதைகள் ஆகியவற்றின் பல்வேறு விவரிப்பான்கள் மற்றும் பன்முகத் தரவுத்தளங்களும் புரதத் தகவலியலை வளர்ப்பதில் உதவியாக இருந்துள்ளன.

10.1.2 புரதத் தரவு வகைகள்

தகவல் பிரித்தெடுத்தலின் கணக்கீட்டு செயல்முறைக்கு புரதத்தின் மூலத் தரவு தேவைப்படுகிறது. இந்த புரதத் தரவு பின்வரும் வகைகளில் இருக்கலாம் -

(i) வெப்பம்-மாற்றப்பட்ட புரதத் திரட்டலின் நுண்ணிய படம்

(ii) கரைசல் வடிவத்தில் உள்ள புரதம்

(iii) மேட்ரிக்ஸ் அசிஸ்டட் லேசர் டிசார்ப்ஷன்/அயனியாக்கம் (MALDI) இன் வெளியீடாக புரத வரிசை

(iv) தொகுக்கப்பட்ட புரத வரிசை

(v) புரத தரவு வங்கி (PDB) வடிவத்தில் புரத படிக அமைப்பு

(vi) புரத-புரத, புரத-லிகண்ட் அல்லது புரத-நியூக்ளியோடைட் தொடர்பு கோப்பு

(vii) அணுக்கரு காந்த அதிர்வு (NMR) தரவு, நிறை நிறமாலையியல் (MS) தரவு

(viii) மரபணு தொடரிலிருந்து நேரடியாக பெறப்பட்ட புரத வரிசைகள், இவை இருப்பதற்கான அறியப்பட்ட சான்றுகளைக் கொண்டிருக்கவில்லை (கருதுகோள் புரதம்)

மேற்கண்ட புரதத் தரவு வகைகள் பின்வரும் பயனுள்ள தகவல்களைப் பெற பயன்படுத்தப்படலாம்

(i) வெப்பம்-மாற்றப்பட்ட புரதத் திரட்டலின் நுண்ணிய படத்தின் பல-பின்னல் பண்பு புரத-குறிப்பானை வடிவமைக்கப் பயன்படுகிறது.

(ii) கரைசலில் உள்ள புரதத் தரவு இயற்பியல்-வேதியியல் பண்புகள் மற்றும் இயக்கவியல் தகவல்களை பகுப்பாய்வு செய்வதற்கு பயனுள்ளதாக இருக்கும்.

(iii) MALDI இலிருந்து புரதங்களின் துண்டிக்கப்பட்ட குறுகிய வரிசைகள் முழு நீள வரிசையைக் கண்டறியப் பயன்படுகின்றன.

(iv) புரத படிக அமைப்புகள் மரபணு மாற்றங்கள் மற்றும் தொடர்புகளைப் படிக்கப் பயன்படுகின்றன.

(v) PDB, NMR மற்றும் MS தரவுகள் படிகமாக்கப்படாத புரதத்தின் கட்டமைப்பைக் கணிக்கவும் பயன்படுத்தப்படுகின்றன (வரிசையிலிருந்து நேரடியாக).

(vi) அறியப்பட்ட இருப்பு இல்லாத புரதங்கள் உள்ளன (கருதுகோள் புரதங்கள் என அறியப்படுகின்றன), அவை மரபணு வரிசைகளிலிருந்து அடையாளம் காணப்படலாம்.

(vii) புரதத்தின் பிணைய மேப்பிங் பல்வேறு நோய்களின் சிகிச்சையின் சாத்தியமான இலக்கைப் பற்றிய தகவலை வழங்குகிறது.

புரதத் தகவலியல் பகுப்பாய்வை மேற்கொள்ள, பின்வரும் இரண்டு அடிப்படை வசதிகள் தேவைப்படுகின்றன:

(i) NCBI, PDB, CHEMBL, BIOMODELS போன்ற பல்வேறு தரவுத்தளங்களிலிருந்து மூலத் தரவு கிடைக்கும் தன்மை.

(ii) பகுப்பாய்வுகளுக்குப் பயன்படுத்தப்படும் தகவலியல் கருவிகள் மற்றும் நுட்பங்கள். சில நன்கு அறியப்பட்ட நுட்பங்கள்: (அ) அலைக்கற்றை நுட்பங்களால் பட பகுப்பாய்வு, (ஆ) வரிசை ஒற்றுமை மற்றும் ஒருபோக்கு கணக்கீடுகள், (இ) கட்டமைப்பு மேம்படுத்தல் நுட்பங்கள், (ஈ) புள்ளிவிவர மற்றும் இயந்திர கற்றல் நுட்பங்களால் தரவு பகுப்பாய்வு, கட்டமைப்பு நரம்பியல் வலையமைப்பு (ANN), ஆதரவு திசையன் இயந்திரம் (SVM) மற்றும் மறைக்கப்பட்ட மார்கோவ் மாதிரி (HMM). (உ) பிணைய மேப்பிங் நுட்பம், மற்றும் (ஊ) கணினி உயிரியல் குறியீட்டு மொழி (SBML).

10.1.3 புரதக் கட்டமைப்புகளின் கணக்கீட்டு கணிப்பு

உயிரித் தகவலியல் கருவிகளைப் பயன்படுத்தி புரதக் கட்டமைப்பைக் கணிப்பது, அமினோ அமில வரிசைகள் புரதங்களின் கட்டமைப்பை எவ்வாறு குறிப்பிடுகின்றன மற்றும் இந்த புரதங்கள் எவ்வாறு அடி மூலக்கூறுகள் மற்றும் பிற மூலக்கூறுகளுடன் இணைந்து அவற்றின் செயல்பாடுகளைச் செய்கின்றன என்பதை ஆராய்வதை நோக்கமாகக் கொண்டுள்ளது. உயிரித் தகவலியல் கருவிகளைப் பயன்படுத்தி ஒரு புரதத்தின் (கருதுகோள் புரதங்கள் உட்பட) கட்டமைப்பைக் கணிக்கும் இந்தப் பணி, புரத வரிசை இல்லாத நிலையில், அதாவது மரபணு வரிசை மட்டுமே தெரிந்தாலும் கூட சாத்தியமாகும். புரதங்களின் கட்டமைப்பு மற்றும் இயற்பியல்-வேதியியல் பண்புகளைக் கணிக்க பல்வேறு ஆதாரங்களிலிருந்து பல கணக்கீட்டு கருவிகள் கிடைக்கின்றன. கணக்கீட்டு முறைகளின் முக்கிய நன்மைகள் ஈடுபட்டுள்ள நேரக் கட்டம், அதிக செலவு மற்றும் அதிக வெளியீட்டு திரையிடலின் சாத்தியம் ஆகும்.

10.1.3.1 முதன்மைக் கட்டமைப்பு கணிப்பு

புரத முதன்மைக் கட்டமைப்பு கணிப்பு, ஐசோமினுக்கு புள்ளி, அழிவுக் குணகம், உறுதியற்ற குறியீடு, கொழுப்பிய குறியீடு மற்றும் மொத்த சராசரி நீர்விருப்பம் போன்ற இயற்பியல்-வேதியியல் பண்புகளை உள்ளடக்கியது. இவை அனைத்தும் ExPASy புரதத்தொகுதி சேவையகத்தின் ProtParam கருவியின் உதவியுடன் கணக்கிடப்படலாம். புரதங்களின் சில இயற்பியல்-வேதியியல் பண்புகள் பின்வரும் பகுதியில் சுருக்கமாக விவரிக்கப்பட்டுள்ளன.

ஐசோமினுக்கு புள்ளி- ஐசோமினுக்கு புள்ளி (pI) என்பது $\mathrm{pH}$ ஆகும், இதில் புரதத்தின் மேற்பரப்பு மின்னூட்டத்தால் மூடப்பட்டிருக்கும் ஆனால் புரதத்தின் நிகர மின்னூட்டம் பூஜ்ஜியமாகும். pI இல், புரதங்கள் நிலையானவை மற்றும் கச்சிதமானவை. கணக்கிடப்பட்ட $\mathrm{pI}$ மதிப்பு $7(\mathrm{pI}<7)$ ஐ விட குறைவாக இருந்தால், புரதம் அமிலமாகக் கருதப்படுகிறது என்பதைக் குறிக்கிறது.

7 ஐ விட அதிகமான pI (pI> 7) புரதம் அடிப்படை தன்மை கொண்டது என்பதை வெளிப்படுத்துகிறது. கணக்கிடப்பட்ட ஐசோமினுக்கு புள்ளி (pI) ஐசோமினுக்கு குவிய முறை மூலம் சுத்திகரிப்பதற்கான தாங்கல் அமைப்பை உருவாக்குவதற்கு பயனுள்ளதாக இருக்கும்.

கொழுப்பிய குறியீடு- கொழுப்பிய குறியீடு (AI), இது கொழுப்பிய பக்கச் சங்கிலிகள் (A, V, I மற்றும் L) ஆக்கிரமிக்கப்பட்ட ஒரு புரதத்தின் ஒப்பீட்டு அளவு என வரையறுக்கப்படுகிறது, இது கோள புரதங்களின் வெப்ப நிலைத்தன்மையின் அதிகரிப்புக்கான நேர்மறையான காரணியாகக் கருதப்படுகிறது. புரத வரிசைகளின் மிக அதிக கொழுப்பிய குறியீடு, புரதம் பரந்த வெப்பநிலை வரம்பிற்கு நிலையானதாக இருக்கலாம் என்பதைக் குறிக்கிறது.

உறுதியற்ற குறியீடு- உறுதியற்ற குறியீடு ஒரு சோதனைக் குழாயில் புரதத்தின் நிலைத்தன்மையின் மதிப்பீட்டை வழங்குகிறது. சில டைபெப்டைடுகள் உள்ளன, அவற்றின் நிகழ்வு நிலையானவற்றுடன் ஒப்பிடும்போது உறுதியற்ற புரதங்களில் கணிசமாக வேறுபட்டது. இந்த முறை உறுதியற்ற தன்மையின் எடை மதிப்பை ஒதுக்குகிறது. இந்த எடை மதிப்புகளைப் பயன்படுத்தி ஒரு உறுதியற்ற குறியீட்டைக் கணக்கிட முடியும். உறுதியற்ற குறியீடு 40 க்கும் குறைவாக இருக்கும் ஒரு புரதம் நிலையானதாக கணிக்கப்படுகிறது, 40 க்கு மேல் உள்ள மதிப்பு புரதம் உறுதியற்றதாக இருக்கலாம் என கணிக்கிறது.

மொத்த சராசரி நீர்விருப்ப (GRAVY) மதிப்பு - ஒரு பெப்டைடு அல்லது புரதத்திற்கான மொத்த சராசரி நீர்விருப்ப (GRAVY) மதிப்பு அனைத்து அமினோ அமிலங்களின் நீர்விருப்ப மதிப்புகளின் கூட்டுத்தொகையாக கணக்கிடப்படுகிறது, இது வரிசையில் உள்ள எச்சங்களின் எண்ணிக்கையால் வகுக்கப்படுகிறது. GRAVY மதிப்பின் குறைந்த வரம்பு நீருடன் சிறந்த தொடர்பு கொள்ளும் சாத்தியத்தைக் குறிக்கிறது.

10.1.3.2 இரண்டாம் நிலைக் கட்டமைப்பு கணிப்பு

புரத இரண்டாம் நிலைக் கட்டமைப்பு தீவிரமாகப் படிக்கப்பட்டுள்ளது, ஏனெனில் அறியப்படாத கட்டமைப்புகளைக் கொண்ட புரதத்தின் செயல்பாடுகளை வெளிப்படுத்த இது மிகவும் உதவியாக இருக்கிறது. கூடுதலாக, புரத இரண்டாம் நிலைக் கட்டமைப்பைக் கணிப்பது புரத 3-பரிமாண கட்டமைப்பு கணிப்புக்கான ஒரு படியாகும் என்பதைக் காட்டியுள்ளது. APSSP, CFSSP, SOPMA மற்றும் GOR ஆகியவை பொதுவான புரத இரண்டாம் நிலைக் கட்டமைப்பு கணிப்பு கருவிகள் ஆகும்.

10.1.3.3 முப்பரிமாண (3D) கட்டமைப்பு கணிப்பு

பின்வரும் மூன்று கணக்கீட்டு முறைகள் பொதுவாக புரத 3D கட்டமைப்பைக் கணிக்கப் பயன்படுத்தப்படுகின்றன.

ஒருபோக்கு மாதிரியாக்கம்- ஒருபோக்கு மாதிரியாக்கத்திற்கு, அறியப்படாத கட்டமைப்பைக் கொண்ட ஒரு புரதத்தின் அமினோ அமில வரிசை அறியப்பட்ட கட்டமைப்புகளைக் கொண்ட புரதங்களின் வரிசைகளுக்கு எதிராக சீரமைக்கப்படுகிறது. அதிக அளவிலான ஒருபோக்கு (புரதங்களுக்கு இடையேயும் இடையேயும் மிகவும் ஒத்த வரிசைகள்) அறியப்படாத கட்டமைப்பைக் கொண்ட புரதத்தின் உலகளாவிய கட்டமைப்பைத் தீர்மானிக்கவும் அதை ஒரு குறிப்பிட்ட மடிப்பு வகைக்குள் வைக்கவும் பயன்படுத்தலாம். குறைந்த அளவிலான ஒருபோக்கு இன்னும் உள்ளூர் கட்டமைப்புகளைத் தீர்மானிக்கப் பயன்படுத்தப்படலாம், இரண்டாம் நிலைக் கட்டமைப்பைக் கணிக்க Chou-Fasman முறை ஒரு எடுத்துக்காட்டு. ஒருபோக்கு மாதிரியாக்க முறைகளின் ஒரு நன்மை என்னவென்றால், இயற்பியல் தீர்மானிப்பான்களின் அறிவைச் சார்ந்திருக்காதது. ஒருபோக்கு மாதிரியாக்கத்திற்கு பொதுவாகப் பயன்படுத்தப்படும் கருவிகள் MODELLER மற்றும் SWISS-MODEL ஆகும்.

மடிப்பு கணிப்பு- மடிப்பு அங்கீகார முறைகள் கட்டமைப்புகள் சீரமைக்கப்படும் ஒரு நிரப்பு அணுகுமுறையை எடுக்கும். ‘த்ரெடிங்’ என்று அழைக்கப்படும் முறையுடன், அறியப்படாத கட்டமைப்பைக் கொண்ட ஒரு புரதத்தின் வரிசை அறியப்பட்ட கட்டமைப்பைக் கொண்ட ஒரு புரதத்தின் முதுகெலும்பின் (புரத பக்கச் சங்கிலிகள்) உருவத்தை எடுக்க கட்டாயப்படுத்தப்படுகிறது. ஒவ்வொரு முயற்சிக்கும் இயற்பியல் தீர்மானிப்பான்கள் அளவிடுவது சிறப்பாக இருந்தால், சீரமைப்புக்கான மதிப்பெண் சிறப்பாக இருக்கும். இந்த முறைகள் ஒருபோக்கு மாதிரியாக்க முறைகளை விட கணக்கீட்டு தீவிரமானவையாக இருக்கும், ஆனால் அவை முடிவுகளின் இயற்பியல் சாத்தியக்கூறுகளில் அதிக நம்பிக்கையை அளிக்கின்றன. LIBELLULA மற்றும் Threader ஆகியவை இந்த முறைக்கு பொதுவாகப் பயன்படுத்தப்படும் கருவிகள் ஆகும்.

டி நோவோ புரதக் கட்டமைப்பு கணிப்பு: இது ஒரு புரதத்தின் மூன்றாம் நிலைக் கட்டமைப்பு அதன் அமினோ அமில முதன்மை வரிசையிலிருந்து கணிக்கப்படும் ஒரு வழிமுறை செயல்முறையாகும். QUARK என்பது $a b$ இனிடியோ புரதக் கட்டமைப்பு கணிப்பு மற்றும் புரத பெப்டைடு மடிப்பதற்கான ஒரு கணினி வழிமுறையாகும், இது அமினோ அமில வரிசையிலிருந்து மட்டுமே சரியான புரத 3D மாதிரியை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளது. QUARK மாதிரிகள் சிறிய துண்டுகளிலிருந்து (1-20 எச்சங்கள் நீளம்) கட்டப்பட்டவை, இது அணு-நிலை அறிவு-சார்ந்த விசைப் புலத்தின் வழிகாட்டுதலின் கீழ் நகல்-பரிமாற்ற மோன்டே கார்லோ உருவகப்படுத்துதலால் கட்டப்பட்டவை.

கணக்கீட்டு மூலம் விளக்கப்பட்ட ஒரு புரதத்தின் கட்டமைப்பு புரத-தரவு-வங்கிக் கோப்புகளில் அணு ஆயங்களாக பதிவு செய்யப்படுகிறது. முப்பரிமாண ஆயங்கள் ஒரு வகை உரை-கோப்பில், அதாவது புரத தரவு வங்கி (PDB) தரவுத்தளத்தில் .pdb கோப்பு நீட்டிப்புடன் PDB-கோப்பில் சேமிக்கப்படுகின்றன. இது எக்ஸ்-கதிர் படிகவியல், NMR மற்றும் சில கோட்பாட்டு கட்டமைப்பு மாதிரிகளிலிருந்து தரவைக் கொண்டுள்ளது. இதனுடன், PDB தரவுத்தளமானது புரத தரவுத்தளங்களுடன் இணைக்கப்பட்டுள்ளது, அவை ஒருபோக்கு வரிசைகளைத் தேடவும் பயன்படுத்தப்படுகின்றன. ஒருபோக்கு மாதிரியாக்கம் மற்றும் த்ரெடிங் போன்ற முறைகள் மூலம் கட்டமைப்பு கணிப்புக்கான 3D-கட்டமைப்பு. MODELLER என்பது புரதக் கட்டமைப்பு கணிப்புக்கு அறியப்பட்ட இலவசமாகக் கிடைக்கும் கருவிகளில் ஒன்றாகும்.

கள கணிப்பு - களம் என்பது ஒரு புரதத்தின் தனித்த செயல்பாட்டு மற்றும்/அல்லது கட்டமைப்பு அலகுகள் ஆகும். ஒரு பாலிபெப்டைட் சங்கிலியின் சுயாதீன மடிப்பு அலகு குறிப்பிட்ட செயல்பாட்டையும் கொண்டுள்ளது. அவை பெரும்பாலும் மீண்டும் மீண்டும் வரும் (வரிசை அல்லது கட்டமைப்பு) அலகுகளாக அடையாளம் காணப்படுகின்றன, அவை பல்வேறு சூழல்களில் இருக்கலாம். களங்கள் புரதக் கட்டமைப்பு, செயல்பாடு, பரிணாமம் மற்றும் வடிவமைப்பு ஆகியவற்றைக் கணிப்பதற்கு மிகவும் மதிப்புமிக்க தகவல்களை வழங்குகின்றன. கள கணிப்புக்கான மிகவும் பொதுவான கருவிகள் EMBL இன் InterPRO ஸ்கேன் மற்றும் NCBI இன் CDD தேடல் ஆகும்.

ஒரு புரத வரிசையிலிருந்து புரதக் கட்டமைப்பைக் கணிப்பதற்கான பல்வேறு சாத்தியமான வழிகளை சித்தரிக்கும் ஒரு பாய்வு விளக்கப்படம் படம் 10.1 இல் காட்டப்பட்டுள்ளது.

படம் 10.1: ஒரு புரத வரிசையிலிருந்து புரதக் கட்டமைப்பைக் கணிப்பதற்கான அனைத்து சாத்தியமான வழிகளின் பாய்வு விளக்கப்படம்

10.2 வேதித் தகவலியல்

10.2.1 அறிமுகம்

வேதியியலின் சிக்கல்களைப் புரிந்துகொள்ள கணக்கீட்டு மற்றும் தகவல் நுட்பங்களைப் பயன்படுத்துவது வேதித் தகவலியல் என அறியப்படுகிறது. வேதித் தகவலியல் என்பது இயற்பியல், வேதியியல், உயிரியல், கணிதம், உயிர்வேதியியல், புள்ளிவிவரம் மற்றும் தகவலியல் ஆகியவற்றின் கொள்கைகளை இணைக்கும் ஒரு இடைமுக அறிவியலாகும். வேதித் தகவலியல் என்ற சொல்லுடன், வேதித் தகவலியல் மற்றும் வேதியியல் தகவலியல் போன்ற சொற்கள் ஒரே அணுகுமுறையைக் குறிக்கப் பயன்படுத்தப்படுகின்றன. வேதித் தகவலியல் உத்திகள் மருந்து கண்டுபிடிப்பில் பயனுள்ளதாக இருக்கின்றன, அங்கு இலக்கு செல்லுலார் மூலக்கூறுகளுடன் தொடர்பு கொள்ள பெருமளவில் சேர்மங்கள் மதிப்பீடு செய்யப்படுகின்றன.

கடந்த இரண்டு தசாப்தங்களாக, வேதித் தகவலியல் அறிவியல் கருத்தியல் மற்றும் தொழில்நுட்ப ரீதியாக வளர்ந்து, வேதித் தொழில், மருந்து மற்றும் உயிரித் தொழில்நுட்ப ஆராய்ச்சி ஆகியவற்றில் பரவலான பயன்பாடுகளைக் கண்டறிந்துள்ளது, எ.கா., கணினி உதவியுடன் மருந்து வடிவமைப்பு (CADD), அங்கு ஒருவர் குறிப்பிட்ட உயிரியல் மற்றும் சிகிச்சை பண்புகளைக் கொண்ட மூலக்கூறுகளைத் தேடுகிறார்.

வேதித் தகவலியல் நிபுணர்கள் இயற்பியல் பண்புகள், முப்பரிமாண மூலக்கூறு மற்றும் படிக அமைப்புகள், வேதியியல் வினைப் பாதைகள் போன்றவற்றின் தகவல்களைக் கையாள்கின்றனர். உண்மையான சேர்மங்களுடன் கூடுதலாக, வேதித் தகவலியல் ஆராய்ச்சியாளர்கள் முதன்மையாக கருதுகோள் சேர்மங்களைக் கொண்டிருக்கக்கூடிய வேதியியல் தரவுத்தளங்களின் மெய்நிகர் நூலகங்களைக் கையாள்கின்றனர். மெய்நிகர் நூலகங்கள் சாத்தியமான தொகுப்பு முறைகள் மற்றும் வினை விளைபொருட்களின் கணிக்கப்பட்ட நிலைத்தன்மை பற்றிய தகவல்களைக் கொண்டிருக்கலாம். மெய்நிகர் திரையிடல், ஒரு குறிப்பிட்ட பண்பு அல்லது வினைக்கான சிறந்த வேட்பாளர்களை அடையாளம் காணவும் மதிப்பீடு செய்யவும் வேதியியல் மற்றும் இயற்பியல் கொள்கைகளைப் பயன்படுத்துகிறது, உண்மையான மற்றும் மெய்நிகர் மூலக்கூறுகளின் பெரிய நூலகங்களிலிருந்து. மிகவும் விரும்பத்தக்க வேட்பாளர்கள் பின்னர் ஆய்வக ஆய்வுகளில் சரிபார்க்கப்படலாம்.

10.2.2 வேதியியல் தரவை சேமித்தல் மற்றும் நிர்வகித்தல்

பல குழுக்கள் மற்றும் நிறுவனங்கள் வேதியியல் சேர்மங்களின் தரவுத்தளத்தை பராமரிக்கின்றன, அவற்றில் சில இலவசமாக பொதுமக்களுக்குக் கிடைக்கின்றன, சில வணிக ரீதியாக கிடைக்கின்றன. இந்த தரவுத்தளங்கள் மில்லியன் கணக்கான வேதியியல் சேர்மங்கள், அவற்றின் வினைகள் போன்றவற்றைக் கொண்டிருந்தாலும், கணக்கீட்டு சக்தி மற்றும் கருவிகள் மிகவும் உறுதியானவை, முழு வளத்திலும் தேடி பதிவுகளை மீட்டெடுப்பதற்கு சில வினாடிகள் மட்டுமே எடுக்கும்.

அறிவியல் மிகவும் முன்னேறியுள்ளது, இப்போது நாம் மெய்நிகர் மூலக்கூறுகளின் நூலகத்தைப் பற்றி பேசுகிறோம் (பில்லியன் கணக்கான உள்ளீடுகளைக் கொண்டுள்ளது) - இவை கிடைக்கக்கூடிய இலக்கியத்தின் படி இல்லாத சேர்மங்கள், ஆனால் மேம்பட்ட காம்பினேட்டோரியல் நுட்பங்களைப் பயன்படுத்தி தொகுக்கப்படலாம்.

CAS (கெமிக்கல் அப்ஸ்ட்ராக்ட்ஸ் சர்வீஸ், அமெரிக்கன் கெமிக்கல் சொசைட்டியின் ஒரு பிரிவு) உலகின் மிகப்பெரிய வேதியியல் நுண்ணறிவுகளின் தொகுப்பாகும். இது வேதியியல் பெயர்கள், கட்டமைப்புகளின் அதிகாரப்பூர்வ மூலமாகும் மற்றும் வேதியியலாளர்களுக்கு ஒரு உலகளாவிய தரநிலையாக செயல்படுகிறது.

2018 ஆம் ஆண்டு நிலவரப்படி, CAS பதிவேடு கடந்த 200 ஆண்டுகளுக்கும் மேலாக இலக்கியத்திலிருந்து எடுக்கப்பட்ட 142 மில்லியன் கரிம மற்றும் கனிமப் பொருட்களை வழங்குகிறது. பதிவேட்டில் 67 மில்லியன் புரத மற்றும் நியூக்ளிக் அமில வரிசைகள் அடங்கும். தரவுத்தளத்தில் 7.6 பில்லியனுக்கும் அதிகமான பொருட்களின் பண்பு மதிப்புகள் உள்ளன.

உயிர் மருத்துவ அறிவியல், வேதியியல், பொறியியல், பொருள் அறிவியல் போன்ற உலகளாவிய வெளியிடப்பட்ட இலக்கியங்களின் பெரிய எண்ணிக்கையிலான தரவுகள் CAS தரவுத்தளத்தில் ஒவ்வொரு நாளும் சேர்க்கப்படுகின்றன. 1800 களிலிருந்து, தரவுத்தளம் 100 மில்லியனுக்கும் அதிகமான வேதியியல் வினைகளை உள்ளடக்கிய 47 மில்லியனுக்கும் அதிகமான வெளியீடுகளை உள்ளடக்கியது. இந்த மிகப்பெரிய வளம் சிகிச்சை மற்றும் தொழில்துறை முக்கியத்துவம் வாய்ந்த சேர்மங்களைக் கண்டறிவதற்கான புதையலாகும். சில பிரபலமான வேதியியல் தரவுத்தளங்கள் அட்டவணை 10.1 இல் குறிப்பிடப்பட்டுள்ளன.

அட்டவணை 10.1: பிரபலமான வேதியியல் தரவுத்தளம்

பெயர்விளக்கம்
PubChemPubChem என்பது வேதியியல் மூலக்கூறுகளின் தரவுத்தளமாகும், இது மூன்று வகையான
தகவல்களைப் பராமரிக்கிறது, அதாவது, பொருள், சேர்மம் மற்றும் BioAssays.
ZINCZINC தரவுத்தளத்தில் மெய்நிகர் திரையிடலுக்கு 21 மில்லியன் சேர்மங்கள் கிடைக்கின்றன.
இந்த தரவுத்தளத்தில் மூலக்கூறு எடை, log P போன்ற பல்வேறு மூலக்கூறு அம்சங்கள்
அடங்கும்.
ChEMBLஇந்த தரவுத்தளம் 1 மில்லியன் உயிரியல் செயலில் உள்ள (சிறிய
மருந்து போன்ற மூலக்கூறுகள்) சேர்மங்கள் மற்றும் 8200 மருந்து இலக்குகள் பற்றிய விரிவான தகவல்களை வழங்குகிறது.
NCINCI தரவுத்தளத்தில் $2,75,000$ சிறிய மூலக்கூறு கட்டமைப்புகள் இருந்தன, புற்றுநோய்/எய்ட்ஸ் துறையில் பணிபுரியும் ஆராய்ச்சியாளர்களுக்கு மிகவும் பயனுள்ள
வளம்.
ChemDBஇது ஐந்து மில்லியன் இரசாயனங்களின் தரவுத்தளமாகும், இது இரசாயனங்களின் தகவல்களைக் கொண்டுள்ளது, இதில்
கணிக்கப்பட்ட அல்லது சோதனை ரீதியாக தீர்மானிக்கப்பட்ட இயற்பியல்-வேதியியல் பண்புகள், அதாவது
3D கட்டமைப்பு, உருகும் வெப்பநிலை மற்றும் கரைதிறன் ஆகியவை அடங்கும்.
ChemSpiderChemSpider 400 க்கும் மேற்பட்ட பல்வேறு தரவு ஆதாரங்களிலிருந்து ஒருங்கிணைக்கப்பட்ட 28 மில்லியனுக்கும் அதிகமான தனித்துவமான வேதியியல் நிறுவனங்களைக் கொண்டுள்ளது.
BindingDBஇது சிறிய மூலக்கூறுகளின் பிணைப்பு நாட்டம் தரவுத்தளமாகும், இதில் 6,263 புரத இலக்குகள் மற்றும் 378,980 சிறிய மூலக்கூறுகளுக்கான 9,10,836 பிணை