«

»

অক্টো. 27

প্রোটিনের গঠন ৬: গঠনের বায়োইনফরমেটিক বিশ্লেষণ: শ্রেনীবিন্যাস ও অনুমান

[পূবর্ের লেকচার] [নিবন্ধন ফর্ম] [কোর্সের মূল পাতা]

আজকে আমরা পড়বো প্রোটিনের গঠনকে কিভাবে শ্রেণীবিন্যাস করা হয় এবং গঠনের অনুমান কিভাবে করা যায় এসব নিয়ে।

 

শ্রেণীবিন্যাস:

তিনটা ডাটাবেইজ প্রোটিনের গঠনকে বিভিন্নভাবে শ্রেণীবিন্যাস করেছে। ডাটাবেইজ তিনটি হল:

 

১. CATH (Class, Architecture, Topology, Homologous superfamily)
২. SCOP (Structural Classification Of Proteins)
৩. FSSP (Fold classification based on Structure-Structure alignment of Proteins)

 

CATH (http://www.cathdb.info/)

এটা হল ম্যানুয়াল এবং অটোমেটেড দুই উপায়েই করা শ্রেণীবিন্যাসের পদ্ধতি। এর মূল চারটি ধাপ।

Class (C) – দ্বিতীয় পর্যায়ের গঠনের উপর নির্ভর করে

Architecture (A) – দ্বিতীয় পর্যায়ের গঠন কিভাবে সাজানো তার উপর নির্ভর করে

Topology (T) – দ্বিতীয় পর্যায়ের কয়টি কিভাবে নিজেদের মধ্যে যোগাযোগ করে তার উপর নির্ভর করে

Homologous superfamily (H) – গঠন এবং কাজের বিবর্তনিক সম্পর্কের উপর নির্ভর করে

CATH এর শ্রেণীবিন্যাস

 

SCOP (http://scop.bic.nus.edu.sg/)

এটা হল পুরোপুরি ম্যানুয়াল উপায়ে করা শ্রেণীবিন্যাসের পদ্ধতি। এর মূল তিনটি ধাপ।

Family – ৩০ শতাংশের বেশি বিন্যাসে মিল থাকা প্রোটিনগুলির বিবর্তনিক সম্পর্কের উপর নির্ভর করে

Superfamily – গঠন/কাজের সম্পর্ক থেকে ফ্যামিলি’র বিবর্তনিক উৎসের উপর নির্ভর করে

Fold – দ্বিতীয় পর্যায়ের গঠনের মূল গাঠনিক মিলগুলির উপর নির্ভর করে

SCOP অনুযায়ী শ্রেণীবিন্যাস

 

FSSP (http://protein.hbu.cn/fssp/)

এটা হল পুরোপুরি অটোমেটেড উপায়ে করা শ্রেণীবিন্যাসের পদ্ধতি। এর মূল তিনটি ধাপ।
–representative set – ৩৩০ টি প্রোটিন চেইনের উপর ভিত্তি করে যাদের মধ্যে এমিনো এসিড বিন্যাসে মিল ৩০ শতাংশের কম
–clustering – ফোল্ডের গাঠনিক এলাইনমেন্ট এর উপর নির্ভর করে গুচ্ছাবৃত্ত করা হয়
–convergence – অনেক বড় ডাটাসেট থেকে ধাপে ধারে একটি একক ফ্যামিলির দিকে ফোকাস করা হয় শ্রেণীতে ফেলার জন্য

গঠনের অনুমান:

প্রশ্ন আসতে পারে প্রোটিনের গঠনের অনুমান কেন দরকার। প্রধান কারনগুলি হল (ভিডিও লেকচারে একটু বিস্তারিত কথা বলা আছে)-

• বহু প্রোটিনের গঠন পরীক্ষা দ্বারা জানা সম্ভব হয়না
• পরীক্ষা ছাড়াই সহজে গঠন জানার জন্য
• একটি গঠন জানা গেলে অন্য জীবের বিবর্তনিকভাবে কাছাকাছি প্রোটিনের গঠনও বুঝতে পারা
• ঔষধ তৈরিতে সাহায্য

 

প্রাথমিক গঠন থেকে ত্রিমাত্রিক গঠন কেমন হবে সেটা বায়োইনফরমেটিক টুল ব্যবহার করে খুঁজে বের করাই হল প্রোটিনের গঠনের অনুমান।
প্রাইমারি বা প্রাথমিক গঠন থেকে ত্রিমাত্রিক গঠন কি অনুমান করা সম্ভব?

 

আমাদের অভিজ্ঞতা বলছে সম্ভব। কিন্তু তাতে অনেক জটিল গাণিতিক, পদার্থবৈজ্ঞানিক এবং রাসায়নিক হিসাব নিকাশের মধ্য দিয়ে যেতে হয়। কম্পিউটেশনাল বায়োলজিষ্টরা জটিল জটিল প্রোগ্রাম তৈরি করছেন শুধু নিখুঁতভাবে গঠন অনুমানের জন্য যা পরীক্ষালব্ধ গঠনের মতই হবে। কিভাবে গঠন অনুমান করা হয় তার একটা উদাহরণ এখানে দিচ্ছি।

প্রথমেই আমরা একটা এমন প্রোটিন নেই যার গঠন পরীক্ষালব্ধভাবে জানা আছে। তাহলে আমরা জানি প্রোটিনটির কোন অংশের সঙ্গে কোন অংশ সম্পর্ক তৈরি করছে। এরকম কিছু গুরুত্বপূর্ণ জায়গা (এমিনো এসিড বিন্যাস এবং পুরো বিন্যাসে অবস্থান) চিহ্নিত করি। এদেরকে বলছি মোটিফ। নিচের ছবির a তে লুপ আকারটিতে দেখুন লাল বল দুইটি। এবার প্রোটিনটির মত একইধরনের অন্য প্রোটিন খুঁজে বের করি, প্রাথমিক গঠন BLAST করলেই পাওয়া যাবে। মোটিফগুলি যদি খুঁজে পাওয়া বিন্যাসগুলিতেও সংরক্ষিত থাকে তাহলে আমরা জানছি যে এই সবগুলি প্রোটিনেই তারা একইরকম গাঠনিক বিন্যাসে থাকবে। তাহলে গঠন জানা প্রোটিনটিতে এই মোটিফগুলির অবস্থানের ভিত্তিতে বাকি প্রোটিনগুলির গঠনটা অনুমানের চেষ্ট করা যায়। আবার এমন কোন মোটিফ গঠনজানা প্রোটিনটিতে খুঁজে পাওয়া যেতে পারে যেখানে অন্যন্য অনেক মোটিফ সম্পর্ক তৈরি করে। একে বলা যায় হটস্পট। এরকম সিগনেচার হটস্পট গঠন না জানা প্রোটিনে খুঁজে পেলেও গঠন অনুমানে সুবিধা হয়। নিচের ছবি দেখুন।

তারপর এমন মোটিফগুলির সম্পর্ক থেকে বারবার প্রতিটি এমিনো এসিডের অবস্থান নিশ্চিত করে সিমুলেশানের মাধ্যমে গঠনে পৌছেন বিজ্ঞানীর। নিচের ছবি থেকে ধাপে ধাপে বিষয়গুলি দেখে নিন।

আবার শুধু এভাবে প্রোটিনের ফোল্ডই অনুমান করা যায়না। বরং অন্য প্রোটিনের সাথে গাঠনিক সম্পর্ক, গাঠনিক পরিবর্তন, লাইগেন্ড বন্ধন, কোষে কার্যক্রমের সম্পর্ক এবং পথ ইত্যাদিও অনুমান করা সম্ভব এরকম বায়োইনফরমেটিক উপায়ে। নিচের ছবিটি দেখুন।

 

এখন যেসব পদ্ধতি গঠন অনুমানে ব্যবহার করা হয় তার কিছু বিবরণ দিচ্ছি:

ক.
Ab-initio: প্রাথমিক গঠন থেকে অন্য কিছু বিবেচনায় না এনে সরাসরি ত্রিমাত্রিক গঠন অনুমান।
[treat amino acids as beads and derive possible structures by rotating through all possible f, y angles using a “reliable” energy function, then optimize globally]

 

Theoretical modeling: Ab-initio থেকে তথ্য প্রাপ্ত হয়ে একইরকম বিন্যাস কিধরনের কাজ করতে পারে সেটা তাত্বিক অনুমান
[protein has an iron binding site > possible heme substructure]
Conformation space search:  Ab-initio থেকে তথ্য প্রাপ্ত হয়ে একটি ত্রিমাত্রিক জায়গায় প্রোটিনটি কতটুকু ছোট অবস্থায় সবচেয়ে সুবিধাজনকভাবে থাকতে পারে সেটা অনুমান
[reduce sample space to conform to Ramachandran plot]

 

খ.
Homology modeling: জানা গঠনকে অনুসরন করে একই কাছাকাছি বিন্যাসের প্রোটিনের গঠন অনুমান
[apply to proteins that have high sequence similarity to those in the database]

 

Threading: জানা গঠনকে অনুসরন করে কয়েকটি গাঠনিক ডাটাবেইজ থেকে তথ্য নিয়ে অনুমান
[apply to proteins with moderate sequence similarity to those in the database]

 

গ.
Energy minimization:  ত্রিমাত্রিক ক্ষেত্রে সবচেয়ে কম শক্তি প্রয়োজন এমন সুবিধাজনক গাঠনিক বিন্যাস অনুমান

 

Simulation: কোন একটা আণবিক অবস্থা নির্ধারন করে দিয়ে (প্রোটিনের মধ্যে বা আশেপাশের পরিবেশে) গঠন কেমন হবে সেটা নির্ধারন

 

Monte Carlo: আণবিক সিমুলেশানই, কিন্তু বারবার চেষ্টা করে সবচেয়ে সঠিক গঠনে পৌঁছানোর চেষ্টা।
[iterated search through a Markov chain of conformations]

Comments

comments

About the author

খান ওসমান

আমি টরন্টো বিশ্ববিদ্যালয়ের মলিকিউলার জেনেটিক্স এর একজন পিএইচডি ছাত্র। কাজ করছি ম্যালেরিয়া জীবাণুর একধরনের প্রোটিন নিয়ে। আমার কাজ মূলতঃ এক্স-রে ক্রিস্টালোগ্রাফির মাধ্যমে প্রোটিনের গঠন নির্ণয়, এর সঙ্গে ম্যালেরিয়া রোগের সম্পর্ক নির্ধারণ এবং ঔষধ তৈরিতে সহায়তা করা ইত্যাদি বিষয়ের উপর। স্নাতক এবং মাস্টাসর্ ডিগ্রী অজর্ন করেছি চট্টগ্রাম বিশ্ববিদ্যালয় থেকে অনুজীববিজ্ঞান নিয়ে। আমার বতর্মান ল্যাব এর ওয়েবসাইটে ঢু মেরে দেখতে পারেন এখানে: www.thesgc.org.

Leave a Reply