«

»

নভে. 23

বায়োইনফরমেটিক্স পরিচিতি: লেকচার – ৫: জিনের বহিঃপ্রকাশ/বৈশিষ্ট্য/আচরণ বিশ্লেষণ

[কোর্সের মূলপাতা | কোর্সের নিবন্ধন ফর্ম]

শুরুতেই আপনাদের মনে করিয়ে দিতে চাই লেকচার ০২ এর কথা। সেখানে আমরা DNA, chromosome এবং gene নিয়ে প্রাথমিক আলোচনা করেছি। তাই আপনাদের সুবিধার জন্য এই লেকচার শুরু করার আগে বলব যে লেকচার ০২ থেকে ঘুরে আসুন একটু। তাহলে আজকের লেকচার টা আয়ত্ত করতে অনেক অনেক কম সময় লাগবে। আজ আমরা আলোচনা করবো মূলত সেই gene নিয়েই। তবে আগের মতো আর বেশি বেশি গল্প, ছবি এবং তত্ত্বীয় আলোচনা না। কারন, এখন আমাদের সবার প্রাথমিক জ্ঞান টুকু সম্পূর্ণ। এই বার আমরা gene এর গঠন, তার বহিঃপ্রকাশ অথবা gene expression, বাস্তব জীবনে আমাদের কি ভাবে কাজে লাগতে পারে (অবশ্যই bioinformatics এর সাহায্যে) তা দেখার চেষ্টা করবো। আর আমাদের এই জ্ঞানকে আর ও একটু বেশি পরিপক্ক করতে আমরা সাহায্য নেবো programming language R এর।

এই কথা শুনে যারা programming পারেন না, তারা হতাশ হবেন না। আমি ও তেমন কিছু পারি না। আমি নিজেও শিখছি। কাজ করতে গেলে আপনি ও শিখে ফেলতে পারবেন। আর আমি সহজ একটা উদাহরন দিয়ে সহজ করে দেখানোর চেষ্টা করবো, ইনশাল্লাহ।

মনে করুন আপনি ঢাকা শহরে একটা অভিজাত ফ্ল্যাটে থাকেন। আর আপনার বাসায় যেই মহিলাটি কাজ করতে আসেন, তিনি পাশের একটা বস্তিতে থাকেন। আপনাদের দুই জনেরই থাকার জায়গা আছে, মানে বাসা আছে। কিন্তু বাসা গুলার মধ্যে আকাস-পাতাল তফাত। তার মানে বাসা বললেই আমরা সব সময় একটা সুগঠিত আকৃতি বা জিনিস চিন্তা করতে পারবো না। তাহলে কোষ অথবা cell এর বেলায় কি আমরা সুগঠিত জিনিস চিন্তা করবো কিনা? এমন একটা বাজে প্রশ্ন আমি করতেই পারি! উত্তর হল, সোজাসুজি “না”! তাহলে কোন কোষ দেখতে কেমন হবে তা আমি জানবো কিভাবে? ঠিক বাসার মতো। বাসাটা না দেখে আপনি শুধু যদি জানেন, এইটা কি মালিকের বাসা, নাকি কাজের লোকের বাসা, তাহলেই কিন্তু আপনি বলতে পারবেন যে বাসার অবস্তা কেমন হতে পারে (অনুমান করে)। ঠিক তেমনি, কোষ টা কোথা থেকে এসেছে অথবা কোষ টা কার তা জানলেই আপনি তার সম্পর্কে অনুমান করতে পারবেন। তার মানে, সোজা কথায় “কোষ টা কার”, তার উপর নির্ভর করছে তার গঠন!

কোষকে আমরা দুই ভাগে চিন্তা করতে পারি। প্রাককেন্দ্রিক কোষ (prokaryotic cell) এবং সুকেন্দ্রিক কোষ (eukaryotic cell)। গল্পটা টেনে নিয়ে আসলে বেশি সময় লাগবে না বুঝাতে। এখানে, কাজের লোকের বাসাটা হল প্রাককেন্দ্রিক কোষ এবং মালিকের বাসাটা হল সুকেন্দ্রিক কোষ। (কাল্পনিক)। আমাদের কিন্তু বাসা অথবা কোষ নিয়ে খুব একটা চিন্তা নেই। চিন্তা হল কোষ এর ভিতরের জিনিস নিয়ে। মনে মনে লেকচার ০২ এ ফিরে যান। সেখানে আমরা বলেছিলাম যে, কোষ এর ভিতরে থাকে DNA, chromosome এবং gene – সব কিছু। মালিকের এবং কাজের লোকের বাসার ভিতরের আসবাবপত্র যেমন এক রকম হবে না। তেমনি দুই রকম কোষ এর ভিতরের gene ও কিন্তু এক রকম পাবো না। মালিকের বাসায় খাট আছে, কাজের লোকের বাসায় ও খাট আছে। কিন্তু, দুই জনের খাট কি এক রে ভাই??? দুই জনের খাটের গঠন ভিন্ন, মান ভিন্ন (সাথে দাম ও!!!)। তেমনি দুই রকম কোষ এর মধ্যে gene এর গঠন ও ভিন্ন। তাহলে কোষ এর নাম অনুযায়ী gene গুলার ও নাম দেয়া যায়ঃ Prokaryotic gene এবং Eukaryotic gene. এবার চলেন একটা ছবি দেখি। তাহলে বুজতে পারবো যে, দুই রকমের gene এর মধ্যে তফাত টা কোথায়।

চিত্রঃ Prokaryotic gene এর গঠন

 চিত্রঃ Eukaryotic gene এর গঠন

দুই রকমের gene এর মধ্যে আসল তফাত তা একটা উদাহরন দিয়ে বলে দিচ্ছি। মালিকের বাসার খাটে অনেক নকশা আর কারুকাজ, যা কাজের লোকের বাসায় খাটে নেই। কিন্তু খাটের দরকার হল ঘুমানোর জন্য, ঐ সব নকশা-ফসকা দিয়ে কোন কাজ নেই। তেমনি eukaryotic gene এ থাকে intron, যা prokaryotic gene এ থাকে না। আর protein তৈরির একটা পর্যায়ে এই intron গুলা কেটে ফেলে দেয়া হয়। ঐ যে বললাম, নকশা দিয়ে হবে তা কি! [আধুনিক গবেষণায় দেখা গেছে যে, intro গুলা ও অনেক ক্ষেত্রে অনেক ভূমিকা পালন করে থাকে।]

আমরা সাধারন মানুষ গুলা সব সময় একটা নির্দিষ্ট গন্ডীর মধ্যে জীবনটাকে চিন্তা করি। যেমন, একটা নামি-দামি প্রতিষ্ঠানের সনদ, একটা ভালো চাকরি, একটা সুন্দরি বউ আর বাকি জীবন ছেলেমেয়ে মানুষ করে পার করে দেয়া। এ থেকে বলা যায় যে, আমরা অধিকাংশ মানুষ খুব “dogmatic” ভাবে চিন্তা করে থাকি। Life অথবা Biology ও কি এভাবে চিন্তা করে কিনা জানতে ইচ্ছা করে না? হুম…তাদের ও আমাদের মতো একটা গতানুগতিক রাস্তা আছে। তাদের ক্ষেত্রে, gene থেকে mRNA,mRNA থেকে protein অথবা catalytic RNA. এটাকেই বলা হয় “The Central Dogma Of Life”. সব মানুষের ক্ষেত্রে যেমন “dogmatic” রাস্তা টা সত্যি নয়, তেমনি বায়োলজিতে ও আমরা “The Central Dogma Of Life” এর এদিক-ওদিক কিছু পরিবর্তন দেখে থাকি। এই সম্পূর্ণ ঘটনাটাকে আমরা বলতে পারি gene এর বহিঃপ্রকাশ।

 চিত্রঃ The Central Dogma of Life

আবার ও গল্প জুড়ে দেই। সেই অভিজাত ফ্ল্যাটে থাকা মালিক! উনার অনেক টাকা, বাসায় অনেক গুলা কাজের মানুষ – দারোয়ান,ড্রাইভার,কাজের বুয়া। এদের মধ্যে সব গুলা লোক কিন্তু সব সময় বাসায় থাকে না। যেমন, ছুটা কাজের বুয়া, সে সকালে এসে কিছু কাজ করে চলে যায়। আমাদের কোষ এর মধ্যে ও এমন কিছু protein আছে যারা permanent কাজের লোকের মত সব সময় থাকে, আর কিছু আছে ছুটা বুয়ার মতো, মানে যখন দরকার হবে তখন কেবল ঐ protein গুলা তৈরি হবে। এই permanent কাজের লোক অথবা protein গুলা কে বলা হয় housekeeping enzyme or protein এবং ছুটা বুয়া গুলা কে বলা হয় constitutive enzyme or protein. আর তারা যেই সকল gene থেকে আসে তাদের নাম টা হয়ে যায়ঃ housekeeping gene এবং constitutive gene, যথাক্রমে।

একটা বাস্তব উদাহারন দেই। আপনি সব সময় ভাত খান। ভাত হল স্টার্চ। কিন্তু আপনি সব সময় দুধ খান না। দুধ হল lactose. তার মানে আপনার শরীরে সব সময় স্টার্চ ভাঙ্গার enzyme অথবা protein দরকার হবে। কিন্তু lactose ভাঙ্গার enzyme অথবা protein দরকার হবে না। আমাদের জানা উচিত, প্রকৃতি খুব হিসেব করে কাজ করে। যা দরকার নেই টা সে বানাবে কেন? তার মানে আমাদের শরীর যখন lactose পাবে, তখন তা ভাঙ্গার enzyme বানাবে। আমরা অনেকেই দুধ খেয়ে হজম করতে পারি না। এর কারন কিন্তু আর কিছু না, আপনার শরীর দীর্ঘদিন দুধ না পেতে পেতে এক সময় সে আর দুধ পাওয়ার পর ও lactose ভাঙ্গার enzyme বানাতে পারছে না। তাই আপনি বঞ্চিত হচ্ছেন দুধ জাতীয় সকল খাবার থেকে! বুজলেন কিছু… gene expression এর ব্যাপার?

তাত্ত্বিক আলোচনা এই পর্যন্ত রাখি। কথা হল তাহলে এখন কি শুরু হবে? আপনারা কি Micro array এর নাম শুনেছেন? এইটা খুবই জনপ্রিয় একটা technique. এটা পুরাটাই gene expression এর উপর ভিত্তি করে করা। কারো cancer হলে তার শরীরে হয়তো কোন gene বেশি অথবা কম express করে। আর gene expression এর pattern দেখে আমরা রোগ-বালাইয়ের অবস্থা বুঝতে পারি। Micro array নিয়ে পুরাপুরি আলোচনা করা এই লেকচার এ সম্ভব না। একটা ছোট problem solve করতে করতে আমরা সামনে এগিয়ে যাবো। এর মধ্যে দিয়ে আমরা অনেক কিছুই শিখতে পারবো বলে আশা করি।

অন্যান্য প্রোগ্রামিং ল্যাঙ্গুয়েজ এর মতো R ও একটা ল্যাঙ্গুয়েজ। কিন্তু এটার প্রধান বৈশিষ্ট্য হল এটা statistical কাজের জন্য অনেক ভালো একটা জিনিস। বর্তমানে R এবং R এর package গুলা ব্যাবহার করে অনেক মারাত্মক মারাত্মক কাজ করা যায় যা অন্য ল্যাঙ্গুয়েজ এ করতে গেলে অনেক কিছু লেখা লাগে।

আপনারা প্রবলেম solve শুরু করার আগে সবাই “R” এবং “R studio” install করে নেন আপনাদের কম্পিউটারে। এই বার নিচের ছবিটি দেখুন।

উপরের ছবিতে আমরা চারটা বক্স দেখছি। এখানে চারটা gene (gene A, gene B, gene C, gene D) এবং চারটা মানুষ, যার মধ্যে তিন জন রোগী (c1, c2, c3), আর একজন সাধারন/সুস্থ মানুষ (c4)। আর এই ডাটা গুলা পাওয়া গেসে pixel এর হিসেব থেকে, যা কিনা gene expression এর উপর ভিত্তি করে পাওয়া। আমরা এখন দেখি এই পার্ট টুকু “R” এ করা যায় কিনা। যেই যেই package গুলা এখানে ব্যাবহার করা হয়েছে তা ও আপনাদের install করে নেয়া লাগবে।

[interpretation এর খাতিরে data গুলা একটু পরিবর্তন করে নেয়া হল]

প্রথমে ডাটা input দেয়া লাগবেঃ

c1=c(10,20,30,40)

c2=c(400,300,200,100)

c3=c(30,200,60,100)

c4=c(100,100,100,100)

 

এখন input নেয়া ডাটা থেকে ছবির মতো একটা matrix বানাবোঃ

raw_data_mat=cbind(c1,c2,c3,c4)

raw_data_mat

rownames(raw_data_mat)=c(“gene A”,”gene B”,”gene C”,”gene D”)

absolute_data_mat=raw_data_mat

 

এই বার সুস্থ মানুষের সাপেক্ষে আমরা রোগীর gene expression হিসেব করবোঃ

relative_measurement=absolute_data_mat/c4

relative_data_mat=relative_measurement[,-4]

colnames(relative_data_mat)=c(“c1/c4″,”c2/c4″,”c3/c4”)

 

এই বার log operator ব্যাবহার করে ডাটা গুলাকে একটু size করাঃ

log_rel_data_mat=log2(relative_data_mat)

colnames(log_rel_data_mat)=c(“log2[c1/c4]”,”log2[c2/c4]”,”log[c3/c4]”)

 

এবার আমরা এই বের হওয়া মান গুলার মধ্যে correlation বের করবো এবং graph এ plot করে দেখবোঃ

z=cor(log_rel_data_mat)

z

require(lattice)

levelplot(z)

এখানে রঙ এর উপর ভিত্তি করে আমরা বুঝতে পারবো যে কোন কোন gene এর মধ্যে এই রোগের জন্য সম্পর্কটা কেমন। আর বুঝতে পারবো, এই রোগ হলে কোন কোন gene এর expression বাড়বে বা কমবে। কোনাকুনি correlation সব সময় +১ হবে। আর অন্য ঘর গুলা তে রঙ এর উপর ভিত্তি করে বুঝা যাবে কত টুকু correlated তারা। ডাটা গুলা একটু পরিবর্তন করে নেয়ার ফলে -১ থেকে +১ পর্যন্ত সব রকমের রঙ অথবা সম্পর্ক পাওয়া গেছে।

এই লেকচার এ Micro array এবং R এর সাথে আপনাদের সামান্য পরিচয় করানো ছাড়া আর কিছুই করা সম্ভব ছিল না। এবার নিজেরাই নিজের মতো চেষ্টা করতে থাকুন। “R” নিয়ে খেলতে থাকুন। শুভ কামনা রইল।

প্রয়োজনীয় কিছু লিঙ্কঃ

১. R book: http://cran.r-project.org/doc/contrib/Krijnen-IntroBioInfStatistics.pdf

২. Micro array animation: http://www.bio.davidson.edu/courses/genomics/chip/chip.html

 

 

 

শিক্ষকের পরিচয়

আমি আরিফ আশরাফ অপু। ঢাকা বিশ্ববিদ্যালয় এর প্রানরসায়ন এবং অনুপ্রান বিজ্ঞান বিভাগের চতুর্থ বর্ষের ছাত্র। Bio-Bio-1 এর সাথে প্রায় এক বছর ধরে পথ চলা। ভালোবাসি Genetics এবং Mathematics নিয়ে সময় কাটাতে। আর দুটি বড় project এ ছোটখাটো মানুষ হিসেবে contribute করার চেষ্টা করে যাচ্ছি।

 

Comments

comments

About the author

বায়ো-বায়ো-১ রিসার্চ ফাউন্ডেশন

বায়ো-বায়ো-১ এর যাত্রা শুরু ২০০৮ সালের শেষের দিকে কয়েকজন বায়োইনফরমেটিকস উৎসাহী নিয়ে। জীববিজ্ঞান, কম্পিউটারবিদ্যা, গণিত সহ বিভিন্ন বিভাগের শিক্ষার্থী এবং কর্মজীবিদের মাঝে পাঠচক্রের মাধ্যমে বায়োইনফরমেটিকস শেখা, চর্চা এবং সত্যিকারের কাজ করা বায়ো-বায়ো-১ এর লক্ষ্য। বায়োইনফরমেটিকসের জ্ঞান ছড়িয়ে দেয়ার জন্য ২০১২ সালের শুরু থেকে ঢাকা বিশ্ববিদ্যালয়ের অণুপ্রাণ ও প্রাণরসায়ন বিভাগে প্রতি সপ্তাহেই একটি উন্মুক্ত আলোচনা ও প্রশিক্ষণ সভা বসে বায়ো-বায়ো-১ এর আয়োজনে। বর্তমানে ঢাকা বিশ্ববিদ্যালয়ের অণুপ্রাণ ও প্রাণরসায়ন বিভাগ এবং অনুজীববিজ্ঞান বিভাগের সাথে আমাদের সহযোগী গবেষণা প্রকল্প চলছে। আমাদের উইকি ঠিকানা । যোগ দিন আমাদের ফেসবুক গ্রুপে

Leave a Reply