[নিবন্ধনের লিংক] [কোর্সের মূল পাতা]
দৈব চলক ও তার সম্ভাবনা বিন্যাস (Random Variable and its Probability Distribution)
এনায়েতুর রহীম
আমরা ইতোমধ্যেই চলক সম্পর্কে জেনেছি। সম্ভাবনা সম্পর্কেও প্রয়োজনীয় অংশটুকু বিস্তারিত আলোচনা করেছি। এ পর্বে আমরা Probability Distribution বা সম্ভাবনা বিন্যাস নিয়ে আলোচনা করবো। সম্ভাবনা বিন্যাস বোঝার জন্য আমি সহজ কতগুলো উদাহরণ দিব। যেগুলি কৌশলগত ভাবে ত্রুটিমুক্ত নয়। তবে সম্ভাবনা বিন্যাস বোঝার জন্য সহায়ক হবে বলে মনে করি।
সম্ভাবনা বিন্যাস জানতে হলে দৈব চলকের বিষয় চলে আসবে। আমরা চলক কী তা জানি। দৈব চলক অনেকটা চলকের মতই একটি বিষয় যা নমুনা ক্ষেত্রের সাথে সম্পর্কযুক্ত। তাত্ত্বিক সংজ্ঞায় না গিয়ে একটি উদাহরণের মাধ্যমে দৈব চলক কী তা দেখার চেষ্টা করি। উদাহরণটি বুঝতে পারলে তখন সংজ্ঞায়িত করা যাবে।
উদাহরণ ১ (দৈব চলক)
ধরি দুটি কয়েন টস করা হবে। আমাদের উদ্দেশ্য এমন একটি চলক সম্পর্কে যা “কতবার হেড ওঠে” তা নির্দেশ করে। চলকটিকে আমরা X দিয়ে চিহ্নিত করবো। অর্থাৎ
X = দুটি টস করলে যতবার হেড আসবে
তাহলে দেখা যাক দুটি কয়েন টস করলে আমাদের নমুনাক্ষেত্রের উপাদানগুলো কী কী। এই পরীক্ষণটি আমরা আগেও করেছি। গুননের নিয়মে আমরা জানি নমুনাক্ষেত্রে চারটি উপাদান থাকবে। সেগুলো নিচের সারণিতে দেয়া হল।
প্রথম টসের ফলাফল | দ্বিতীয় টসের ফলাফল | নমুনাক্ষেত্রের উপাদান |
H | H | HH |
H | T | HT |
T | H | TH |
T | T | TT |
এবার এই সারণিতে আরেকটি কলাম যোগ করি যা আমাদের চলককে নির্দেশ করবে।
প্রথম টসের ফলাফল | দ্বিতীয় টসের ফলাফল | নমুনাক্ষেত্রের উপাদান | X = হেড-এর সংখ্যা(চলকের মান) |
H | H | HH | ২ |
H | T | HT | ১ |
T | H | TH | ১ |
T | T | TT | ০ |
দেখা যাচ্ছে আমাদের চলকটি ০, ১ অথবা ২ এই তিনটি সংখ্যা যেকোন একটি নিতে পারে। চলকের সম্ভাব্য মানগুলো ০, ১ এবং ২ এর বাইরে কোনটিই হতে পারে না। আরো লক্ষ্যনীয় যে চলকটির মান কত হবে তা নমুনাক্ষেত্রের উপাদানের উপর নির্ভরশীল। এ ধরনের চলককে পরিসংখ্যানে “দৈব চলক” বলে।
দৈব চলক এর সংজ্ঞা
দৈব চলক হলো এমন একটি ফাংশন যেটি নমুনাক্ষেত্রের প্রতিটি উপাদানের উপর একটি সংখ্যা বসিয়ে দেয়।
উপরের উদাহরণে HH উপাদানটির উপর ২ বসানো হয়েছে। আবার TT উপাদানটির এর উপর শুন্য বসানো হয়েছে। উল্লেখ্য যে দৈব চলক নমুনাক্ষেত্রের একাধিক উপাদানের উপর একই মান বসাতে পারে। কিন্তু প্রত্যেকটি উপাদান কেবলমাত্র একটি মান গ্রহণ করতে পারবে। উপরের সারণিতে দেখুন ১ মানটি দুটি উপাদানের উপর বসানো হয়েছে, কিন্তু প্রত্যেকটি উপদান শুধুমাত্র একটি মান গ্রহণ করেছে।
সম্ভাবনা বিন্যাস এর ধারণা
সম্ভাবনা বিন্যাস কী?
এটি জানার আগে আমরা একটি প্রশ্নের উত্তর জানার চেষ্টা করি।
ধরুন আপনি জানতে চাইছেন দুটি কয়েন টস করলে দুই বার হেড আসার সম্ভাবনা কত। তাহলে প্রথমেই আমাদের জানতে হবে দুটি কয়েন টস করলে নমুনাক্ষেত্রের কী কী উপাদান থাকবে। এরপর দৈব চলকটিকে নির্ধারণ করতে হবে। উপরে X চলকটি দিয়ে আমরা হেড-এর সংখ্যা নির্দেশ করেছি। তাহলে আসলে আমরা জানতে চাইছি X চলকটি ২ মান গ্রহণ করবে তার সম্ভাবনা কত। গণিতের নোটেশন ব্যবহার করে বলা যায়
P(X = 2) = ?
এই প্রশ্নের উত্তর বের করা কিন্তু একদম সহজ। তুলনামূলক ঘটনসংখ্যা সম্পর্কে আমরা আগেই জেনেছি। সেটি ব্যবহার করেই সম্ভাবনা বের করতে পারা যাবে।
উপরের সারণিটির দিকে যদি আবারো তাকাই তাহলে আমরা দেখব নমুনাক্ষেত্রের প্রতিটি উপাদান আসার সম্ভাবনা ১/৪ = ০.২৫. অর্থাৎ P(HH) = P(HT) = P(TH) = P(TT) = ০.২৫
তাহলে দুটি হেড আসার সম্ভাবনা = P(HH) = ০.২৫
একটি হেড আসার সম্ভাবনা = P(HT) + P(TH) = ০.২৫ + ০.২৫ = ০.৫০
কোন হেড না আসার সম্ভাবনা = P(TT) = ০.২৫
এই ফলাফল গুলো যদি আমরা এমন একটি সারণির মাধ্যমে উপস্থাপন করি যেখানে দৈব চলকের মান এবং দৈব চলকটি সাই মান গ্রহণ করবে তার সম্ভাবনা দেয়া থাকবে তাহলে সেই সারণিতে দেখতে এরকম হবে—
দৈব চলকের মান (X=x) | নোটেশন P(X = x) | সম্ভাবনা |
০ | P(X=0) | ০.২৫ |
১ | P(X=1) | ০.৫০ |
২ | P(X=2) | ০.২৫ |
এখানে ছোট হাতের x দিয়ে দৈব চলকটি যে মান গ্রহণ করে সেটি বোঝানো হয়েছে।
এরকম একটি সারণিকে সম্ভাবনা বিন্যাস বলে। সারণির মানগুলোকে আমরা লেখচিত্রের মাধ্যমেও প্রকাশ করতে পারি। নিচের চিত্রে দৈব চলকটি যে মান গ্রহণ করতে পারে এবং তার সম্ভাবনাকে স্তম্ভচিত্রের মাধ্যেমে দেখানো হয়েছে। এরকম চিত্রকেও আমরা সম্ভাবনা বিন্যাস বলবো।
সম্ভাবনা বিন্যাসকে গাণিতিক সূত্রের মাধ্যমেও প্রকাশ করা যায়। তাহলে সম্ভাবনা বিন্যাস ব্যাপারটা আসলে সহজ। এটিকে এভাবে সংজ্ঞায়িত করা যায়—
সম্ভাবনা বিন্যাস
সম্ভাবনা বিন্যাস হলো একটি সারণি বা চিত্র বা ফরমুলা যার দ্বারা কোন দৈব চলকের সম্ভাব্য সকল মান এবং সেই মান গ্রহণ করার সম্ভাবনাকে প্রকাশ করা হয় তাকেই সম্ভাবনা বিন্যাস বলে।
বিচ্ছিন্ন ও অবিচ্ছিন্ন সম্ভাবনা বিন্যাস
দৈব চলকের উপর ভিত্তি করে সম্ভাবনা বিন্যাস বিচ্ছিন্ন কিংবা অবিচ্ছিন্ন হতে পারে। বিচ্ছিন্ন সম্ভাবনা বিন্যাসে (Discrete probability distribution) দৈব চলকটি বিচ্ছিন্ন বা discrete, আর অবিচ্ছিন্ন সম্ভাবনা বিন্যাসে (Continuous probability distribution) দৈব চলকটি হয় অবিচ্ছিন্ন বা continuous.
দৈব চলকের গড়, ভেদ ও পরিমিত ব্যবধান (Mean, Variance and Standard Deviation of a Random Variable)
বাস্তব জীবনে দৈব চলকের ব্যবহার ব্যাপক। দৈব চলকের বিন্যাস জানার পাশাপাশি আমাদের জানতে হবে কিভাবে একটি দৈব চলকের গড়, ভেদ এবং পরিমিত ব্যবধান বের করা হয়। ব্যাপারটা সহজে বোঝার জন্য আমরা বিচ্ছিন্ন দৈব চলকের এবং বিচ্ছিন্ন সম্ভাবনা বিন্যাসের কয়েকটি উদাহরণ দিব।
উদাহরণ ২ (বিচ্ছিন্ন সম্ভাবনা বিন্যাস)
(এটি একটি কাল্পনিক উদাহরণ)
ধরা যাক শিক্ষক ডট কমে কোন একটি পাঠ প্রকাশিত হওয়া ২ ঘন্টার মধ্যে কতজন সেটি পড়ে সেটি আমাদের আলোচ্য দৈব চলক। আগের অভিজ্ঞতা থেকে জানা যায় প্রথম ২ ঘন্টার মধ্যে কোন পাঠক লেখাটি পড়বেনা তার সম্ভাবনা ৩/২০, একজন পাঠক লেখাটি পড়বে তার সম্ভাবনা ৭/২০, দুইজন পড়বে তার সম্ভাবনা ৫/২০, তিনজন পড়বে তার সম্ভাবনা ৩/২০ এবং চারজন জন পড়বে তার সম্ভাবনা ২/২০.
এখানে দৈব চলকটি হলো কতজন লেখাটি পড়ে সেই সংখ্যা। এটি একটি বিচ্ছিন্ন চলক। আমরা দৈব চলকটিকে বড় হাতের Y দিয়ে নির্দেশ করবো। আর দৈব চলকটি যে মান গ্রহণ করবে সেটিকে ছোট হাতের y দিয়ে প্রকাশ করবো।
দৈব চলকের সম্ভাবনা বিন্যাসটি নিচের সারণিতে দেয়া হলো।
দৈব চলকের মান y | সম্ভাবনা P(Y=y) |
০ | ৩/২০ |
১ | ৭/২০ |
২ | ৫/২০ |
৩ | ৩/২০ |
৪ | ২/২০ |
লক্ষ্য করুন, সম্ভাবনাগুলোর যোগফল সবসময়ই ১ হতে হবে। কারণ মোট সম্ভাবনা = ১
আমরা জানতে চাইবো
১) প্রথম ২ ঘন্টার মধ্যে কমপক্ষে তিনজন লেখাটি পড়বে তার সম্ভাবনা কত?
২) প্রথম ২ ঘন্টার মধ্যে গড়ে কতজন লেখাটি পড়বে?
উত্তর
১) এর উত্তর বের করা আমরা ইতোমধ্যেই শিখেছি। সঠিক উত্তর হবে
কমপক্ষে তিন জন মানে হলো ৩ বা তার অধিক জন পড়বে তার সম্ভাবনা, অর্থাৎ
P(Y >= ৩) = P(Y =৩) + P(Y=৪) = ৩/২০ + ২/২০ = ৫/২০ = ০.২৫
২) এর উত্তর জানতে হলে আমাদের শিখতে হবে কিভাবে বিচ্ছিন্ন সম্ভাবনা বিন্যাসের গড় বের করতে হয়। এখানে আমরা Y দৈব চলকটির গড় বের করবো। গড়কে আমরা Expectation বলে থাকি। একে E(Y) দ্বারা প্রকাশ করা হয়।
গড় বের করার সূত্রটি হলো
E(Y) = (দৈব চলকটির মান) গুনন (তার সম্ভাবনা )
আমাদের উদাহরণ থেকে পাই
গড়ে যতজন পাঠ করবে
= E(Y)
= ০(৩/২০) + ১(৭/২০) + ২(৫/২০) + ৩(৩/২০) + ৪(২/২০)
= ৭/২০ + ১০/২০ + ৮/২০
=২৫/২০
= ১.২৫
অর্থাৎ গড়ে এক জনের কিছু বেশী পাঠক লেখাটি প্রথম ২ ঘন্টার মধ্যে পড়বে।
দৈব চলকের ভেদ ও পরিমিত ব্যবধান
দৈব চলকের ভ্যারিয়্যান্স বা ভেদ বের করার জন্য আমরা নিচের সূত্রটি ব্যবহার করবো।
ভেদ = যোগ করুন [(চলকের মান – গড়)২ গুনন (সম্ভাবনা)]
আমাদের উদাহরণের ক্ষেত্রে দৈব চলকটির ভেদ
= (০ – ১.২৫)২(৩/২০) + (১ – ১.২৫)২(৭/২০) + (২ – ১.২৫)২(৫/২০) + (৩ – ১.২৫)২(৩/২০) + (৪ – ১.২৫)২(২/২০)
= (-১.২৫)২(৩/২০) + (-.২৫)২(৭/২০) + (.৭৫)২(৫/২০) + (১.৭৫)২(৩/২০) + (২.৭৫)২(২/২০)
= ১.৬১২৫
তাহলে, পরিমিত ব্যবধান = ১.৬১২৫ এর বর্গমূল = ১.২৭
আগামী পর্বে আমরা দ্বিপদ বিন্যাস নিয়ে আলোচনা করবো।
আগের লেকচার-এর লিংক
লেকচার ২ – গবেষণা পদ্ধতি ও চলক সম্পর্কে ধারণা
লেকচার ৩ – ড্যাটা সামারি বা উপাত্ত সারাংশ (কোয়ালিটেটিভ ভ্যারিয়েবল)
লেকচার ৪ – হিস্টোগ্রাম ও ড্যাটার শেইপ
লেকচার ৫ – কেন্দ্রীয় প্রবণতা ও তার পরিমাপসমূহ
লেকচার ৬ – ভেদ ও এর পরিমাপসমূহ
লেকচার ৭ – তুলনামূলক অবস্থান ও z-score
লেকচার ১১ – কতিপয় জটিল ঘটনার সম্ভাবনা