«

»

জুলাই 08

পরিসংখ্যান পরিচিতি – লেকচার ১৩ – দ্বিপদ বিন্যাস (Binomial Distribution)

গত পর্বে আমরা জেনেছি সম্ভাবনার বিন্যাস সম্পর্কে। যারা এখনো সম্ভাবনার বিন্যাস কী তা জানেন না, তারা লেকচার ১২ আগে পড়ে নিন। সম্ভাবনা বিন্যাস না বুঝলে আজকের পর্বটি বুঝতে পারবেন না। বুঝতে পারা বলতে আমি কনসেপ্ট বোঝার কথা বলছি। ফর্মুলা দিয়ে অংক করা যায় কিন্তু ফর্মুলা কিভাবে কাজ করে বা একটি ফর্মুলা কেন একটি বিশেষ ক্ষেত্রে প্রযোজ্য হয় সেটা জানা জরুরী।

বাংলাদেশের জনবিন্যাস বা Population distribution জানা থাকা যেমন দরকারী তেমনি দরকারি সুন্দরবনের বাঘের বিন্যাস (Distribution of tiger population) জানা। বিন্যাস জানা থাকলে আমরা সহজেই বলতে পারবো সুন্দরবনের কোন অঞ্চলে কতটি বাঘ থাকতে পারে। তেমনি জনবিন্যাস জানা থাকলে অর্থাৎ দেশের কোন বিভাগে কতজন মানুষ বাস করে সেটা জানা থাকলে প্রশাসনিক নানা সিদ্ধান্ত গ্রহণ সহজ হয়। উদাহরণ স্বরূপ বলা যায় কোন এলাকায় নতুন একটি বিদ্যালয় খোলা দরকার কি দরকার নয় তা নির্ভর করে সেই এলাকায় বিদ্যালয়গামী ছেলেমেয়েদের সংখ্যার উপর। সরকারের কাছে তাই কোন এলাকার জনবিন্যাসের সর্বশেষ  তথ্য-উপাত্ত থাকা খুবই দরকারি। জনবিন্যাস জানা না থাকলে সুষম উন্নয়ন ব্যহত হতে পারে।

জনবিন্যাসের মত সম্ভাবনার বিন্যাস জানা থাকলে আমরা সম্ভাবনা গণনা করতে পারবো। অর্থাৎ কোন একটি ঘটনার সম্ভাবনা বিন্যাস জানা থাকলে সেই বিন্যাসকে ব্যবহার করে সেই ঘটনাটি ঘটার সম্ভাবনা বের করা যাবে। গত পর্বে আমরা সম্ভাবনার বিন্যাসকে সংজ্ঞায়িত করেছি। সেখানে বলেছিলাম সম্ভাবনার বিন্যাস হলো একটি সারণি বা একটি চিত্র বা একটি ফর্মুলা যেখানে একটি দৈব চলক (Random variable) যে যে মান গ্রহণ করতে পারে সেগুলি এবং সেই মানগুলি গ্রহণ করার সম্ভাবনা দেয়া থাকে তাকে সম্ভাবনা বিন্যাস বলে।

উদাহরণ ১

২বার টস করলে দুইবারই হেড আসার সম্ভাবনা কত?

এই উদাহরণটি আমরা গত পর্বে দিয়েছিলাম। সেখানে দেখিয়েছিলাম দুটি কয়েন টস করলে যতবার হেড আসবে—সেই দৈব চলকের সম্ভাবনা বিন্যাস।

দৈব চলকের মান

(X=x)

নোটেশন

P(X = x)

সম্ভাবনা

P(X=0)

০.২৫

P(X=1)

০.৫০

P(X=2)

০.২৫

 

এরকম একটি সারণি থেকে আমরা জানি দুটি কয়েন টস করলে দুই বারই হেড আসবে তার সম্ভাবনা ২৫%. আর একবারও হেড আসবেনা তার সম্ভাবনাও ২৫%. পরীক্ষণটির সম্ভাবনা বিন্যাস জানা থাকায় আমরা দেখতে পাই যে ১বার হেড উঠবে তার পক্ষে বাজি ধরা বেশী লাভজনক। কারণ একবার হেড আসার সম্ভাবনা ৫০% যা অন্য দুটি ফলাফলের চেয়ে বেশী সম্ভাব্য।

উদাহরণ ২

উদাহরণ ১ এর মত আরেকটি পরীক্ষণ আমরা করব যেখানে একটি কয়েনকে ৫ বার টস করা হবে। আমরা জানতে চাইবো ৫বারের মধ্যে ২ বার হেড আসার সম্ভাবনা কত?

এই পরীক্ষণের সম্ভাব্য যত ফলাফল হতে পারে তার মধ্যে একটি হলো HHTTT

এখানে দেখা যাচ্ছে প্রথম টসে হেড উঠেছে, দ্বিতীয় টসেও হেড উঠেছে এবং বাকী তিনটি টসেই টেইল উঠেছে। এরকম আরো একটি ফলাফল হতে পারে HTHTT.  এখানেও দুটি হেড উঠেছে যদিও সেটি কততম টসে উঠেছে সেটি ভিন্ন। কিন্তু কততম টসে হেড উঠল সেটি আমাদের কাছে গুরুত্বপূর্ণ নয় কারণ আমাদের কাছে ৫বার টসে ২ বার হেড উঠলেই হবে। তা যেভাবেই উঠুক। অর্থাৎ ঘটনা ঘটার ক্রম এখানে গুরুত্বপূর্ণ নয়।

এখানে আমাদেরকে জানতে হবে কত ভাবে এরকম দুটি হেড উঠতে পারে। সেটি আমরা কম্বিনেশনের (সমাবেশ) নিয়ম ব্যবহার করে বের করতে পারবো। আমরা পাই (৫ কম্বিনেশন ২)  = ১০ ভাবে।

এবার HHTTT ওঠার সম্ভাবনা কত তা দেখা যাক।

প্রতিটি টসে হেড ওঠার সম্ভাবনা ১/২. সে হিসেবে প্রতিটি টসে টেইল ওঠার সম্ভাবনাও ১/২. আর প্রতিটি টস আলাদা আলাদা অর্থাৎ একটি টসের সাথে আরেকটি টসের কোন সম্পর্ক নেই। তাহলে গুননের নিয়মে HHTTT ফলটি আসার সম্ভাবনা

= P(HHTTT)

= P(H) P(H) P(T) P(T) P(T)

= (১/২) (১/২) (১/২) (১/২) (১/২)

= (১/২)

= ০.০৩১২৫

আর আগেই দেখেছি ৫টি টসে ২ বার হেড আসতে পারে ১০ ভাবে, তাই মোট সম্ভাবনা

= (০.০৩১২৫) + (০.০৩১২৫) + (০.০৩১২৫) +… এভাবে ১০ বার যোগ করতে হবে

= (১০) (০.০৩১২৫)

= ০.৩১২৫

একই নিয়মে আমরা ৫টি টসে ৩ বার হেড আসার সম্ভাবনাও বের করতে পারবো। কিন্তু এভাবে হাতে হাতে গুনে সম্ভাবনা বের করা সময়সাপেক্ষ ব্যাপার। আর তাছাড়া সহজেই ভুল হয়ে যেতে পারে। তাই এভাবে সম্ভাবনা গণনার পদ্ধতিকে একটি সূত্রের মাধ্যমে প্রকাশ করতে পারলে ভালো হবে।

যদি আমাদের দৈব চলক হয় X আর সেটি যে মান গ্রহণ করে সেটিকে যদি ছোট হাতের x দিয়ে প্রকাশ করি, তাহলে n সংখ্যক টসে x সংখ্যক হেড আসবে তার সম্ভাবনার সূত্র হবে–

এই সূত্র ব্যবহার করে আমরা জানতে চাইবো ১০ বার টস করলে ৭ বার হেড আসবে তার সম্ভাবনা কত?

এখানে  n = 10 এবং x = 7. তাহলে সম্ভাবনা হবে–

দ্বিপদ বিন্যাস

বাস্তব জীবনে অনেক ক্ষেত্রেই উপরের উদাহরণের মতো পরিস্থিতি আমরা দেখতে পাই। যেমন ধরুন কোন একটি পরীক্ষায় আপনি বিনা প্রস্ততিতে অংশ নিচ্ছেন। সেখানে ২০টি প্রশ্ন আছে এবং প্রতিটি প্রশ্নে ৪টি করে অপশন আছে যার মধ্যে একটি মাত্র সঠিক। আপনি যদি আন্দাজে উত্তর দেন তাহলে ১০টি প্রশ্নের উত্তর সঠিক ভাবে দিতে পারবেন তার সম্ভাবনা কত? (উত্তর জানতে কুইজ-৩ এ অংশ নিন)

এই সমস্যাটি ঠিক কয়েন টসের সমস্যাটির মতো। আপনার দৈব চলকটি হলো X যেটি ২০টির মধ্যে কতটি উত্তর সঠিক হবে তা নির্দেশ করছে। এই দৈব চলকটি ০ থেকে ২০ পর্যন্ত মান গ্রহণ করতে পারে। এরকম পরীক্ষণে সঠিক উত্তর করতে পারাকে আমরা সাফল্য (success) বলতে পারি আর ভুল উত্তর করারকে ব্যর্থতা (failure) হিসেবে চিহ্নিত করতে পারি। ধরি সফল হওয়ার সম্ভাবনা p, তাহলে ব্যর্থ হওয়ার সম্ভাবনা 1-p.

তাহলে দ্বিপদ বিন্যাস হলো এরকম পরীক্ষণ যার দুটি মাত্র সম্ভাব্য উত্তর থাকে যার একটি হবে success আর অপরটি হবে failure.  সেরকম পরীক্ষণ যদি n সংখ্যক বার সম্পন্ন করা হয় তাহলে X বার সফলতা আসবে তার সম্ভাবনাকে সূত্রের মাধ্যমে প্রকাশ করলে যা হবে —

এরকম একটি পরীক্ষণের ক্ষেত্রে নিম্নে লিখিত শর্তগুলি পুরণ করতে হবে।

১) পরীক্ষণটি n সংখ্যকবার সম্পন্ন করা হবে একই রকম ভাবে।

২) প্রতিবার পরীক্ষণটিতে কেবলমাত্র দুই ধরনের ফলাফল আসতে পারে—সফলতা অথবা ব্যর্থতা।

৩) প্রতিবার পরীক্ষণটি সম্পন্ন করলে সফল হওয়ার সম্ভাবনা একই থাকবে। অর্থাৎ যতবারই পরীক্ষণটি করা হোক না কেন সফল হওয়ার সম্ভাবনা প্রতিটি ক্ষেত্রেই একই থাকবে।

এই শর্তগুলোর সবগুলো পূরণ হলেই দৈব চলকটি দ্বিপদ বিন্যাস অনুসরণ করবে এবং উপরের সূত্র ব্যবহার করে সম্ভাবনা বের করা যাবে।

এবারে কুইজে অংশ নিয়ে যাচাই করুন দ্বিপদ বিন্যাস আপনি কতটা বুঝতে পেরেছেন। আর কোন প্রশ্ন থাকলে অবশ্যই মন্তব্যের মাধ্যমে জানাবেন।

কুইজ ৩

কুইজ ৩: দ্বিপদ বিন্যাস

আপনার নাম এবং ইমেইল ঠিকানা ঠিকঠাক মতো দিন। ইমেইল ঠিকানা ঠিক মতো দিলে কুইজের ফলাফল এবং ভুল উত্তরের ব্যাখ্যা পৌঁছে যাবে আপনার ঠিকানায়।
* Required
    This is a required question
    This is a required question
    This is a required question
    This is a required question
    This is a required question
    Never submit passwords through Google Forms.

 

আগের লেকচার-এর লিংক

ভূমিকা

লেকচার ১ – উপাত্ত সংগ্রহ

লেকচার ২ – গবেষণা পদ্ধতি ও চলক সম্পর্কে ধারণা

লেকচার ৩ – ড্যাটা সামারি বা উপাত্ত সারাংশ (কোয়ালিটেটিভ ভ্যারিয়েবল)

লেকচার ৪ – হিস্টোগ্রাম ও ড্যাটার শেইপ

লেকচার ৫ – কেন্দ্রীয় প্রবণতা ও তার পরিমাপসমূহ

লেকচার ৬ – ভেদ ও এর পরিমাপসমূহ 

লেকচার ৭ – তুলনামূলক অবস্থান ও z-score

লেকচার ৮ – সম্ভাবনার খুঁটি 

লেকচার ৯ – গণনার পদ্ধতিসমূহ

লেকচার ১০ – সম্ভাবনা

লেকচার ১১ – কতিপয় জটিল ঘটনার সম্ভাবনা

লেকচার ১২ – দৈব চলক ও তার সম্ভাবনা বিন্যাস

কোর্সের সূচনা পাতা

Comments

comments

About the author

এনায়েতুর রহীম

পরিসংখ্যান নিয়ে আছি প্রায় দুই দশক -- এখনো শিখছি--পড়ে এবং পড়ানোর মাধ্যমে। ঢাকা বিশ্ববিদ্যালয় থেকে ফলিত পরিসংখ্যানে ব্যাচেলরস, মাস্টার্স। গবেষণা মূলত গাণিতিক পরিসংখ্যান নিয়ে। বিশেষভাবে কাজ করি রিগ্রেশন মডেলে Shrinkage and Absolute Penalty Estimation নিয়ে। আরো কাজ করি পরিসংখ্যান বিষয়ক সফটওয়্যার, মন্টি কারলো, রিস্যাম্পলিং, জনস্বাস্থ্য ও এপিডেমিওলজি, এবং পরিবেশ বিষয়ক পরিসংখ্যানে। কর্মজীবন শুরু ঢাকা বিশ্ববিদ্যালয়ে শিক্ষকতার মাধ্যমে। বর্তমানে ইউনিভার্সিটি অব নর্দার্ন কলোরাডো তে ফলিত পরিসংখ্যানের সহকারী অধ্যাপক হিসেবে কর্মরত। ব্যক্তিগত সাইট

Leave a Reply