«

»

সেপ্টে. 09

পরিসংখ্যান পরিচিতি – লেকচার ১৪ – পয়সোঁ বিন্যাস (Poisson Probability Distribution)

এ যাবত অত্যন্ত ধীর গতিতে এগিয়ে আমরা দ্বিপদ বিন্যাস পর্যন্ত এসেছিলাম। আজ আমরা আরো একটি বিন্যাস নিয়ে আলোচনা করবো। তার আগে দ্বিপদ বিন্যাস খানিকটা রিভিউ করে নেব।

আগেই জেনেছি কোন দৈব চলকের সম্ভাবনার বিন্যাস জানা থাকলে আমরা তা ব্যবহার করে সহজেই সম্ভাবনা বের করতে পারি। সেই সাথে আরো কিছু বর্ণনামূলক তথ্যও আমরা বের করতে পারি, যেমন, গড়, ভেদ, ইত্যাদি।

গত পর্বে দ্বিপদ বিন্যাসে আমরা এমন একটি দৈব চলক সম্পর্কে জেনেছিলাম যা বাস্তব জীবনের অনেক ঘটনার ক্ষেত্রে প্রয়োগ করা যায়। আমরা বলেছিলাম এই চলকটি কোন ঘটনা যদি n সংখ্যকবার রিপিট করা হয় তাহলে এর মধ্যে কতবার “সাফল্য” পাওয়া যাবে তা নির্দেশ করে। যেমন, বাসে উঠে রাস্তার জ্যাম ঠেলে সময়মত অফিসে পৌছুঁতে পারাকে যদি আমরা সাফল্য ধরি, তাহলে মাসের ২০ দিনের মধ্যে কতদিন সময়মত পৌঁছুতে পারবেন সেই দৈব চলকটি দ্বিপদ বিন্যাস অনুসরণ করবে। এখানে আরো অনেকগুলো শর্ত পূরণ করতে হবে যেগুলো আমরা আগের পর্বে আলোচনা করেছি।

ট্রেনের উদাহরণ

ধরা যাক, একটি ট্রেন সময়মত আসবে তার সম্ভাবনা ৭০%. কিভাবে এটা জানলাম? দীর্ঘদিনের অভিজ্ঞতার আলোকে এটা জানা যেতে পারে। তাহলে আপনি যদি আগামী ৩০ দিন স্টেশনে বসে পর্যবেক্ষণ করেন তাহলে ট্রেনটি যতদিন সময়মত আসবে (অর্থাৎ “সাফল্য” ঘটবে) সেই দৈব চলকটি দ্বিপদ বিন্যাস অনুসরণ করবে। এখন আমরা যেহেতু জানলাম যে দৈব চলকটি দ্বিপন বিন্যাস অনুসরণ করবে, তাহলে আমরা নিচের প্রশ্নগুলোর উত্তর বের করতে পারবো।

১) ৩০ দিনের মধ্যে ১৫ দিন ট্রেনটি সময়মত আসবে তার সম্ভাবনা কত?

২) আপনি ঠিক করলেন ৩০ দিন নয়, আপনি ১৫ দিন পর্যবেক্ষণ করবেন। তো এই ১৫ দিনের মধ্যে ১২ দিন ট্রেনটি সময়মত আসবে তার সম্ভাবনা কত?

৩) সবচেয়ে বেশী দরকারী এবং সহজে বোঝা যায় এমন একটি প্রশ্ন হলো ১৫ দিন পর্যবেক্ষণ করলে ট্রেনটি গড়ে কতদিন সময়মতো আসবে?

উত্তর

১) দৈব চলকটি দ্বিপদ বিন্যাস অনুসরণ করছে। এখানে n=৩০ এবং প্রতিদিন সময়মতো আসার সম্ভাবনা p=.৭০. তাহলে ৩০ দিনের মধ্যে ১৫ দিন সময়মতো আসবে তার সম্ভাবনা প্রায় ১.০৫% যা খুবই কম।

২) একই ভাবে ১৫ দিনের মধ্যে ১২ দিন ট্রেনটি সময়মতো আসবে তার সম্ভাবনা

= Choose(15, 12) * (.7)^12 *  (.3)^3

=.17

অর্থাৎ প্রায় ১৭%

৩) এই প্রশ্নের উত্তর জানতে হলে আমাদের জানতে হবে দ্বিপদ বিন্যাসের গড় কিভাবে বের করা হয়।

দ্বিপদ বিন্যাসের গড়

আমরা বিস্তারিত বর্ণনায় না গিয়ে শুধু বলবো দ্বিপদ বিন্যাসের গড় বের করার সূত্র হলো

গড় = (যতবার পরীক্ষণটি সম্পন্ন করা হবে ) × (প্রতিবার সাফল্য আসার সম্ভাবনা)

এই সূত্র  মতে ১৫ দিন পর্যবেক্ষণ করলে গড়ে যতদিন ট্রেনটি সময়মত আসবে তা হলো–

গড় = (১৫ দিন পর্যবেক্ষণ করা হবে) × (প্রতি দিন সময়মত আসার সম্ভাবনা .৭) = ১০.৫

অর্থাৎ গড়ে প্রায় ১১ দিন ট্রেনটি সময়মতো আসবে।

একই ভাবে যদি আমরা ট্রেনটিকে ৩০ দিন পর্যবেক্ষণ করি তাহলে গড়ে (৩০ × .৭) = ২১ দিন ট্রেনটি সময়মতো আসবে বলে আশা করা যায়।

পয়সোঁ বিন্যাস

দ্বিপদ বিন্যাসের মতই আরেকটি বিন্যাস হল পয়সোঁ বিন্যাস। ইংরেজীতে লেখা হয় Poisson distribution. ফরাসি গণিতবিদ সিমিয়ন ডেনিস পয়সোঁ-এর নামানুসারে এই বিন্যাসের নামকরণ করা হয়েছে।

কেন আবার আরেকটি বিন্যাস?

প্রশ্নটি স্বাভাবিক। কেন আরেকটি বিন্যাসের প্রয়োজন!

প্রয়োজন– কারণ বাস্তব জীবনের সব ঘটনা দ্বিপদ বিন্যাস অনুসরণ করে না। সেরকম একটি ঘটনার কথা বিবেচনা করা যাক: ১০-১২টা পর্যন্ত ক্লাস চলাকালীন সময়ে আপনার মোবাইল ফোনে সর্বোচ্চ ৩টি ফোন আসবে তার সম্ভাবনা কত? কিংবা ধরা যাক মোড়ের দোকানে সন্ধ্যা ৬-৭টার মধ্যে কতজন চা খেতে আসবে? কিংবা একটি সুপার মার্কেটে সকাল ১০ টা থেকে রাত ১০ পর্যন্ত প্রতিদিন কতজন ক্রেতা আসবেন?

এরকম অন্তবর্তীকালীন সময়ে অর্থাৎ প্রদত্ত কোন সময়ের মধ্যে (যেমন প্রতি ঘন্টায়, বা প্রতি তিন ঘন্টায়) কোন একটি ঘটনা কতবার ঘটবে তাকে আমরা পয়সোঁ বিন্যাস দিয়ে ব্যাখ্যা করতে পারি। অর্থাৎ এরকম একটি ঘটনাকে যে দৈব চলক দিয়ে নির্দেশ করা যায় সেটি পয়সোঁ বিন্যাস অনুসরণ করে।

এরকম ঘটনা ঘটার সম্ভাবনা জানার জন্য আমাদের একটি বাড়তি তথ্যের দরকার হয়, সেটি হচ্ছে ঘটনাটি ঘটার হার বা রেইট। অর্থাৎ প্রতি ঘন্টায় বা প্রতি মিনিটি বা প্রতি ইউনিটে কত বার ঘটছে সেটি অতীত অভিজ্ঞতা থেকে কিংবা অন্য কোন উপায়ে জানা থাকতে হবে।

ঘটনাটি ঘটার হার জানা থাকলে সম্ভাবনা বের করার জন্য আমাদের সম্ভাবনা বিন্যাসটি (গাণিতিক সূত্র) ব্যবহার করতে হবে। যদি দৈব চলকটিকে X দিয়ে চিহ্নিত করি আর ঘটনাটি ঘটার হার-কে গ্রিক অক্ষর ল্যাম্বডা দিয়ে প্রকাশ করি তাহলে কোন অন্তর্বতীকালীন সময়ে x সংখ্যক ঘটনা ঘটার সম্ভাবনাকে নিচের সূত্রের সাহায্যে প্রকাশ করা যাবে—

উদাহরণ

ধরা যাক প্রতি ঘন্টায় আপানার মোবাইলে তিনটি করে ফোন আসে। তাহলে আগামী দুই ঘন্টায় আপনার কাছে কমপক্ষে ৭টি ফোন আসবে তার সম্ভাবনা কত?

উত্তর

এখানে দৈব চলকটি দুই ঘন্টায় কতটি ফোন আসবে সেটি নির্দেশ করছে। আমরা জানতে চাইছি চলকটির মান কমপক্ষে ৭ হবে তার সম্ভাবনা কত? এখানে দেয়া আছে যে প্রতি ঘন্টায় ৩টি ফোন আসে।

যেহেতু আমরা জানতে চাইছি দুই ঘন্টায় কমপক্ষে ৭টি ফোন আসার সম্ভাবনা, তাই প্রদত্ত ‘ফোন আসার হার’ অর্থাৎ ‘প্রতি ঘন্টায় ৩টি ফোন’ কে প্রতি দুই ঘন্টায় কত সেটিতে আগে প্রকাশ করতে হবে। আমরা বুঝতেই পারছি প্রতি ঘন্টায় ৩টি হলে প্রতি দুই ঘন্টায় ফোন আসার হার ৩ গুনন ২ = ৬টি। এটিই আমাদের ল্যাম্বডা’র মান। এটুকু বের করতে পারলে আমরা সম্ভাবনা-বিন্যাসের সূত্র ব্যবহার করে সম্ভাবনা বের করতে পারবো। উত্তরটি কিভাবে পাবো তা নীচে দেয়া হলো। উল্লেখ্য যে দৈব চলকটি কেবল মাত্র বিচ্ছিন্ন মান গ্রহণ করতে পারবে। অর্থাৎ ০, ১, ২ ইত্যাদি মান নিতে পারবে। ১.৫ বা এরকম ভগ্নাংশ মান নিতে পারবেন না কারণ এটি একটি বিচ্ছিন্ন বা ডিসক্রিট দৈব চলক (Discrete random variable).

এখন P(X <=6) কে আমরা এভাবে লিখতে পারি:

P(X<=6) = P(6 বা তার কম)

= P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) +P(X=5) + P(X=6)

এভাবে প্রতিটি সম্ভাবনা বের করে সেগুলো যোগ করে আমরা ৬টি বা তার কম সংখ্যক ফোন আসবে তার সম্ভাবনা পাই ০.৬০৬৩

তাহলে ৭বা তার বেশী সংখ্যক ফোন আসবে তার সম্ভাবনা = ১- .৬০৬৩ = .৩৯৩৭

অর্থাৎ প্রায় ৪০% সম্ভাবনা আছে যে আগামী দুই ঘন্টায় ৭ বা ততোধিক সংখ্যক ফোন আসবে।

গড় ও ভেদ

পয়সোঁ বিন্যাসের গড় এবং ভেদ এর মান একই—ল্যাম্বডা। উপরের উদাহরণের ক্ষেত্রে দুই ঘন্টায় গড়ে ৬টি ফোন আসতে পারে। কারণ এই উদাহরণে ল্যাম্বডার মান ৬.

 

কুইজ

ধরা যাক প্রতি বছর বাংলাদেশের কোন একটি জেলায় গড়ে ২৫ জন একটি বিশেষ ভাইরাসে আক্রান্ত হয়। এই হার বজায় থাকলে

ক) আগামী বছর সেই জেলায় ২৫ বা তার বেশী মানুষ আক্রান্ত হবে তার সম্ভাবনা কত?

খ) ১০ জনের কম লোক আক্রান্ত হবে তার সম্ভাবনা কত?

গ) ৩০ জনের বেশী আক্রান্ত হবে তার সম্ভাবনা কত?

উত্তর

ক) .৫২৬৭ বা ৫২.৬৭%

খ) .০২২৩ বা ২.২৩%

গ) .১৮২১ বা ১৮.২১%

সম্ভাবনাগুলো নিজে বের করার চেষ্টা করুন। না পারলে এখানে প্রশ্ন রাখুন।

আজ এ পর্যন্তই থাক। আগামী পর্বে নরমাল বিন্যাস নিয়ে আলোচনা করার আশা রাখছি।

 

আগের লেকচার-এর লিংক

ভূমিকা

লেকচার ১ – উপাত্ত সংগ্রহ

লেকচার ২ – গবেষণা পদ্ধতি ও চলক সম্পর্কে ধারণা

লেকচার ৩ – ড্যাটা সামারি বা উপাত্ত সারাংশ (কোয়ালিটেটিভ ভ্যারিয়েবল)

লেকচার ৪ – হিস্টোগ্রাম ও ড্যাটার শেইপ

লেকচার ৫ – কেন্দ্রীয় প্রবণতা ও তার পরিমাপসমূহ

লেকচার ৬ – ভেদ ও এর পরিমাপসমূহ 

লেকচার ৭ – তুলনামূলক অবস্থান ও z-score

লেকচার ৮ – সম্ভাবনার খুঁটি 

লেকচার ৯ – গণনার পদ্ধতিসমূহ

লেকচার ১০ – সম্ভাবনা

লেকচার ১১ – কতিপয় জটিল ঘটনার সম্ভাবনা

লেকচার ১২ – দৈব চলক ও তার সম্ভাবনা বিন্যাস

লেকচার ১৩ – দ্বিপদ বিন্যাস

কোর্সের সূচনা পাতা

Comments

comments

About the author

এনায়েতুর রহীম

পরিসংখ্যান নিয়ে আছি প্রায় দুই দশক -- এখনো শিখছি--পড়ে এবং পড়ানোর মাধ্যমে। ঢাকা বিশ্ববিদ্যালয় থেকে ফলিত পরিসংখ্যানে ব্যাচেলরস, মাস্টার্স। গবেষণা মূলত গাণিতিক পরিসংখ্যান নিয়ে। বিশেষভাবে কাজ করি রিগ্রেশন মডেলে Shrinkage and Absolute Penalty Estimation নিয়ে। আরো কাজ করি পরিসংখ্যান বিষয়ক সফটওয়্যার, মন্টি কারলো, রিস্যাম্পলিং, জনস্বাস্থ্য ও এপিডেমিওলজি, এবং পরিবেশ বিষয়ক পরিসংখ্যানে। কর্মজীবন শুরু ঢাকা বিশ্ববিদ্যালয়ে শিক্ষকতার মাধ্যমে। বর্তমানে ইউনিভার্সিটি অব নর্দার্ন কলোরাডো তে ফলিত পরিসংখ্যানের সহকারী অধ্যাপক হিসেবে কর্মরত। ব্যক্তিগত সাইট

Leave a Reply