[নিবন্ধনের লিংক] [কোর্সের মূল পাতা]
পরিসংখ্যান পরিচিতি
ভিডিও-ডাউনলোড লিংক
3GP (৪ মেগা) | MP4 (২৪ মেগা) | প্লে-ব্যাক : ৬ মিনিট
ভূমিকা
২০০৯ সনের কোন একটা সময়ের কথা বলছি। রাগিব হাসানের ফেসবুকে এরকম একটা স্ট্যাটাস ছিল:
Google is a high energy environment. Lots of smart people with big ideas. Everything is data driven. Decisions are made based on data that has been analyzed, and going forward everything is monitored and measured based on the data. Opinions and “gut feel” are considered too, but in the end, results are measured by data. Even things like travel expense caps for airfares and hotels are data driven. They keep track of every trip taken and the actual costs for airfares and hotels, then establish the caps based on the data. [Source]
গুগলের উদাহরণ দিলাম যাতে আমরা স্বত:সিদ্ধের মতো মেনে নেই ড্যাটার গুরুত্ব। ড্যাটার বাংলা অর্থ উপাত্ত। উপাত্ত থেকে আসবে তথ্য। সেই তথ্যের উপর নির্ভর করে নেয়া হবে সিদ্ধান্ত। সেই সিদ্ধান্তের উপর নির্ভর করবে কোম্পানীর সাফল্য।
উপাত্ত মানেই তথ্য নয়। উপাত্তকে বরং খনি থেকে প্রাপ্ত আকরিকের সাথে তুলনা করা যায়। আকরিককে যেমন নানা প্রক্রিয়ার মধ্যে দিয়ে তা থেকে লোহা বের করা হয় তেমনি উপাত্তকে ধুয়ে মুছে পরিস্কার করে তা থেকে তথ্য বের করে আনাই আমাদের উদ্দেশ্য। আর সেজন্য যেসব উপকরণ ও পদ্ধতির প্রয়োজন তা আমরা পরিসংখ্যান নামক আপাত: ভীতিকর বিষয় থেকে জানতে পারবো।
পরিসংখ্যান কী?
উইকিপিডিয়া থেকে- “Statistics is the study of the collection, organization, analysis, interpretation, and presentation of data.[1][2] It deals with all aspects of this, including the planning of data collection in terms of the design of surveys and experiments.[1]
এই সংজ্ঞা থেকে পরিসংখ্যানের একটি দিক সম্পর্কে আমরা ধারনা পাই। সেটি হলো উপাত্তের বিশ্লেষণ, ব্যাখ্যা ও পরিবেশন সম্পর্কিত। পরিসংখ্যানের এই দিকটিকে বলা হয় বর্ণনামূলক পরিসংখ্যান (Descriptive statistics)। এই সংজ্ঞায় পরিসংখ্যানের (আমার মতে) সবচেয়ে গুরুত্বপূর্ণ দিকটিই না বলা রয়ে গেছে। সেটি হলো – সিদ্ধান্ত গ্রহণে পরিসংখ্যানের ব্যবহার এবং সে সম্পর্কিত দিকটি যাকে ইংরেজীতে আমরা বলি Inferential statistics. অর্থাৎ পরিসংখ্যানের যে অংশটি পরিশোধিত উপাত্ত (তথ্য)-কে ব্যবহার করে প্রকল্পের পরীক্ষণ (Test of hypothesis) এবং তা থেকে সিদ্ধান্ত গ্রহণে (decision making) ভূমিকা রাখে সেই অংশটি।
কোর্সটি যাদের জন্য
কোর্সটি একদম প্রাথমিক পর্যায়ের উপযোগী করে তৈরী করেছি।
সবার জন্যই উন্মুক্ত অর্থাৎ যে কেউই অংশ নিতে পারেন। তবে কমপক্ষে মাধ্যমিক পাশ হলে ভালো। যাদের প্রাতিষ্ঠানিক শিক্ষা নেই কিন্তু যোগ-বিয়োগ-গুন-ভাগ করতে পারেন এবং পরিণত চিন্তা করতে সক্ষম তারাও স্বাগতম। মাইক্রোসফটএক্সেল বা লিব্র-অফিসের ক্যালক জানা থাকলে বা হাতের কাছে থাকলে ভালো হবে। কিছু কিছু কাজকর্ম আমি এক্সেলে দেখাবো যাতে কর্মক্ষেত্রে কাজে লাগে। তাছাড়া আমার দেখানো কাজগুলো নিজে পুনরাবৃত্তি করলে শেখাটা ভালো হবে। কোর্সটি করতে যেহেতু আপনাকে কেউ বাধ্য করছে না তাই ইচ্ছাশক্তিই শেখার জন্য সবচেয়ে দরকারী। স্মরণ করা যেতে পারে– প্রয়োজন আবিষ্কারের জননী। ঠিক তেমনি, শেখার ইচ্ছা থাকলে আপনি শিখতে পারবেন। তার জন্য আমি আপনার কাছে যা আশা করবো—
১. ভিডিও পুরোটা শুনতে/দেখতে হবে; টেনে টেনে দেখলে কোর্সটি অনুসরণ করতে সমস্যা হতে পারে। তবে পরিসংখ্যান সম্পর্কে যাদের ধারণা আছে, তাদের কথা আলাদা।
২. যখন কুইজ পোস্ট করা হবে সেগুলোর উত্তর দিতে চেষ্টা করবেন। এ থেকে বুঝতে পারবেন আপনি কোর্সটি কত ভালোভাবে বুঝতে পারছেন।
৩. বিনা সংকোচে প্রশ্ন করবেন। প্রশ্ন না করলে বুঝবো আপনি সবই বুঝতে পারছেন অথবা কিছুই বুঝতে পারছেন না।
৪. কোর্স সম্পর্কে যে কোন মতামত (ভালো/মন্দ) নির্দ্বিধায় জানাবেন।
নিবন্ধন
এখানে ক্লিক করে কোর্সে নিবন্ধন করুন।
পাঠদান পদ্ধতি
মূলত ভিডিও লেকচারের মাধ্যমে আমরা শেখার চেষ্টা করবো। পুরো ভিডিওর ট্র্যান্সক্রিপ্ট প্রকাশ করা সম্ভব না হলেও আশা করি সারাংশটুকু পোস্ট করবো। আলোচনা করবো বাংলায়। তবে সবার সুবিধার্থে অনেক ইংরেজী শব্দ অপরিবর্তিত অবস্থায় ব্যবহার করবো।
কোর্সটিতে ভিন্ন মাত্র যোগ করতে মাঝে মাঝে বিভিন্ন টপিকের উপর পড়ানোর জন্য অতিথি শিক্ষক নিয়ে আসা হবে।
প্রতি সপ্তাহে (বা প্রতি দুই সপ্তুাহে) নতুন ভিডিও প্রকাশ করা হবে। সে অর্থে কোর্সটি ১২-১৫ সপ্তাহ চলবে। শুরু হবে ১৫ নভেম্বর ২০১২ থেকে; চলবে আনুমানিক মার্চ ২০১৩ পর্যন্ত।
বিষয়শ্রেণী
(সাময়িক। কোর্স চলাকালীন সময়ে এই তালিকায় সংযোজন/বিয়োজন হতে পারে)
- Data Collection (উপাত্ত সংগ্রহ)
- Descriptive Statistics (বর্ণনামূলক পরিসংখ্যান)
- Graphical summary of data (qualitative variable)
- Histogram and shape of data
- Central tendency and its measures (কেন্দ্রীয় প্রবণতা ও এর পরিমাপসমূহ) (যেমন গড়, মধ্যক, ভেদ, পরিমিত ব্যবধান)
- Variability and its measures (ভেদ ও এর পরিমাপসমূহ)
- Measure of relative standing and z-score (তুলনামূলক অবস্থান ও জেড-স্কোর)
- Probability (সম্ভাবনার পরিচিতি)
- Probability distribution (সম্ভাবনার বিন্যাস)
- Sampling distribution (নমুনা নিবেশন)
- Inferential Statistics (সিদ্ধান্তমূলক পরিসংখ্যান)
- Analysis of Variance (ANOVA) (কাভার করা হবে না)
- Correlation and Regression (কাভার করা হবে না)
- Categorical Data Analysis (কাভার করা হবে না)
গুরুত্বপূর্ণ মাইলফলক
কুইজ ১: ৩য় অধ্যায়ের শেষে (এ থেকে বেসিক জিনিসগুলো কতটা বুঝেছেন তা বোঝা যাবে)
কুইজ ২: ৪র্থ অধ্যায়ের শেষে (সম্ভাবনা ও সম্ভাবনার বিন্যাস কতটা বুঝেছেন তা বোঝা যাবে)
কুইজ ৩: ৬ষ্ঠ অধ্যায়ের শেষে (প্রকল্পের পরীক্ষা সম্পর্কে কতটা বুঝেছেন তার পরীক্ষা এটি)
কোর্সের সূচনা ভিডিও
ভিডিও-ডাউনলোড লিংক
3GP (৪ মেগা) | MP4 (২৪ মেগা) | প্লে-ব্যাক : ৬ মিনিট
আমার সম্পর্কে
পরিসংখ্যান নিয়ে আছি প্রায় দুই দশক — এখনো শিখছি–পড়ে এবং পড়ানোর মাধ্যমে। ঢাকা বিশ্ববিদ্যালয় থেকে ফলিত পরিসংখ্যানে ব্যাচেলরস, মাস্টার্স। গবেষণা মূলত গাণিতিক পরিসংখ্যান নিয়ে। বিশেষভাবে কাজ করি রিগ্রেশন মডেলে Shrinkage and Absolute Penalty Estimation নিয়ে। আরো কাজ করি পরিসংখ্যান বিষয়ক সফটওয়্যার, মন্টি কারলো, রিস্যাম্পলিং, জনস্বাস্থ্য ও এপিডেমিওলজি, এবং পরিবেশ বিষয়ক পরিসংখ্যানে। কর্মজীবন শুরু ঢাকা বিশ্ববিদ্যালয়ে শিক্ষকতার মাধ্যমে। বর্তমানে ইউনিভার্সিটি অব নর্দার্ন কলোরাডো তে ফলিত পরিসংখ্যানের সহকারী অধ্যাপক হিসেবে কর্মরত। ব্যক্তিগত সাইট।