ওভার ফিটিং

যে কোন তরল বা গ্যাসীয় পদার্থে দুটি অনু যখন পরস্পর মিথ:স্ক্রিয়া করে তখন নিউটনের সূত্রগুলো মেনে চলে। কিন্তু, তরল বা গ্যাসীয় পদার্থে অসংখ্য অনুর নড়াচারা আপনি শুধু এই সুত্র থেকে প্রেডিক্ট করতে পারবেন না। যেহেতু অসংখ্য অনুর প্রতিটির গতি প্রকৃতি ও আনুসঙ্গিক প্রভাবক আলাদা ভাবে মাপা সম্ভব নয়, সেহেতু আপনি সুনির্দিষ্টভাবে একদল অনুর গতিবিধি প্রেডিক্ট করতে পারবেন না। তবে পূর্ববর্তি গতিবিধির উপর ভিত্তি করে পরবর্তী গতি বিধির একটি সম্ভাব্যতা হিসেব করতে পারবেন। এটি স্ট্যাটিসটিক্যাল মেকানিক্স-এর কাজ।

অনুরুপভাবে, ধরি একজন মানুষ নিয়মিত ধুমপান করেন এবং কয়েক বছর পর তার ফুসফুসের ক্যান্সার হলো। কিন্তু, শুধু মাত্র এই একজনের তথ্য থেকে আপনি বলতে পারবেন না ধুমপানের সাথে ক্যান্সারের সম্পর্ক আছে কি না। কারণ, মানুষ ভেদে ধুমপানের প্রভাবে পার্থক্য হয়। আপনি যা করতে পারবেন তা হলো ক্যান্সার আক্রান্ত অনেক রোগী এবং ক্যান্সার নেই এরকম অনেক ব্যাক্তি নিয়ে ধূমপানের কারণে ক্যান্সার হবার সম্ভাবনা হিসেব করতে পারবেন। এক্ষেত্রে বায়স্ট্যাটিসটিক্স এর সাহায্য লাগবে।

স্ট্যাটিস্টিসিয়ানগণ কোনো বিষয়ে বিভিন্ন ধরনের তথ্য এর উপর ভিত্তি করে গানিতিক সমীকরণ (ম্যাথমেটিকেল মডেল) দাড় করান। এই মডেলগুলো উদ্দেশ্য হচ্ছে বিভিন্ন প্রভাবককে বিবেচনায় নিয়ে একটি ঘটনার সম্ভাব্যতা হিসেব করা। কোন কোন ক্ষেত্রে বিজ্ঞানীদের উদ্দেশ্য হচ্ছে নমুনা তথ্যের উপর ভিত্তি করে এমন একটি মডেল দাড় করানো, যেটি অধিকাংশ ক্ষেত্রেই সঠিকভাবে প্রত্যাশিত ঘটনাটি সম্পর্কে প্রেডিক্ট করতে পারে।

তবে আপনি যদি আপনার নমুনা ডেটা দিয়ে প্রায় শতভাগ ক্ষেত্রে সঠিক প্রেডিকশন দেয় এমন একটি মডেল দাড় করান, সেটি প্রকৃতপক্ষে আপনি যে সকল নমুনা নিয়ে কাজ করেছেন সেগুলোর ব্যাপারেই সঠিক প্রেডিকশন দিতে পারে। অর্থাৎ, ভবিষ্যতে সংগৃহীত নমুনার ক্ষেত্রে এটি শতভাগ প্রেডিকশন দিতে পারবে না।

এর কারণ, আপনি তখনই কোন স্ট্যাটিসটিক্যাল মডেলিং করেন, যখন আপনার লক্ষ্যবস্তুতে অন্ত:র্নিহিত র‍্যানডমনেস থাকে। এই র‍্যানডমনেস আসে প্রকৃত পক্ষে অনেক জানা এবং অজানা প্রভাবক (ফ্যাক্টর)-এর মিথস্ক্রিয়ার কারণে।

প্রায় শতভাগ প্রেডিকশন দিতে পারার এই বিষয়টিকে বলা হয় ওভার ফিটিং। ওভার ফিটিং কেন গ্রহনযোগ্য নয়? কারণ, ওভারফিটেড মডেল আমার স্যাম্পলের ভিতর যে ত্রুটি আছে তা সহ ফিট করে। ফলে, নতুন পর্যবেক্ষনের ক্ষেত্রে তা সাধারনীকরণ করা যায় না।

নিউরাল নেটওয়ার্ককে যখন ট্রেইনিং দেয়া হয় তখনও একধরনের নন-লিনিয়ার ম্যাথমেটিকাল মডেলিং কর হয়। নিউরাল নেটওয়ার্কের সুবিধে হল আপনি প্রাথমিক মডেলের আউটপুট সঠিক হয়েছে কিনা এই ফিডব্যাক (ট্রেইনিং) দিতে পারেন। উক্ত ফিডব্যাকের আলোকে নেটওয়ার্কের ভিতর ব্যাকপ্রপাগেশনের মাধ্যমে সিগনাল ভ্যারিয়েশন (Weight variation) তৈরী হয়। ফলে পরবর্তীবার ইনপুট হিসেবে উক্ত ভ্যারিয়েশন সহ ডাটা মডেলে প্রবেশ করে। এভাবে প্রতিটি ইটারেশনের সময় মডেলটির প্রেডিকটিভ ক্ষমতা বাড়তে থাকে। কিন্তু, একই সাথে তৈরী হয় ওভার ফিটিং প্রবলেম।

লার্জ ল্যাঙ্গুয়েজ মডেলগুলো ওভারফিটিং হলে অনেক সময় এমন কিছু বাক্য তৈরী করে যার কোন সিনটেক্স ও সিমেনটিক্স অনুযায়ী হয়ত ঠিক আছে। কিন্তু, বাক্যগুলোর অর্থহীন এবং কোন সুনির্দিষ্ট প্যাটার্ণকে অনুসরণ করে না। এই ঘটনাকে মেশিন লার্নিং-এর ভাষায় বলা হয় হ্যালুসিনেশন। তবে মজার বিষয় হল ইমেজ বিল্ডিং বা এ ধরনের কাজে এই হ্যালুসিনেশকে কাজে লাগানোর সুযোগ আছে। তবে হেল্দ ডেটারর প্রেডিকটিভ মডেলিং আমাদের টার্গেট থাকতে হবে আন্ডার ফিট বা অভার ফিট পরিহার করা।

Leave a Reply Cancel reply