যেহেতু আরও শিল্পগুলি অ্যালগরিদমের শক্তি ব্যবহার করে ক্রিয়াকলাপগুলিকে স্বয়ংক্রিয় করতে এবং পছন্দগুলি তৈরি করে, তাই সমসাময়িক বিশ্ব কীভাবে কাজ করে তার একটি গুরুত্বপূর্ণ উপাদান হয়ে উঠছে মেশিন লার্নিং৷
যখন মেশিন লার্নিং মডেলগুলি বিভিন্ন প্রতিষ্ঠানের সিদ্ধান্ত গ্রহণের প্রক্রিয়ার সাথে একত্রিত হয় তখন মেশিন লার্নিংয়ে পক্ষপাতের বিষয়টি বিবেচনায় নেওয়া গুরুত্বপূর্ণ।
অ্যালগরিদম দ্বারা উত্পন্ন পছন্দগুলি নিরপেক্ষ এবং পক্ষপাতবিহীন যে কোনও সংস্থার লক্ষ্য হওয়া উচিত মেশিন লার্নিং মডেলগুলি ব্যবহার করে এমন গ্যারান্টি দেওয়ার জন্য৷ মডেল আউটপুটগুলির উপর নির্ভর করা যায় এবং ন্যায্য হিসাবে দেখা যায় তা নিশ্চিত করার জন্য, এটি সনাক্ত করা এবং সম্বোধন করা অত্যন্ত গুরুত্বপূর্ণ মেশিন লার্নিং পক্ষপাত
এটি মডেল ব্যাখ্যাযোগ্যতার প্রশ্নগুলির সাথে সম্পর্কিত, বা একজন ব্যক্তির পক্ষে কীভাবে একটি মেশিন লার্নিং মডেল একটি উপসংহারে পৌঁছেছে তা উপলব্ধি করা কতটা সহজ। মেশিন লার্নিং মডেল যে প্রবণতা এবং নিদর্শনগুলিকে ম্যাপ করে এবং শেখে তা সরাসরি মানব বিকাশের মাধ্যমে না হয়ে ডেটা থেকেই আসে।
মেশিন লার্নিংয়ে পক্ষপাতিত্ব বিভিন্ন কারণে দেখা দিতে পারে যদি এটি নিয়ন্ত্রণ ও পরীক্ষা না করা হয়। যখন একটি মডেল স্থাপন করা হয়, তখন এটি প্রায়শই এমন পরিস্থিতির সম্মুখীন হয় যা প্রশিক্ষণের ডেটা নমুনায় সুনির্দিষ্টভাবে প্রতিফলিত হয় না।
ডেটার এই অপ্রতিনিধিত্বমূলক প্রশিক্ষণ সেটের জন্য মডেলটি ওভারফিটিং হতে পারে। প্রশিক্ষণ ডেটার চমৎকার গুণমান সত্ত্বেও, মডেলটি এখনও বৃহত্তর সাংস্কৃতিক প্রভাবের ফলে ঐতিহাসিক পক্ষপাত দ্বারা প্রভাবিত হতে পারে।
একবার বাস্তবায়িত হলে, একটি পক্ষপাতমূলক মডেল নির্দিষ্ট গোষ্ঠীর পক্ষে বা নির্দিষ্ট ডেটা উপসেটের সাথে সঠিকতা হারাতে পারে। এর ফলে এমন বিচার হতে পারে যা অন্যায়ভাবে ব্যক্তিদের একটি নির্দিষ্ট গোষ্ঠীকে শাস্তি দেয়, যা প্রকৃত বিশ্বে নেতিবাচক প্রভাব ফেলতে পারে।
এই নিবন্ধটি মেশিন লার্নিং পক্ষপাতিত্ব নিয়ে আলোচনা করে, এটি কী, কীভাবে এটি চিহ্নিত করা যায়, এটি যে বিপদগুলি সৃষ্টি করে এবং আরও অনেক কিছু সহ।
তাহলে, মেশিন লার্নিং বায়াস কি?
একটি অ্যালগরিদম উত্পাদনকারী আউটপুট যা মেশিন লার্নিং প্রক্রিয়া চলাকালীন তৈরি করা মিথ্যা অনুমানের ফলে পদ্ধতিগতভাবে পক্ষপাতদুষ্ট হয় মেশিন লার্নিং বায়াস নামে পরিচিত, এটি অ্যালগরিদম পক্ষপাত নামেও পরিচিত বা এআই পক্ষপাত হিসাবে পরিচিত।
মেশিন লার্নিং বায়াস হল একটি মডেলের প্রবণতা যা ডেটার একটি নির্দিষ্ট সেট বা ডেটার একটি উপসেটকে সমর্থন করে; এটি প্রায়শই অ-প্রতিনিধি প্রশিক্ষণ ডেটাসেট দ্বারা আনা হয়। ডেটার একটি নির্দিষ্ট সংগ্রহের সাথে, একটি পক্ষপাতদুষ্ট মডেল কম পারফর্ম করবে, যা এর নির্ভুলতার ক্ষতি করবে।
একটি বাস্তব-বিশ্বের সেটিংয়ে, এটি বোঝাতে পারে যে পক্ষপাতদুষ্ট প্রশিক্ষণ ডেটার ফলে একটি মডেলের আউটপুট একটি নির্দিষ্ট জাতি, জনসংখ্যা বা লিঙ্গের পক্ষে।
ফলস্বরূপ, মেশিন লার্নিং এর ফলাফল অন্যায্য বা বৈষম্যমূলক হতে পারে। অ-প্রতিনিধি প্রশিক্ষণ ডেটাসেট পক্ষপাতিত্বে অবদান রাখতে পারে মেশিন লার্নিং এ।
ফলাফলের মডেলটি অন্যান্য, কম উপস্থাপিত বিভাগের প্রতি পক্ষপাতমূলক হতে পারে যদি প্রশিক্ষণের ডেটার অভাব হয় বা একটি নির্দিষ্ট ডেটা গ্রুপিংয়ের অত্যধিক প্রতিনিধি হয়। এটি ঘটতে পারে যদি প্রশিক্ষণের ডেটা নমুনা বাস্তব-বিশ্ব স্থাপনার পরিবেশের সাথে সঠিকভাবে মেলে না।
স্বাস্থ্যসেবা শিল্পে মেশিন লার্নিং, যা পরিচিত রোগ বা অসুস্থতার বিরুদ্ধে রোগীর ডেটা পরীক্ষা করতে ব্যবহার করা যেতে পারে, এটি একটি প্রধান উদাহরণ। মডেলগুলি যথাযথভাবে ব্যবহার করা হলে চিকিত্সকদের হস্তক্ষেপকে দ্রুত করতে পারে।
যাইহোক, কুসংস্কার সম্ভব। যখন একজন বয়স্ক রোগীর সম্ভাব্য অসুস্থতার পূর্বাভাস দিতে বলা হয়, একটি মডেল ভাল কাজ করতে পারে না যদি এটি তৈরি করতে ব্যবহৃত প্রশিক্ষণের ডেটা বেশিরভাগই একটি ছোট বয়সের পরিসর থেকে রোগীর ডেটা নিয়ে থাকে।
উপরন্তু, ঐতিহাসিক পরিসংখ্যান তির্যক হতে পারে. উদাহরণস্বরূপ, যেহেতু ঐতিহাসিকভাবে, বেশিরভাগ কর্মচারী ছিলেন পুরুষ, চাকরি প্রার্থীদের ফিল্টার করার জন্য প্রশিক্ষিত একটি মডেল পুরুষ আবেদনকারীদের পক্ষে হবে।
মেশিন লার্নিং পক্ষপাত উভয় পরিস্থিতিতে মডেলের নির্ভুলতার উপর প্রভাব ফেলবে এবং সবচেয়ে খারাপ পরিস্থিতিতে এটি বৈষম্যমূলক এবং অন্যায্য সিদ্ধান্তে পরিণত হতে পারে।
কোন পক্ষপাত নেই তা নিশ্চিত করার জন্য সিদ্ধান্তগুলি অবশ্যই সাবধানতার সাথে পর্যালোচনা করা উচিত মেশিন লার্নিং মডেল আরো এবং আরো ম্যানুয়াল অপারেশন প্রতিস্থাপন. ফলস্বরূপ, যে কোনও সংস্থার মডেল গভর্নেন্স অনুশীলনের মধ্যে মেশিন লার্নিং পক্ষপাতের জন্য পর্যবেক্ষণ অন্তর্ভুক্ত করা উচিত।
মেশিন লার্নিং মডেলের মাধ্যমে বিভিন্ন শিল্পে বিভিন্ন ধরনের কাজ সম্পন্ন করা হচ্ছে। আজ, মডেলগুলি ক্রমবর্ধমান কঠিন প্রক্রিয়াগুলিকে স্বয়ংক্রিয় করতে এবং পরামর্শগুলি তৈরি করতে ব্যবহৃত হয়। এই সিদ্ধান্ত গ্রহণের প্রক্রিয়ায়, পক্ষপাতের অর্থ হল একটি মডেল একটি শেখা পক্ষপাতের উপর ভিত্তি করে অন্য একটি নির্দিষ্ট গোষ্ঠীকে সমর্থন করতে পারে।
প্রকৃত পরিণতি সহ অনিরাপদ রায় দিতে ব্যবহৃত হলে, এর মারাত্মক প্রতিক্রিয়া হতে পারে। যখন স্বয়ংক্রিয়ভাবে ঋণের আবেদন অনুমোদন করতে ব্যবহৃত হয়, উদাহরণস্বরূপ, একটি পক্ষপাতমূলক মডেল একটি নির্দিষ্ট জনসংখ্যার প্রতি পূর্বাভাস দিতে পারে। নিয়ন্ত্রিত ব্যবসায় যেখানে যেকোন ক্রিয়া পরিদর্শন বা যাচাই করা যেতে পারে, এটি বিবেচনায় নেওয়া একটি বিশেষ গুরুত্বপূর্ণ বিষয়।
মেশিন লার্নিং বায়াস প্রকার
- অ্যালগরিদম পক্ষপাত - এটি ঘটে যখন অ্যালগরিদমে একটি বাগ থাকে যা গণনা করে যা মেশিন লার্নিং কম্পিউটেশন চালায়।
- নমুনা পক্ষপাত - যখন ডেটা ব্যবহার করত মেশিন লার্নিং প্রশিক্ষণ মডেলের একটি সমস্যা আছে, এটি ঘটে। এই ধরনের পক্ষপাতের ক্ষেত্রে, সিস্টেমকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত ডেটার পরিমাণ বা গুণমান অপর্যাপ্ত। অ্যালগরিদমকে বিশ্বাস করতে প্রশিক্ষিত করা হবে যে সমস্ত শিক্ষক মহিলা যদি, উদাহরণস্বরূপ, প্রশিক্ষণের ডেটা সম্পূর্ণরূপে মহিলা শিক্ষকদের সমন্বয়ে থাকে।
- বর্জন পক্ষপাত - এটি ঘটে যখন একটি গুরুত্বপূর্ণ ডেটা পয়েন্ট ব্যবহার করা ডেটার সেট থেকে অনুপস্থিত থাকে, যা হতে পারে যদি মডেলাররা অনুপস্থিত ডেটা পয়েন্টের তাৎপর্য উপলব্ধি করতে ব্যর্থ হয়।
- কুসংস্কার পক্ষপাত - এই উদাহরণে, মেশিন লার্নিং নিজেই পক্ষপাতদুষ্ট কারণ সিস্টেমকে প্রশিক্ষণের জন্য ব্যবহৃত ডেটা বাস্তব-বিশ্বের পক্ষপাতগুলি যেমন কুসংস্কার, স্টেরিওটাইপ এবং ভুল সামাজিক অনুমানগুলি প্রতিফলিত করে৷ উদাহরণস্বরূপ, যদি কম্পিউটার সিস্টেমে চিকিৎসা পেশাদারদের ডেটা অন্তর্ভুক্ত করা হয় যাতে শুধুমাত্র পুরুষ চিকিত্সক এবং মহিলা নার্স অন্তর্ভুক্ত থাকে, তাহলে স্বাস্থ্যসেবা কর্মীদের সম্পর্কে একটি বাস্তব-বিশ্বের লিঙ্গ স্টেরিওটাইপ স্থায়ী হবে।
- পরিমাপ পক্ষপাত - নাম থেকে বোঝা যায়, এই পক্ষপাতিত্বটি ডেটার গুণমান এবং এটি সংগ্রহ বা মূল্যায়নের জন্য ব্যবহৃত পদ্ধতিগুলির সাথে মৌলিক সমস্যাগুলির ফলাফল। সঠিকভাবে ওজন নির্ণয় করার জন্য প্রশিক্ষিত একটি সিস্টেম পক্ষপাতমূলক হবে যদি প্রশিক্ষণের ডেটাতে থাকা ওজনগুলি ধারাবাহিকভাবে বৃত্তাকার করা হয় এবং একটি কর্মক্ষেত্রের পরিবেশ মূল্যায়ন করার জন্য একটি সিস্টেমকে প্রশিক্ষণ দেওয়ার জন্য সন্তুষ্ট কর্মীদের ছবি ব্যবহার করা পক্ষপাতদুষ্ট হতে পারে যদি ছবির কর্মচারীরা জানত তারা সুখের জন্য পরিমাপ করা হচ্ছে.
মেশিন লার্নিংয়ে পক্ষপাতিত্বের জন্য কোন বিষয়গুলো অবদান রাখে?
যদিও মেশিন লার্নিং পক্ষপাতিত্বের অনেক কারণ রয়েছে, এটি প্রায়শই প্রশিক্ষণের ডেটাতেই পক্ষপাতিত্ব থেকে উদ্ভূত হয়। প্রশিক্ষণের তথ্যে পক্ষপাতের জন্য বিভিন্ন সম্ভাব্য অন্তর্নিহিত কারণ রয়েছে।
সবচেয়ে আপাত দৃষ্টান্ত হল প্রশিক্ষণ ডেটা, যা একটি স্থাপন করা সিস্টেমে দেখা শর্তগুলির একটি উপসেট যা সাধারণ নয়। এটি হতে পারে একটি শ্রেণীবিভাগের একটি কম উপস্থাপনা বা অন্যটির একটি অসামঞ্জস্যপূর্ণ পরিমাণ সহ প্রশিক্ষণ ডেটা।
এটি নমুনা পক্ষপাত হিসাবে পরিচিত, এবং এটি অ-র্যান্ডমাইজড প্রশিক্ষণ ডেটা সংগ্রহের ফলে হতে পারে। ডেটা সংগ্রহ, বিশ্লেষণ বা শ্রেণীবদ্ধ করার জন্য ব্যবহৃত পদ্ধতিগুলি, সেইসাথে ডেটার ঐতিহাসিক শিকড়গুলি, সমস্ত ডেটাতেই পক্ষপাত ঘটাতে পারে।
তথ্য এমনকি ঐতিহাসিকভাবে পক্ষপাতদুষ্ট হতে পারে বৃহত্তর সংস্কৃতিতে যেখানে এটি সংগ্রহ করা হয়েছিল।
মেশিন লার্নিং পক্ষপাতিত্ব বেশিরভাগ কারণে হয়:
- ঐতিহাসিক তথ্যে মানুষ বা সমাজ দ্বারা সৃষ্ট পক্ষপাতগুলি অ্যালগরিদম প্রশিক্ষণের জন্য ব্যবহার করা হয়।
- প্রশিক্ষণের ডেটা যা বাস্তব-বিশ্বের পরিস্থিতি প্রতিফলিত করে না।
- তত্ত্বাবধানে থাকা মেশিন লার্নিংয়ের জন্য ডেটা লেবেল বা প্রস্তুত করার সময় পক্ষপাত।
উদাহরণস্বরূপ, প্রশিক্ষণের ডেটাতে বৈচিত্র্যের অভাব প্রতিনিধিত্বের পক্ষপাতের কারণ হতে পারে। মেশিন লার্নিং মডেলের যথার্থতা বৃহত্তর সংস্কৃতিতে ঐতিহাসিক পক্ষপাত দ্বারা প্রায়ই প্রভাবিত হয়।
এটি কখনও কখনও সামাজিক বা মানব পক্ষপাত হিসাবে উল্লেখ করা হয়। সামাজিক পক্ষপাতের প্রবণ নয় এমন ডেটার বিশাল সংগ্রহ খুঁজে পাওয়া চ্যালেঞ্জিং হতে পারে। মেশিন লার্নিং লাইফ সাইকেলের ডেটা প্রসেসিং স্টেজ মানুষের পক্ষপাতের জন্য সমানভাবে সংবেদনশীল।
তত্ত্বাবধানে মেশিন লার্নিংয়ের জন্য ডেটা সায়েন্টিস্ট বা অন্য বিশেষজ্ঞের দ্বারা লেবেলযুক্ত এবং প্রক্রিয়াজাত করা ডেটা প্রয়োজনীয়। এটি বিভিন্ন ধরণের ডেটা যা পরিষ্কার করা হয়, ডেটা পয়েন্টগুলি যেভাবে লেবেল করা হয় বা বৈশিষ্ট্যগুলির পছন্দ থেকে উদ্ভূত হয়, এই লেবেলিং প্রক্রিয়ার পক্ষপাতিত্ব মেশিন লার্নিংয়ে পক্ষপাত ঘটাতে পারে৷
মেশিন লার্নিং বায়াস রিস্ক
যেহেতু মডেলগুলি ডেটা-চালিত সিদ্ধান্ত গ্রহণের সরঞ্জাম, তাই ধরে নেওয়া হয় যে তারা নিরপেক্ষ রায় প্রদান করে। মেশিন লার্নিং মডেলগুলিতে প্রায়শই পক্ষপাত থাকে, যা ফলাফলগুলিকে প্রভাবিত করতে পারে।
পুরানো সফ্টওয়্যার এবং পদ্ধতির পরিবর্তে আরও বেশি শিল্প মেশিন লার্নিং বাস্তবায়ন করছে। পক্ষপাতদুষ্ট মডেলগুলি বাস্তব জগতে নেতিবাচক প্রভাব ফেলতে পারে যখন আরও জটিল কাজগুলি মডেলগুলি ব্যবহার করে স্বয়ংক্রিয় হয়।
মেশিন লার্নিং অন্যান্য সিদ্ধান্ত গ্রহণের প্রক্রিয়া থেকে আলাদা নয় যে সংস্থাগুলি এবং ব্যক্তিরা এটি স্বচ্ছ এবং ন্যায়সঙ্গত হবে বলে আশা করে। যেহেতু মেশিন লার্নিং একটি স্বয়ংক্রিয় প্রক্রিয়া, এটি ব্যবহার করে করা রায়গুলি মাঝে মাঝে আরও ঘনিষ্ঠভাবে পরীক্ষা করা হয়।
এটি অত্যন্ত গুরুত্বপূর্ণ যে সংস্থাগুলি বিপদগুলি মোকাবেলায় সক্রিয় হওয়া উচিত কারণ মেশিন লার্নিংয়ের পক্ষপাত প্রায়শই কিছু জনসংখ্যার উপর বৈষম্যমূলক বা নেতিবাচক প্রভাব ফেলতে পারে। নিয়ন্ত্রিত প্রেক্ষাপটের জন্য, বিশেষ করে, মেশিন লার্নিংয়ে পক্ষপাতিত্বের সম্ভাবনাকে অবশ্যই বিবেচনায় নিতে হবে।
উদাহরণস্বরূপ, প্রাথমিক স্ক্রীনিংয়ের পরে বন্ধকী আবেদনকারীদের স্বয়ংক্রিয়ভাবে গ্রহণ বা প্রত্যাখ্যান করতে ব্যাঙ্কিং-এ মেশিন লার্নিং ব্যবহার করা যেতে পারে। একটি মডেল যা প্রার্থীদের একটি নির্দিষ্ট গোষ্ঠীর প্রতি পক্ষপাতিত্ব করে তা প্রার্থী এবং সংস্থা উভয়ের উপরই ক্ষতিকর প্রভাব ফেলতে পারে।
একটি স্থাপনার পরিবেশে পাওয়া যেকোন পক্ষপাত যেখানে ক্রিয়াগুলি যাচাই করা হতে পারে তা বড় সমস্যা হতে পারে। মডেলটি কাজ নাও করতে পারে এবং, সবচেয়ে খারাপ পরিস্থিতিতে, এমনকি ইচ্ছাকৃতভাবে বৈষম্যমূলক হতে পারে।
পক্ষপাতকে অবশ্যই যত্ন সহকারে মূল্যায়ন করতে হবে এবং এর জন্য প্রস্তুত হতে হবে কারণ এর ফলে মডেলটিকে সম্পূর্ণরূপে স্থাপন থেকে সরানো হতে পারে। মডেলের সিদ্ধান্তে আস্থা অর্জনের জন্য মেশিন লার্নিং পক্ষপাতিত্ব বোঝা এবং সমাধান করা প্রয়োজন।
প্রতিষ্ঠানের অভ্যন্তরে এবং বহিরাগত পরিষেবা ভোক্তাদের মধ্যে বিশ্বাসের স্তর মডেল সিদ্ধান্ত গ্রহণে অনুভূত পক্ষপাত দ্বারা প্রভাবিত হতে পারে। যদি মডেলগুলি বিশ্বস্ত না হয়, বিশেষ করে উচ্চ-ঝুঁকির পছন্দগুলি পরিচালনা করার সময়, সেগুলি একটি সংস্থার মধ্যে তাদের সম্পূর্ণ সম্ভাবনার সাথে ব্যবহার করা হবে না।
একটি মডেলের ব্যাখ্যাযোগ্যতা মূল্যায়ন করার সময়, পক্ষপাতের জন্য অ্যাকাউন্টিং একটি ফ্যাক্টর হিসাবে বিবেচনা করা উচিত। মডেল পছন্দের বৈধতা এবং নির্ভুলতা অচেক করা মেশিন লার্নিং পক্ষপাত দ্বারা গুরুতরভাবে প্রভাবিত হতে পারে।
এটি মাঝে মাঝে বৈষম্যমূলক কর্মের ফলাফল হতে পারে যা নির্দিষ্ট ব্যক্তি বা গোষ্ঠীকে প্রভাবিত করতে পারে। বিভিন্ন ধরনের মেশিন লার্নিং মডেলের জন্য অসংখ্য অ্যাপ্লিকেশান বিদ্যমান, এবং প্রতিটি কিছু পরিমাণে মেশিন লার্নিং পক্ষপাতের জন্য সংবেদনশীল।
মেশিন লার্নিং বায়াস দ্বারা চিত্রিত করা হয়েছে:
- প্রশিক্ষণের ডেটাতে বৈচিত্র্যের অনুপস্থিতির কারণে, কিছু জাতিগত গোষ্ঠীর জন্য মুখের স্বীকৃতি অ্যালগরিদম কম সঠিক হতে পারে।
- প্রোগ্রামটি মানব বা ঐতিহাসিক কুসংস্কারের কারণে ডেটাতে জাতিগত এবং লিঙ্গ পক্ষপাত সনাক্ত করতে পারে।
- একটি নির্দিষ্ট উপভাষা বা উচ্চারণ সহ, প্রাকৃতিক ভাষা প্রক্রিয়াকরণ আরও সঠিক হতে পারে, এবং এটি এমন একটি উচ্চারণ প্রক্রিয়া করতে সক্ষম নাও হতে পারে যা প্রশিক্ষণের ডেটাতে উপস্থাপিত হয়।
মেশিন লার্নিং-এ পক্ষপাত সমাধান করা
যখন পক্ষপাত পাওয়া যায় তখন মনিটরিং এবং পুনরায় প্রশিক্ষণ দেওয়া হল মেশিন লার্নিং পক্ষপাত দূর করার দুটি উপায়। বেশিরভাগ ক্ষেত্রে, মডেল পক্ষপাত হল প্রশিক্ষণের তথ্যে পক্ষপাতের একটি ইঙ্গিত, অথবা অন্ততপক্ষে পক্ষপাত মেশিন লার্নিং জীবনচক্রের প্রশিক্ষণ পর্যায়ের সাথে সম্পর্কিত হতে পারে।
মডেল জীবনচক্রের প্রতিটি পর্যায়ে পক্ষপাত বা মডেল ড্রিফ্ট ধরার জন্য পদ্ধতি থাকা উচিত। স্থাপনের পরে মেশিন লার্নিং নিরীক্ষণের প্রক্রিয়াগুলিও অন্তর্ভুক্ত করা হয়েছে। পক্ষপাতের জন্য মডেল এবং ডেটাসেটগুলি ঘন ঘন পরীক্ষা করা গুরুত্বপূর্ণ৷
গোষ্ঠীগুলি কীভাবে বিতরণ করা হয় এবং সেখানে প্রতিনিধিত্ব করা হয় তা দেখতে এটি একটি প্রশিক্ষণ ডেটাসেট পরীক্ষা করতে পারে। সম্পূর্ণরূপে প্রতিনিধি নয় এমন ডেটাসেটগুলিকে সংশোধন এবং/অথবা উন্নত করা সম্ভব।
উপরন্তু, মডেলের কর্মক্ষমতা মূল্যায়ন করার সময় পক্ষপাতিত্ব বিবেচনা করা উচিত। ডেটার বিভিন্ন উপসেটে মডেলের কার্যকারিতা পরীক্ষা করলে দেখা যাবে যে এটি একটি নির্দিষ্ট গোষ্ঠীর সাথে পক্ষপাতদুষ্ট বা ওভারফিট করা হয়েছে কিনা।
ক্রস-ভ্যালিডেশন কৌশল ব্যবহার করে নির্দিষ্ট ডেটা উপসেটে মেশিন লার্নিং মডেলের কর্মক্ষমতা মূল্যায়ন করা সম্ভব। পদ্ধতিতে ডেটাকে আলাদা প্রশিক্ষণ এবং টেস্টিং ডেটাসেটে ভাগ করা জড়িত।
আপনি মেশিন লার্নিং এর পক্ষপাত দূর করতে পারেন:
- প্রয়োজনে, বড়, আরও প্রতিনিধি প্রশিক্ষণ সেট ব্যবহার করে মডেলটিকে পুনরায় প্রশিক্ষণ দিন।
- পক্ষপাতদুষ্ট ফলাফল এবং অস্বাভাবিক রায়ের জন্য সক্রিয়ভাবে নজর দেওয়ার জন্য একটি পদ্ধতি স্থাপন করা।
- বৈশিষ্ট্যগুলিকে পুনরায় ওজন করা এবং প্রয়োজনীয় হিসাবে হাইপারপ্যারামিটারগুলি সামঞ্জস্য করা পক্ষপাতের জন্য অ্যাকাউন্টে সহায়তা করতে পারে।
- সনাক্তকরণ এবং অপ্টিমাইজেশানের ক্রমাগত চক্রের মাধ্যমে আবিষ্কৃত পক্ষপাতের সমাধানকে উত্সাহিত করা।
উপসংহার
এটা বিশ্বাস করতে প্রলুব্ধ হয় যে একবার প্রশিক্ষিত হলে, একটি মেশিন-লার্নিং মডেল স্বায়ত্তশাসিতভাবে কাজ করবে। প্রকৃতপক্ষে, মডেলের অপারেশনাল এনভায়রনমেন্ট সবসময় পরিবর্তিত হয়, এবং ম্যানেজারদের অবশ্যই নিয়মিতভাবে নতুন ডেটা সেট ব্যবহার করে মডেলগুলিকে পুনরায় প্রশিক্ষণ দিতে হবে।
মেশিন লার্নিং বর্তমানে বাস্তব বিশ্বের অর্থনৈতিক সুবিধা সহ সবচেয়ে আকর্ষণীয় প্রযুক্তিগত ক্ষমতাগুলির মধ্যে একটি। মেশিন লার্নিং, যখন বড় ডেটা প্রযুক্তি এবং পাবলিক ক্লাউডের মাধ্যমে উপলব্ধ বিপুল কম্পিউটেশনাল শক্তির সাথে পেয়ার করা হয়, তখন ব্যক্তিরা কীভাবে প্রযুক্তির সাথে এবং সম্ভবত সমগ্র শিল্পের সাথে যোগাযোগ করে তা রূপান্তর করার সম্ভাবনা রয়েছে।
যাইহোক, মেশিন-লার্নিং প্রযুক্তি যতটা আশাব্যঞ্জক, অনিচ্ছাকৃত পক্ষপাত এড়ানোর জন্য এটি অবশ্যই সাবধানে পরিকল্পনা করা উচিত। মেশিন দ্বারা করা রায়ের কার্যকারিতা পক্ষপাত দ্বারা গুরুতরভাবে প্রভাবিত হতে পারে, যা মেশিন লার্নিং মডেল ডেভেলপারদের অবশ্যই বিবেচনায় নিতে হবে।
নির্দেশিকা সমন্ধে মতামত দিন