Google ক্রমাগত AI গবেষণার অগ্রভাগে থেকেছে, তার বিশাল সম্পদকে কাজে লাগিয়ে এবং উল্লেখযোগ্য সংখ্যক শীর্ষ-প্রতিভা প্রকৌশলী নিয়োগ করেছে। যাইহোক, ভাষার মডেলের পরিপ্রেক্ষিতে, গুগলের প্রচেষ্টা গেমটিতে দেরি করেছিল।
টেক জায়ান্ট মাইক্রোসফ্ট ইতিমধ্যেই OpenAI এর সাথে একটি ফলপ্রসূ অংশীদারিত্ব থেকে উপকৃত হওয়ার সাথে সাথে, Google এর কাছে ধরা ছাড়া আর কোন বিকল্প ছিল না।
এই বছরের Google I/O সম্মেলনে, কোম্পানিটি জেনারেটিভ AI অস্ত্র প্রতিযোগিতার উত্তর ঘোষণা করেছে: PaLM 2। এই নতুন মডেলটি কি OpenAI-এর GPT-4-এর সাথে পারফরম্যান্সে পরিমাপ করবে?
PaLM 2 কি?
গুগল বর্ণনা করে PaLM2 একটি অত্যাধুনিক ভাষার মডেল হিসাবে যা তাদের বিদ্যমান PaLM মডেলে উন্নতি করে যা 2022 সালে প্রথম ঘোষণা করা হয়েছিল। অন্যান্য ভাষার মডেলের মতো, PaLM 2 বিভিন্ন পাঠ্য তৈরির কাজগুলি সম্পাদন করতে সক্ষম যেমন PaLM বিস্তৃত কাজ করতে সক্ষম। প্রশ্নের উত্তর, পাঠ্য অনুবাদ সহ, কোড তৈরি করছে, এবং আরো অনেক কিছু.
পরীক্ষাগুলি দেখিয়েছে যে PaLM 2 ইতিমধ্যে উল্লেখযোগ্য উন্নতি দেখায়, অনেক কম সংখ্যক পরামিতি ব্যবহার করার সময় PaLM মডেলকে ছাড়িয়ে যায়।
PaLM 2 হল একটি মডেলের পরিবার
অন্যান্য ভাষার মডেলের মতো, PaLM 2 প্রকল্পটি আসলে মডেলের একটি পরিবার যা আকারে পরিসীমা। Google PaLM 2 মডেলটি চারটি আকারে সরবরাহ করবে: Gecko, Otter, Bison, এবং Unicorn।
আকারের বৈচিত্র্য বিভিন্ন ব্যবহারের ক্ষেত্রে PaLM 2 স্থাপন করা সহজ করে তোলে। উদাহরণস্বরূপ, Gecko মডেলটি যথেষ্ট হালকা যে পুরো মডেলটি একটি মোবাইল ডিভাইসে ফিট করতে পারে এবং এমনকি অফলাইনেও চলতে পারে।
PaLM 2 এর প্রশিক্ষণ ডেটাসেট
একটি সফল ভাষা মডেলের সবচেয়ে গুরুত্বপূর্ণ দিকগুলির মধ্যে একটি হল প্রশিক্ষণ ডেটাসেট. প্রশিক্ষণের ডেটাসেটটি অবশ্যই যথেষ্ট বৈচিত্র্যময় হতে হবে যাতে মডেলটিকে এটি যে বিষয়ের জন্য ডিজাইন করা হয়েছে তার গভীর বোঝার জন্য অনুমতি দেয়।
বড় ল্যাঙ্গুয়েজ মডেলের (LLM) জন্য, সাধারণত কোন নির্দিষ্ট বিষয় নেই যে মডেলটিকে প্রশিক্ষণ দিতে হবে। এলএলএমগুলি এর পরিবর্তে সাধারণ-উদ্দেশ্যের মডেল হিসাবে তৈরি করা হয়েছে যেগুলি অবশ্যই বিস্তৃত সংখ্যক কাজ সম্পাদনের জন্য উপযুক্ত হতে হবে। এই মডেলগুলি বৃহৎ পাঠ্য ডেটাসেটগুলি ব্যবহার করে যা ওয়েবের একটি বড় অংশের পাশাপাশি প্রকাশিত রেফারেন্স উপাদান, সাহিত্য এবং এমনকি সোর্স কোডও ক্যাপচার করে।
PaLM 2 এর প্রশিক্ষণ ডেটাসেট এবং অন্যান্য মডেলের মধ্যে প্রধান পার্থক্য হল অ-ইংরেজি ডেটার উচ্চ শতাংশ অন্তর্ভুক্ত করা। তাদের মতে প্রযুক্তিগত প্রতিবেদন, নন-ইংরেজি পাঠ্যগুলি অন্তর্ভুক্ত করার জন্য ডেটাসেটকে প্রসারিত করা মডেলটিকে বিভিন্ন ভাষা এবং সংস্কৃতির কাছে তুলে ধরে।
PaLM 2 মডেলটিকে সমান্তরাল বহুভাষিক ডেটাতেও প্রশিক্ষণ দেওয়া হয়েছিল যাতে মডেলটিকে এক ভাষা থেকে অন্য ভাষায় অনুবাদ করার ক্ষমতা অর্জনে সহায়তা করা হয়। ডেটাতে পাঠ্যের জোড়া রয়েছে যেখানে একটি এন্ট্রি ইংরেজিতে এবং অন্যটি অন্য ভাষার সমতুল্য পাঠ্য।
উপরের সারণীটি PaLM 2 কে প্রশিক্ষণের জন্য ব্যবহৃত বহুভাষিক ওয়েব নথির ভাষা বিতরণ দেখায়।
PaLM 2 মূল বৈশিষ্ট্য
এখানে কিছু প্রধান ক্ষেত্র রয়েছে যা PaLM 2 অন্যান্য ভাষার মডেলের তুলনায় উন্নত।
যুক্তি
PaLM 2 এর ডেটাসেটে বৈজ্ঞানিক কাগজপত্র এবং গাণিতিক অভিব্যক্তি সহ ওয়েব বিষয়বস্তুর মতো উত্স অন্তর্ভুক্ত রয়েছে। এটি মডেলটিকে গণিত, সাধারণ জ্ঞানের যুক্তি এবং যুক্তিতে উন্নত ক্ষমতা দেয়।
গবেষকরা গ্রেড স্কুল এবং হাই স্কুলের গণিত প্রশ্নে মডেলের গাণিতিক যুক্তি ক্ষমতা পরীক্ষা করেছেন যেখানে এটি GPT-4 এর গণিত ক্ষমতার সাথে তুলনামূলক ফলাফল দেখায়।
কোডিং
PaLM 2 এর প্রশিক্ষণের তথ্য এটিকে বিভিন্ন প্রোগ্রামিং ভাষায় কোড তৈরি করার ক্ষমতা দেয়। PALM 2 টিম PaLM 2-S* নামে একটি কোডিং-নির্দিষ্ট PaLM 2 মডেল তৈরি করেছে যেটিকে একটি কোড-ভারী বহুভাষিক ডেটাসেটে প্রশিক্ষণ দেওয়া হয়েছিল।
মডেলটি কেবল কোড তৈরি করতে সক্ষম নয়, এটি একাধিক ভাষা জড়িত এমন কাজগুলি পরিচালনা করতেও সক্ষম। উদাহরণস্বরূপ, আপনি PaLM 2 কে একটি পাইথন সাজানোর ফাংশন তৈরি করতে বলতে পারেন যা স্প্যানিশ ভাষায় লাইন-বাই-লাইন মন্তব্য যোগ করে।
বহুভাষিকতা
যেহেতু মডেলটিকে 100 টিরও বেশি ভাষা অন্তর্ভুক্ত একটি ডেটাসেটে প্রশিক্ষণ দেওয়া হয়েছিল, তাই PaLM 2 একাধিক ভাষায় পাঠ্য বোঝার, তৈরি করা এবং অনুবাদ করার দক্ষতা দেখায়।
বহুভাষিকতা পরীক্ষা করার জন্য, গবেষকরা বিভিন্ন ভাষায় বিভিন্ন ভাষার দক্ষতা পরীক্ষায় মডেলটি পরীক্ষা করেছেন। ফলাফলগুলি দেখায় যে PaLM 2 শুধুমাত্র PaLM কে ছাড়িয়ে যায় না বরং প্রতিটি মূল্যায়ন করা ভাষার জন্য একটি পাসিং গ্রেডও অর্জন করেছে।
PaLM 2 তার বহুভাষিক ক্ষমতাও দেখায় বিভিন্ন ভাষায় বাগধারা বোঝার ক্ষমতা, কৌতুক ব্যাখ্যা করে, টাইপো সংশোধন করে এবং এমনকি কীভাবে আনুষ্ঠানিক পাঠ্যকে কথোপকথনে রূপান্তর করতে হয় তা শিখতে পারে।
PaLM 2 Google পণ্যগুলিকে শক্তি দেয়৷
Google ইতিমধ্যেই PaLM 2 এর অগ্রগতির সুবিধা নিচ্ছে মডেলটিকে অন্যান্য পণ্যের সাথে একীভূত করে৷
কবি
বহুভাষিক কাজগুলি পরিচালনা করার মডেলের ক্ষমতা এখন Google এর শক্তি দিচ্ছে৷ বার্ড পরীক্ষা যেহেতু এটি 180 টিরও বেশি দেশ এবং অঞ্চলে বিস্তৃত।
বার্ড এখন PaLM 2 এর কোডিং ক্ষমতা ব্যবহার করছে প্রোগ্রামিং এবং সফটওয়্যার ডেভেলপমেন্টের কাজ যেমন কোড জেনারেশন এবং কোড ডিবাগিং এ সহায়তা করার জন্য।
Google Workspace-এর জন্য Duet AI
Google তার Google Workspace গ্রুপের অ্যাপ্লিকেশনগুলিতে জেনারেটিভ AI বৈশিষ্ট্য যুক্ত করার পরিকল্পনা করছে। জিমেইল এবং ডক্স শীঘ্রই একটি বৈশিষ্ট্য অন্তর্ভুক্ত করবে ডুয়েট এআই যা ব্যবহারকারীকে প্রম্পট ব্যবহার করে তাদের উত্তর এবং লেখার খসড়া তৈরি করতে সাহায্য করবে।
ডুয়েট এআই ব্যবহারকারীদের প্রদত্ত প্রম্পটের উপর ভিত্তি করে কাজ এবং প্রকল্পের জন্য Google পত্রকগুলিতে কাস্টম পরিকল্পনা তৈরি করার অনুমতি দেবে।
উপসংহার
গুগল অবশ্যই তাদের PaLM 2 ভাষা মডেলের মাধ্যমে AI ভাষা সরঞ্জামগুলির বাজারে ব্যবধান বন্ধ করার আশা করছে। যদিও মডেলটির sAPI এখনও সর্বজনীনভাবে উপলব্ধ নয়, তাদের গবেষণার ফলাফলগুলি দেখায় যে মডেলটি GPT-4 এর কর্মক্ষমতার সাথে মেলে যথেষ্ট প্রতিযোগিতামূলক।
Google-এর বিদ্যমান ব্যবহারকারী বেসের সাথে, তারা অবশ্যই ব্যাপক অভিযোজনের সুবিধা পাবে যদি তাদের AI তাদের সার্চ ইঞ্জিন বা তাদের উত্পাদনশীলতার সরঞ্জামগুলির মতো তাদের পরিষেবাগুলিতে একীভূত হয়।
নির্দেশিকা সমন্ধে মতামত দিন