সুচিপত্র[লুকান][দেখান]
প্রাকৃতিক ভাষা প্রোগ্রামিং এবং নিউরাল নেটওয়ার্কের ক্ষেত্রে বৃহৎ ভাষার মডেলগুলি হল সবচেয়ে চিত্তাকর্ষক সাম্প্রতিক উন্নয়ন।
ওপেনএআই-এর GPT-3 সেরা পারফর্মিং মডেলগুলির মধ্যে একটি হিসাবে দাঁড়িয়েছে। মডেলের আউটপুট প্রায়শই মানুষের কাছ থেকে আসা পাঠ্য থেকে আলাদা করা যায় না।
যাইহোক, GPT-3 এখনও একটি বন্ধ-উৎস মডেল। যদিও অবিশ্বাস্যভাবে শক্তিশালী, কিছু নির্দিষ্ট সীমাবদ্ধতা রয়েছে যা কিছু নির্দিষ্ট ব্যবহারের ক্ষেত্রে এটিকে অনুপযুক্ত করে তুলতে পারে।
এই নিবন্ধে, আমরা কয়েকটি বড় উপর যেতে হবে ভাষার মডেল যা GPT-3 এর কাঁচা কর্মক্ষমতার সাথে প্রতিদ্বন্দ্বিতা করতে পারে।
কেন একটি OpenAI GPT-3 বিকল্প সন্ধান করুন?
OpenAI এর GPT-3 মডেল উন্নত ব্যবহার করে গভীর জ্ঞানার্জন মানুষের মত টেক্সট উত্পাদন মডেল. এটি OpenAI এর গবেষণা ল্যাবরেটরি থেকে তৃতীয় প্রজন্মের ভাষা ভবিষ্যদ্বাণী মডেল।
2021 সালের শেষের দিকে OpenAI অবশেষে জনসাধারণের জন্য API খোলার আগে মডেলটি প্রাথমিকভাবে একটি বন্ধ বিটা হিসাবে প্রকাশ করা হয়েছিল।
বর্তমানে, আপনার পছন্দের জন্য GPT-3 এর চারটি বেস মডেল রয়েছে৷ অ্যাডা, সবচেয়ে সস্তা এবং দ্রুততম মডেলের দাম প্রতি 0.0004 টোকেনগুলির জন্য মাত্র $1000৷ OpenAI এর সবচেয়ে শক্তিশালী মডেল, Davinci-এর দাম প্রতি 0.02 টোকেন $1000, বা প্রায় 50 গুণ বেশি ব্যয়বহুল।
ওপেনএআই ডেভেলপারকে তাদের নিজস্ব অনুসরণ করতে হবে ব্যবহারের নির্দেশিকা. বিকাশকারী একটি সীমিত ব্যবহারের কোটাও প্রদান করবে যা একবার বিকাশকারীর আবেদনটি ম্যানুয়াল পর্যালোচনা প্রক্রিয়ার মাধ্যমে অনুমোদিত হলে বাড়ানো যেতে পারে।
যদিও GPT-3 আউটপুট তার উচ্চ-মানের আউটপুটের জন্য সুপরিচিত, এটি আপনার ব্যবহারের জন্য উপলব্ধ একমাত্র ভাষা ভবিষ্যদ্বাণী মডেল নয়।
আসুন কিছু প্রতিযোগী মডেলের উপর যাই যা আপনি GPT-3 এর বিকল্প হিসাবে ব্যবহার করতে পারেন।
1. জিপিটি-জে
GPT-J হল Eleuther AI গ্রুপের একটি ওপেন-সোর্স ভাষার মডেল।
জিরো-শট পারফরম্যান্স মোটামুটি GPT-3-এর সমতুল্য এবং অন্যান্য অনেক GPT বাস্তবায়নের তুলনায় কর্মক্ষমতার দিক থেকে অনেক কাছাকাছি।
6-বিলিয়ন প্যারামিটার অটোরিগ্রেসিভ টেক্সট জেনারেশন মডেলটিকে "দ্য পাইল" নামে পরিচিত একটি ডেটা সেটে প্রশিক্ষণ দেওয়া হয়েছে।
গাদা আসলে 22টি ছোট ডেটাসেটের সংমিশ্রণ একত্রে। এটির একটি সম্মিলিত ফাইলের আকার 825 GiB এবং একাডেমিক এবং পেশাদার উত্সের উপর বেশি জোর দেওয়া হয়েছে।
আপনি এর মাধ্যমে মডেলটি নিজেই পরীক্ষা করতে পারেন বিনামূল্যের ওয়েব অ্যাপ্লিকেশন.
আমি একটি সাধারণ প্রম্পট দিয়ে মডেলটি পরীক্ষা করতে সক্ষম হয়েছি। GPT-J "আজকে একটি নতুন ভাষা শেখার সর্বোত্তম উপায়" গণনা করতে সফল হয়েছে।
যাইহোক, যখন আমি একটি অটোরিগ্রেসিভ টেক্সট জেনারেশন মডেল কী তা ব্যাখ্যা করার জন্য জিজ্ঞাসা করার চেষ্টা করেছি তখন পারফরম্যান্সটি কিছুটা দাগযুক্ত।
যদিও আউটপুটটি বোধগম্য হয়েছিল, এটি আসলে একটি অর্থপূর্ণ উপায়ে প্রম্পটের উত্তর দেয়নি।
প্রাইসিং
যেহেতু GPT-J একটি ওপেন-সোর্স মডেল, আপনি আসলে আপনার নিজের উদাহরণ নিজেই চালাতে পারেন। অনুযায়ী অফিসিয়াল ভান্ডার, মডেলটি টেনসর প্রসেসিং ইউনিটে (TPU) চালানোর জন্য ডিজাইন করা হয়েছে। সর্বোত্তম হলেও, এটি Google-এর সবচেয়ে সস্তার থেকে সবচেয়ে সাশ্রয়ী বিকল্প নাও হতে পারে৷ ক্লাউড TPUs খরচ প্রায় $4.50/ঘন্টা।
দীর্ঘমেয়াদে আপনার নিজের GPU ব্যবহার করা বা একটি ডেডিকেটেড GPU সার্ভার ভাড়া নেওয়ার মতো পরিষেবাগুলির মাধ্যমে এটি কম ব্যয়বহুল হতে পারে ভাস্ত.আই or ফ্লুইডস্ট্যাক.
2. জুরাসিক-1
জুরাসিক-1 হল একটি ভাষা মডেল যা AI21 ল্যাবস দ্বারা প্রকাশ করা হয়েছে, একটি ইসরায়েলি এআই কোম্পানি যা এনএলপিতে বিশেষজ্ঞ। OpenAI এর মতো, তারা একটি API অফার করে যা আপনাকে তাদের ভাষা মডেল অ্যাক্সেস করতে দেয়।
আপনি তাদের একটি অ্যাকাউন্ট তৈরি করতে পারেন ওয়েবসাইট নিজের জন্য মডেল পরীক্ষা করার জন্য একটি খেলার মাঠের ওয়েব অ্যাপ অ্যাক্সেস করতে।
AI21 স্টুডিওতে এমন একটি বৈশিষ্ট্যও রয়েছে যেখানে আপনি তাদের জুরাসিক-1 মডেলের নিজস্ব কাস্টম সংস্করণগুলিকে প্রশিক্ষণ দিতে এবং জিজ্ঞাসা করতে পারেন। একটি অনুযায়ী অফিসিয়াল ব্লগ পোস্ট, পঞ্চাশটি উদাহরণ সহ কাস্টম মডেলগুলি মূল মডেল ব্যবহার করে প্রম্পট ইঞ্জিনিয়ারিংকে ছাড়িয়ে যেতে পারে।
প্রাইসিং
তারা তাদের তিনটি বেস মডেলের প্রতিটির জন্য নমনীয় ব্যবহার-ভিত্তিক মূল্য অফার করে। উদাহরণস্বরূপ, তারা মডেল দ্বারা উত্পন্ন প্রতি 0.25 টোকেনের জন্য $1000 চার্জ করে। গড়ে, প্রতিটি টোকেন প্রায় 1 শব্দ বা ছয়টি অক্ষর।
এর মানে হল যে আপনি AI21 এর সেরা মডেলটি ব্যবহার করতে পারেন মাত্র $4000-এ একটি 1-শব্দের নথি তৈরি করতে। তবে আপনাকে একটি জিনিস মনে রাখতে হবে যে মডেলটি ব্যবহার করার জন্য আপনাকে এখনও প্রতি মাসে ন্যূনতম $29 দিতে হবে।
3. TextSynth
TextSynth হল আরেকটি NLP ওয়েব পরিষেবা যা আপনি পাঠ্য তৈরি করতে ব্যবহার করতে পারেন। আগের দুটি উদাহরণের বিপরীতে, TextSynth একটি স্বতন্ত্র মডেল নয়। পরিষেবাটি ব্যবহারকারীকে GPT-NeoX, M2M100 এবং এমনকি GPT-J-এর মতো অন্যান্য ওপেন-সোর্স বৃহৎ ভাষার মডেলগুলিতে অ্যাক্সেস দেওয়ার মাধ্যমে কাজ করে।
বিকাশকারীরা তাদের ব্যবহার করতে পারেন বিশ্রাম এপিআই ভাষা মডেলগুলিকে তাদের নিজস্ব অ্যাপ্লিকেশনগুলিতে সংহত করতে। আপনি তাদের বিনামূল্যে চেক আউট চেষ্টা করতে পারেন খেলার মাঠ পাতা প্রতিটি উপলব্ধ মডেল কিভাবে কাজ করে তা দেখতে।
প্রাইসিং
তাদের বিনামূল্যের পরিকল্পনা আপনাকে কিছু হারের সীমা সহ তাদের সমস্ত ভাষার মডেলগুলিতে অ্যাক্সেস দেয়। পরিষেবাটি প্রতিটি অনুরোধকে 200 টোকেনের দৈর্ঘ্যে সীমাবদ্ধ করে।
স্ট্যান্ডার্ড প্ল্যান জেনারেট করা টোকেনের সংখ্যার সীমাবদ্ধতা দূর করে। অপ্রত্যাশিত খরচ এড়াতে মূল্যের মডেল ক্রেডিট-ভিত্তিক। ক্রয় করার জন্য সর্বনিম্ন ক্রেডিট সংখ্যা $20। অব্যবহৃত ক্রেডিট এক বছর পরে অবৈধ।
প্রতিটি অনুরোধের মূল্য ইনপুট এবং উৎপন্ন টোকেনের সংখ্যার উপর ভিত্তি করে। তাদের অফিসিয়াল ওয়েবসাইটের টেবিলের উপর ভিত্তি করে, আপনি তাদের সস্তা মডেলগুলি ব্যবহার করার জন্য প্রায় $0.75 থেকে $1.25 দিতে আশা করতে পারেন।
উপসংহার
আশা করি, এই নিবন্ধটি আপনাকে একটি সাশ্রয়ী মূল্যের এবং কার্যকর ভাষার মডেল খুঁজে পেতে সাহায্য করবে যা আপনি একটি হিসাবে ব্যবহার করতে পারেন OpenAI GPT-3 বিকল্প.
বড় ভাষার মডেলগুলি খুব শক্তিশালী এবং বিভিন্ন কাজের জন্য ব্যবহার করা যেতে পারে। এগুলি পাঠ্য তৈরি করতে, ভাষার মধ্যে অনুবাদ করতে এবং প্রাকৃতিক ভাষা বুঝতে এবং প্রতিক্রিয়া জানাতে ব্যবহার করা যেতে পারে।
মহাকাশে আমার গবেষণা এবং আমি যে পরীক্ষাগুলি করেছি তার উপর ভিত্তি করে, GPT-3 এখনও অন্যদেরকে ছাড়িয়ে গেছে বড় ভাষা মডেল আমি চেষ্টা করেছিলাম. যাইহোক, এটি ভবিষ্যতে পরিবর্তিত হতে পারে কারণ গবেষকরা নতুন মডেলগুলি বিকাশ এবং প্রকাশ করে৷
Google, Facebook এবং অন্যান্য AI ল্যাবরেটরির গবেষকরা এখনও তাদের নিজস্ব LMMগুলিকে এগিয়ে নিয়ে যাওয়ার জন্য কাজ চালিয়ে যাবেন৷ এটা অবশ্যই সম্ভব যে এই AI টিমগুলির মধ্যে একটি GPT-3 এর থেকে উচ্চতর মডেল নিয়ে আসবে।
নির্দেশিকা সমন্ধে মতামত দিন