সুচিপত্র[লুকান][দেখান]
GPT-3, এই মুহূর্তের বড় নিউরাল নেটওয়ার্ক, 2020 সালের মে মাসে প্রকাশিত হয়েছিল OpenAI, এআই স্টার্টআপটি এলন মাস্ক এবং স্যাম অল্টম্যান দ্বারা সহ-প্রতিষ্ঠিত। GPT-3 হল একটি অত্যাধুনিক ভাষা মডেল যার 175 বিলিয়ন প্যারামিটার রয়েছে এর পূর্বসূরী GPT-1,5-এর 2 বিলিয়ন প্যারামিটারের তুলনায়।
GPT-3 মাইক্রোসফটের এনএলজি টুরিং মডেলকে (টুরিং ন্যাচারাল ল্যাঙ্গুয়েজ জেনারেশন) ছাড়িয়ে গেছে, যা আগে 17 বিলিয়ন প্যারামিটার সহ সবচেয়ে বড় নিউরাল নেটওয়ার্কের রেকর্ড ছিল।
ভাষার মডেলটি প্রশংসিত হয়েছে, সমালোচনা করা হয়েছে এবং এমনকি যাচাই-বাছাই করা হয়েছে; এটি নতুন এবং কৌতূহলী ব্যবহারও তৈরি করেছে। আর এখন জানা যাচ্ছে যে ওপেনএআই-এর পরবর্তী সংস্করণ GPT-4 ভাষার মডেল, সত্যিই শীঘ্রই আসছে হবে.
আপনি যদি GPT-4 সম্পর্কে আরও জানতে চান তাহলে আপনি সঠিক সাইটে পৌঁছেছেন। আমরা এই নিবন্ধে GPT-4 গভীরভাবে দেখব, এর পরামিতিগুলি কভার করব, এটি কীভাবে অন্যান্য মডেলের সাথে তুলনা করে এবং আরও অনেক কিছু।
তাহলে, GPT-4 কি?
GPT-4 এর সুযোগ বোঝার জন্য, আমাদের প্রথমে GPT-3 বুঝতে হবে, এর পূর্বসূরী। GPT-3 (জেনারেটিভ প্রাক-প্রশিক্ষিত ট্রান্সফরমার, তৃতীয়-প্রজন্ম) একটি স্বায়ত্তশাসিত বিষয়বস্তু তৈরির সরঞ্জাম।
ব্যবহারকারীরা একটি তথ্য প্রবেশ করান মেশিন লার্নিং মডেল, যা পরবর্তীতে ওপেনএআই অনুসারে প্রতিক্রিয়া হিসাবে প্রচুর পরিমাণে প্রাসঙ্গিক লেখা তৈরি করতে পারে। GPT-4 অল্প-শট অবস্থায় মাল্টিটাস্কিংয়ের ক্ষেত্রে উল্লেখযোগ্যভাবে ভাল হবে - এক ধরনের মেশিন লার্নিং - ফলাফলগুলিকে মানুষের আরও কাছাকাছি নিয়ে আসা।
GPT-3 তৈরি করতে কয়েক মিলিয়ন পাউন্ড খরচ হয়, কিন্তু GPT-4 এর দাম উল্লেখযোগ্যভাবে বেশি হবে কারণ এটি স্কেলে পাঁচশ গুণ বেশি হবে। এটিকে দৃষ্টিভঙ্গিতে রাখতে,
GPT-4 এর মস্তিষ্কে সিন্যাপসের মতো অনেক বৈশিষ্ট্য থাকতে পারে। GPT-4 প্রধানত GPT-3 এর মতো একই পদ্ধতি ব্যবহার করবে, এইভাবে একটি প্যারাডাইম লিপ হওয়ার পরিবর্তে, GPT-4 বর্তমানে GPT-3 যা সম্পন্ন করে তার উপর প্রসারিত হবে — কিন্তু উল্লেখযোগ্যভাবে বৃহত্তর অনুমান ক্ষমতা সহ।
GPT-3 ব্যবহারকারীদের ব্যবহারিক উদ্দেশ্যে প্রাকৃতিক ভাষায় প্রবেশ করার অনুমতি দেয়, তবে এটির এখনও একটি প্রম্পট ডিজাইন করার জন্য কিছু দক্ষতার প্রয়োজন যা ভাল ফলাফল দেবে। GPT-4 ব্যবহারকারীদের উদ্দেশ্য ভবিষ্যদ্বাণী করার ক্ষেত্রে উল্লেখযোগ্যভাবে ভালো হবে।
GPT-4 প্যারামিটার কি হবে?
সর্বাধিক প্রতীক্ষিত AI অগ্রগতিগুলির মধ্যে একটি হওয়া সত্ত্বেও, GPT-4 সম্পর্কে কিছুই জানা যায়নি: এটি দেখতে কেমন হবে, এর বৈশিষ্ট্যগুলি কী হবে এবং এর কী ক্ষমতা থাকবে৷
গত বছর, অল্টম্যান একটি প্রশ্নোত্তর করেছিলেন এবং GPT-4 এর জন্য OpenAI-এর উচ্চাকাঙ্ক্ষা সম্পর্কে কিছু বিবরণ প্রকাশ করেছিলেন। অল্টম্যানের মতে এটি GPT-3 এর চেয়ে বড় হবে না। GPT-4 সবচেয়ে বেশি ব্যবহৃত হওয়ার সম্ভাবনা নেই ভাষার মডেল. যদিও মডেলটি আগের প্রজন্মের তুলনায় বিশাল হবে নিউরাল নেটওয়ার্ক, এর আকার তার স্বতন্ত্র বৈশিষ্ট্য হবে না। GPT-3 এবং Gopher হল সবচেয়ে প্রশংসনীয় প্রার্থী (175B-280B)।
এনভিডিয়া এবং মাইক্রোসফ্টের মেগাট্রন-টুরিং এনএলজি রেকর্ডটি ধরে রেখেছে ঘনতম নিউরাল নেটওয়ার্ক 530B-তে পরামিতি - GPT-3-এর তিনগুণ - যতক্ষণ না Google এর PaLM এটিকে 540B-তে নিয়েছিল। আশ্চর্যজনকভাবে, অনেক কম মডেল এমটি-এনএলজিকে ছাড়িয়ে গেছে।
পাওয়ার-আইন সংযোগ অনুসারে, OpenAI-এর জ্যারেড কাপলান এবং সহকর্মীরা 2020 সালে নির্ধারণ করেছিলেন যে যখন প্রক্রিয়াকরণের বাজেট বৃদ্ধি বেশিরভাগ প্যারামিটারের সংখ্যা বাড়ানোর জন্য ব্যয় করা হয়, তখন কর্মক্ষমতা সবচেয়ে বেশি উন্নত হয়। গুগল, এনভিডিয়া, মাইক্রোসফ্ট, ওপেনএআই, ডিপমাইন্ড এবং অন্যান্য ভাষা-মডেলিং কোম্পানিগুলি বাধ্যতার সাথে প্রবিধানগুলি অনুসরণ করেছে৷
অল্টম্যান ইঙ্গিত দিয়েছেন যে তারা আর বিশাল মডেল নির্মাণে মনোযোগ দিচ্ছে না, বরং ছোট মডেলের কর্মক্ষমতা সর্বাধিক করার দিকে।
OpenAI গবেষকরা স্কেলিং হাইপোথিসিসের প্রথম দিকের প্রবক্তা ছিলেন, কিন্তু তারা হয়তো আবিষ্কার করেছেন যে অতিরিক্ত, পূর্বে অনাবিষ্কৃত পথগুলি উচ্চতর মডেলের দিকে নিয়ে যেতে পারে। এই কারণে GPT-4 GPT-3 থেকে উল্লেখযোগ্যভাবে বড় হবে না।
ওপেনএআই ডেটা, অ্যালগরিদম, প্যারামিটারাইজেশন এবং অ্যালাইনমেন্টের মতো অন্যান্য দিকগুলিতে আরও বেশি ফোকাস করবে, যেগুলির আরও দ্রুত উল্লেখযোগ্য সুবিধাগুলি পাওয়ার সম্ভাবনা রয়েছে। আমাদের অপেক্ষা করতে হবে এবং 100T প্যারামিটার সহ একটি মডেল কী করতে পারে তা দেখতে হবে।
গুরুত্বপূর্ণ দিক:
- মডেলের আকার: GPT-4 GPT-3 থেকে বড় হবে, কিন্তু বেশি নয় (MT-NLG 530B এবং PaLM 540B)। মডেলের আকার অসাধারণ হবে।
- সর্বোত্তমতা: GPT-4 GPT-3 থেকে বেশি সম্পদ ব্যবহার করবে। এটি প্যারামিটারাইজেশন (অনুকূল হাইপারপ্যারামিটার) এবং স্কেলিং পদ্ধতিতে (প্রশিক্ষণ টোকেনের সংখ্যা মডেলের আকারের মতো গুরুত্বপূর্ণ) বিষয়ে নতুন সর্বোত্তম অন্তর্দৃষ্টি প্রয়োগ করবে।
- মাল্টিমোডালিটি: GPT-4 শুধুমাত্র পাঠ্য বার্তা পাঠাতে এবং গ্রহণ করতে সক্ষম হবে (মাল্টিমোডাল নয়)। ওপেনএআই মাল্টিমডাল মডেলে রূপান্তর করার আগে ভাষার মডেলগুলিকে তাদের সীমাতে ঠেলে দিতে চায় ডালে 2, যা তারা ভবিষ্যদ্বাণী করে অবশেষে ইউনিমোডাল সিস্টেমকে ছাড়িয়ে যাবে।
- স্পারসিটি: GPT-4, এর পূর্বসূরি GPT-2 এবং GPT-3 এর মতো, একটি ঘন মডেল হবে (প্রদত্ত ইনপুট প্রক্রিয়া করার জন্য সমস্ত প্যারামিটার ব্যবহার করা হবে)। ভবিষ্যতে, sparsity আরও গুরুত্বপূর্ণ হয়ে উঠবে।
- শ্রেণীবিন্যাস: GPT-4 আমাদের কাছে GPT-3-এর থেকে আরও ঘনিষ্ঠভাবে যোগাযোগ করবে। এটি InstructGPT থেকে যা শিখেছে তা রাখবে, যা মানুষের ইনপুট দিয়ে তৈরি করা হয়েছে। তবুও, এআই কনভারজেন্স অনেক দূরের পথ, এবং প্রচেষ্টাকে অতিরঞ্জিত না করে সাবধানে মূল্যায়ন করা উচিত।
উপসংহার
কৃত্রিম সাধারণ বুদ্ধি. এটি একটি বড় উদ্দেশ্য, কিন্তু OpenAI বিকাশকারীরা এটি অর্জনের জন্য কাজ করছে। AGI-এর লক্ষ্য হল একটি মডেল বা "এজেন্ট" তৈরি করা যা একজন ব্যক্তি করতে পারে এমন যেকোনো কার্যকলাপ বুঝতে এবং করতে সক্ষম।
GPT-4 এই লক্ষ্য অর্জনের পরবর্তী ধাপ হতে পারে, এবং এটি একটি কল্পবিজ্ঞান চলচ্চিত্রের মতো কিছু শোনাচ্ছে। আপনি ভাবছেন যে AGI অর্জন করা কতটা বাস্তবসম্মত।
গুগলের ইঞ্জিনিয়ারিং ডিরেক্টর রে কুর্জউইলের মতে, আমরা 2029 সালের মধ্যে এই মাইলফলকটি অতিক্রম করব৷ এই বিষয়টি মাথায় রেখে, আসুন আমরা AGI (কৃত্রিম সাধারণ বুদ্ধিমত্তা) এর কাছাকাছি আসার সাথে সাথে GPT-4 এবং এই মডেলের প্রভাবগুলিকে আরও গভীরভাবে দেখি।
নির্দেশিকা সমন্ধে মতামত দিন