مواد جي جدول[لڪ][ڏسو]
GPT-3، هن وقت جو وڏو نيورل نيٽورڪ، مئي 2020 ۾ شايع ڪيو ويو OpenAI، AI شروعاتي ايلون مسڪ ۽ سام آلٽمن پاران گڏيل طور تي قائم ڪيل. GPT-3 هڪ جديد ٻولي ماڊل آهي 175 بلين پيرا ميٽرز سان ان جي اڳئين GPT-1,5 ۾ 2 بلين پيٽرولر جي مقابلي ۾.
GPT-3 Microsoft جي NLG Turing ماڊل (Turing Natural Language Generation) کي اڳتي وڌايو، جيڪو اڳ ۾ 17 بلين پيرا ميٽرز سان گڏ سڀ کان وڏي نيورل نيٽ ورڪ جو رڪارڊ رکي چڪو هو.
ٻوليءَ جي ماڊل کي ساراهيو ويو آهي، تنقيد ڪئي وئي آهي، ۽ اڃا به ڇنڊڇاڻ ڪئي وئي آهي؛ اهو پڻ نئون ۽ دلچسپ استعمال ڪيو آهي. ۽ هاڻي رپورٽون آهن ته GPT-4، OpenAI جو ايندڙ ايڊيشن ٻولي ماڊل، واقعي جلد اچي ويندو.
توهان صحيح سائيٽ تي پهچي چڪا آهيو جيڪڏهن توهان GPT-4 بابت وڌيڪ سکڻ چاهيو ٿا. اسان هن آرٽيڪل ۾ GPT-4 جي کوٽائي تي نظر ڪنداسين، ان جي پيٽرولن کي ڍڪيندي، اهو ڪيئن ٻين ماڊلن سان مقابلو ڪري ٿو، ۽ وڌيڪ.
پوء، GPT-4 ڇا آهي؟
GPT-4 جي دائري کي سمجهڻ لاءِ، اسان کي پهريان سمجهڻ گهرجي GPT-3، ان جو اڳوڻو. GPT-3 (پيداوار اڳ-تربيت ٿيل ٽرانسفارمر، ٽيون نسل) هڪ خودمختيار مواد پيدا ڪرڻ وارو اوزار آهي.
صارفين کي ڊيٽا داخل ڪريو a مشين جي سکيا ماڊل، جيڪو بعد ۾ جواب ۾ لاڳاپيل لکڻين جي وڏي مقدار پيدا ڪري سگهي ٿو، OpenAI جي مطابق. GPT-4 ڪجهه شاٽ جي حالتن ۾ ملٽي ٽاسڪنگ ۾ خاص طور تي بهتر ٿيندو - هڪ قسم جو مشين جي سکيا - نتيجن کي انسانن جي ويجهو آڻيندي.
GPT-3 تعمير ڪرڻ ۾ سوين ملين پائونڊ خرچ ڪري ٿو، پر GPT-4 جي قيمت تمام گهڻو وڌيڪ هجڻ جي اڳڪٿي ڪئي وئي آهي ڇاڪاڻ ته اهو پيماني تي پنج سئو ڀيرا وڌيڪ هوندو. هن نقطي نظر ۾ رکڻ لاء،
GPT-4 شايد ڪيتريون ئي خاصيتون هجن جيئن دماغ ۾ synapses. GPT-4 بنيادي طور تي ساڳيا طريقا استعمال ڪندو جيئن GPT-3، اهڙيءَ طرح هڪ پيراڊائم ليپ ٿيڻ جي بجاءِ، GPT-4 ان تي وڌندو جيڪو GPT-3 هن وقت پورو ڪري ٿو - پر خاص طور تي وڏي انفرنس جي صلاحيت سان.
GPT-3 استعمال ڪندڙن کي عملي مقصدن لاءِ قدرتي ٻولي داخل ڪرڻ جي اجازت ڏني، پر ان کي اڃا تائين ڪجھ ماهرن جي ضرورت آھي ھڪڙي تڪڙي ٺاھڻ لاءِ جيڪي سٺا نتيجا ڏين. GPT-4 صارفين جي ارادن جي اڳڪٿي ڪرڻ تي خاص طور تي بهتر ٿيندو.
GPT-4 پيٽرول ڇا ٿيندو؟
سڀ کان وڏي پيماني تي انتظار ڪندڙ AI پيش رفتن مان هڪ هجڻ جي باوجود، GPT-4 بابت ڪجھ به معلوم ناهي: اهو ڇا ٿيندو، ان ۾ ڪهڙيون خاصيتون هونديون، ۽ ان ۾ ڪهڙيون طاقتون هونديون.
گذريل سال، Altman هڪ سوال ۽ جواب ڪيو ۽ GPT-4 لاءِ OpenAI جي عزائم بابت ڪجھ تفصيل پڌرو ڪيو. اهو GPT-3 کان وڏو نه هوندو، Altman جي مطابق. GPT-4 سڀ کان وڏي پيماني تي استعمال ٿيڻ ممڪن ناهي ٻولي ماڊل. جيتوڻيڪ ماڊل جي پوئين نسلن جي مقابلي ۾ وڏي هوندي نظرياتي نيٽ ورڪ، ان جي سائيز ان جي ڌار ڌار خصوصيت نه هوندي. GPT-3 ۽ گوفر سڀ کان وڌيڪ قابل اميدوار اميدوار آهن (175B-280B).
Nvidia ۽ Microsoft جي Megatron-Turing NLG لاء رڪارڊ منعقد ڪيو گھڻا اعصابي نيٽ ورڪ 530B تي پيٽرول - ٽي دفعا GPT-3 کان - تازو جيستائين گوگل جي PaLM ان کي 540B تي ورتو. حيرت انگيز طور تي، گهٽ ماڊلز جي هڪ ٻلي MT-NLG کي ختم ڪيو.
پاور لا ڪنيڪشن جي مطابق، OpenAI جي Jared Kaplan ۽ ساٿين 2020 ۾ طئي ڪيو ته جڏهن پروسيسنگ بجيٽ وڌندي آهي گهڻو ڪري پيرا ميٽرن جي تعداد کي وڌائڻ تي خرچ ڪيو ويندو آهي، ڪارڪردگي تمام گهڻي بهتر ٿي ويندي آهي. Google، Nvidia، Microsoft، OpenAI، DeepMind، ۽ ٻيون ٻولي-ماڊلنگ ڪمپنيون فرمانبرداري سان ضابطن جي پيروي ڪندا آھن.
Altman اشارو ڪيو ته اهي هاڻي وڏا ماڊل ٺاهڻ تي ڌيان نه ڏئي رهيا هئا، بلڪه ننڍن ماڊل جي ڪارڪردگي کي وڌائڻ تي.
OpenAI محقق اسڪيلنگ مفروضي جي ابتدائي حامي هئا، پر انهن شايد اهو دريافت ڪيو آهي ته اضافي، اڳ ۾ اڻڄاتل رستا شايد اعلي ماڊل جي اڳواڻي ڪن. GPT-4 انهن سببن جي ڪري GPT-3 کان گهڻو وڏو نه هوندو.
OpenAI ٻين پهلوئن تي وڌيڪ ڌيان ڏيندو، جهڙوڪ ڊيٽا، الگورٿمز، پيرا ميٽرائيزيشن، ۽ ترتيب ڏيڻ، جن ۾ وڌيڪ جلدي اهم فائدا حاصل ڪرڻ جي صلاحيت آهي. اسان کي انتظار ڪرڻو پوندو ۽ ڏسو ته 100T پيٽرولر سان ماڊل ڇا ڪري سگھن ٿا.
Key Points:
- ماڊل جي ماپ: GPT-4 GPT-3 کان وڏو ٿيندو، پر گھڻو نه (MT-NLG 530B ۽ PaLM 540B). ماڊل جي سائيز غير معمولي ٿي ويندي.
- Optimality: GPT-4 GPT-3 کان وڌيڪ وسيلا استعمال ڪندو. اهو پراميٽرائيزيشن (بهترين هائپرپيراميٽرز) ۽ اسڪيلنگ طريقن ۾ نئين بهتري جي بصيرت کي لاڳو ڪندو (ٽريننگ ٽوڪن جو تعداد ماڊل سائيز جيترو اهم آهي).
- ملٽي موڊلٽي: GPT-4 صرف ٽيڪسٽ پيغام موڪلڻ ۽ وصول ڪرڻ جي قابل هوندو (ملٽي موڊل نه). OpenAI ٻولي جي ماڊل کي انهن جي حدن ڏانهن ڌڪڻ جي ڪوشش ڪري ٿو ملٽي موڊل ماڊل وانگر منتقل ڪرڻ کان اڳ ڊيلي 2، جنهن جي اهي اڳڪٿي ڪن ٿا ته آخرڪار يونيموڊل سسٽم کان اڳتي وڌي ويندا.
- تفاوت: GPT-4، ان جي اڳڪٿين GPT-2 ۽ GPT-3 وانگر، ھڪڙو گھڻا ماڊل ھوندو (سڀئي پيرا ميٽرز ڪنھن به ڏنل ان پٽ کي پروسيس ڪرڻ لاءِ استعمال ۾ ھوندا). مستقبل ۾، sparsity وڌيڪ اهم ٿي ويندي.
- سڌي: GPT-4 اسان کي GPT-3 کان وڌيڪ ويجھو ويجھو ڪندو. اهو رکندو جيڪو اهو سکيو آهي InstructGPT، جيڪو انساني ان پٽ سان ترقي ڪئي وئي هئي. اڃا تائين، AI ڪنورجنسي هڪ ڊگهو رستو آهي، ۽ ڪوششن کي مبالغہ جي بجاءِ احتياط سان جائزو وٺڻ گهرجي.
ٿڪل
مصنوعي جنرل انٽيليجنس. اهو هڪ وڏو مقصد آهي، پر OpenAI ڊولپرز ان کي حاصل ڪرڻ لاء ڪم ڪري رهيا آهن. AGI جو مقصد ھڪڙو نمونو يا ”ايجنٽ“ ٺاھڻ آھي جيڪو سمجھي سگھي ٿو ۽ ڪنھن به سرگرمي کي ڪري سگھي ٿو جيڪو ھڪڙو ماڻھو ڪري سگھي ٿو.
GPT-4 هن مقصد کي حاصل ڪرڻ ۾ ايندڙ قدم ٿي سگهي ٿو، ۽ اهو هڪ سائنس فڪشن فلم مان ڪجهه آواز وانگر آهي. توھان حيران ٿي سگھوٿا ته AGI حاصل ڪرڻ ڪيترو حقيقي آھي.
اسان 2029 تائين هن سنگ ميل کي مارينداسين، ري ڪرزويل، گوگل جي ڊائريڪٽر آف انجنيئرنگ جي مطابق. انهي کي ذهن ۾ رکڻ سان، اچو ته GPT-4 تي هڪ تمام گهڻي نظر رکون ۽ هن ماڊل جي اثرن کي جيئن اسان AGI (مصنوعي جنرل انٽيليجنس) جي ويجهو وڃون ٿا.
جواب ڇڏي وڃو