گوگل به طور مداوم در خط مقدم تحقیقات هوش مصنوعی باقی مانده است و از منابع گسترده خود استفاده می کند و تعداد قابل توجهی از مهندسان با استعداد را به کار می گیرد. با این حال، از نظر مدلهای زبان، تلاشهای گوگل دیر به پایان رسید.
با توجه به اینکه غول فناوری مایکروسافت قبلاً از شراکت پربار با OpenAI سود می برد، گوگل چاره ای جز عقب نشینی نداشت.
در کنفرانس امسال Google I/O، این شرکت پاسخ خود را به مسابقه تسلیحاتی هوش مصنوعی مولد اعلام کرد: PalM 2. آیا این مدل جدید عملکرد خود را در کنار GPT-4 OpenAI می سنجد؟
پالم 2 چیست؟
گوگل توضیح می دهد پالم 2 به عنوان یک مدل زبانی پیشرفته که مدل موجود خود را بهبود میبخشد که برای اولین بار در سال 2022 معرفی شد. مشابه سایر مدلهای زبان، PalM 2 قادر به انجام وظایف مختلف تولید متن است، مانند PalM که قادر به انجام طیف گستردهای از وظایف است. از جمله پاسخ به سوالات، ترجمه متن، تولید کد، و خیلی بیشتر.
آزمایشها نشان دادهاند که PalM 2 در حال حاضر پیشرفتهای قابلتوجهی را نشان میدهد و از مدل PalM بهتر عمل میکند در حالی که از تعداد بسیار کمتری پارامتر استفاده میکند.
PalM 2 یک خانواده از مدل ها است
پروژه PalM 2 نیز مانند سایر مدل های زبانی، در واقع خانواده ای از مدل ها است که اندازه آنها متفاوت است. گوگل مدل PalM 2 را در چهار اندازه ارائه خواهد کرد: جکو، سمور، گاومیش کوهان دار و تک شاخ.
تنوع در اندازه ها، استقرار PalM 2 را در موارد استفاده مختلف آسان می کند. به عنوان مثال، مدل Gecko به اندازه کافی سبک است که کل مدل می تواند در یک دستگاه تلفن همراه جا شود و حتی به صورت آفلاین اجرا شود.
مجموعه داده های آموزشی PalM 2
یکی از مهمترین جنبه های یک مدل زبان موفق این است مجموعه داده های آموزشی. مجموعه داده آموزشی باید به اندازه کافی متنوع باشد تا به مدل اجازه دهد درک عمیقی از موضوعی که برای آن طراحی شده است داشته باشد.
برای مدل های زبان بزرگ (LLM)، معمولاً موضوع خاصی وجود ندارد که مدل باید در مورد آن آموزش ببیند. در عوض، LLM ها برای مدل های همه منظوره ساخته شده اند که باید برای انجام تعداد زیادی کار مناسب باشند. این مدلها از مجموعه دادههای متنی بزرگی استفاده میکنند که بخش بزرگی از وب و همچنین مطالب مرجع منتشر شده، ادبیات و حتی کد منبع را به تصویر میکشند.
تفاوت اصلی بین مجموعه داده آموزشی PalM 2 و سایر مدلها، گنجاندن درصد بالاتری از دادههای غیر انگلیسی است. با توجه به آنها گزارش فنی، گسترش مجموعه داده برای شامل متون غیر انگلیسی، مدل را در معرض تنوع گسترده تری از زبان ها و فرهنگ ها قرار می دهد.
مدل PalM 2 همچنین بر روی دادههای چندزبانه موازی آموزش داده شد تا به مدل کمک کند توانایی ترجمه از یک زبان به زبان دیگر را به دست آورد. داده ها شامل جفت متنی است که یک ورودی به زبان انگلیسی و دیگری متنی معادل در زبان دیگر است.
جدول بالا توزیع زبان اسناد وب چندزبانه مورد استفاده برای آموزش PalM 2 را نشان می دهد.
ویژگی های کلیدی Palm 2
در اینجا برخی از زمینههای اصلی که PalM 2 در مقایسه با سایر مدلهای زبان برتری دارد، آورده شده است.
استدلال
مجموعه داده PalM 2 شامل منابعی مانند مقالات علمی و محتوای وب با عبارات ریاضی است. این به مدل قابلیت های بهبود یافته در ریاضیات، استدلال عقل سلیم و منطق می دهد.
محققان تواناییهای استدلال ریاضی مدل را روی سؤالات ریاضی دبیرستان و دبیرستان آزمایش کردند، جایی که نتایج قابل مقایسه با قابلیتهای ریاضی GPT-4 را نشان داد.
برنامه نویسی
داده های آموزشی PalM 2 همچنین به آن توانایی تولید کد در انواع زبان های برنامه نویسی را می دهد. تیم PALM 2 یک مدل PaLM 2 مخصوص کدگذاری به نام PaLM 2-S* ایجاد کرد که بر روی یک مجموعه داده چندزبانه با کد سنگین آموزش داده شد.
این مدل نه تنها قادر به تولید کد است، بلکه می تواند وظایفی را که شامل چندین زبان است نیز انجام دهد. برای مثال، میتوانید از Palm 2 بخواهید که یک تابع مرتبسازی پایتون ایجاد کند که نظرات خط به خط را به زبان اسپانیایی اضافه میکند.
چند زبانه بودن
از آنجایی که این مدل بر روی یک مجموعه داده شامل بیش از 100 زبان آموزش داده شده است، PalM 2 مهارت در درک، تولید و ترجمه متن در چندین زبان را نشان می دهد.
برای آزمایش چند زبانه بودن، محققان این مدل را در آزمونهای مختلف مهارت زبان در زبانهای مختلف آزمایش کردند. نتایج نشان میدهد که نه تنها PalM 2 بهتر از PalM عمل میکند، بلکه برای هر زبان ارزیابیشده نمره قبولی کسب کرده است.
PaLM 2 همچنین قابلیت های چند زبانه خود را با توانایی خود در درک اصطلاحات در زبان های مختلف، توضیح جوک، رفع اشتباهات تایپی، و حتی می تواند یاد بگیرد که چگونه متن رسمی را به چت محاوره ای تبدیل کند، نشان می دهد.
پالم 2 محصولات گوگل را تقویت می کند
گوگل در حال حاضر با ادغام این مدل با سایر محصولات از پیشرفتهای PalM 2 بهره میبرد.
شاعر
توانایی این مدل برای انجام وظایف چند زبانه اکنون گوگل را تقویت کرده است آزمایش بارد با گسترش آن به بیش از 180 کشور و منطقه.
Bard اکنون همچنین از قابلیت های کدگذاری PalM 2 برای کمک به برنامه نویسی و کارهای توسعه نرم افزار مانند تولید کد و اشکال زدایی کد استفاده می کند.
هوش مصنوعی Duet برای Google Workspace
گوگل همچنین در حال برنامه ریزی برای افزودن ویژگی های مولد هوش مصنوعی به گروه برنامه های Google Workspace خود است. Gmail و Docs به زودی قابلیتی به نام خواهند داشت هوش مصنوعی دوتایی که به کاربر کمک می کند تا پاسخ های خود را پیش نویس کند و با استفاده از دستورات بنویسد.
هوش مصنوعی Duet همچنین به کاربران این امکان را می دهد که برنامه های سفارشی را در Google Sheets برای وظایف و پروژه ها بر اساس درخواست های کاربر ایجاد کنند.
نتیجه
گوگل مطمئنا امیدوار است با مدل زبانی PalM 2 شکاف موجود در بازار ابزارهای زبان هوش مصنوعی را کاهش دهد. در حالی که sAPI مدل هنوز به صورت عمومی در دسترس نیست، نتایج تحقیقات آنها نشان می دهد که این مدل به اندازه کافی رقابتی است که با عملکرد GPT-4 مطابقت داشته باشد.
با پایگاه کاربری موجود گوگل، اگر هوش مصنوعی آنها در سرویسهایشان مانند موتور جستجو یا مجموعه ابزارهای بهرهوری آنها ادغام شود، مطمئناً از مزیت سازگاری گسترده برخوردار خواهند بود.
پاسخ دهید