Çox güman ki, yeni generativ AI inqilabının başlanğıcındayıq.
Generativ süni intellekt məzmun yaratmağa qadir olan alqoritmlərə və modellərə aiddir. Bu cür modellərin çıxışına mətn, audio və təsvirlər daxildir ki, bu da çox vaxt real insan çıxışı kimi səhv edilə bilər.
Kimi proqramlar GPT söhbəti generativ süni intellektin sadəcə yenilik olmadığını göstərdilər. Süni intellekt indi təfərrüatlı təlimatları yerinə yetirməyə qadirdir və dünyanın necə işlədiyini dərindən başa düşür.
Bəs biz bu nöqtəyə necə gəldik? Bu təlimatda biz süni intellekt tədqiqatında bu yeni və həyəcanverici generativ süni intellekt inqilabına yol açan əsas nailiyyətlərdən bəzilərini nəzərdən keçirəcəyik.
Neyron şəbəkələrinin yüksəlişi
Müasir süni intellektin mənşəyini araşdırmalara qədər izləyə bilərsiniz dərin öyrənmə və neyron şəbəkələri 2012 edir.
Həmin il Toronto Universitetindən Aleks Krijevski və onun komandası obyektləri təsnif edə bilən yüksək dəqiqlikli alqoritm əldə edə bildilər.
The ən müasir neyron şəbəkəsiİndi AlexNet kimi tanınan , ImageNet vizual verilənlər bazasındakı obyektləri ikinci yerə nisbətən daha aşağı səhv nisbəti ilə təsnif edə bildi.
Sinir şəbəkələri bəzi təlim məlumatlarına əsasən müəyyən davranışı öyrənmək üçün riyazi funksiyalar şəbəkəsindən istifadə edən alqoritmlərdir. Məsələn, xərçəng kimi bir xəstəliyin diaqnozu üçün modeli öyrətmək üçün neyron şəbəkəsini tibbi məlumatlarla qidalandıra bilərsiniz.
Ümid odur ki, neyron şəbəkə yavaş-yavaş verilənlərdə nümunələr tapır və yeni məlumatlar verildikdə daha dəqiq olur.
AlexNet bir sıçrayış tətbiqi idi konvulsional sinir şəbəkəsi və ya CNN. “Konvolutional” açar sözü bir-birinə daha yaxın olan məlumatlara daha çox diqqət yetirən konvolyusiya qatlarının əlavə edilməsinə aiddir.
CNN-lər artıq 1980-ci illərdə bir ideya olsa da, onlar yalnız 2010-cu illərin əvvəllərində ən son GPU texnologiyası texnologiyanı yeni zirvələrə qaldırdıqda populyarlıq qazanmağa başladılar.
sahəsində CNN-lərin uğurları kompüter görmə neyron şəbəkələrinin tədqiqinə marağın artmasına səbəb oldu.
Google və Facebook kimi texnologiya nəhəngləri öz süni intellekt çərçivələrini ictimaiyyətə təqdim etmək qərarına gəliblər. kimi yüksək səviyyəli API-lər Keras istifadəçilərə dərin neyron şəbəkələri ilə təcrübə etmək üçün istifadəçi dostu interfeys təqdim etdi.
CNN-lər təsvirin tanınması və video analizində əla idi, lakin dil əsaslı problemlərin həllində çətinlik çəkirdilər. Təbii dilin işlənməsində bu məhdudiyyət mövcud ola bilər, çünki şəkillər və mətn əslində necə fərqli problemlərdir.
Məsələn, bir təsvirdə svetoforun olub-olmadığını təsnif edən bir modeliniz varsa, sözügedən svetofor şəklin istənilən yerində görünə bilər. Ancaq bu cür yumşaqlıq dildə yaxşı işləmir. "Bob balıq yedi" və "Balıq Bob yedi" cümlələri eyni sözləri işlətməsinə baxmayaraq, çox fərqli mənalara malikdir.
Tədqiqatçıların insan dili ilə bağlı problemləri həll etmək üçün yeni bir yanaşma tapmalı olduqları aydın oldu.
Transformatorlar hər şeyi dəyişir
2017 da, a tədqiqat kağız “Diqqət Sizə Lazımdır” adlı yeni şəbəkə növü təklif etdi: Transformator.
CNN-lər şəklin kiçik hissələrini dəfələrlə süzməklə işləyərkən, transformatorlar verilənlərdəki hər bir elementi hər bir digər elementlə əlaqələndirirlər. Tədqiqatçılar bu prosesi “özünə diqqət” adlandırırlar.
Cümlələri təhlil etməyə çalışarkən, CNN-lər və transformatorlar çox fərqli işləyir. CNN bir-birinə yaxın olan sözlərlə əlaqə yaratmağa diqqət yetirsə də, transformator bir cümlədəki hər bir söz arasında əlaqə yaradacaqdır.
Özünə diqqət prosesi insan dilini dərk etməyin ayrılmaz hissəsidir. Böyütməklə və bütün cümlənin bir-birinə necə uyğun gəldiyinə baxmaqla maşınlar cümlənin strukturunu daha aydın başa düşə bilər.
İlk transformator modelləri buraxıldıqdan sonra tədqiqatçılar internetdə tapılan inanılmaz miqdarda mətn məlumatından faydalanmaq üçün tezliklə yeni arxitekturadan istifadə etdilər.
GPT-3 və İnternet
2020-ci ildə OpenAI GPT-3 model transformatorların nə qədər effektiv ola biləcəyini göstərdi. GPT-3 insandan demək olar ki, fərqlənməyən mətni çıxara bildi. GPT-3-ü bu qədər güclü edənin bir hissəsi istifadə olunan təlim məlumatlarının miqdarı idi. Modelin məşqdən əvvəl məlumat dəstinin çoxu 400 milyarddan çox tokenlə gələn Common Crawl kimi tanınan verilənlər toplusundan gəlir.
GPT-3-ün real insan mətni yaratmaq qabiliyyəti təkbaşına yenilikçi olsa da, tədqiqatçılar eyni modelin digər vəzifələri necə həll edə biləcəyini kəşf etdilər.
Məsələn, tvit yaratmaq üçün istifadə edə biləcəyiniz eyni GPT-3 modeli mətni ümumiləşdirməyə, paraqrafı yenidən yazmağa və hekayəni bitirməyə də kömək edə bilər. Dil modelləri o qədər güclü hala gəldilər ki, onlar indi hər hansı bir əmr növünə əməl edən ümumi təyinatlı alətlərdir.
GPT-3-ün ümumi təyinatlı təbiəti bu cür tətbiqlərə icazə verdi GitHub Kopilotu, proqramçılara sadə ingilis dilindən iş kodu yaratmağa imkan verir.
Diffuziya Modelləri: Mətndən Şəkillərə
Transformatorlar və NLP ilə əldə edilən irəliləyiş digər sahələrdə də generativ süni intellekt üçün yol açdı.
Kompüter görmə sahəsində biz artıq dərin öyrənmənin maşınlara şəkilləri başa düşməsinə necə imkan verdiyini araşdırdıq. Bununla belə, biz hələ də süni intellektin onları təsnif etmək əvəzinə şəkilləri özləri yaratmaq üçün bir yol tapmalı idik.
DALL-E 2, Stable Diffusion və Midjourney kimi generativ şəkil modelləri mətn daxiletməsini şəkillərə çevirə bildikləri üçün populyarlaşıb.
Bu şəkil modelləri iki əsas aspektə əsaslanır: şəkillər və mətn arasındakı əlaqəni anlayan model və girişə uyğun gələn yüksək dəqiqlikli təsviri həqiqətən yarada bilən model.
OpenAI-lər KLIP (Təzadlı Dil – Şəkildən əvvəl təlim) ilk aspekti həll etməyi hədəfləyən açıq mənbəli modeldir. Şəkili nəzərə alaraq, CLIP modeli həmin təsvir üçün ən uyğun mətn təsvirini proqnozlaşdıra bilər.
CLIP modeli mühüm təsvir xüsusiyyətlərini çıxarmağı və təsvirin daha sadə təsvirini yaratmağı öyrənməklə işləyir.
İstifadəçilər DALL-E 2-yə nümunə mətn daxiletməsini təqdim etdikdə, daxiletmə CLIP modelindən istifadə edərək “şəkil yerləşdirməyə” çevrilir. İndi məqsəd yaradılan təsvirin daxil edilməsinə uyğun gələn bir şəkil yaratmaq üçün bir yol tapmaqdır.
Ən son generativ görüntü AI-ləri a diffuziya modeli həqiqətən bir görüntü yaratmaq vəzifəsini həll etmək. Diffuziya modelləri şəkillərdən əlavə səs-küyü necə aradan qaldıracağını bilmək üçün əvvəlcədən öyrədilmiş neyron şəbəkələrə əsaslanır.
Bu təlim prosesi zamanı neyroşəbəkə sonda təsadüfi səs-küy təsvirindən yüksək keyfiyyətli təsvir yaratmağı öyrənə bilər. Artıq CLIP tərəfindən təqdim olunan mətn və şəkillərin xəritələşdirilməsinə malik olduğumuz üçün bunu edə bilərik diffuziya modelini hazırlayın hər hansı bir görüntü yaratmaq üçün bir proses yaratmaq üçün CLIP şəkil əlavələrində.
Generativ AI İnqilabı: Sonra nə gəlir?
Biz indi elə bir nöqtədəyik ki, generativ süni intellektdə irəliləyişlər hər iki gündə bir baş verir. Süni intellektdən istifadə edərək müxtəlif növ media yaratmaq daha asan və asanlaşdıqca, bunun cəmiyyətimizə necə təsir edəcəyindən narahat olmalıyıq?
İşçiləri əvəz edən maşınların qayğıları buxar maşınının ixtirasından bəri hər zaman söhbətdə olsa da, görünür, bu dəfə bir az fərqlidir.
Generativ süni intellekt, süni intellektin ələ keçirilməsindən təhlükəsiz hesab edilən sənayeləri poza bilən çoxməqsədli bir vasitəyə çevrilir.
Süni intellekt bir neçə əsas təlimatdan qüsursuz kod yazmağa başlasa, proqramçılara ehtiyacımız olacaqmı? İnsanlar istədikləri məhsulu daha ucuza istehsal etmək üçün generativ modeldən istifadə edə bilsələr, kreativləri işə götürəcəklərmi?
Generativ AI inqilabının gələcəyini proqnozlaşdırmaq çətindir. Ancaq indi məcazi Pandoranın qutusu açıldıqdan sonra ümid edirəm ki, texnologiya dünyaya müsbət təsir edə biləcək daha maraqlı yeniliklərə imkan verəcək.
Cavab yaz