Em îhtîmal e ku em tenê di destpêka şoreşek nû ya AI-ya hilberîner de ne.
Zehmetiya çêkirî ya hilberîner algorîtm û modelên ku dikarin naverokê biafirînin vedibêje. Hilberîna modelên weha nivîs, deng û wêne hene ku pir caran dikarin wekî hilberîna rastîn a mirovî werin xelet kirin.
Serlêdanên wekî GPT chat destnîşan kir ku AI-ya hilberîner ne nûbûnek tenê ye. AI naha karibe rêwerzên berfireh bişopîne û xuya dike ku têgihiştinek kûr heye ka cîhan çawa dixebite.
Lê em çawa gihîştin vê nuqteyê? Di vê rêbernameyê de, em ê di lêkolîna AI-ê de hin serketinên sereke derbas bikin ku rê li ber vê şoreşa nû û balkêş a AI-yê hilberîner vekiriye.
Rabûna Torên Neuralî
Hûn dikarin koka AI-ya nûjen bi lêkolîna li ser bişopînin hînbûna kûr û torên neuralî li 2012.
Di wê salê de, Alex Krizhevsky û ekîba wî ji Zanîngeha Torontoyê karîbûn algorîtmayek pir rast bi dest bixin ku dikare tiştan dabeş bike.
Ew tora neuralî ya herî nûjen, ku naha wekî AlexNet tê zanîn, karîbû tiştên di databasa dîtbarî ya ImageNet de bi rêjeyek xeletiyek pir kêmtir ji ya duyemîn dabeş bike.
Torên neural algorîtmayên ku tevnek fonksiyonên matematîkî bikar tînin da ku li ser bingeha hin daneyên perwerdehiyê tevgerek taybetî fêr bibin. Mînakî, hûn dikarin daneya bijîjkî ya tora neuralî bidin da ku modelê perwerde bikin da ku nexweşiyek mîna penceşêrê teşhîs bike.
Hêvî ev e ku tora neuralî hêdî hêdî di daneyan de nimûneyan bibîne û dema ku daneya nû tê dayîn rasttir dibe.
AlexNet serîlêdanek serketî ya a bû tevna neuralî ya konvolusyon an CNN. Peyva sereke ya "convolutional" behsa lêzêdekirina qatên hevedudanî dike ku bêtir giraniyê dide daneyên ku nêzîkê hev in.
Dema ku CNN di salên 1980-an de jixwe ramanek bû, wan tenê di destpêka salên 2010-an de dest bi populerbûna xwe kir dema ku teknolojiya herî dawî ya GPU teknolojî berbi astên nû ve bir.
Serkeftina CNN di warê vîzyona computer bû sedema eleqeya zêdetir di lêkolîna torên neuralî de.
Dêweyên teknolojiyê yên mîna Google û Facebook biryar dan ku çarçoveyên xwe yên AI-yê ji gel re azad bikin. API-yên asta bilind ên wekî Keras ji bikarhêneran re navgînek-user dostane da ku bi torên neuralî yên kûr re ceribandin.
CNN di naskirina wêne û analîza vîdyoyê de pir baş bûn, lê dema ku dor tê çareserkirina pirsgirêkên ziman-based tengasiyê dikirin. Dibe ku ev sînorkirin di pêvajoya zimanê xwezayî de hebe ji ber ku wêne û nivîs bi rastî pirsgirêkên bingehîn ên cûda ne.
Mînakî, heke we modelek heye ku tasnîf dike ka wêneyek ronahiya trafîkê heye an na, ronahiya trafîkê ya navborî dikare li her derê wêneyê xuya bibe. Lê belê, ev cûre nermbûn di zimên de baş nayê xebitandin. Hevoka "Bob masî xwar" û "Masî Bob xwar" digel ku heman peyvan bikar tînin jî wateyên cûda cûda ne.
Eşkere bû ku lêkolîner ji bo çareserkirina pirsgirêkên bi zimanê mirovî re hewcedariyek nû bibînin.
Transformer her tiştî diguherînin
Li 2017, a kaxeza lêkolînê bi sernavê "Tiştê ku hûn hewce ne baldar e" celebek torê ya nû pêşniyar kir: Transformer.
Dema ku CNN bi fîlterkirina çend caran perçeyên piçûk ên wêneyek dixebitin, veguherîner her elementek di daneyê de bi her hêmanek din ve girêdide. Lêkolîner ji vê pêvajoyê re dibêjin "xwe-baldarî".
Dema ku hewl didin ku hevokan parve bikin, CNN û veguherîner pir cûda dixebitin. Dema ku CNN dê balê bikişîne ser avakirina girêdanên bi peyvên ku nêzî hev in, veguherînerek dê di nav hevokekê de di navbera her peyvan de girêdanan çêbike.
Pêvajoya xwe-balkêşiyê parçeyek bingehîn a têgihîştina zimanê mirovan e. Bi mezinkirin û nihêrîna ku tevaya hevokê çawa li hev dikeve, makîneyên dikarin ji strukturên hevokê têgihiştinek zelaltir bibin.
Dema ku yekem modelên veguherîner hatin berdan, lêkolîner di demek kurt de mîmariya nû bikar anîn da ku sûdê ji daneya nivîsê ya bêhempa ya ku li ser înternetê têne dîtin bikar bînin.
GPT-3 û Înternetê
Di 2020 de, OpenAI's Gpt-3 Modelê nîşan da ku çiqas veguherîner dikarin bandorker bin. GPT-3 karîbû metna ku hema ji mirovekî nayê cûdakirin derxe. Beşek ji tiştê ku GPT-3 ew qas hêzdar kir hêjeya daneyên perwerdehiyê hate bikar anîn. Piraniya daneheva pêş-perwerdeyê ya modelê ji danegehek ku bi navê Common Crawl tê zanîn ku zêdetirî 400 mîlyar nîşanekan tê de tê.
Digel ku şiyana GPT-3 ya afirandina teksta mirovî ya rasteqîn bi serê xwe serpêhatî bû, lêkolîner kifş kirin ka heman model çawa dikare karên din çareser bike.
Mînakî, heman modela GPT-3 ya ku hûn dikarin bikar bînin da ku tweetek çêbikin jî dikare ji we re bibe alîkar ku hûn nivîsê kurt bikin, paragrafek ji nû ve binivîsin û çîrokek biqedînin. Modelên ziman ew qas hêzdar bûne ku ew naha bi rastî amûrên gelemperî ne ku her cûre fermanê dişopînin.
Xwezaya giştî ya GPT-3 destûr daye serîlêdanên weha GitHub Copilot, ku destûrê dide bernamenûsan ku koda xebatê ji îngilîzî ya sade biafirînin.
Modelên Difuzyonê: Ji Nivîsar Berbi Wêne
Pêşkeftina ku bi veguherîner û NLP-ê hatî çêkirin di warên din de jî rê li ber AI-ya hilberîner vekiriye.
Di warê dîtina kompîturê de, me berê vegot ka fêrbûna kûr çawa hişt ku makîneyan wêneyan fam bikin. Lêbelê, me hîn jî hewce bû ku rêyek ji AI-ê re bibînin ku wêneyan bixwe çêbike ne ku tenê wan dabeş bike.
Modelên wêneya hilberîner ên mîna DALL-E 2, Stable Diffusion, û Midjourney ji ber ku ew çawa dikarin têketina nivîsê li wêneyan veguherînin populer bûne.
Van modelên wêneyê xwe dispêrin du aliyên sereke: modelek ku têkiliya di navbera wêne û nivîsê de fam dike û modelek ku bi rastî dikare wêneyek pênase bilind a ku têketinê li hev dike biafirîne.
OpenAI's KLIPP (Zimanê berevajî – Pêş-perwerdeya wêneyê) modelek çavkaniyek vekirî ye ku armanc dike ku aliye yekem çareser bike. Ji ber ku wêneyek tê dayîn, modela CLIP dikare ji bo wê wêneya taybetî ravekirina nivîsê ya herî têkildar pêşbîn bike.
Modela CLIP bi fêrbûna fêrbûna ka meriv çawa taybetmendiyên wêneyê girîng derdixe û nûneriyek hêsantir a wêneyek biafirîne dixebite.
Dema ku bikarhêner ji bo DALL-E 2 têketinek nivîsê ya nimûne peyda dikin, bi karanîna modela CLIP-ê tê veguheztinek "veguheztina wêneyê". Naha armanc ew e ku meriv rêyek peyda bike ku wêneyek ku bi cîhkirina wêneya hatî hilberandin re têkildar be peyda bike.
AI-ya wêneya nûjen a nûjen a bikar tîne modela belavbûnê ji bo ku bi rastî karê afirandina wêneyek were çareser kirin. Modelên belavbûnê xwe dispêrin torên neuralî yên ku ji berê ve hatine perwerde kirin da ku zanibin ka meriv çawa dengê zêde ji wêneyan derxîne.
Di vê pêvajoya perwerdehiyê de, tora neuralî di dawiyê de dikare fêr bibe ka meriv çawa ji wêneyek dengek bêserûber wêneyek bi rezîliya bilind biafirîne. Ji ber ku me berê nexşeyek nivîs û wêneyan ji hêla CLIP ve hatî peyda kirin, em dikarin modela belavbûnê perwerde bikin li ser pêvekirinên wêneyê CLIP-ê da ku pêvajoyek çêbikin ku her wêneyek çêbikin.
Şoreşa AI-ya Generative: Dûv re çi tê?
Em naha li nuqteyek in ku her du rojan carekê serkeftin di AI-ya hilberîner de çêdibin. Digel ku ew hêsantir û hêsantir dibe ku hilberîna cûrbecûr medyayê bi karanîna AI-ê re çêbike, gelo divê em bi fikar bin ka ev çawa dikare bandorê li civaka me bike?
Digel ku fikarên makîneyên ku li şûna karkeran diguhezînin ji îcadkirina motora hilmê ve her dem di axaftinê de ne, wusa dixuye ku ew vê carê hinekî cûda ye.
AI-ya hilberîner dibe amûrek pir-armanc ku dibe ku pîşesaziyên ku ji destwerdana AI-ê ewle dihatin hesibandin asteng bike.
Ger AI bikaribe ji çend rêwerzên bingehîn dest bi nivîsandina koda bêkêmasî bike gelo em ê hewceyê bernamenûsan bibin? Ma mirov dê afirîner kar bikin ger ew tenê modelek hilberîner bikar bînin da ku hilberîna ku ew dixwazin bi erzantir hilberînin?
Zehmet e ku meriv paşeroja şoreşa AI-ya hilberîner pêşbîn bike. Lê naha ku qutiya Pandora ya rengdêr hate vekirin, ez hêvî dikim ku teknolojî dê rê bide nûbûnên balkêştir ên ku dikarin bandorek erênî li cîhanê bihêlin.
Leave a Reply