እኛ ምናልባት አዲስ የጄኔሬቲቭ AI አብዮት መጀመሪያ ላይ ነን።
ጄነሬቲቭ አርቴፊሻል ኢንተለጀንስ ይዘትን መፍጠር የሚችሉ ስልተ ቀመሮችን እና ሞዴሎችን ያመለክታል። የእነዚህ ሞዴሎች ውፅዓት እንደ እውነተኛ የሰው ልጅ ውፅዓት ሊሳሳቱ የሚችሉ ጽሑፎችን፣ ኦዲዮ እና ምስሎችን ያጠቃልላል።
መተግበሪያዎች እንደ ውይይት ጂፒቲ ጄኔሬቲቭ AI ተራ አዲስ ነገር እንዳልሆነ አሳይተዋል። AI አሁን ዝርዝር መመሪያዎችን መከተል የሚችል እና አለም እንዴት እንደሚሰራ ጥልቅ ግንዛቤ ያለው ይመስላል።
ግን እዚህ ደረጃ ላይ እንዴት ደረስን? በዚህ መመሪያ ውስጥ ለዚህ አዲስ እና አስደሳች የጄኔሬቲቭ AI አብዮት መንገድ የከፈቱ አንዳንድ በ AI ምርምር ውስጥ አንዳንድ ቁልፍ ግኝቶችን እናልፋለን።
የነርቭ አውታረ መረቦች መጨመር
የዘመናዊውን AI አመጣጥ በምርምር ላይ መፈለግ ይችላሉ። ጥልቅ ትምህርት እና የነርቭ አውታረ መረቦች 2012 ውስጥ.
በዚያ ዓመት አሌክስ ክሪዝቭስኪ እና የቶሮንቶ ዩኒቨርሲቲ ቡድኑ ነገሮችን ለመመደብ የሚያስችል እጅግ በጣም ትክክለኛ የሆነ አልጎሪዝም ማግኘት ችለዋል።
የ ዘመናዊው የነርቭ አውታርአሁን አሌክስኔት በመባል የሚታወቀው በ ImageNet ቪዥዋል ዳታቤዝ ውስጥ ያሉትን ነገሮች ከወራጅው ያነሰ የስህተት መጠን መለየት ችሏል።
ነርቭ አውታረ መረቦች በአንዳንድ የስልጠና መረጃዎች ላይ በመመስረት የተለየ ባህሪን ለመማር የሂሳብ ተግባራትን መረብ የሚጠቀሙ ስልተ ቀመሮች ናቸው። ለምሳሌ፣ እንደ ካንሰር ያለ በሽታን ለመመርመር ሞዴሉን ለማሰልጠን የነርቭ አውታረ መረብ የህክምና መረጃን መመገብ ይችላሉ።
ተስፋው የነርቭ አውታረመረብ በመረጃው ውስጥ ቀስ በቀስ ቅጦችን ያገኛል እና አዲስ መረጃ ሲሰጥ የበለጠ ትክክለኛ ይሆናል።
አሌክስኔት የ ሀ ንፅፅር የነርቭ አውታረመረብ ወይም CNNs. የ"convolutional" ቁልፍ ቃል የሚያመለክተው እርስ በርስ በሚቀራረቡ መረጃዎች ላይ የበለጠ ትኩረት የሚያደርጉ ኮንቮሉሽን ንብርብሮች መጨመርን ነው።
ሲ.ኤን.ኤን በ1980ዎቹ ቀደም ሲል ሀሳብ ሆነው ሳለ፣ በ2010ዎቹ መጀመሪያ ላይ ተወዳጅነትን ማግኘት የጀመሩት አዲሱ የጂፒዩ ቴክኖሎጂ ቴክኖሎጂውን ወደ አዲስ ከፍታ ሲገፋው ነው።
በመስክ ውስጥ የሲኤንኤንዎች ስኬት የኮምፒተር ራዕይ በነርቭ ኔትወርኮች ምርምር ላይ የበለጠ ፍላጎት አሳድሯል.
እንደ ጎግል እና ፌስቡክ ያሉ የቴክኖሎጂ ግዙፍ ኩባንያዎች የራሳቸውን የ AI ማዕቀፎችን ለህዝብ ለመልቀቅ ወሰኑ። እንደ ከፍተኛ ደረጃ ኤፒአይዎች ኬራሎች ጥልቅ የነርቭ አውታረ መረቦችን እንዲሞክሩ ለተጠቃሚዎች ተስማሚ የሆነ በይነገጽ ሰጠ።
ሲ ኤን ኤን በምስል ማወቂያ እና በቪዲዮ ትንተና ጥሩ ነበሩ ነገር ግን ቋንቋን መሰረት ያደረጉ ችግሮችን ለመፍታት ችግር ነበረባቸው። ምስሎች እና ጽሑፎች በመሠረቱ የተለያዩ ችግሮች ስለሆኑ ይህ በተፈጥሮ ቋንቋ ሂደት ውስጥ ያለው ገደብ ሊኖር ይችላል።
ለምሳሌ, ምስል የትራፊክ መብራትን እንደያዘ የሚከፋፍል ሞዴል ካለዎት, በጥያቄ ውስጥ ያለው የትራፊክ መብራት በምስሉ ውስጥ በማንኛውም ቦታ ሊታይ ይችላል. ይሁን እንጂ እንዲህ ዓይነቱ ገርነት በቋንቋው ውስጥ ጥሩ አይሰራም. “ቦብ አሳ በላ” እና “ቦብ አሳ በላ” የሚለው አረፍተ ነገር ተመሳሳይ ቃላት ቢጠቀሙም በጣም የተለያየ ትርጉም አላቸው።
ተመራማሪዎች ከሰው ቋንቋ ጋር የተያያዙ ችግሮችን ለመፍታት አዲስ ዘዴ መፈለግ እንደሚያስፈልጋቸው ግልጽ ሆነ።
ትራንስፎርመሮች ሁሉንም ነገር ይለውጣሉ
በ 2017, a ምርምር ወረቀት “ትኩረት ብቻ የሚያስፈልግህ ነው” በሚል ርዕስ አዲስ የኔትወርክ አይነት አቅርቧል፡ ትራንስፎርመር።
CNN ዎች ትንሽ የምስል ክፍሎችን በተደጋጋሚ በማጣራት ሲሰሩ፣ ትራንስፎርመሮች በመረጃው ውስጥ ያለውን እያንዳንዱን አካል ከሌላው አካል ጋር ያገናኛሉ። ተመራማሪዎች ይህንን ሂደት "ራስን ትኩረት" ብለው ይጠሩታል.
ዓረፍተ ነገሮችን ለመተንተን በሚሞከርበት ጊዜ CNNs እና Transformers በጣም በተለየ መንገድ ይሰራሉ። ሲ ኤን ኤን እርስ በርስ ከተቀራረቡ ቃላት ጋር ግንኙነቶችን በመፍጠር ላይ ያተኩራል, ትራንስፎርመር በእያንዳንዱ እና በእያንዳንዱ ዓረፍተ ነገር መካከል ግንኙነቶችን ይፈጥራል.
ራስን የማሰብ ሂደት የሰውን ቋንቋ የመረዳት ዋና አካል ነው። በማጉላት እና አጠቃላይ ዓረፍተ ነገሩ እንዴት እንደሚገጣጠም በመመልከት፣ ማሽኖች ስለ ዓረፍተ ነገሩ አወቃቀር የበለጠ ግልጽ ግንዛቤ ሊኖራቸው ይችላል።
የመጀመሪያዎቹ የትራንስፎርመር ሞዴሎች ከተለቀቁ በኋላ፣ ተመራማሪዎች ብዙም ሳይቆይ አዲሱን የሕንፃ ጥበብ በበይነመረቡ ላይ የሚገኘውን አስደናቂ የጽሑፍ መረጃ ለመጠቀም ተጠቅመውበታል።
GPT-3 እና ኢንተርኔት
በ2020፣ OpenAI's GPT-3 ሞዴል ትራንስፎርመሮች ምን ያህል ውጤታማ ሊሆኑ እንደሚችሉ አሳይቷል። GPT-3 ከሰው የማይለይ የሚመስለውን ጽሑፍ ማውጣት ችሏል። GPT-3ን በጣም ኃይለኛ ካደረገው ነገር ውስጥ ጥቅም ላይ የዋለው የስልጠና መረጃ መጠን ነው። አብዛኛው የአምሳያው የቅድመ-ሥልጠና መረጃ ስብስብ ከ400 ቢሊዮን በላይ ቶከኖች ጋር ከሚመጣው የጋራ ክራውል ከሚታወቀው የውሂብ ስብስብ የመጣ ነው።
የጂፒቲ-3 ትክክለኛ የሰው ጽሑፍ የማመንጨት ችሎታ በራሱ ትልቅ ደረጃ ላይ የደረሰ ቢሆንም፣ ተመራማሪዎች ተመሳሳይ ሞዴል ሌሎች ሥራዎችን እንዴት እንደሚፈታ ደርሰውበታል።
ለምሳሌ፣ ትዊት ለመፍጠር የምትጠቀመው ያው GPT-3 ሞዴል ጽሑፍን ለማጠቃለል፣ አንቀጽ እንደገና ለመጻፍ እና ታሪክን ለመጨረስ ይረዳል። የቋንቋ ሞዴሎች በጣም ኃይለኛ ከመሆናቸው የተነሳ አሁን ማንኛውንም ዓይነት ትዕዛዝ የሚከተሉ በአጠቃላይ አጠቃላይ ዓላማ ያላቸው መሳሪያዎች ናቸው.
የ GPT-3 አጠቃላይ ዓላማ ተፈጥሮ ለመሳሰሉት መተግበሪያዎች ፈቅዷል GitHub ረዳት አብራሪ፣ ፕሮግራመሮች ከቀላል እንግሊዝኛ የስራ ኮድ እንዲያወጡ ያስችላቸዋል።
የስርጭት ሞዴሎች፡ ከጽሑፍ ወደ ምስሎች
በትራንስፎርመሮች እና በኤንኤልፒ የተደረገው እድገት በሌሎች መስኮች ለጄነሬቲቭ AI መንገድ ከፍቷል።
በኮምፒዩተር እይታ መስክ፣ ማሽኖቹ ምስሎችን እንዲረዱ ምን ያህል ጥልቅ ትምህርት እንዳስቻላቸው አስቀድመን ሸፍነናል። ሆኖም፣ አሁንም ምስሎችን ከመመደብ ይልቅ ምስሎችን እራሳቸው የሚያመነጩበት መንገድ መፈለግ ነበረብን።
እንደ DALL-E 2፣Stable Diffusion እና Midjourney ያሉ አመንጭ የምስል ሞዴሎች የጽሑፍ ግብዓትን ወደ ምስሎች እንዴት መለወጥ በመቻላቸው ታዋቂ ሆነዋል።
እነዚህ የምስሎች ሞዴሎች በሁለት ቁልፍ ገጽታዎች ላይ የተመሰረቱ ናቸው-በምስሎች እና በፅሁፍ መካከል ያለውን ግንኙነት የሚረዳ ሞዴል እና ከመግቢያው ጋር የሚዛመድ ከፍተኛ ጥራት ያለው ምስል መፍጠር የሚችል ሞዴል.
ክፍት AI's ቅንጥብ (ተቃራኒ ቋንቋ-የምስል ቅድመ-ስልጠና) የመጀመሪያውን ገጽታ ለመፍታት ያለመ ክፍት ምንጭ ሞዴል ነው። ምስል ከተሰጠው፣ የCLIP ሞዴል ለዚያ ምስል በጣም አስፈላጊ የሆነውን የጽሁፍ መግለጫ መተንበይ ይችላል።
የ CLIP ሞዴል የሚሠራው ጠቃሚ የምስል ባህሪያትን እንዴት ማውጣት እና ቀለል ያለ ምስል መፍጠር እንደሚቻል በመማር ነው።
ተጠቃሚዎች ለDALL-E 2 የናሙና የጽሑፍ ግብዓት ሲያቀርቡ፣ ግብአቱ የCLIP ሞዴልን በመጠቀም ወደ "ምስል መክተት" ይቀየራል። ግቡ አሁን ከተፈጠረው የምስል መክተት ጋር የሚዛመድ ምስል የሚፈጥርበትን መንገድ መፈለግ ነው።
የቅርብ ጊዜ አመንጪ ምስል ኤአይኤስ ይጠቀማሉ ሀ የስርጭት ሞዴል ምስልን በትክክል የመፍጠር ስራን ለመቋቋም. የስርጭት ሞዴሎች የተጨመሩትን ጫጫታ ከምስሎች እንዴት ማስወገድ እንደሚችሉ ለማወቅ አስቀድመው በሰለጠኑ የነርቭ መረቦች ላይ ይመረኮዛሉ.
በዚህ የሥልጠና ሂደት ውስጥ የነርቭ አውታረመረብ በመጨረሻ ከድምጽ ምስል ከፍተኛ ጥራት ያለው ምስል እንዴት መፍጠር እንደሚቻል መማር ይችላል። ቀደም ሲል በCLIP የቀረበ የጽሑፍ እና የምስሎች ካርታ ስላለን፣ እንችላለን የስርጭት ሞዴል ማሰልጠን ማንኛውንም ምስል ለመፍጠር ሂደት ለመፍጠር በ CLIP ምስል መክተቻዎች ላይ።
የጄኔሬቲቭ AI አብዮት፡ ቀጥሎ ምን ይመጣል?
አሁን በየሁለት ቀኑ የጄኔሬቲቭ AI ግኝቶች እየተከሰቱ ባለበት ደረጃ ላይ ነን። AIን በመጠቀም የተለያዩ አይነት ሚዲያዎችን ማፍለቅ ቀላል እና ቀላል እየሆነ በመምጣቱ ይህ በህብረተሰባችን ላይ እንዴት ሊጎዳ ይችላል ብለን መጨነቅ አለብን?
የእንፋሎት ሞተር ከተፈለሰፈበት ጊዜ ጀምሮ ሰራተኞችን የሚተኩ የማሽኖች ጭንቀት ሁልጊዜም በንግግሩ ውስጥ የነበረ ቢሆንም በዚህ ጊዜ ግን ጉዳዩ ትንሽ የተለየ ይመስላል።
ጄኔሬቲቭ AI ከ AI ቁጥጥር ነፃ ናቸው ተብለው የተገመቱትን ኢንዱስትሪዎች ሊያስተጓጉል የሚችል ሁለገብ መሳሪያ እየሆነ ነው።
AI ከጥቂት መሰረታዊ መመሪያዎች እንከን የለሽ ኮድ መፃፍ ከጀመረ ፕሮግራመሮች ያስፈልጉናል? ሰዎች የፈለጉትን ምርት በርካሽ ለማምረት አመንጪ ሞዴልን ብቻ መጠቀም ከቻሉ ፈጣሪዎችን ይቀጥራሉ?
የጄኔሬቲቭ AI አብዮት የወደፊት ሁኔታን ለመተንበይ አስቸጋሪ ነው. አሁን ግን ምሳሌያዊው የፓንዶራ ሣጥን ስለተከፈተ፣ ቴክኖሎጂው በዓለም ላይ በጎ ተጽዕኖ ሊያሳድሩ የሚችሉ ተጨማሪ አዳዲስ ፈጠራዎችን ይፈቅዳል ብዬ ተስፋ አደርጋለሁ።
መልስ ይስጡ