በአጠቃላይ እንደ GANs፣ VAEs እና autoregressive ሞዴሎች ያሉ ጥልቅ አመንጪ ሞዴሎች የምስል ውህደት ችግሮችን ይይዛሉ።
እነሱ ከሚፈጥሩት ከፍተኛ ጥራት አንጻር የጄኔሬቲቭ አድቨርሳሪያል ኔትወርኮች (GANs) በቅርብ ዓመታት ውስጥ ብዙ ትኩረት አግኝተዋል.
የስርጭት ሞዴሎች እራሱን ያቋቋመ ሌላ አስደናቂ የጥናት መስክ ነው። የምስል፣ የቪዲዮ እና የድምጽ ማመንጨት መስኮች ለሁለቱም ሰፊ ጥቅም አግኝተዋል።
የስርጭት ሞዴሎች ከ GAN ጋር፡ የትኛው የተሻለ ውጤት ያስገኛል? በተፈጥሮ, ይህ ቀጣይነት ያለው ውይይት እንዲፈጠር አድርጓል.
GAN ተብሎ በሚታወቀው የስሌት ህንፃ ውስጥ, ሁለት የነርቭ ኔትወርኮች ለእውነተኛ መረጃ ሊተላለፉ የሚችሉ አዲስ የተቀናጁ የመረጃ ምሳሌዎችን ለማምረት እርስ በእርስ ይጣላሉ።
የሥልጠና መረጋጋት እና ለሙዚቃ እና ግራፊክስ ለማምረት ከፍተኛ ውጤቶችን ስለሚሰጡ የስርጭት ሞዴሎች በጣም ተወዳጅ እየሆኑ መጥተዋል።
ይህ መጣጥፍ በስርጭት ሞዴል እና GANs ውስጥ እንዲሁም አንዳቸው ከሌላው እና ከሌሎች ጥቂት ነገሮች እንዴት እንደሚለያዩ በዝርዝር እናያለን።
ስለዚህ፣ Generative Adversarial Networks ምንድን ናቸው?
በእውነተኛ መረጃ የተሳሳቱ አዲስ፣ ሰው ሰራሽ የመረጃ አጋጣሚዎችን ለመፍጠር፣ አመንጪ ተከራካሪ ኔትወርኮች (GANs) ሁለት የነርቭ ኔትወርኮችን በመቅጠር እርስ በእርሳቸው ያጋጫሉ (ስለዚህ በስሙ “ተቃዋሚ”)።
ለንግግር፣ ለቪዲዮ እና ለሥዕል ፈጠራ በስፋት ጥቅም ላይ ይውላሉ።
የጋን አላማ ከዚህ ቀደም ያልተገኘ መረጃ ከአንድ የተወሰነ የውሂብ ስብስብ መፍጠር ነው። ከናሙናዎቹ ውስጥ ትክክለኛውን፣ ያልታወቀ የስርጭት መረጃን ሞዴል ለመገመት መሞከር ይህን ያደርጋል።
በአማራጭ እነዚህ ኔትወርኮች የተወሰነ ስታትስቲካዊ ስርጭትን ለመማር የሚሞክሩ ስውር ሞዴሎች ናቸው።
GAN ይህንን ዓላማ እንዴት ማሳካት እንደሚቻል ለማወቅ የተጠቀመበት ዘዴ አዲስ ነበር። እንደ እውነቱ ከሆነ, ስውር ሞዴል ለማዘጋጀት ሁለት-ተጫዋች ጨዋታን በመጫወት መረጃን ያዘጋጃሉ.
የሚከተለው አወቃቀሩን ይገልጻል።
- በእውነተኛ እና በሐሰት ውሂብ መካከል የመለየት ችሎታ የሚያገኝ አድልዎ
- መረጃን ለመፍጠር አዳዲስ መንገዶችን የሚወስድ ጀነሬተር አድሏዊውን ሊያታልል ይችላል።
አድሏዊው እንደ ነርቭ አውታር ነው. ስለዚህ ጄነሬተር ለማታለል ከፍተኛ ጥራት ያለው ምስል መፍጠር ያስፈልገዋል.
እነዚህ ጄነሬተሮች ምንም ዓይነት የውጤት ስርጭትን በመጠቀም ያልሰለጠኑ መሆናቸው በአውቶኢንኮደር ሞዴሎች እና በሌሎች ሞዴሎች መካከል ትልቅ ልዩነት ነው.
የአምሳያው ኪሳራ ተግባርን ለመበስበስ ሁለት መንገዶች አሉ-
- አድሎአዊው ትክክለኛ መረጃን በትክክል ካየ የመለካት ችሎታ
- የመነጨ ውሂብ በትክክል በአንድ ክፍል ይተነብያል።
በጣም ጥሩ በሆነው አድልዎ ላይ፣ ይህ የኪሳራ ተግባር ይቀንሳል፡-
አጠቃላይ ሞዴሎች ስለዚህ የርቀት ቅነሳ ሞዴሎች ተብለው ሊወሰዱ ይችላሉ, እና አድልዎ በጣም ጥሩ ከሆነ, በእውነተኛ እና በተመረተ ስርጭት መካከል ያለውን ልዩነት መቀነስ.
እንደ እውነቱ ከሆነ, የተለያዩ ልዩነቶች ተቀጥረው የተለያዩ የ GAN ስልጠና ዘዴዎችን ሊያስከትሉ ይችላሉ.
በጄነሬተር እና በአድሎአዊው መካከል ያለውን የንግድ ልውውጥ የሚያጠቃልለው የመማሪያ ተለዋዋጭነት የ GANs ኪሳራ ተግባርን ማስተካከል ቀላል ቢሆንም ለመከተል ፈታኝ ነው።
ትምህርት እንደሚጣመር ምንም ማረጋገጫዎች የሉም። በውጤቱም፣ የ GAN ሞዴልን ማሰልጠን ከባድ ነው፣ ምክንያቱም እንደ መጥፋት ቅልመት እና ሁነታ ውድቀት (በተፈጠሩት ናሙናዎች ውስጥ ምንም ልዩነት በማይኖርበት ጊዜ) ባሉ ችግሮች ውስጥ ማለፍ የተለመደ ስለሆነ።
አሁን የስርጭት ሞዴሎች ጊዜው አሁን ነው።
የጋን (GANs) የሥልጠና ትስስር ችግር የስርጭት ሞዴሎችን በማዘጋጀት ተቀርፏል።
እነዚህ ሞዴሎች የማሰራጨት ሂደት በድምፅ ተራማጅ ጣልቃገብነት ከሚመጣው የመረጃ መጥፋት ጋር እኩል ነው ብለው ያስባሉ (በእያንዳንዱ የስርጭት ሂደት ጊዜ የጋኡሲያን ድምጽ ይታከላል)።
የእንደዚህ አይነት ሞዴል አላማ ጫጫታ በናሙና ውስጥ ያለውን መረጃ እንዴት እንደሚጎዳ ወይም በሌላ መንገድ ለማስቀመጥ, በማሰራጨት ምክንያት ምን ያህል መረጃ እንደሚጠፋ ለመወሰን ነው.
አንድ ሞዴል ይህንን ማወቅ ከቻለ ዋናውን ናሙና ማውጣት እና የተከሰተውን የመረጃ መጥፋት መቀልበስ መቻል አለበት።
ይህ የሚፈጸመው በማይታወቅ የስርጭት ሞዴል ነው። ወደ ፊት የማሰራጨት ሂደት እና የተገላቢጦሽ ስርጭት ሂደት ሁለቱን ደረጃዎች ያጠቃልላል።
ወደ ፊት የማሰራጨት ሂደት መረጃው በድምጽ ሙሉ በሙሉ እስኪበከል ድረስ ቀስ በቀስ የ Gaussian ጫጫታ (ማለትም የማሰራጨት ሂደት) መጨመርን ያካትታል።
ጩኸቱን ለመቀልበስ ሁኔታዊ ስርጭት እድሎችን ለመማር የነርቭ አውታረመረብ በኋላ በተገላቢጦሽ ስርጭት ዘዴ ሰልጥኗል።
እዚህ ስለ ተጨማሪ መረዳት ይችላሉ የስርጭት ሞዴል.
የስርጭት ሞዴል Vs GANs
ልክ እንደ ስርጭት ሞዴል፣ GANs ምስሎችን ከድምጽ ያዘጋጃሉ።
ሞዴሉ በጄነሬተር ነርቭ አውታር የተሰራ ነው, እሱም የሚጀምረው በአንዳንድ መረጃ ሰጪ ኮንዲሽነሮች ጩኸት ነው, ለምሳሌ የክፍል መለያ ወይም የጽሑፍ ኢንኮዲንግ.
ውጤቱም ከተጨባጭ ምስል ጋር የሚመሳሰል መሆን አለበት.
የፎቶ እውነተኛ እና ከፍተኛ ታማኝነት ያላቸው የምስል ትውልዶችን ለመፍጠር፣ GANs እንቀጥራለን። ከ GAN የበለጠ ተጨባጭ ምስሎች የሚዘጋጁት የስርጭት ሞዴሎችን በመጠቀም ነው።
በአንድ መንገድ, የስርጭት ሞዴሎች እውነታዎችን በመግለጽ የበለጠ ትክክለኛ ናቸው.
GAN እንደ ግቤት የዘፈቀደ ጫጫታ ወይም የክፍል ማቀዝቀዣ ተለዋዋጭ እና ተጨባጭ ናሙና ሲያወጣ፣ የስርጭት ሞዴሎች ብዙ ጊዜ ቀርፋፋ፣ ተደጋጋሚ እና የበለጠ መመሪያ ያስፈልጋቸዋል።
ከድምፅ ወደ መጀመሪያው ምስል የመመለስ ዓላማን ማስተባበል በተደጋጋሚ ሲተገበር ለስህተት ብዙ ቦታ የለም።
እያንዳንዱ የፍተሻ ነጥብ በፍጥረት ደረጃ ውስጥ ያልፋል፣ እና በእያንዳንዱ እርምጃ ስዕሉ የበለጠ እና የበለጠ መረጃ ሊያገኝ ይችላል።
መደምደሚያ
ለማጠቃለል፣ በ2020ዎቹ እና 2021 ብቻ በታተሙት ጥቂት ጉልህ ጥናቶች ምክንያት፣ የስርጭት ሞዴሎች አሁን ከ GANs በስእል ውህደት ሊበልጡ ይችላሉ።
በዚህ ዓመት OpenAI ተጀምሯል። ዳኤል-ኢ2, የምስል ማምረቻ ሞዴል ባለሙያዎች የስርጭት ሞዴሎችን እንዲቀጥሩ ያስችላቸዋል.
ምንም እንኳን GANዎች በጣም ጥሩ ቢሆኑም፣ ገደቦቻቸው በአዲስ አውድ ውስጥ ለመለካት እና ለመጠቀም ፈታኝ ያደርገዋል።
በአጋጣሚ ላይ የተመሰረቱ ሞዴሎችን በመጠቀም የ GAN መሰል የናሙና ጥራትን ለማግኘት ብዙ ስራ ተሰርቷል።
መልስ ይስጡ