በቅርብ ዓመታት ውስጥ "የስርጭት ሞዴሎች" የሚባሉት አመንጪ ሞዴሎች በጣም ተወዳጅ እየሆኑ መጥተዋል, እና በጥሩ ምክንያት.
በ2020ዎቹ እና 2021 ዎቹ ውስጥ ለታተሙ ጥቂት ታዋቂ ህትመቶች ምስጋና ይግባውና ዓለም በሥዕል ውህድ ላይ GANsን በበላይ ማድረጋቸው ምን ዓይነት የማሰራጨት አቅም እንዳላቸው አይቷል።
ባለሙያዎች በቅርብ ጊዜ ውስጥ የስርጭት ሞዴሎችን አጠቃቀም አይተዋል። ዳኤል-ኢ2፣ ባለፈው ወር የታተመው የOpenAI ምስል ፈጠራ ሞዴል።
ብዙ የማሽን መማሪያ ባለሙያዎች ከቅርብ ጊዜ ወዲህ እያሳደጉት ካለው ስኬት አንጻር ስለ Diffusion Models ውስጣዊ አሠራር ለማወቅ ጉጉ ናቸው።
በዚህ ልጥፍ፣ የስርጭት ሞዴሎችን የንድፈ ሃሳባዊ ድጋፍ፣ ዲዛይናቸውን፣ ጥቅሞቻቸውን እና ሌሎችንም እንመለከታለን። እንሂድ።
የስርጭት ሞዴል ምንድን ነው?
ይህ ሞዴል ለምን እንደ ማከፋፈያ ሞዴል ተብሎ እንደተጠራ በማወቅ እንጀምር።
በፊዚክስ ክፍሎች ውስጥ ከቴርሞዳይናሚክስ ጋር የተያያዘ ቃል ስርጭት ይባላል። በአንድ ቦታ ላይ እንደ ሽታ ያለ ከፍተኛ መጠን ያለው ቁሳቁስ ካለ ስርዓቱ ሚዛናዊነት የለውም።
ስርዓቱ ወደ ሚዛናዊነት እንዲገባ ስርጭት መከሰት አለበት። የመዓዛው ሞለኪውሎች በስርዓቱ ውስጥ ከፍተኛ ትኩረት ካለው ክልል ውስጥ ይሰራጫሉ ፣ ይህም ስርዓቱን በጠቅላላው አንድ ዓይነት ያደርገዋል።
በስርጭት ምክንያት ሁሉም ነገር በመጨረሻ ተመሳሳይ ይሆናል.
የስርጭት ሞዴሎች በዚህ ቴርሞዳይናሚክ ሚዛናዊ ያልሆነ ሁኔታ ይነሳሳሉ። የስርጭት ሞዴሎች የማርኮቭ ሰንሰለት ይጠቀማሉ፣ እሱም የእያንዳንዱ ተለዋዋጭ እሴት በቀድሞው ክስተት ሁኔታ ላይ የሚመረኮዝ ተከታታይ ተለዋዋጮች ነው።
ፎቶግራፍ በማንሳት፣ ወደፊት በሚሰራጭበት ጊዜ በሙሉ የተወሰነ መጠን ያለው ድምጽ በተከታታይ እንጨምረዋለን።
የጩኸት ምስልን ካስቀመጥን በኋላ, ተጨማሪ ድምጽን በማስተዋወቅ ተከታዩን ምስል ለመፍጠር እንቀጥላለን.
ብዙ ጊዜ ይህ አሰራር ይከናወናል. የንጹህ ድምጽ ምስል ይህንን ዘዴ ጥቂት ጊዜ በመድገም ውጤት ያስገኛል.
ታዲያ ከዚህ የተዝረከረከ ምስል እንዴት መፍጠር እንችላለን?
የስርጭት ሂደቱ የሚቀለበሰው ሀ በመጠቀም ነው። የነርቭ ኔትወርክ. ምስሉን ከ t እስከ t-1 ለመፍጠር ተመሳሳይ አውታረ መረቦች እና ተመሳሳይ ክብደቶች በኋለኛው ስርጭት ሂደት ውስጥ ጥቅም ላይ ይውላሉ።
አውታረ መረቡ ምስሉን እንዲገምተው ከማድረግ ይልቅ, ተግባሩን የበለጠ ለማቃለል በእያንዳንዱ ደረጃ ላይ ያለውን ድምጽ ለመተንበይ መሞከር ይችላል, ይህም ከምስሉ ላይ መወገድ አለበት.
በማንኛውም ሁኔታ፣ የ የነርቭ አውታር ንድፍ የመረጃ ልኬትን በሚጠብቅ መንገድ መመረጥ አለበት።
ወደ ስርጭቱ ሞዴል ጥልቅ ይዝለሉ
የስርጭት ሞዴል አካላት ወደፊት ሂደት (የስርጭት ሂደት በመባልም ይታወቃል)፣ ዳቱም (ብዙውን ጊዜ ምስል) ቀስ በቀስ የሚጮህበት፣ እና የተገላቢጦሽ ሂደት (በተጨማሪም የተገላቢጦሽ ስርጭት ሂደት በመባልም ይታወቃል) ጫጫታ ነው። ከዒላማው ስርጭት ወደ ናሙና ተመልሰዋል.
የጩኸቱ መጠን በበቂ ሁኔታ ዝቅተኛ ሲሆን፣ ሁኔታዊ Gaussians ወደፊት ሂደት ውስጥ የናሙና ሰንሰለት ሽግግሮችን ለማዘጋጀት ጥቅም ላይ ሊውል ይችላል። የቀጣይ ሂደት ቀላል መለኪያ ይህንን እውቀት ከማርኮቭ ግምት ጋር በማጣመር ነው፡-
q(x1:T |x0):= YT t=1 q(xt|xt-1)፣ q(xt|xt-1) := N (xt; p 1 - βtxt-1፣ βtI)
እዚህ 1…ቲ የልዩነት መርሃ ግብር ነው (የተማረም ሆነ የተስተካከለ) ፣ በበቂ ከፍተኛ ቲ ፣ xT ማለት ይቻላል አይዞሮፒክ ጋውሲያን ነው።
ተቃራኒው ሂደት የስርጭት ሞዴል አስማት የሚከሰትበት ነው። ሞዴሉ ትኩስ መረጃዎችን ለማምረት በስልጠና ወቅት ይህንን የማሰራጨት ሂደት መቀልበስ ይማራል። ሞዴሉ የጋራ ስርጭትን እንደ ይማራል (x0:T) በንጹህ የ Gaussian ጫጫታ እኩልነት የመጀመር ውጤት
(xT):=N(xT፣0፣I)።
pθ(x0:T):= p(xT) YT t=1 pθ(xt−1|xt)፣ pθ(xt−1|xt) := N (xt−1; µθ (xt, t)፣ Σθ( xt, t))
የ Gaussian ሽግግሮች ጊዜ-ጥገኛ መለኪያዎች የተገኙበት። በተለይም፣ የማርኮቭ አጻጻፍ እንዴት እንደተገለፀው አንድ የተወሰነ የተገላቢጦሽ ስርጭት ሽግግር ስርጭት በቀደመው ጊዜ (ወይም በሚከተለው የጊዜ ደረጃ ላይ፣ እርስዎ እንደሚመለከቱት) ላይ ብቻ እንደሚወሰን ልብ ይበሉ።
pθ(xt−1|xt):= N (xt−1; µθ (xt, t)፣ Σθ(xt, t))
ሞዴል ስልጠና
የስልጠና መረጃን እድል ከፍ የሚያደርግ የተገላቢጦሽ ማርኮቭ ሞዴል ስርጭትን ለማሰልጠን ይጠቅማል። በተግባራዊ አነጋገር፣ ስልጠና በአሉታዊ የምዝግብ ማስታወሻ ዕድል ላይ ያለውን ልዩነት የላይኛው ወሰን ለመቀነስ ተመሳሳይ ነው።
E [- log pθ(x0)] ≤ Eq - log pθ(x0:T) q(x1:T |x0) = Eq - log p(xT) - X t≥1 log pθ(xt−1|xt) q (xt|xt−1) =፡ ኤል
ሞዴሎች
የዓላማ ተግባራችንን የሂሳብ መሠረቶች ካቋቋምን በኋላ የኛን ስርጭት ሞዴላችንን እንዴት እንደምናስፈጽም መወሰን አለብን። ለቀጣይ ሂደት የሚያስፈልገው ብቸኛ ውሳኔ የልዩነት መርሃ ግብሩን መወሰን ነው፣ ይህም በሂደቱ ወቅት እሴቶቹ በተለምዶ የሚነሱ ናቸው።
ለተገላቢጦሽ ሂደት የ Gaussian ስርጭት መለኪያ እና ሞዴል አርክቴክቸር ለመጠቀም አጥብቀን እናስባለን።
የዲዛይናችን ብቸኛ ሁኔታ ግብአት እና ውፅዓት ሁለቱም ተመሳሳይ ልኬቶች አሏቸው። ይህ የስርጭት ሞዴሎች የሚሰጡትን ግዙፍ የነፃነት ደረጃ ያጎላል።
ከዚህ በታች ስለእነዚህ አማራጮች በጥልቀት እንመረምራለን።
የማስተላለፍ ሂደት
ከሂደቱ ጋር በተያያዘ የልዩነት መርሃ ግብሩን ማቅረብ አለብን። በተለይ በጊዜ-ጥገኛ ቋሚዎች እንዲሆኑ እናስቀምጣቸዋለን እና ሊማሩ የሚችሉበትን እድል ችላ አልን። የጊዜ መርሐግብር ከ
β1 = 10-4 እስከ βT = 0.02.
Lt በቋሚ ልዩነት መርሃ ግብር ምክንያት ሊማሩ የሚችሉ መለኪያዎች ስብስባችንን በተመለከተ ቋሚ ይሆናል።
የተገላቢጦሽ ሂደት
አሁን የተገላቢጦሹን ሂደት ለመወሰን የሚያስፈልጉትን ውሳኔዎች እንመረምራለን. የተገላቢጦሽ የማርኮቭ ሽግግሮችን እንደ ጋውሲያን እንዴት እንደገለጽናቸው አስታውስ፡-
pθ(xt−1|xt):= N (xt−1; µθ (xt, t)፣ Σθ(xt, t))
አሁን ተግባራዊ ዓይነቶችን ለይተናል. ምንም እንኳን ለመለካት የበለጠ ውስብስብ ቴክኒኮች ቢኖሩም ፣ እኛ ብቻ እናዘጋጃለን
Σθ(xt፣ t) = σ 2 t I
σ 2 t = βt
በሌላ መንገድ ለማስቀመጥ፣ መልቲቫሪያት ጋውሲያን ተመሳሳይ ልዩነት ያላቸው የተለያዩ Gaussians ውጤት፣ በጊዜ ሂደት ሊለዋወጥ የሚችል የልዩነት እሴት እንቆጥረዋለን። እነዚህ ልዩነቶች የተቀናበሩት የማስተላለፍ ሂደት ልዩነቶችን የጊዜ ሰሌዳ ለማዛመድ ነው።
በዚህ አዲስ ቀመር ምክንያት, እና አለነ:
pθ(xt−1|xt):= N (xt-1፤ µθ (xt, t)፣ Σθ(xt, t)):=N (xt−1; µθ (xt, t)፣ σ2 t I
ይህ ከዚህ በታች የሚታየውን ተለዋጭ የኪሳራ ተግባርን ያስከትላል፣ ይህም ደራሲዎቹ የበለጠ ወጥ የሆነ ስልጠና እና የላቀ ውጤት ያስገኛሉ፡
ቀላል (θ) := Et,x0, h - θ( √ αNTx0 + √ 1 - αNT, t) 2
ደራሲዎቹ በዚህ የስርጭት ሞዴሎች እና በላንጌቪን ላይ የተመሰረቱ የውጤት ማዛመጃ አመንጪ ሞዴሎች መካከል ግንኙነቶችን ይሳሉ። እንደ ሞገድ ላይ የተመሰረተ የኳንተም ፊዚክስ እና ማትሪክስ ላይ የተመሰረተ የኳንተም መካኒኮች ገለልተኛ እና ትይዩ እድገት ጋር ተመሳሳይ የሆኑ ሁለት ተነጻጻሪ ቀመሮችን የገለጠው ፣ Diffusion Models እና Score-Based ሞዴሎች የአንድ ሳንቲም ሁለት ገጽታዎች ሊሆኑ የሚችሉ ይመስላል።
የአውታረ መረብ ስነ-ቅርጽ
ምንም እንኳን የእኛ የታመቀ ኪሳራ ተግባራችን ሞዴልን ለማሰልጠን ያለመ ቢሆንም Σθበዚህ ሞዴል አርክቴክቸር ላይ አሁንም አልወሰንንም። ሞዴሉ በቀላሉ ተመሳሳይ የግብአት እና የውጤት መጠን ሊኖረው እንደሚገባ ያስታውሱ.
ከዚህ ገደብ አንጻር የምስል ስርጭት ሞዴሎችን ለመፍጠር ዩ-ኔት መሰል አርክቴክቸር በተደጋጋሚ ጥቅም ላይ ውሎ መገኘቱ ያልተጠበቀ ላይሆን ይችላል።
ቀጣይነት ያለው ሁኔታዊ የጋውሲያን ስርጭቶችን እየተጠቀሙ በተገላቢጦሽ ሂደት መንገድ ላይ ብዙ ለውጦች ተደርገዋል። ያስታውሱ የተገላቢጦሽ ሂደት ግብ በኢንቲጀር ፒክሰል እሴቶች የተሰራ ምስል መፍጠር ነው። ስለዚህ ለእያንዳንዱ እምቅ የፒክሰል ዋጋ ከሁሉም ፒክሰሎች በላይ የልዩ (ሎግ) እድሎችን መወሰን አስፈላጊ ነው።
ይህ የተገላቢጦሽ ስርጭት ሰንሰለት የመጨረሻ ሽግግር ላይ የተለየ ዲኮደር በመመደብ ይከናወናል። የአንድ የተወሰነ ምስል ዕድል መገመት x0 ተሰጥቷል x1.
pθ(x0|x1) = YD i=1 Z δ+(xi 0) δ−(xi 0) N (x; µ i θ (x1, 1)፣ σ2 1) dx
δ+(x) = ∞ ከሆነ x = 1 x + 1 255 ከሆነ x < 1 δ− (x) = -∞ ከሆነ x = -1 x - 1 255 ከሆነ x > -1
የሱፐር ስክሪፕት እኔ የአንድ መጋጠሚያ መውጣትን እና D በመረጃው ውስጥ ያሉትን የልኬቶች ብዛት ያሳያል።
በዚህ ነጥብ ላይ ያለው ዓላማ ለዚያ ፒክሴል በጊዜ ልዩነት ውስጥ እምቅ እሴቶችን በማከፋፈል የእያንዳንዱ ኢንቲጀር ዋጋ ለአንድ የተወሰነ ፒክሰል የመሆን እድልን ማረጋገጥ ነው. t=1
የመጨረሻ ዓላማ
ሳይንቲስቶች እንደሚሉት ከፍተኛው ውጤት የተገኘው በተወሰነ ጊዜ ውስጥ የስዕሉን ድምጽ ክፍል በመተንበይ ነው። በመጨረሻ ፣ የሚከተለውን ግብ ይጠቀማሉ።
ቀላል (θ) := Et,x0, h - θ( √ αNTx0 + √ 1 - αNT, t) 2
በሚከተለው ምስል ላይ ለስርጭት ሞዴላችን የስልጠና እና የናሙና ሂደቶች በአጭሩ ቀርበዋል፡-
የስርጭት ሞዴል ጥቅሞች
ቀደም ሲል እንደተገለፀው በስርጭት ሞዴሎች ላይ ያለው የምርምር መጠን በቅርብ ጊዜ ተባዝቷል. የስርጭት ሞዴሎች አሁን ዘመናዊ የምስል ጥራትን ያቀርባሉ እና ሚዛናዊ ባልሆኑ ቴርሞዳይናሚክስ ተመስጧዊ ናቸው።
የስርጭት ሞዴሎች እንደ ተቃራኒ ስልጠና የማይፈልጉ ከመሳሰሉት የላቀ የምስል ጥራት ከማግኘታቸው በተጨማሪ ሌሎች የተለያዩ ጥቅሞችን ይሰጣሉ።
የተቃዋሚ ስልጠና ድክመቶች በሰፊው ይታወቃሉ ፣ ስለሆነም ብዙውን ጊዜ ተመጣጣኝ ያልሆነ አፈፃፀም እና የሥልጠና ውጤታማነት አማራጮችን መምረጥ ተመራጭ ነው።
የስርጭት ሞዴሎች ከስልጠና ውጤታማነት አንፃር የመለጠጥ እና ትይዩነት ጥቅሞችን ይሰጣሉ።
ምንም እንኳን የስርጭት ሞዴሎች ከአየር ውጭ የሚመስሉ ውጤቶችን የሚያመነጩ ቢመስሉም ለእነዚህ ውጤቶች መሰረቱን በበርካታ አሳቢ እና አስደሳች የሂሳብ ውሳኔዎች እና ረቂቅ ዘዴዎች የተቀመጡ ናቸው እና የኢንዱስትሪ ምርጥ ተሞክሮዎች አሁንም እየተዘጋጁ ናቸው።
መደምደሚያ
በማጠቃለያው፣ ተመራማሪዎች የስርጭት ፕሮባብሊስቲክ ሞዴሎችን በመጠቀም ከፍተኛ ጥራት ያላቸውን የምስል ውህድ ግኝቶችን አሳይተዋል፣ ይህ ክፍል ባልተመጣጠነ ቴርሞዳይናሚክስ ሀሳቦች የተነሳሱ ድብቅ ተለዋዋጭ ሞዴሎች።
በዘመናዊ ውጤታቸው እና ተቃዋሚ ባልሆኑ ስልጠናዎች እና በጨቅላነታቸው ምክንያት እጅግ በጣም ጥሩ ውጤቶችን አግኝተዋል እና በመጪዎቹ ዓመታት ብዙ እድገቶች ሊጠበቁ ይችላሉ።
በተለይም የስርጭት ሞዴሎች እንደ DALL-E 2 ላሉት የላቀ ሞዴሎች ተግባር ወሳኝ እንደሆኑ ታውቋል ።
እዚህ ሙሉውን ምርምር ማግኘት ይችላሉ.
መልስ ይስጡ