Мундариҷа[Пинҳон кардан][Намоиш]
Нав ва такмилёфтаи AI қобилиятҳо, фаҳмиш ва қобилияти тавлиди тасвирҳои баландсифатро беҳтар кардааст. Шумо шояд вақтҳои охир бо баъзе тасвирҳои аҷиб ва ҷолибе дар саросари интернет дучор шудаед.
Саги Шиба Ину дар тан берет ва гардани сиёҳпӯш дорад. Ва бахри баҳрӣ ба тарзи рассоми Голландия Вермеер "Духтаре бо гӯшвораи марворид". Ва як пиёла шӯрбо, ки ба ҳаюло пашм монанд аст.
Ин тасвирҳо аз тарафи одами рассом офарида нашудаанд.
Ба ҷои ин, DALL-E 2, системаи нави AI, ки метавонад тавсифи матниро ба тасвирҳо табдил диҳад, онҳоро офаридааст.
Танҳо он чизеро, ки дидан мехоҳед, нависед, ва AI онро барои шумо эҷод мекунад - бо тафсилоти равшан, сифати олӣ ва дар баъзе мавридҳо, ихтироъкории ҳақиқӣ. Дар ин паём, мо ба омӯзиши охирини OpenAI, DALL.E 2, инчунин чӣ гуна кор кардани он ва ғайраро амиқ дида мебароем. Биёед оғоз кунем.
Пас, маҳз чист DALL.E 2?
DALL-E 2 як "модели тавлидкунанда", як навъи алгоритми омӯзиши мошинист, ки на иҷрои вазифаҳои пешгӯӣ ё таснифот дар маълумоти воридотӣ натиҷаи мураккабро тавлид мекунад.
Шумо ба DALL-E 2 тавсифи хаттӣ медиҳед ва он тасвири ба он мувофиқро эҷод мекунад. Бо омезиши консепсияҳо, сифатҳо ва услубҳо, DALLE 2-и OpenAI метавонад графикаи инноватсионӣ, воқеӣ ва санъатро аз тавсифи асосии забонӣ тавлид кунад.
Гуфта мешавад, ки версияи охирини DALLE 2 бисёрҷонибатар буда, қодир аст аз сарлавҳаҳо бо қарорҳои баландтар ва дар доираи васеи услубҳои эҷодӣ тасвирҳо созад. Масалан, расмҳои зер (аз блоги DALL-E 2) бо тавсифи "Астронавт савори асп" сохта шудаанд.
Яке аз тавсифҳо "мисли эскизи қалам", дар ҳоле ки дигаре "ба таври фотореалистӣ" хулоса мекунад.
Он инчунин метавонад аксҳои мавҷударо бо дақиқии ҳайратангез тағир диҳад. Ҳамин тавр, шумо метавонед ҳангоми нигоҳ доштани рангҳо, инъикосҳо ва сояҳо, ҳангоми нигоҳ доштани намуди аслии тасвир элементҳоро илова кунед ё нест кунед.
Чӣ тавр он кор мекунад?
DALL-E 2 моделҳои CLIP ва диффузиро истифода мебарад, ки ду мукаммал мебошанд омӯзиши чуқур равишҳое, ки дар солҳои охир таҳия шудаанд. Бо вуҷуди ин, он ба ҳамон мафҳум мисли ҳама амиқҳои дигар асос ёфтааст шабакаҳои нейронӣ: омӯзиши намояндагӣ. CLIP ҳамзамон ду нафарро таълим медиҳад шабакаҳои нейралӣ дар тасвирҳо ва сарлавҳаҳо.
Як шабака тасвирҳои визуалиро дар расм меомӯзад, дар ҳоле ки шабакаи дигар муаррифии матнро меомӯзад. Дар давоми омӯзиш, ду шабака кӯшиш мекунанд, ки параметрҳои худро тағир диҳанд, то тасвирҳо ва тавсифҳои муқоисашаванда ба воридкунии шабеҳ оварда расонанд.
"Диффузия", як навъи модели тавлидкунанда, ки бо роҳи тадриҷан садо додан ва беэътино кардани намунаҳои таълимии худ сохтани тасвирҳоро меомӯзад, дигар равиши омӯзиши мошини дар DALL-E 2 истифодашаванда мебошад. Моделҳои диффузия ба автоматикодерҳо монанданд, зеро онҳо маълумоти воридшударо ба як файл табдил медиҳанд. муаррифии дохилкунӣ ва сипас иттилооти дохилкуниро барои аз нав сохтани маълумоти аслӣ истифода баред.
Истифодаи OpenAI модели забон CLIP, ки тавсифи матниро бо аксҳо пайваст карда метавонад, аввал дархости хаттиро ба шакли фосилавӣ тарҷума мекунад, ки дорои хосиятҳои муҳимест, ки тасвир бояд ба ин дархост мувофиқат кунад (тибқи CLIP).
Дуюм, DALL-E 2 мувофиқи CLIP-ро эҷод мекунад тасвир бо истифода аз модели диффузия, ки шабакаи нейрон аст.
Дар аксҳои таҳрифшуда бо пикселҳои тасодуфӣ моделҳои диффузия омӯхта мешаванд. Онҳо тарзи барқарор кардани шакли аслии аксҳоро меомӯзанд. Моделҳои диффузия метавонанд тасвирҳои синтетикии баландсифатро ба вуҷуд оранд, хусусан вақте ки дар якҷоягӣ бо равиши роҳнамо истифода мешаванд, ки дақиқиро аз гуногунрангӣ авлавият медиҳанд.
Дар натича, ба модели диффузия пикселҳои тасодуфиро мегирад ва CLIP-ро барои табдил додани онҳо ба тасвири наве, ки ба дархости калима мувофиқат мекунад, истифода мебарад. Аз сабаби консепсияи диффузия, DALL-E 2 метавонад тасвирҳои баландтарро нисбат ба DALL-E зудтар тавлид кунад.
Ҳолати истифодаи DALL.E 2
Дар бист соли охир, биниши компютерӣ техника аз мафхуми оддй ба пешравии калон пеш рафт. Бо вуҷуди ин пешрафтҳо, моделҳои шинохти тасвирҳо ва объектҳо дар ҳаёти ҳаррӯза ҳанӯз ҳам бо монеаҳои ҷиддӣ рӯ ба рӯ мешаванд. Набудани маҷмӯи додаҳо яке аз нуқсонҳои муҳимтарини шинохти тасвир ва биниши компютер мебошад. Азбаски дар ҳарду тараф норасоии маълумот мавҷуд аст, омӯзиши моделҳои шинохти тасвир барои додани 100% натиҷаҳои дақиқ қариб душвор аст.
Хушбахтона, модели нави омӯзиши мошинсозии OpenAI метавонад холигии технологияро бартараф кунад. DALLE 2 қодир аст, ки дар асоси тавсифи матн тасвирҳои аҷиб эҷод кунад. Ин истеҳсоли тасвирҳои қалбакӣ метавонад ба моделҳои шинохти тасвир дар асоси талаботи онҳо маълумот диҳад. Набудани маълумот як монеаи ҷиддие барои шинохти объект ва тасвир аст.
Дар давраи рақамӣ, маҷмӯаҳои додаҳо дар ҳама ҷо мавҷуданд, аммо мо то ҳол миёнабурҳоро меҷӯем, то модели AI-ро таъмин кунад, то он метавонад натиҷаҳои хуб диҳад. Аммо, омӯзонидани модели шинохти тасвир осон нест. Он миқдори зиёди маҷмӯаҳои маълумотро бо фарқиятҳои каме талаб мекунад, ки мо шояд онҳоро ба осонӣ дарёфт карда натавонистем.
Пас, ҷавоб чист: Ҷавоб DALLE 2 аст. Генератори расмҳои OpenAI бо иқтидори худ барои тавлиди тасвирҳо аз матнҳо ва тағир додани тасвирҳои мавҷуда метавонад барои бартараф кардани фарқият кӯмак кунад. Ин ба тавлиди маълумоти иловагӣ дар бораи омӯзиш кӯмак мекунад ва ҳамзамон миқдори тамғагузории инсонро кам мекунад. Сарфи назар аз фоидаи назаррас, шумо бояд аз истеҳсоли тасвирҳои қалбакӣ ва тасвирҳое, ки дохилкуниро истисно мекунанд, огоҳ бошед. Ин метавонад ба усулҳои муайянкунии тасвир оварда расонад, ки натиҷаҳои ғаразнок медиҳанд.
Маҳдудияти
Мувофиқи OpenAI, DALL.E 2 метавонад таъсири зараровар расонад, агар он ба дасти нодуруст афтад. Дар ҷаҳони имрӯзаи қалбакӣ, моделро метавон ба осонӣ барои паҳн кардани маълумоти бардурӯғ ё тасвирҳои нажодпарастона истифода бурд, аз ин рӯ, OpenAI танҳо ба таҳиягарон имкон медиҳад, ки DALL.2-ро бо даъват истифода баранд. Модел бояд барои ҳама пешниҳодҳои гирифтааш ба маҳдудияти ҷиддии мундариҷа мувофиқат кунад.
Барои истисно кардани потенсиали DALL.E 2 эҷоди ҳама гуна тасвирҳои душманона ё зӯроварӣ, маҷмӯаи маълумот бидуни ягон силоҳи марговар сохта шудааст. Дар ҳоле ки OpenAI изҳор кардааст, ки он ният дорад онро ба API дар оянда табдил диҳад, дар мавриди DALL.E 2, он омода аст бо эҳтиёт кор кунад.
хулоса
DALL-E 2 боз як кашфиёти ҷолиби тадқиқотии OpenAI мебошад, ки дари барномаҳои навро мекушояд.
Як мисол эҷоди маҷмӯаҳои азими додаҳо барои қонеъ кардани яке аз монеаҳои асосии биниши компютер – додаҳо мебошад. Гарчанде ки парвандаи иқтисодии бисёре аз барномаҳои дар асоси DALL-E асосёфта аз рӯи нарх ва сиёсатҳое, ки OpenAI барои корбарони API муқаррар мекунад, муайян карда мешавад, онҳо бешубҳа истеҳсоли тасвирҳоро пеш мебаранд.
Дин ва мазҳаб