સામગ્રીનું કોષ્ટક[છુપાવો][બતાવો]
મોટા ટેક્સ્ટ-ટુ-ઇમેજ મોડેલોએ આપેલ ટેક્સ્ટ પ્રોમ્પ્ટમાંથી ઉચ્ચ-ગુણવત્તાવાળા અને વૈવિધ્યસભર ચિત્ર સંશ્લેષણનું ઉત્પાદન કરીને AI ના વિકાસમાં નોંધપાત્ર પ્રગતિ કરી છે.
આ મોડેલો વિવિધ સેટિંગ્સમાં વિષયોની અનન્ય રજૂઆતોને સંશ્લેષણ કરવામાં અથવા આપેલ સંદર્ભ સમૂહમાં વિષયોના દેખાવની નકલ કરવામાં અસમર્થ છે.
OpenAI ની DALL.E2 અથવા સ્ટેબિલિટીએઆઈ જેવી નવી રીલીઝ થયેલ ટેકનોલોજી સ્થિર પ્રસરણ અને મિડજર્ની પહેલેથી જ તોફાન દ્વારા ઇન્ટરનેટ લઈ રહી છે. હવે પરિણામોને કસ્ટમાઇઝ કરવાનો સમય છે. છતાં કેવી રીતે?
Google DreamBooth AI આવી ગયું છે.
ડ્રીમબૂથમાં ચિત્રના વિષયને ઓળખવાની, તેને તેના મૂળ સંદર્ભમાંથી ડિકન્સ્ટ્રક્ટ કરવાની અને પછી તેને નવા ઇચ્છિત સંદર્ભમાં ચોક્કસ રીતે સંશ્લેષણ કરવાની ક્ષમતા છે. વધુમાં, તેનો ઉપયોગ વર્તમાન AI પિક્ચર જનરેટર સાથે કરી શકાય છે.
આ લેખમાં, અમે ડ્રીમબૂથ, તેનો ઉપયોગ, તેના ટ્યુટોરીયલ, તેની મર્યાદાઓ અને ઘણું બધું પર ઊંડાણપૂર્વક વિચાર કરીશું.
ડ્રીમબૂથ શું છે?
ડ્રીમબૂથ, એક તદ્દન નવું ટેક્સ્ટ-ટુ-ઇમેજ ડિફ્યુઝન મોડલ, Google દ્વારા પ્રસ્તુત કરવામાં આવ્યું હતું. વિવિધ સેટિંગ્સમાં વપરાશકર્તાના પસંદ કરેલા વિષયના ફોટાઓની વિશાળ શ્રેણી જનરેટ કરવા માટે Google DreamBooth AI દ્વારા માર્ગદર્શન તરીકે લેખિત પ્રોમ્પ્ટનો ઉપયોગ કરી શકાય છે.
બોસ્ટન યુનિવર્સિટી અને ગૂગલના એક સંશોધન જૂથે ડ્રીમબૂથ વિકસાવી છે, જે ટેક્સ્ટ-ટુ-ઇમેજ મોડલ્સને બદલવા માટે એક અદ્યતન તકનીક છે જે વ્યાપક પૂર્વ-તાલીમમાંથી પસાર થઈ છે.
એકંદર ખ્યાલ એકદમ સીધો છે: તેઓ ભાષા-દ્રષ્ટિ શબ્દકોશને વધારવા માંગે છે જેમ કે અસામાન્ય ટોકન ID કસ્ટમ વિષયો સાથે સંકળાયેલા હોય જેને વપરાશકર્તાઓ વ્યાખ્યાયિત કરી શકે.
મોડેલનો મુખ્ય ધ્યેય વપરાશકર્તાઓને સાથે જોડવાનો છે ટેક્સ્ટ-ટુ-ઇમેજ પ્રસાર મોડલ તેમને તેમના પસંદ કરેલા વિષયના ઉદાહરણોની ફોટોરિયલિસ્ટિક રજૂઆતો બનાવવા માટે જરૂરી સંસાધનો આપીને.
પરિણામે, આ ટેકનિક વિવિધ પરિસ્થિતિઓમાં પડકારોનો સારાંશ આપવા માટે સારી રીતે કામ કરતી જણાય છે.
ગૂગલનું ડ્રીમબૂથ અગાઉના ટેક્સ્ટ-ટુ-ઇમેજ ટૂલ્સથી અલગ છે, જેમ કે DALL-E2, સ્થિર પ્રસરણ, અને મિડજર્ની, જેમાં તે વપરાશકર્તાઓને ટેક્સ્ટ-આધારિત ઇનપુટ્સનો ઉપયોગ કરીને પ્રસાર મોડલને ચાલાકી કરવા દેતા પહેલા વિષયની છબી પર વધુ નિયંત્રણ આપે છે.
વિશેષતા
- DreamBooth AI 3-5 ઇમેજ સાથે ટેક્સ્ટ-ટુ-ઇમેજ મોડલને સુધારી શકે છે.
- ડ્રીમબૂથ AI વડે મૂળ ફોટોરિયલિસ્ટિક ફોટા બનાવી શકાય છે.
- આ ઉપરાંત, ડ્રીમબૂથ AI બહુવિધ ખૂણાઓથી વિષયના ફોટા બનાવી શકે છે.
એપ્લિકેશન
કલા પ્રસ્તુતિઓ
આ કાર્ય ખાસ કરીને શૈલીના સ્થાનાંતરણથી અલગ છે, જે મૂળ દ્રશ્યમાં અન્ય છબીની શૈલીને સમાવિષ્ટ કરતી વખતે સ્રોત દ્રશ્યના અર્થશાસ્ત્રને જાળવી રાખે છે.
સર્જનાત્મક અભિગમના આધારે, AI ઓળખ અને વિષયના દાખલાની વિશિષ્ટતાઓને જાળવી રાખીને નોંધપાત્ર દ્રશ્ય ફેરફારોને પરિપૂર્ણ કરી શકે છે.
મિલકત ફેરફાર
વિષય દાખલાની લાક્ષણિકતાઓ DreamBooth AI દ્વારા સુધારી શકાય છે.
એક્સેસરાઇઝેશન
જનરેશન મૉડલ પહેલાંની મજબૂત રચના એ ડ્રીમબૂથ AIની ઑબ્જેક્ટને શણગારવાની ક્ષમતાને એટલી રસપ્રદ બનાવે છે.
પુનઃસંદર્ભીકરણ
ડ્રીમબૂથ AI પ્રશિક્ષિત મોડેલને એક વાક્ય આપીને ચોક્કસ વિષયના દાખલા માટે વિશિષ્ટ છબીઓ બનાવી શકે છે જેમાં અનન્ય ઓળખકર્તા અને વર્ગ સંજ્ઞાનો સમાવેશ થાય છે.
તે આજુબાજુના વાતાવરણને બદલવાને બદલે અનન્ય, અગાઉ સાંભળ્યા ન હોય તેવા મુદ્રાઓ, અભિવ્યક્તિઓ અને દ્રશ્ય રચનામાં વિષય પેદા કરી શકે છે. વાસ્તવિક પ્રતિબિંબ અને પડછાયાઓ, તેમજ વિષય અને આસપાસના પદાર્થો વચ્ચેની ક્રિયાપ્રતિક્રિયાઓ.
ડ્રીમબૂથ ટ્યુટોરીયલ
આ ટ્યુટોરીયલમાં, આપણે અનુસરીશું Google Collab નોટબુક, અને હું તમને તેમાંથી પસાર કરીશ, જે તમને સમજશે અને તમારા પોતાના પર તેનો ઉપયોગ કરશે.
GPU સેટ કરી રહ્યું છે અને લાઇબ્રેરીઓ ઇન્સ્ટોલ કરી રહી છે
GPU અને VRAM કયા પ્રકારના ઉપલબ્ધ છે તે શોધવું એ પ્રથમ પગલું છે. કેટલીક આવશ્યકતાઓ અને નિર્ભરતા સ્થાપિત કરવી પણ જરૂરી છે. ફક્ત પ્લે બટન દબાવો, પછી તે સમાપ્ત થાય ત્યાં સુધી રાહ જુઓ.
Huggingface પર એકાઉન્ટ બનાવો અને ટોકન જનરેટ કરો
આગળનું પગલું એ Huggingface એકાઉન્ટ માટે નોંધણી કરવાનું છે. જ્યારે તમે પૂર્ણ કરી લો, ત્યારે ઉપરના જમણા ખૂણે સેટિંગ્સ પર ક્લિક કરો. તમે આગલા પૃષ્ઠ પર પહોંચશો.
અહીંથી વિનંતી કર્યા મુજબ ટોકન અને નામ બનાવો. ટોકન નીચે કોષમાં Google કોલેબમાં કૉપિ કરીને પેસ્ટ કરવું જોઈએ.
xformers ઇન્સ્ટોલ કરો
આ તબક્કામાં, તમે રનટાઇમ પર ક્લિક કરીને xformers ઇન્સ્ટોલ કરવા માટે પ્લે બટન દબાવી શકો છો.
ડ્રાઇવથી કનેક્ટ કરો
હવે, તમારે ગૂગલ ડ્રાઇવથી કનેક્ટ થવા માટે આ સેલને ચલાવવાનું રહેશે.
પ્રોમ્પ્ટ દાખલ કરો
નીચેના કોષમાં, તમારે ફક્ત પ્રોમ્પ્ટ દાખલ કરવો પડશે.
ચિત્રો અપલોડ કરી રહ્યા છીએ
આ પગલામાં, તમારે ફક્ત તે ચિત્રો અપલોડ કરવા પડશે જે તમે તાલીમ આપવા માંગતા હતા.
ટ્રેન AI મોડેલ
આ સૌથી મહત્વપૂર્ણ તબક્કો છે, કારણ કે તમે તમારા સબમિટ કરેલા તમામ સંદર્ભ ફોટોગ્રાફ્સના આધારે નવા AI મોડેલને તાલીમ આપવા માટે ડ્રીમબૂથનો ઉપયોગ કરશો. તમારે તમારું ધ્યાન બે ઇનપુટ ફીલ્ડ પર મર્યાદિત કરવું જોઈએ. "—ઇન્સ્ટન્સ પ્રોમ્પ્ટ" એ પ્રથમ પરિમાણ છે. તમારે અહીં એક ખૂબ જ અલગ નામ પ્રદાન કરવું આવશ્યક છે.
'-સંકલ્પના સૂચિ' દલીલ એ બીજું મહત્વપૂર્ણ ઇનપુટ ક્ષેત્ર છે. 'ચેન્જ ધ પ્રોમ્પ્ટ' વિભાગમાં વપરાયેલ નામ સાથે મેળ કરવા માટે તેનું નામ બદલવું આવશ્યક છે.
AI છબીઓ બનાવો
AI ચિત્રો આ તબક્કે બનાવવામાં આવશે, જ્યાં તમે ટેક્સ્ટ સૂચનાઓ ઇનપુટ કરી શકો છો.
ડ્રીમબૂથ મર્યાદાઓ
- કમાન્ડ પ્રોમ્પ્ટ ઉચ્ચ ડિગ્રીની વિગતો સાથે વિષયમાં પુનરાવર્તનો કરવા માટે અવરોધ બની જાય છે. DreamBooth વિષયના સંદર્ભને બદલી શકે છે, પરંતુ જો મોડેલ પોતે જ વિષય બદલવા માંગે છે, તો ફ્રેમ સાથે સમસ્યાઓ છે.
- બીજી સમસ્યા આઉટપુટ ચિત્રને ઇનપુટ ઇમેજમાં ઓવરફિટ કરવાનો છે. જો પૂરતા ચિત્રો પૂરા પાડવામાં આવ્યાં નથી, તો વિષયને ધ્યાનમાં લેવામાં આવશે નહીં અથવા સબમિટ કરેલી છબીઓના સંદર્ભ સાથે મિશ્રિત થઈ શકે છે. જ્યારે વિચિત્ર પેઢી માટે સંદર્ભ પૂછવામાં આવે છે, ત્યારે તે જ વસ્તુ થાય છે.
ઉપસંહાર
એક ટેક્સ્ટ ઇનપુટમાંથી આઉટપુટ ઉત્પન્ન કરવા માટે, ટેક્સ્ટ-ટુ-ઇમેજ મોડલ્સના મોટા ભાગને લાખો પરિમાણો અને લાઇબ્રેરીઓની જરૂર પડે છે.
ડ્રીમબૂથ ટેક્સ્ટની પૃષ્ઠભૂમિ સાથે માત્ર ત્રણથી પાંચ વિષયના ફોટોગ્રાફ્સના ઇનપુટની આવશ્યકતા દ્વારા ગ્રાહકો માટે સામગ્રી સંપાદન અને વપરાશને સરળ બનાવે છે.
એક જવાબ છોડો