નવા નિશાળીયા માટે ડ્રીમબૂથ ટ્યુટોરીયલ

સામગ્રીનું કોષ્ટક[છુપાવો][બતાવો]

ડ્રીમબૂથ શું છે?
વિશેષતા
એપ્લિકેશન+-
ડ્રીમબૂથ ટ્યુટોરીયલ+-
ડ્રીમબૂથ મર્યાદાઓ
ઉપસંહાર

મોટા ટેક્સ્ટ-ટુ-ઇમેજ મોડેલોએ આપેલ ટેક્સ્ટ પ્રોમ્પ્ટમાંથી ઉચ્ચ-ગુણવત્તાવાળા અને વૈવિધ્યસભર ચિત્ર સંશ્લેષણનું ઉત્પાદન કરીને AI ના વિકાસમાં નોંધપાત્ર પ્રગતિ કરી છે.

આ મોડેલો વિવિધ સેટિંગ્સમાં વિષયોની અનન્ય રજૂઆતોને સંશ્લેષણ કરવામાં અથવા આપેલ સંદર્ભ સમૂહમાં વિષયોના દેખાવની નકલ કરવામાં અસમર્થ છે.

OpenAI ની DALL.E2 અથવા સ્ટેબિલિટીએઆઈ જેવી નવી રીલીઝ થયેલ ટેકનોલોજી સ્થિર પ્રસરણ અને મિડજર્ની પહેલેથી જ તોફાન દ્વારા ઇન્ટરનેટ લઈ રહી છે. હવે પરિણામોને કસ્ટમાઇઝ કરવાનો સમય છે. છતાં કેવી રીતે?

Google DreamBooth AI આવી ગયું છે.

ડ્રીમબૂથમાં ચિત્રના વિષયને ઓળખવાની, તેને તેના મૂળ સંદર્ભમાંથી ડિકન્સ્ટ્રક્ટ કરવાની અને પછી તેને નવા ઇચ્છિત સંદર્ભમાં ચોક્કસ રીતે સંશ્લેષણ કરવાની ક્ષમતા છે. વધુમાં, તેનો ઉપયોગ વર્તમાન AI પિક્ચર જનરેટર સાથે કરી શકાય છે.

આ લેખમાં, અમે ડ્રીમબૂથ, તેનો ઉપયોગ, તેના ટ્યુટોરીયલ, તેની મર્યાદાઓ અને ઘણું બધું પર ઊંડાણપૂર્વક વિચાર કરીશું.

ડ્રીમબૂથ શું છે?

ડ્રીમબૂથ, એક તદ્દન નવું ટેક્સ્ટ-ટુ-ઇમેજ ડિફ્યુઝન મોડલ, Google દ્વારા પ્રસ્તુત કરવામાં આવ્યું હતું. વિવિધ સેટિંગ્સમાં વપરાશકર્તાના પસંદ કરેલા વિષયના ફોટાઓની વિશાળ શ્રેણી જનરેટ કરવા માટે Google DreamBooth AI દ્વારા માર્ગદર્શન તરીકે લેખિત પ્રોમ્પ્ટનો ઉપયોગ કરી શકાય છે.

બોસ્ટન યુનિવર્સિટી અને ગૂગલના એક સંશોધન જૂથે ડ્રીમબૂથ વિકસાવી છે, જે ટેક્સ્ટ-ટુ-ઇમેજ મોડલ્સને બદલવા માટે એક અદ્યતન તકનીક છે જે વ્યાપક પૂર્વ-તાલીમમાંથી પસાર થઈ છે.

એકંદર ખ્યાલ એકદમ સીધો છે: તેઓ ભાષા-દ્રષ્ટિ શબ્દકોશને વધારવા માંગે છે જેમ કે અસામાન્ય ટોકન ID કસ્ટમ વિષયો સાથે સંકળાયેલા હોય જેને વપરાશકર્તાઓ વ્યાખ્યાયિત કરી શકે.

મોડેલનો મુખ્ય ધ્યેય વપરાશકર્તાઓને સાથે જોડવાનો છે ટેક્સ્ટ-ટુ-ઇમેજ પ્રસાર મોડલ તેમને તેમના પસંદ કરેલા વિષયના ઉદાહરણોની ફોટોરિયલિસ્ટિક રજૂઆતો બનાવવા માટે જરૂરી સંસાધનો આપીને.

પરિણામે, આ ટેકનિક વિવિધ પરિસ્થિતિઓમાં પડકારોનો સારાંશ આપવા માટે સારી રીતે કામ કરતી જણાય છે.

ગૂગલનું ડ્રીમબૂથ અગાઉના ટેક્સ્ટ-ટુ-ઇમેજ ટૂલ્સથી અલગ છે, જેમ કે DALL-E2, સ્થિર પ્રસરણ, અને મિડજર્ની, જેમાં તે વપરાશકર્તાઓને ટેક્સ્ટ-આધારિત ઇનપુટ્સનો ઉપયોગ કરીને પ્રસાર મોડલને ચાલાકી કરવા દેતા પહેલા વિષયની છબી પર વધુ નિયંત્રણ આપે છે.

વિશેષતા

DreamBooth AI 3-5 ઇમેજ સાથે ટેક્સ્ટ-ટુ-ઇમેજ મોડલને સુધારી શકે છે.
ડ્રીમબૂથ AI વડે મૂળ ફોટોરિયલિસ્ટિક ફોટા બનાવી શકાય છે.
આ ઉપરાંત, ડ્રીમબૂથ AI બહુવિધ ખૂણાઓથી વિષયના ફોટા બનાવી શકે છે.

એપ્લિકેશન

કલા પ્રસ્તુતિઓ

આ કાર્ય ખાસ કરીને શૈલીના સ્થાનાંતરણથી અલગ છે, જે મૂળ દ્રશ્યમાં અન્ય છબીની શૈલીને સમાવિષ્ટ કરતી વખતે સ્રોત દ્રશ્યના અર્થશાસ્ત્રને જાળવી રાખે છે.

કલા પ્રસ્તુતિ

સર્જનાત્મક અભિગમના આધારે, AI ઓળખ અને વિષયના દાખલાની વિશિષ્ટતાઓને જાળવી રાખીને નોંધપાત્ર દ્રશ્ય ફેરફારોને પરિપૂર્ણ કરી શકે છે.

મિલકત ફેરફાર

વિષય દાખલાની લાક્ષણિકતાઓ DreamBooth AI દ્વારા સુધારી શકાય છે.

મિલકત ફેરફાર

એક્સેસરાઇઝેશન

જનરેશન મૉડલ પહેલાંની મજબૂત રચના એ ડ્રીમબૂથ AIની ઑબ્જેક્ટને શણગારવાની ક્ષમતાને એટલી રસપ્રદ બનાવે છે.

એક્સેસરાઇઝેશન

પુનઃસંદર્ભીકરણ

ડ્રીમબૂથ AI પ્રશિક્ષિત મોડેલને એક વાક્ય આપીને ચોક્કસ વિષયના દાખલા માટે વિશિષ્ટ છબીઓ બનાવી શકે છે જેમાં અનન્ય ઓળખકર્તા અને વર્ગ સંજ્ઞાનો સમાવેશ થાય છે.

પુનઃસંદર્ભીકરણ

તે આજુબાજુના વાતાવરણને બદલવાને બદલે અનન્ય, અગાઉ સાંભળ્યા ન હોય તેવા મુદ્રાઓ, અભિવ્યક્તિઓ અને દ્રશ્ય રચનામાં વિષય પેદા કરી શકે છે. વાસ્તવિક પ્રતિબિંબ અને પડછાયાઓ, તેમજ વિષય અને આસપાસના પદાર્થો વચ્ચેની ક્રિયાપ્રતિક્રિયાઓ.

ડ્રીમબૂથ ટ્યુટોરીયલ

આ ટ્યુટોરીયલમાં, આપણે અનુસરીશું Google Collab નોટબુક, અને હું તમને તેમાંથી પસાર કરીશ, જે તમને સમજશે અને તમારા પોતાના પર તેનો ઉપયોગ કરશે.

GPU સેટ કરી રહ્યું છે અને લાઇબ્રેરીઓ ઇન્સ્ટોલ કરી રહી છે

GPU અને VRAM કયા પ્રકારના ઉપલબ્ધ છે તે શોધવું એ પ્રથમ પગલું છે. કેટલીક આવશ્યકતાઓ અને નિર્ભરતા સ્થાપિત કરવી પણ જરૂરી છે. ફક્ત પ્લે બટન દબાવો, પછી તે સમાપ્ત થાય ત્યાં સુધી રાહ જુઓ.

GPU સેટ કરી રહ્યું છે અને લાઇબ્રેરીઓ ઇન્સ્ટોલ કરી રહી છે

Huggingface પર એકાઉન્ટ બનાવો અને ટોકન જનરેટ કરો

આગળનું પગલું એ Huggingface એકાઉન્ટ માટે નોંધણી કરવાનું છે. જ્યારે તમે પૂર્ણ કરી લો, ત્યારે ઉપરના જમણા ખૂણે સેટિંગ્સ પર ક્લિક કરો. તમે આગલા પૃષ્ઠ પર પહોંચશો.

હગીંગ ફેસ ટોકન

અહીંથી વિનંતી કર્યા મુજબ ટોકન અને નામ બનાવો. ટોકન નીચે કોષમાં Google કોલેબમાં કૉપિ કરીને પેસ્ટ કરવું જોઈએ.

Google Colab માં ટોકન

xformers ઇન્સ્ટોલ કરો

આ તબક્કામાં, તમે રનટાઇમ પર ક્લિક કરીને xformers ઇન્સ્ટોલ કરવા માટે પ્લે બટન દબાવી શકો છો.

Xformers ઇન્સ્ટોલ કરો

ડ્રાઇવથી કનેક્ટ કરો

હવે, તમારે ગૂગલ ડ્રાઇવથી કનેક્ટ થવા માટે આ સેલને ચલાવવાનું રહેશે.

ડ્રાઇવથી કનેક્ટ કરો

પ્રોમ્પ્ટ દાખલ કરો

નીચેના કોષમાં, તમારે ફક્ત પ્રોમ્પ્ટ દાખલ કરવો પડશે.

પ્રોમ્પ્ટ દાખલ કરો

ચિત્રો અપલોડ કરી રહ્યા છીએ

આ પગલામાં, તમારે ફક્ત તે ચિત્રો અપલોડ કરવા પડશે જે તમે તાલીમ આપવા માંગતા હતા.

તમે આ સેલમાં તમારી છબીઓ અપલોડ કરી શકો છો

ટ્રેન AI મોડેલ

આ સૌથી મહત્વપૂર્ણ તબક્કો છે, કારણ કે તમે તમારા સબમિટ કરેલા તમામ સંદર્ભ ફોટોગ્રાફ્સના આધારે નવા AI મોડેલને તાલીમ આપવા માટે ડ્રીમબૂથનો ઉપયોગ કરશો. તમારે તમારું ધ્યાન બે ઇનપુટ ફીલ્ડ પર મર્યાદિત કરવું જોઈએ. "—ઇન્સ્ટન્સ પ્રોમ્પ્ટ" એ પ્રથમ પરિમાણ છે. તમારે અહીં એક ખૂબ જ અલગ નામ પ્રદાન કરવું આવશ્યક છે.

'-સંકલ્પના સૂચિ' દલીલ એ બીજું મહત્વપૂર્ણ ઇનપુટ ક્ષેત્ર છે. 'ચેન્જ ધ પ્રોમ્પ્ટ' વિભાગમાં વપરાયેલ નામ સાથે મેળ કરવા માટે તેનું નામ બદલવું આવશ્યક છે.

AI મોડલની તાલીમ

AI છબીઓ બનાવો

AI ચિત્રો આ તબક્કે બનાવવામાં આવશે, જ્યાં તમે ટેક્સ્ટ સૂચનાઓ ઇનપુટ કરી શકો છો.

AI છબીઓ બનાવો

ડ્રીમબૂથ મર્યાદાઓ

કમાન્ડ પ્રોમ્પ્ટ ઉચ્ચ ડિગ્રીની વિગતો સાથે વિષયમાં પુનરાવર્તનો કરવા માટે અવરોધ બની જાય છે. DreamBooth વિષયના સંદર્ભને બદલી શકે છે, પરંતુ જો મોડેલ પોતે જ વિષય બદલવા માંગે છે, તો ફ્રેમ સાથે સમસ્યાઓ છે.
બીજી સમસ્યા આઉટપુટ ચિત્રને ઇનપુટ ઇમેજમાં ઓવરફિટ કરવાનો છે. જો પૂરતા ચિત્રો પૂરા પાડવામાં આવ્યાં નથી, તો વિષયને ધ્યાનમાં લેવામાં આવશે નહીં અથવા સબમિટ કરેલી છબીઓના સંદર્ભ સાથે મિશ્રિત થઈ શકે છે. જ્યારે વિચિત્ર પેઢી માટે સંદર્ભ પૂછવામાં આવે છે, ત્યારે તે જ વસ્તુ થાય છે.

ઉપસંહાર

એક ટેક્સ્ટ ઇનપુટમાંથી આઉટપુટ ઉત્પન્ન કરવા માટે, ટેક્સ્ટ-ટુ-ઇમેજ મોડલ્સના મોટા ભાગને લાખો પરિમાણો અને લાઇબ્રેરીઓની જરૂર પડે છે.

ડ્રીમબૂથ ટેક્સ્ટની પૃષ્ઠભૂમિ સાથે માત્ર ત્રણથી પાંચ વિષયના ફોટોગ્રાફ્સના ઇનપુટની આવશ્યકતા દ્વારા ગ્રાહકો માટે સામગ્રી સંપાદન અને વપરાશને સરળ બનાવે છે.

નવા નિશાળીયા માટે ડ્રીમબૂથ ટ્યુટોરીયલ

ડ્રીમબૂથ શું છે?

વિશેષતા