Yeni Başlayanlar için Dreambooth Eğitimi

İçindekiler[Saklamak][Göstermek]

Dreambooth nedir?
Özellikler
Uygulama+-
Dreambooth öğreticisi+-
Dreambooth Sınırlamaları
Sonuç

Büyük metinden görüntüye modeller, belirli bir metin isteminden yüksek kaliteli ve çeşitlendirilmiş resim sentezi üreterek yapay zekanın geliştirilmesinde önemli bir ilerleme kaydetti.

Bu modeller, çeşitli ortamlarda öznelerin benzersiz temsillerini sentezleyemez veya belirli bir referans kümesinde öznelerin görünümünü çoğaltamaz.

OpenAI'nin DALL.E2 veya StabilityAI's gibi yeni çıkan teknolojiler Kararlı Difüzyon ve Midjourney şimdiden interneti kasıp kavuruyor. Şimdi sonuçları özelleştirme zamanı. Yine de nasıl?

Google DreamBooth AI geldi.

DreamBooth, bir resmin konusunu tanıma, orijinal bağlamından yapısını bozma ve ardından onu istenen yeni bir bağlamda tam olarak sentezleme yeteneğine sahiptir. Ek olarak, mevcut AI resim oluşturucuları ile kullanılabilir.

Bu yazıda DreamBooth'a, kullanımına, öğreticisine, sınırlamalarına ve çok daha fazlasına derinlemesine bakacağız.

Dreambooth nedir?

rüya kabini, yepyeni bir metinden görüntüye yayılma modeli Google tarafından sunuldu. Kullanıcının seçtiği konunun farklı ayarlarda çok çeşitli fotoğraflarını oluşturmak için Google DreamBooth AI tarafından kılavuz olarak yazılı bir istem kullanılabilir.

Boston Üniversitesi ve Google'dan bir araştırma grubu, kapsamlı bir ön eğitimden geçen metinden görüntüye modelleri değiştirmek için son teknoloji bir teknik olan DreamBooth'u geliştirdi.

Genel konsept oldukça basittir: dil-görü sözlüğünü, yaygın olmayan belirteç kimliklerinin, kullanıcıların tanımlayabileceği özel konularla ilişkilendirileceği şekilde genişletmek istiyorlar.

Modelin temel amacı kullanıcıları birbirine bağlamaktır. metinden görüntüye yayılma modeli onlara seçtikleri konunun örneklerinin fotogerçekçi temsillerini üretmeleri için ihtiyaç duydukları kaynakları vererek.

Sonuç olarak, bu teknik bir dizi durumdaki zorlukları özetlemek için iyi çalışıyor gibi görünüyor.

Google'ın DreamBooth'u, aşağıdakiler gibi önceki metinden görüntüye araçlarından farklıdır: DALL-E2, Kararlı Difüzyon, ve yolculuk, böylece kullanıcılara metin tabanlı girdiler kullanarak difüzyon modelini manipüle etmelerine izin vermeden önce konu görüntüsü üzerinde daha fazla kontrol sağlar.

Özellikler

DreamBooth AI, 3-5 görüntü içeren bir metinden görüntüye modelini geliştirebilir.
DreamBooth AI ile orijinal fotogerçekçi fotoğraflar oluşturulabilir.
Ayrıca DreamBooth AI, bir konunun fotoğraflarını birden çok açıdan oluşturabilir.

Uygulama

Sanat Yorumları

Bu görev, özellikle orijinal sahneye başka bir görüntünün stilini dahil ederken kaynak sahnenin anlamını koruyan stil aktarımından farklıdır.

Sanat Yorumu

Yaratıcı yaklaşıma dayalı olarak, AI, tanımlama ve konu örneği özelliklerini korurken önemli sahne değişiklikleri gerçekleştirebilir.

Mülk Değişikliği

Konu örneğinin özellikleri DreamBooth AI tarafından değiştirilebilir.

Mülk Değişikliği

aksesuarlandırma

Nesil modelden önceki güçlü kompozisyon, DreamBooth AI'nin nesneleri süsleme yeteneğini bu kadar ilginç kılan şeydir.

aksesuarlandırma

yeniden bağlamsallaştırma

DreamBooth AI, eğitimli bir modele benzersiz tanımlayıcıyı ve sınıf adını içeren bir cümle vererek belirli bir konu örneği için ayırt edici görüntüler üretebilir.

yeniden bağlamsallaştırma

Konuyu, çevreyi değiştirmek yerine benzersiz, daha önce duyulmamış duruşlar, eklemler ve sahne yapısında üretebilir. Gerçekçi yansımalar ve gölgeler ile özne ve çevresindeki nesneler arasındaki etkileşimler.

Dreambooth öğreticisi

Bu eğitimde, takip edeceğiz Google Collab not defteri, ve ben size yol göstereceğim, bu da onu kendi başınıza anlamanızı ve kullanmanızı sağlayacaktır.

GPU'yu ayarlama ve kitaplıkları yükleme

Hangi GPU ve VRAM türlerinin mevcut olduğunu bulmak ilk adımdır. Birkaç gereksinim ve bağımlılık yüklemek de gereklidir. Oynat düğmesine basmanız ve ardından bitmesini beklemeniz yeterlidir.

GPU Kurulumu ve Kitaplıkların Kurulumu

Huggingface'de bir hesap oluşturun ve bir jeton oluşturun

Bir sonraki adım, bir Huggingface hesabına kaydolmaktır. Bitirdiğinizde, sağ üst köşedeki ayarlar'a tıklayın. Bir sonraki sayfaya geleceksiniz.

Sarılma Yüz Jetonu

Belirteci ve adı buradan istendiği gibi oluşturun. Belirteç kopyalanmalı ve aşağıdaki hücredeki Google ortak çalışmasına yapıştırılmalıdır.

Google Colab'da Jeton

xformers'ı yükleyin

Bu aşamada, çalışma zamanına tıklayarak xformers'ı yüklemek için oynat düğmesine basabilirsiniz.

Xformers'ı yükleyin

Drive'a Bağlan

Şimdi, google drive'a bağlanmak için bu hücreyi çalıştırmanız yeterli.

Drive'a Bağlan

İstemi girin

Aşağıdaki hücrede, istemi girmeniz yeterlidir.

İstemi Girin

Resimlerin yüklenmesi

Bu adımda, eğitmek istediğiniz resimleri yüklemeniz yeterlidir.

Resimlerinizi Bu Hücreye Yükleyebilirsiniz

AI modelini eğit

Gönderdiğiniz tüm referans fotoğraflarını temel alan yeni bir AI modeli eğitmek için DreamBooth'u kullanacağınız için bu en önemli aşamadır. Dikkatinizi iki giriş alanıyla sınırlandırmalısınız. “—örnek istemi” ilk parametredir. Burada oldukça belirgin bir ad sağlamalısınız.

'–kavram listesi' argümanı ikinci kritik girdi alanıdır. 'İstemi değiştir' bölümünde kullanılanla eşleşecek şekilde yeniden adlandırılmalıdır.

Eğitim AI Modeli

AI görüntüleri oluşturun

AI resimleri, metin talimatlarını girebileceğiniz bu aşamada oluşturulacaktır.

Yapay Zeka Görüntüleri Oluşturun

Dreambooth Sınırlamaları

Komut istemi, konuyla ilgili yüksek derecede ayrıntılı yinelemeler yapmak için bir engel haline gelir. DreamBooth öznenin bağlamını değiştirebilir, ancak model öznenin kendisini değiştirmek isterse çerçeveyle ilgili sorunlar vardır.
Başka bir sorun, çıkış resmini giriş görüntüsüne sığdırmaktır. Sağlanan yeterli resim yoksa, konu dikkate alınmayabilir veya gönderilen resimlerin bağlamıyla karıştırılabilir. Garip bir nesil için bir bağlam sorulduğunda, aynı şey gerçekleşir.

Sonuç

Tek bir metin girişinden çıktılar üretmek için, metinden görüntüye modellerin çoğu, milyonlarca parametre ve kitaplık gerektirir.

DreamBooth, metinsel bir arka planla birlikte yalnızca üç ila beş konu fotoğrafının girilmesini gerektirerek tüketiciler için içerik edinimini ve kullanımını basitleştirir.

Yeni Başlayanlar için Dreambooth Eğitimi

Dreambooth nedir?

Özellikler