İçindekiler[Saklamak][Göstermek]
Büyük metinden görüntüye modeller, belirli bir metin isteminden yüksek kaliteli ve çeşitlendirilmiş resim sentezi üreterek yapay zekanın geliştirilmesinde önemli bir ilerleme kaydetti.
Bu modeller, çeşitli ortamlarda öznelerin benzersiz temsillerini sentezleyemez veya belirli bir referans kümesinde öznelerin görünümünü çoğaltamaz.
OpenAI'nin DALL.E2 veya StabilityAI's gibi yeni çıkan teknolojiler Kararlı Difüzyon ve Midjourney şimdiden interneti kasıp kavuruyor. Şimdi sonuçları özelleştirme zamanı. Yine de nasıl?
Google DreamBooth AI geldi.
DreamBooth, bir resmin konusunu tanıma, orijinal bağlamından yapısını bozma ve ardından onu istenen yeni bir bağlamda tam olarak sentezleme yeteneğine sahiptir. Ek olarak, mevcut AI resim oluşturucuları ile kullanılabilir.
Bu yazıda DreamBooth'a, kullanımına, öğreticisine, sınırlamalarına ve çok daha fazlasına derinlemesine bakacağız.
Dreambooth nedir?
rüya kabini, yepyeni bir metinden görüntüye yayılma modeli Google tarafından sunuldu. Kullanıcının seçtiği konunun farklı ayarlarda çok çeşitli fotoğraflarını oluşturmak için Google DreamBooth AI tarafından kılavuz olarak yazılı bir istem kullanılabilir.
Boston Üniversitesi ve Google'dan bir araştırma grubu, kapsamlı bir ön eğitimden geçen metinden görüntüye modelleri değiştirmek için son teknoloji bir teknik olan DreamBooth'u geliştirdi.
Genel konsept oldukça basittir: dil-görü sözlüğünü, yaygın olmayan belirteç kimliklerinin, kullanıcıların tanımlayabileceği özel konularla ilişkilendirileceği şekilde genişletmek istiyorlar.
Modelin temel amacı kullanıcıları birbirine bağlamaktır. metinden görüntüye yayılma modeli onlara seçtikleri konunun örneklerinin fotogerçekçi temsillerini üretmeleri için ihtiyaç duydukları kaynakları vererek.
Sonuç olarak, bu teknik bir dizi durumdaki zorlukları özetlemek için iyi çalışıyor gibi görünüyor.
Google'ın DreamBooth'u, aşağıdakiler gibi önceki metinden görüntüye araçlarından farklıdır: DALL-E2, Kararlı Difüzyon, ve yolculuk, böylece kullanıcılara metin tabanlı girdiler kullanarak difüzyon modelini manipüle etmelerine izin vermeden önce konu görüntüsü üzerinde daha fazla kontrol sağlar.
Özellikler
- DreamBooth AI, 3-5 görüntü içeren bir metinden görüntüye modelini geliştirebilir.
- DreamBooth AI ile orijinal fotogerçekçi fotoğraflar oluşturulabilir.
- Ayrıca DreamBooth AI, bir konunun fotoğraflarını birden çok açıdan oluşturabilir.
Uygulama
Sanat Yorumları
Bu görev, özellikle orijinal sahneye başka bir görüntünün stilini dahil ederken kaynak sahnenin anlamını koruyan stil aktarımından farklıdır.
Yaratıcı yaklaşıma dayalı olarak, AI, tanımlama ve konu örneği özelliklerini korurken önemli sahne değişiklikleri gerçekleştirebilir.
Mülk Değişikliği
Konu örneğinin özellikleri DreamBooth AI tarafından değiştirilebilir.
aksesuarlandırma
Nesil modelden önceki güçlü kompozisyon, DreamBooth AI'nin nesneleri süsleme yeteneğini bu kadar ilginç kılan şeydir.
yeniden bağlamsallaştırma
DreamBooth AI, eğitimli bir modele benzersiz tanımlayıcıyı ve sınıf adını içeren bir cümle vererek belirli bir konu örneği için ayırt edici görüntüler üretebilir.
Konuyu, çevreyi değiştirmek yerine benzersiz, daha önce duyulmamış duruşlar, eklemler ve sahne yapısında üretebilir. Gerçekçi yansımalar ve gölgeler ile özne ve çevresindeki nesneler arasındaki etkileşimler.
Dreambooth öğreticisi
Bu eğitimde, takip edeceğiz Google Collab not defteri, ve ben size yol göstereceğim, bu da onu kendi başınıza anlamanızı ve kullanmanızı sağlayacaktır.
GPU'yu ayarlama ve kitaplıkları yükleme
Hangi GPU ve VRAM türlerinin mevcut olduğunu bulmak ilk adımdır. Birkaç gereksinim ve bağımlılık yüklemek de gereklidir. Oynat düğmesine basmanız ve ardından bitmesini beklemeniz yeterlidir.
Huggingface'de bir hesap oluşturun ve bir jeton oluşturun
Bir sonraki adım, bir Huggingface hesabına kaydolmaktır. Bitirdiğinizde, sağ üst köşedeki ayarlar'a tıklayın. Bir sonraki sayfaya geleceksiniz.
Belirteci ve adı buradan istendiği gibi oluşturun. Belirteç kopyalanmalı ve aşağıdaki hücredeki Google ortak çalışmasına yapıştırılmalıdır.
xformers'ı yükleyin
Bu aşamada, çalışma zamanına tıklayarak xformers'ı yüklemek için oynat düğmesine basabilirsiniz.
Drive'a Bağlan
Şimdi, google drive'a bağlanmak için bu hücreyi çalıştırmanız yeterli.
İstemi girin
Aşağıdaki hücrede, istemi girmeniz yeterlidir.
Resimlerin yüklenmesi
Bu adımda, eğitmek istediğiniz resimleri yüklemeniz yeterlidir.
AI modelini eğit
Gönderdiğiniz tüm referans fotoğraflarını temel alan yeni bir AI modeli eğitmek için DreamBooth'u kullanacağınız için bu en önemli aşamadır. Dikkatinizi iki giriş alanıyla sınırlandırmalısınız. “—örnek istemi” ilk parametredir. Burada oldukça belirgin bir ad sağlamalısınız.
'–kavram listesi' argümanı ikinci kritik girdi alanıdır. 'İstemi değiştir' bölümünde kullanılanla eşleşecek şekilde yeniden adlandırılmalıdır.
AI görüntüleri oluşturun
AI resimleri, metin talimatlarını girebileceğiniz bu aşamada oluşturulacaktır.
Dreambooth Sınırlamaları
- Komut istemi, konuyla ilgili yüksek derecede ayrıntılı yinelemeler yapmak için bir engel haline gelir. DreamBooth öznenin bağlamını değiştirebilir, ancak model öznenin kendisini değiştirmek isterse çerçeveyle ilgili sorunlar vardır.
- Başka bir sorun, çıkış resmini giriş görüntüsüne sığdırmaktır. Sağlanan yeterli resim yoksa, konu dikkate alınmayabilir veya gönderilen resimlerin bağlamıyla karıştırılabilir. Garip bir nesil için bir bağlam sorulduğunda, aynı şey gerçekleşir.
Sonuç
Tek bir metin girişinden çıktılar üretmek için, metinden görüntüye modellerin çoğu, milyonlarca parametre ve kitaplık gerektirir.
DreamBooth, metinsel bir arka planla birlikte yalnızca üç ila beş konu fotoğrafının girilmesini gerektirerek tüketiciler için içerik edinimini ve kullanımını basitleştirir.
Yorum bırak