Geçen yılın başlarında OpenAI, her şeyi her tarzda çizebilen DALL-E (WALL-E ve Dali'nin bir kombinasyonu) adlı yeni bir AI modelini sergilemişti. Ancak elde edilen sonuçlar pek de duvara asacağınız türden eserler olmuyordu. DALL-E 2’nin ise önceki modeline nazaran yaptığı çizimleri "korkutucu derecede" daha iyi yaptığı söyleniyor. Ancak bu yeni özellikler, kötüye kullanımı önlemek için yeni kısıtlamalarla birlikte geliyor.
DALL-E 2 temelde ilk versiyonuyla aynı şeyi yapıyor, metin girdisini -şaşırtıcı doğrulukla- bir görüntüye dönüştürüyor. Ancak ilk versiyonuna göre birkaç yeni numara daha öğrendi.
İlginizi Çekebilir: Better Origin Sürdürülebilirlik için 14,6 Milyar Euro Yatırım Aldı!
DALL-E 2 Yenilikleri
İlk olarak, OpenAI’nin iddiası DALL-E 2’nin 1’e göre her şeyi daha iyi yaptığı yönünde. Öncelikle DALL-E 2’nin ürettiği görüntüler birkaç kat daha büyük ve daha detaylı. Daha fazla görüntü üretmesine rağmen daha hızlı olması da sağlanmış, yani bir kullanıcının beklediği birkaç saniye içinde daha fazla varyasyon üretilebilir.
İkincisi, DALL-E 2, bir görüntüdeki belirli bir alanın akıllıca değiştirilmesini, "iç boyama" olarak adlandırıyorlar. Diyelim ki evinizin bir resmi var ama masada kirli bulaşıklar var. Sadece o alanı seçin ve bunun yerine ne istediğinizi tanımlayın: "boş bir tahta masa" veya "üzerinde tabak olmayan bir masa", ne isterseniz. Saniyeler içinde, model size bu isteğinize dair farklı görseller sunacak, istediğinizi seçebilirsiniz.
Aslında Photoshop'ta da benzer bir şey var: "içeriğe uygun dolgu". Ancak bu araç, daha çok, bir kuşu kaldırarak açık bir gökyüzü görmek istiyorsanız ve klon damgalama ile uğraşmak istemiyorsanız, yanındaki pikselleri kullanarak işlem yapan bir araç. DALL-E 2'nin yetenekleri ise çok daha fazla, ortaya yeni şeyler koyabilir, örneğin farklı bir kuş veya bir bulut veya masa örneğinde, bir vazo çiçek veya daha başka bir şey. Bunun faydalı olacağı pek çok durumu hayal etmek zor değil.
DALL-E 2 buna ek olarak, görselin geri kalanından haberdar olduğu için uygun aydınlatma ve gölgeler gibi şeyleri içeriyor ve doğru malzemeleri seçiyor. Burada dikkat çekilmesi istenen bir nokta bulunuyor. DALL-E yaratıcıları bile doğru malzemelerin seçilmesi konusunda bu kadar başarılı sonuçlar vermesine anlam veremiyor. Ancak burada önemli olan elde edilen sonuçların DALL-E’nin bir tür farkındalığa sahip olduğunu gösterdiği.
Üçüncü yeni yetenek, doğruluğunun yeterince iyi olduğu söylenen “varyasyonlar”. Bunun için sisteme örnek bir görüntü veriyorsunuz. Sistem, bu görsele yakın olan pek çok görsel oluşturuyor ve bu görselden edindiği izlenimlere göre yeni görseller de oluşturuyor. Hatta uygulamaya ikinci bir görüntü verirseniz, her birinin en göze çarpan yönlerini birleştirerek yeni bir görsel oluşturuyor. DALL-E 2, gösterilen demoda orijinal resme dayalı sokak duvar resimleri üretiyordu ve incelemede hangisinin orijinal olduğu net olarak görülse dahi, sanatçının stilini çoğunlukla yakaladığını söylemek mümkün.
DALL-E’nin Yol Açabileceği Problemler
Modelin bulabildiğiniz her şeyi inandırıcı bir şekilde çizmesini engelleyecek herhangi bir teknik sınırlama yok. Ancak OpenAI, bunun yol açabileceği sahtekarlıkların sunduğu riskin bilincinde ve bu nedenle DALL-E 2 için bazı kısıtlamalar eklediklerini söylüyorlar.
DALL-E 2 şimdilik, geliştiricilerin kontrollü bir şekilde deneyebilecekleri, yalnızca davetle girilebilen bir test ortamında çalışıyor. Bu test ortamında üreticiler nefret, taciz, şiddet, kendine zarar verme, açık veya "şok edici" görüntüler, yasa dışı faaliyetler, aldatma (ör. sahte haberler), tıbbi veya hastalıkla ilgili görüntülere karşı alınacak önlemleri test ediyorlar. Aslında, bu durumlar zaten DALL-E’nin eğitim setinden çıkarıldığı için bunları üretmek pek de mümkün olmayacak.
OpenAI blog gönderisinde DALL-E 2 hakkında daha fazla bilgi edinebilir ve bazı örnekleri test edebilirsiniz.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...