Nvidia'nın GauGAN modelinin sonraki sürümü olan GauGAN2 programı kullanıcıların gerçekte olmayan manzara görselleri oluşturmalarına yardımcı oluyor.
Birçok Teknik Kullanılıyor
Bölümlemeyle haritalandırma, içboyama ve metinden görsel oluşturma gibi teknikleri bu sistem ile birlikte tek bir araçta toplayan
GauGAN2 kelime ve çizim karışımlarıyla birlikte fotorealistik sanatlar oluşturmak için kullanılıyor.
Nvidia şirket iletişim ekibinden Isha Salian, bir blog paylaşımında bu konuya değiniyor. Metinden görsele veya bölümle haritalandırma için kullanılan diğer son teknoloji uygulamalara karşısında;
GauGAN2 sistemindeki nöral ağ, daha çok çeşitlilikte ve görsel kalitesi daha yüksek görüntüler sağlıyor.
Kendisi kullanıcıların zihnindeki bir sahnenin her bir detayını çizmek yerine o görselin anahtar özelliklerini ve temasını oluşturmak için kısa bir cümle girebileceklerini söylüyor.
Örneğin "Kar kaplı bir dağ" gibi bir metin ile bu manzaraya taslak halinde ulaşmak mümkün oluyor.
Sonrasında ise bu başlangıç noktası özelleştirilebiliyor ve örnekten ilerlersek o dağın uzunluğunu değiştirmek, fazladan ağaç eklemek ya da gökyüzüne bulut eklemek gibi farklı seçimler yapılabiliyor.
Metinden Resime
[caption id="attachment_26934" align="alignnone" width="800"]
GauGAN2 metin olarak yazılan ifadeleri görsel olarak sizlere iletebiliyor - Startup Teknoloji[/caption]
Adını empresyonizm sonrası ressamlarından Paul Gaugin'den alan
GauGAN2, Nvidia'nın 2019 yılındaki geliştirdiği ve bir milyondan fazla Flickr görselinden faydalanan GauGAN sistemine bazı eklemeler getiriyor.
GauGAN'da olduğu gibi
GauGAN2 de belirli nesneler arasındaki ilişkiyi hesaba katarak çalışıyor. Kar, ağaçlar, su, çiçekler, çalılıklar, tepeler ve dağlar gibi objeler arasında bağlantı kuran sistem böylece mevsime göre oluşan yağışı değiştirmek gibi hamleler yapabiliyor.
GauGAN ve GauGAN2, generative adversarial network (GAN) olarak bilinen bir sistemden oluşuyor. Bir üretici ve ayrıştırıcıdan oluşan bu sistemde üretici kısım metinle uyuşan örnekleri alıyor ve sağlanan verileri uyuşan diğer görsel verilerle eşleştiriyor. Söz konusu üretici sistem ise tahminlerin gerçekçi görünüp görünmediğini test eden ayrıştırıcı sistem ile birlikte çalışarak ileri seviyeye taşınıyor. Dolayısıyla GAN sistemiyle sağlanan geçişler ilk olarak düşük kalitede olabilse da ayrıştırıcıdan gelen geri bildirimle birlikte gittikçe gelişiyor.
Sonuç olarak GauGAN'ın aksine
GauGAN2 10 milyon görsel üzerinde geliştirilmiş olup doğal dil imgelemelerini manzara resimlerine çevirebiliyor. Yani "Sahilde gün batımı" benzeri bir cümle yazmanız durumunda o sahne önünüze çıkartılıyor. Üstelik "kayalıklı bir sahilde gün batımı" gibi detaylar eklemeniz ya da "gün batımı" ifadesini "öğlen vakti" ya da "yağmurlu bir gün" gibi başka bir ifade ile değiştirmeniz durumunda da bu, anlık olarak resime yansıtılıyor.
GauGAN2 ile birlikte bölümlü haritalandırma gibi işler çıkarmak da mümkün olabiliyor. Böylece oluşturulan manzaradaki nesnelerin yerini gösterebilen üst seviye bir taslak hazırlanabiliyor. Yani gökyüzü, ağaç, kayalık, nehir gibi genel ifadelerle oluşturulacak bir taslağın ardından istenmesi durumunda görsel üzerinde çeşitli değişiklikler, ekleme-çıkarmalar yapmak mümkün olabiliyor.
Yapay Zeka Beyin Fırtınası
GauGAN2 programı
OpenAI tarafından geliştirilen ve benzer şekilde metinden görüntü elde etme işlevi gören
DALL-E sisteminden çok da farklı çalışmıyor.
GauGAN2 de
Dall-E gibi temelde bir görsel kavram oluşturucusu olarak karşımıza çıkıyor. Programların potansiyel kullanım alanları olarak ise filmler, yazılımlar, video oyunları, diğer ürünler ve tasarım gibi alanlar karşımıza çıkıyor.
Nvidia bir önceki
GauGAN programının şimdiye kadar bazı film ve video oyunları için oluşturulan kavramsal sanatlarda kullanıldığını iddia ediyor. Bununla birlikte Nvidia
GauGAN2 programı için bir kodu
GitHub üzerinden erişilebilir kılma planları yaparken; Nvidia firmasının yapay zeka ve derin araştırmalar için kullanılan
Playground sistemi üzerinde de interaktif bir demo oluşturulması düşünülüyor.
GauGAN2 gibi üretici modellerinin bir eksikliğini ise ön yargı potansiyeli olarak görebiliyoruz. Örneğin yapılan bazı araştırmalara göre
DALL-E sisteminde belli ifadeler ile hep belli nesnelerin ya da kişilerin eşleştirilmesi durumu oluşurken bu da hem önyargı hem de çeşitlilik konusunda sisteme bir darbe vurabiliyor.
Nvidia ise bu konuda
GauGAN2 sisteminde oluşabilecek önyargıya bir müdahale yapıp yapmadığını ya da nasıl yaptığını açıklamadı. Ancak firmanın bir sözcüsü email yoluyla sistemin 100 milyondan fazla parametreye sahip olduğunu ve eğitiminin bir aydan fazla sürdüğünü belirtirken; bu modelin sadece manzara görüntülerine odaklandığını ve insanların bu görsellerde yer almadığını söylüyor. GauGAN2'nin bir araştırma demosu olduğunun da altı çiziliyor.
Benzer Başka Sistemler de Mevcut
GauGAN Nvidia tarafının ürettiği en yeni yapay zeka aracı iken; firma daha önce de StyleGAN ile benzer bir girişimde bulunmuştu.
StyleGAN sistemi hiç yaşamamış olan insanların gerçeğe yakın görsellerini çıkartabiliyordu. Bunun dışında 2018 yılının Eylül ayında şirketteki araştırmacılar bir akademik yazıda beyin kanserinin sentetik taramasını çıkartabilen bir sistem açıklamıştı. Yine aynı yıl içerisinde Nvidia gerçek dünya videolarını kullanarak sanal çevreler oluşturabilen bir sistemden de bahsetmişti. Dolayısıyla şimdi de bu minvalde bir program söz konusu.
Aynı şekilde GauGAN sisteminin ilk çıkışını
GAN Paint Studio programından önce yaptığını da hatırlatalım. Herkese açık halde kullanıma sunulan bir başka yapay zeka aracı olan
GAN Paint Studio benzer şekilde kullanıcıların herhangi bir fotoğraf yükleyip onun üzerindeki nesnelerin görünüşünde bazı değişiklikler yapmasına olanak tanıyordu.
Buna benzer bir şekilde yakın zamanda
YouTube videolarını izleyerek gerçekçi ve yeni videolar oluşturabilen başka bir üretkenlik odaklı programa da şahit olmuştuk. O videolardan alınan verilerle oluşturulabilen videolarda orijinal görseller, animasyonlar ve ifadelerle birlikte insan konuşmaları gibi ögeleri bulabiliyorduk.
Dolayısıyla
GauGAN2 ile yine benzer ve birçok alanda faydalanmaya açık bir çalışmanın söz konusu olduğunu söyleyebiliriz.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...