Google, Yeni Görsel Oluşturma Aracı Whisk’i Tanıttı: Yaratıcı Keşif İçin Yeni Bir Dönem Başlatıyor

Google, yapay zeka çözümleri alanındaki yenilikçi adımlarına bir yenisini daha ekleyerek Whisk adını verdiği yeni görsel oluşturma aracını tanıttı. Google Labs tarafından geliştirilen bu platform, kullanıcıların mevcut görselleri başlangıç noktası olarak kullanarak yeni görseller yaratmalarına olanak tanıyor. Ancak Whisk’in sunduğu sonuçlar, yüklenen görselin tam bir kopyasını değil, onun “özünü” yansıtarak daha yaratıcı ve özgün çıktılar ortaya koymayı amaçlıyor. Bu özellik, aracı beyin fırtınası yapmak ve hızlı görsel konseptleri üretmek için ideal hale getiriyor.

Yeni Bir Yaratıcı Araç: Basit ve Esnek Arayüz

Google, Whisk’i “yeni bir tür yaratıcı araç” olarak tanımlıyor. Aracın kullanıcı arayüzü oldukça basit ve anlaşılır bir yapıya sahip; burada kullanıcılar stil ve konu gibi temel girdiler seçerek yaratıcı sürece başlıyor. Şu an için Whisk, üç ön tanımlı stil seçeneği sunuyor: çıkartma, mine pin ve peluş oyuncak. Bu sınırlı stil seçenekleri, aracın deneysel yapısıyla uyumlu olarak, hızlı ve kaba hatlı görseller üretmek için seçilmiş. Örneğin, Google’ın sunduğu örneklerden birinde, Whisk bir Wilford Brimley peluş oyuncak tasarlamayı başarmış. Ancak Google, ünlülerin görsellerinin oluşturulmasını yasaklamış olsa da, bu örnekte bir istisna yapılmış gibi görünüyor.

Gelişmiş Düzenleme Modu ile Daha Fazla Esneklik

Whisk, sadece basit girişlerle değil, daha fazla esneklik sağlayan gelişmiş bir düzenleme moduna da sahip. Kullanıcılar, “Sıfırdan Başla” seçeneğiyle bu moda geçebiliyor ve burada hem metin hem de kaynak görsel kullanarak yeni görseller oluşturabiliyor. Gelişmiş modda, görsel girdiler konu, sahne ve stil olarak kategorize ediliyor. Ayrıca metin detayları eklemek için özel bir giriş çubuğu da bulunuyor. Ancak bu modda dahi, aracın oluşturduğu sonuçlar bazen istenilen detay seviyesine ulaşamayabiliyor. Örneğin, Whisk, yüklenen görseldeki bazı özellikleri doğru şekilde yansıtmayan çıktılar üretebiliyor. Bu da Google’ın, Whisk’i “hızlı görsel keşif” aracı olarak önermesinin nedenini açıklıyor. Google, Whisk’in yalnızca kaynak görselin “temel özelliklerinden” faydalandığını belirtiyor ve kullanıcıları, görsellerin boyu, kilosu, saç modeli ya da ten rengi gibi unsurlarının farklılık gösterebileceği konusunda uyarıyor.

Gemini ve Imagen Altyapısı ile Güçlü Performans

Google, Whisk’in çalışma prensibini detaylandırırken, aracın Gemini dil modeli ve Imagen 3 görsel oluşturucu altyapısını kullandığını açıkladı. İlk olarak Gemini dil modeli, yüklenen görseli detaylı bir şekilde tanımlar ve ardından bu açıklamayı Imagen 3 görsel oluşturucuya aktarır. Sonuç olarak, oluşturulan görsel, doğrudan yüklenen görsel üzerinden değil, Gemini’nin görseli nasıl yorumladığına dayalı olarak şekillenir.

Şu An İçin Sadece ABD’de Erişilebilir

Google’ın Whisk’i şu an için yalnızca ABD’deki kullanıcılarına sunduğu belirtiliyor. Kullanıcılar, Google Labs platformu üzerinden bu deneysel aracı test edebilirler. Ancak Whisk’in gelecekte daha fazla ülkeye sunulup sunulmayacağı veya ek özelliklerle geliştirilip geliştirilmeyeceği konusunda henüz net bir bilgi bulunmuyor.

Google Whisk, yaratıcı süreci hızlandıran ve farklı görsel konseptleri kolayca üretmeye olanak sağlayan bir araç olarak öne çıkıyor. Yapay zeka destekli görsel oluşturma araçlarının geleceği, bu tür yenilikçi çözümlerle şekillenmeye devam edecek gibi görünüyor.

Yorum yapın