Google'dan yapay zekayla üretilen görsellerin anlaşılması için önlem
Google, yapay zeka tarafından oluşturulan görsellerde şeffaflığa yönelik bir adım daha attı. Google DeepMind, yapay zeka ile üretilen sanata yönelik bir filigran / tanımlama aracı olan SynthID'yi duyurdu.
Şirket, teknolojinin insan gözüyle görülemeyen dijital bir filigranı doğrudan görüntünün piksellerine yerleştirdiğini söylüyor. SynthID, Google'ın bulut tabanlı yapay zeka araçları paketinde bulunan sanat üreticisi Imagen'i kullanarak başlangıçta "sınırlı sayıda" müşteriye sunuluyor.
Üretken yapay zeka sanatı ilgili pek çok sorun bulunsa da, deepfake yaratma potansiyeli en büyük problemlerden biri olarak öne çıkıyor. Örneğin, Papa'nın sosyal medyada viral hale gelen yeni ve popüler hip-hop kıyafeti (MidJourney ile oluşturulan bir yapay zeka görüntüsü), üretken araçlar geliştikçe neyin daha sıradan hale gelebileceğinin erken bir örneğiydi. Yapay zeka tarafından üretilen sanatı kullanan siyasi reklamlar gibi bir uygulamanın, Twitter'da dolaşan komik bir görselden çok daha fazla zarar verebileceği rahatlıkla söylenebilir. İçeriğin yapay zeka tarafından oluşturulduğunu açıkça belirtmek için görsel ve işitsel içeriğe filigran eklemek, yedi yapay zeka şirketinin Temmuz ayında Beyaz Saray'da yapılan bir toplantı sonrasında geliştirmeyi kabul ettiği gönüllü taahhütlerden biriydi. Google böyle bir sistemi başlatan şirketlerden ilki oldu.
Google, SynthID'nin teknik uygulamasıyla ilgili çok fazla ayrıntı vermiyor, ancak filigranın basit düzenleme teknikleriyle kolayca kaldırılamayacağını söylüyor. Şirket, DeepMind blog yazısında "Görüntü manipülasyonlarında algılanamazlık ve sağlamlık arasında doğru dengeyi bulmak zordur" diye yazdı. DeepMind'ın SynthID proje liderleri Sven Gowal ve Pushmeet Kohli "SynthID'yi görüntü kalitesinden ödün vermeyecek ve filtre ekleme, renkleri değiştirme ve çeşitli kayıplı sıkıştırma şemalarıyla kaydetme (en yaygın olarak JPEG'ler için kullanılır) gibi değişikliklerden sonra bile filigranın algılanabilir kalmasına izin verecek şekilde tasarladık" diyor.
SynthID'nin tanımlama kısmı, görüntüyü üç dijital filigran güven düzeyine göre derecelendiriyor: Algılanan, algılanmayan ve muhtemelen algılanan. Araç, görüntünün piksellerine gömülü olduğundan dolayı Google, sisteminin, Adobe'nin şu anda açık beta sürümünde bulunan Photoshop üretken özellikleriyle kullandığı gibi meta veri tabanlı yaklaşımlarla birlikte çalışabileceğini söylüyor.
SynthID, biri filigranlama için, diğeri tanımlama için olmak üzere bir çift derin öğrenme modeli içeriyor. Google, ikilinin farklı görseller üzerinde eğitim aldığını ve bunun sonucunda birleşik bir makine öğrenimi modeli ortaya çıktığını söylüyor. Gowal ve Kohli, "Birleşik model, filigranlı içeriğin doğru şekilde tanımlanması ve filigranı orijinal içerikle görsel olarak hizalayarak algılanamazlığın iyileştirilmesi de dahil olmak üzere bir dizi hedef doğrultusunda optimize edildi" diye yazıyor.
Google bunun mükemmel bir çözüm olmadığını kabul ediyor ve "aşırı görüntü manipülasyonlarına karşı kusursuz olmadığını" ekliyor. Ancak filigranı "insanların ve kuruluşların yapay zeka tarafından oluşturulan içerikle sorumlu bir şekilde çalışmasına olanak tanıyan umut verici bir teknik yaklaşım" olarak tanımlıyor. Şirket, aracın metin, video ve ses oluşturanlar da dahil olmak üzere diğer AI modellerine genişletilebileceğini söylüyor.