Tıpkı OpenAI üzere yapay zekâ takviyeli teknolojiler üreten firmaların başında gelen Stability AI, bugün çok kıymetli bir duyuru gerçekleştirdi. Bu duyuruda, şirketin yeni yapay zekâ modeli ‘Stable Görüntü Diffusion‘ tanıtıldı. Şirketin metinden görsel üretmeye yarayan yapay zekâ modeli ‘Stable Diffusion’ üzerine inşa edilen yeni model, metinleri evvel manzaralara, akabinde da görüntülere dönüştürüyor.
Stable Görüntü Diffusion, şimdi erken evrede olan bir yapay zekâ modeli. Hâl bu türlü olunca herkesin kullanımına açık değil. Ancak Stability AI’ın şanslı ferdi ve ticari lisans sahibi kullanıcıları, şirketin yeni yapay zekâ modelini şimdiden deneyebiliyorlar. Bu ortada; Stable Görüntü Diffusion için paylaşılan örnekler, teknolojinin hiç de fena olmadığını gözler önüne seriyor.
İşte Stable Görüntü Diffusion ile üretilen birtakım örnek görüntüler:
Stability AI tarafından yapılan açıklamalara nazaran yeni yapay zekâ modeli, SVD ve SVD-XT halinde iki farklı çıktı formatı üretebiliyor. SVD formatı, 14 kareyi 576×1024 piksel çözünürlükte görüntü hâline getiriyor. SVD-XT ise bir içerik için 24 kare kullanabiliyor. Her iki formatta da 3 ila 30 fps arasında imaj alınabiliyor.
Stable Görüntü Diffusion, milyonlarca görüntünün eğitim için kullanıldığı bir model. Şirket, bu türlü devasa bir bilgi seti ile eğittiği modeli, ikinci kademede yaklaşık bir milyon görüntü kullanarak tekrar eğitti. İkinci eğitim, Stable Görüntü Diffusion tarafından üretilen imajlara ince ayar yapılmasını sağladı. Lakin şirket, bilgi setlerinde kullandığı görüntüleri nereden temin ettiğine ait bir açıklama yapmadı. Aslında şirket, eğitim datalarının telifsiz ve kamuya açık bilgi tabanlarından alındığını söylüyor lakin bunun nasıl yapıldığını bilen yok.
Stability AI’ın açıklamasına nazaran yeni yapay zekâ modeli, aslında ticari kullanım için tasarlandı. Şirket, geliştirdiği teknolojinin reklamcılık, eğitim ve cümbüş üzere birtakım bölümlerde işleri kolaylaştıracağını söylüyor. Lakin bunun kişisel açıdan kullanımının yol açabileceği kimi sıkıntılar olduğunu atlamamak gerek. Sonuçta deepfake teknolojisinin sonuçlarını hepimiz biliyoruz…
İşte Stable Görüntü Diffusion, ferdî kullanım risklerini ortadan kaldırmak için kimi kısıtlamalar içeriyor. Yapılan açıklamalara nazaran bu yapay zekâ modeli, yine düzenlemeye müsaade vermiyor. Ayrıyeten bir kişinin yüzü, metindekiyle uyumlu olmayabiliyor. Tüm bunlara ek olarak yeni yapay zekâ modeli, büyük oranda hareketsiz yahut yavaş kamera efektleri içeren imajlar de üretmiyor. Takımın bu usullerle tüketicileri koruyup koruyamayacakları şimdilik belgisiz.
Kaynak; https://www.webtekno.com/metinden-video-ureten-yapay-zeka-stable-video-diffusion-h138779.html