Google DeepMind, OpenAI’ın Sora’sıyla rekabet edecek Veo 2’yi piyasaya sürdü. Sora 1080p çözünürlükte sadece 20 saniyelik klipler üretirken, Google’ın Veo 2 modeli dakikalarca süren videoları etkileyici bir şekilde 4K çözünürlükte oluşturabilmektedir.
Google, Veo 2’nin gerçek dünya fiziğini ve insan hareketlerinin inceliklerini anlayabildiğini iddia ediyor – ki bu, Sora gibi modellerin hala zorlandığı bir alan. İşte Google’ın yeni Veo 2 modeli hakkında bilmeniz gerekenler.
Google’ın Veo 2 Modelindeki Yenilikler Neler?
Rehber
Google, bu yılın başında Veo’yu yani yapay zeka destekli metin-video üretim modelini duyurmuştu. Şimdi ise daha da geliştirilen Veo 2 modelini kullanıma sundu.
Veo 2’deki en büyük gelişmelerden biri, gerçek dünya fiziğini ve insan hareketlerini daha iyi kavraması. Örneğin, Sora gibi modelleri denedinizse, ekstra parmaklı eller veya sahneye ait olmayan nesneler gibi sorunları fark etmiş olabilirsiniz. Veo 2 bu tür sorunların üstesinden geliyor ve daha doğal, tutarlı çıktılar üretiyor. Google ayrıca, Veo 2’nin diğer modellere kıyasla daha az “halüsinasyon” içerdiğini belirtiyor.
Bunun yanı sıra Veo 2, sinema dilini de anlayabiliyor. Bir tür, lens tipi veya sinematografik efektler belirttiğinizde, model bu talimatları yerine getiriyor. Örneğin, alçak açılı takip çekimleri, sığ netlik alanı veya 18mm’lik bir lens isteyebilirsiniz.
Ancak Google, modelin hala karmaşık sahneler veya hareketlerle baş etmekte zorlandığını söylüyor.
Model, dakikalarca uzunlukta ve ultra yüksek 4K çözünürlükte videolar üretebiliyor. OpenAI’ın Sora’sının 20 saniyelik 1080p klipler ile sınırlı olduğunu düşünürsek, bu gerçekten büyük bir gelişme. Veo 1 ise sadece 1080p’de bir dakika uzunluğunda videolar oluşturabiliyordu.
Veo 2 modeli ile üretilen tüm videolar, yapay zeka tarafından üretildiğini belirten görünmez bir SynthID filigranı içerecek, bu da yanlış bilgilendirme riskini azaltmaya yardımcı olacak.
Veo 2’yi Nasıl Kullanabilirsiniz?
Orijinal Veo modeli gibi, Veo 2 de henüz herkes için kullanılabilir değil. Şu anda Google Labs’in bir parçası olan VideoFX aracı üzerinden erişilebilir. Erişim şimdilik sınırlı ve kullanıcılar bekleme listesine kaydolabiliyorlar. Veo 2 4K çözünürlük ve uzun süreli videolar desteklemesine rağmen, mevcut uygulaması 720p çözünürlük ve sekiz saniye uzunluğunda kliplerle sınırlı.
Google, Veo 2’yi gelecek yıl YouTube Shorts’a entegre etmeyi planlıyor, bu da içerik üreticileri için daha fazla olanak sağlayacak. Geliştiriciler ve şirketler için ise Veo 2, Google’ın yapay zeka platformu Vertex AI üzerinden kullanıma sunuluyor.
Imagen 3 Hakkında Ne Düşünüyorsunuz?
Veo 2 ile birlikte Google, Imagen 3 görüntü oluşturma modelini de yükseltti. Imagen 3 artık daha parlak, daha ayrıntılı görüntüler oluşturabiliyor. Google, modelin komutları daha doğru bir şekilde takip edebildiğini söylüyor. Imagen 3, 100’den fazla ülkede kullanıma sunulan ImageFX’te mevcut.
Google bununla da kalmadı. Daha fazla yaratıcı kontrol sağlamak için Imagen 3’ü Google’ın Gemini AI’sı ile birleştiren deneysel bir araç olan Whisk’i de tanıttı. Whisk ile özne, sahne ve stilleri yeniden karıştırarak benzersiz görüntüler oluşturabilirsiniz. Örneğin, bir görüntü yükleyebilir, bir sahne tarif edebilir ve belirli bir sanat stilini ekleyerek tamamen yeni bir şey ortaya çıkarabilirsiniz. Whisk, ABD’de Google Labs üzerinden kullanılabilir, dolayısıyla meraklıysanız deneyebilirsiniz.