Gündelik hayatta, iş hayatımızda, okul hayatımızda sıkça kullandığımız ChatGPT’nin üreticisi OpenAI yazılı talimatlar ile video oluşturabilen yapay zeka modeli Sora’yı tanıttı. Sora; fiziksel dünyadaki hareket mantığını anlayıp simüle edebilecek şekilde eğitildi. Sora ile 1 dakikaya kadar uzunlukta, görsel kalitenin yüksek olduğu videolar üretilebileceği belirtiliyor.
2021’de yayınlanan bir başka OpenAI ürünü DALL-E ile yazılı talimatlar doğrultusunda resim oluşturulabiliyordu. Sora ise yazılı istemleri, fiziksel harekete yönelik tahminler yürüterek videoya çevirebiliyor. Bu istemler videoda istenen detaylarla doldurulduğunda ortaya gerçek görüntü seviyesinde videolar çıkıyor. Örneğin aşağıdaki videoya dair istem şu şekilde:
“Şık bir kadın; animasyonlu, neon ışıklı tabelaların olduğu bir Tokyo caddesinde yürüyor. Üzerinde siyah bir deri ceket, uzun kırmızı bir elbise, siyah botlar var ve siyah bir çanta taşıyor. Güneş gözlükleri ve kırmızı ruju var. Özgüvenli bir şekilde yürüyor. Cadde nemli ve yansıtıcı, renkli ışıklarla ayna etkisi oluşturuyor. Birçok yaya caddede yürüyor.”
Sora’da, DALL-E’de de kullanılan “yeniden açıklama” tekniği kullanılıyor. Önce veri setinde bulunan videoların nasıl açıklandığı, yapay zeka modeline öğretiliyor. Ardından yapay zekadan videoları kendi açıklaması isteniyor. Bu işlemi tersine çevirdiğimizde ise yazıyla açıklanan video, model tarafından üretilebiliyor. Ayrıca Sora kısa ve detaysız istem yazılarını, uzun ve detaylı hâle getirerek videonun daha kaliteli ve doğru şekilde üretilebilmesini sağlıyor.
Sora sadece sıfırdan yazıyı videoya çevirmekle kalmıyor, kendisine yüklenen videolar üzerinde düzenlemeler yapabiliyor. Videodaki çevresel faktörleri, nesneleri, ışıklandırmayı değiştirebiliyor. Bunun yanında, birbirinden farklı iki video arasında geçiş yaparak videoları birleştirebiliyor.
Bu model, hiç şüphesiz içerik üreticileri ile videografi alanında çalışanlar başta olmak üzere çoğu kişi için harika bir araç olacak. Ancak sadece yazıyla böyle gerçeğe yakın videolar elde etmenin tehlikeli yanları da yok değil. Örneğin geçtiğimiz haftalarda haberini yaptığımız yapay zeka görüntüleri ile dolandırıcılık, bu araçların herkesin kullanımına açık hâle gelmesiyle daha kolay hale gelecek. Sahte görüntüler ile şantaj, karalama, tehdit gibi sorunlar da ortaya çıkacak. Bu tehditlerin önüne geçmenin yolu ise, görüntülerin yapay zeka olduğunu algılayabilen başka yapay zeka modelleri üretmekten geçiyor.