OpenAI’ın video oluşturma aracı Sora, gerçekçi videolar üreterek yapay zeka topluluğunu şaşırtmaya devam ediyor!
OpenAI’ın video oluşturma aracı Sora, Şubat ayında rakiplerini geride bırakarak yapay zeka topluluğunu şaşırttı. Sora ile yapılan ilk gösterimler akıcı ve gerçekçi videolarla doluydu. Ancak, bu gösterimlerde pek çok detay göz ardı edildi. Sora’ya erken erişim hakkı verilen bir film yapımcısı, Sora’nın eksik detayları inceleyerek fikirlerini belirtti.
Toronto merkezli dijital prodüksiyon ekibi Shy Kids, OpenAI tarafından tanıtım amaçlı kısa filmler üretmek üzere seçilen birkaç ekipten biri olmasına rağmen önemli ölçüde yaratıcı özgürlüğe sahip bir kuruluş olarak ön plana çıktı. Post prodüksiyon sanatçısı Patrick Cederberg, görsel efektler, animasyon ve ilgili teknolojiler üzerine uzmanlaşmış bir web sitesi olan fxguide ile yaptığı röportajda Sora’nın gerçek kullanımını detaylarıyla anlattı.
Çoğu kişi için önemli olan bir başka nokta ise OpenAI’ın kısa filmleri hakkındaki açıklamalarıdır. Bu açıklamalar, izleyicilerin filmlerin Sora tarafından tamamen şekillendirildiğini düşünmelerine neden olabilir. Ancak gerçekte bu filmler, storyboard, düzenleme, renk düzeltme ve rotoskop gibi post prodüksiyon işlemleriyle tamamlanan profesyonel yapımlardır. Apple’ın “iPhone’da çekildi” demesi gibi, burada da aslında pek çok profesyonel işlem yapılmaktadır.
Cederberg’in röportajındaki teknik detaylarlar ile ilgileniyorsanız fxguide websitesinde yayınlanan bu yazıyı inceleyebilirsiniz: FxGuide Teknik Yazı
Ayrıca, Sora kullanımı hakkında verilen bilgiler, bu modelin düşündüğümüzden daha az gelişmiş bir model olduğunu ortaya koyuyor. Kontrol mekanizmaları, en çok arzu edilen ve en zor özelliklerden biri olarak ön plana çıkıyor. Kontrol mekanizmaları, karakterler için bir giysi dolabını veya balon türlerinin açıklanması gibi detaylar, her bir çekimin diğerlerinden bağımsız olarak oluşturulduğu göz önünde bulundurulduğunda, tutarlılığı sağlamak amacıyla yapılan önemli çabalardır. Bu tür detaylar, ayrıntılı çözümler ve kontroller gerektirir.
Sora çıktılarının videoda bulunması istenmeyen unsurlara karşı da dikkatli bir inceleme ve düzenleme yapması gerekebilir. Cederberg, modelin bazen ana karakterin kafası yerine, balonun üzerine yüz veya balonun ön tarafından sarkan bir ip oluşturduğunu söyledi. Bu unsurların post prodüksiyonda çıkarılması gerekiyordu, bu da hem zaman alıcı hem de zahmetli bir süreçtir.
Karakterlerin ve kameranın zamanlaması ve hareketleri tam olarak mümkün olmadığından bu tür eylemlerin zamanlaması yaklaşık ve öneriye dayalı bir süreçtir. Örneğin, bir hareketin zamanlaması manuel animasyonlar gibi kesin olmayabilir ve bu da film yapımcısının istediği akıcılığı ve hızı yakalamayı zorlaştırabilir. Oluşturulan kliplerde sıklıkla beklenmedik ve istenmeyen ağır çekim efektleri görülebilir.
Sora ile oluşturulan shy kids’in oluşturduğu kısa filmin arka planının videosunu inceleyebilirsiniz:
Cederberg, “sağa kaydırma” veya “takip çekimi” gibi film yapımının günlük dilini kullanmanın genel olarak tutarsız olduğunu ve ekibin bunu oldukça şaşırtıcı bulduğunu söyledi. “Araştırmacılar, video aracını test etmek için sanatçılara danışmadan önce, gerçekten bir film yapımcısı gibi düşünmüyorlardı” dedi.
Sonuç olarak ekip, her biri 10 ila 20 saniye arasında değişen yüzlerce üretim yaptı ve sonunda sadece bir avuç kullanıldı. Cederberg bu oranın 300 üretim için bir video kullanıldığını tahmin ediyor ve buna çok şaşırdığını ifade ediyor.
Meraklı olanlar için, ekip aslında yapay zeka modelinin sınırlamalarını ve karşılaştıkları zorlukları anlatan kısa bir kamera arkası videosu yayınladı. Beklendiği gibi, yorumlar genel olarak yapay zekanın yeteneklerini eleştiriyor fakat tepkiler son zamanlarda gördüğümüz yapay zeka destekli reklamlara gösterilen yoğun tepki kadar sert değil.
Telif hakları konusunda da ilginç bir durum söz konusu:
Sora’dan size bir “Star Wars” klibi oluşturmasını isterseniz, telif hakkı ihlali endişesiyle talebinizi reddedecektir. Hatta “retro-fütüristik bir uzay gemisinde lazer kılıçlı cüppeli adam” gibi dolaylı bir tanımlama yapsanız bile yapay zeka modelinin akıllı mekanizması amacınızı anlayarak yine de talebinizi reddedebilir. Benzer şekilde, “Aronofsky tipi çekim” veya “Hitchcock zoom” gibi belirli yönetmenlere veya tekniklere atıfta bulunan istekler de kabul edilmiyor.
Bir yandan, Sora’nın telif hakkı ihlallerini önlemek için bu tür önlemler alması oldukça mantıklı geliyor. Ancak bu durum, yapay zeka modelinin telif hakkıyla korunan içerikler üzerinde eğitildiği ve bu nedenle ihlalleri daha iyi anlayabildiği anlamına mı geliyor sorusu insanların akıllarına geliyor. Bu soru, eğitim verilerini gizli tutan OpenAI gibi şirketlerin şeffaflık politikaları hakkında da önemli tartışmaları beraberinde getiriyor.