İnsan gibi düşünen yapay zekaya 10 yıl uzaklıkta olabiliriz!
Günümüz yapay zeka modelleri insan beyni gibi hatırlıyor, düşünüyor, plan yapıyor ve mantık yürütüyor mu? Bazı yapay zeka laboratuvarları bu konuda çok iyimser, ancak Meta’nın baş yapay zeka bilimcisi Yann LeCun bu iddialara temkinli yaklaşıyor. LeCun, yapay zekanın insan seviyesine ulaşabileceğini düşünüyor, ancak bu hedefin önümüzdeki 10 yıl içinde gerçekleşeceğini belirtiyor. Bu hedefe ulaşmak için ise yeni bir yöntem olan “dünya modeli”ni geliştirmenin gerektiğini savunuyor.
Bu yılın başlarında OpenAI, ChatGPT’ye “hafıza” özelliğini ekleyerek önceki konuşmaları hatırlayabilme yeteneği sundu. Ayrıca OpenAI yeni çıkardığı o1 modelinin “karmaşık akıl yürütme” yeteneğine sahip olduğunu öne sürüyor.
Tüm bu gelişmeler, insan seviyesinde yapay zekaya (AGI) çok yaklaştığımızı düşündürebilir. Ancak kısa süre önce Hudson Forum’da konuşan LeCun, Elon Musk (xAI kurucusu) ve Shane Legg (Google DeepMind kurucusu) gibi yapay zeka optimistlerinin, insan seviyesinde yapay zekanın çok yakın olduğu yönündeki iddialarını reddetti.
LeCun, “Dünyayı anlayabilen makinelere ihtiyacımız var; hafızaya sahip, sezgileri olan, sağduyu geliştiren ve insanlar gibi mantık yürütebilen ve plan yapabilen makineler” diyerek mevcut yapay zeka sistemlerinin bu yeteneklerden hala uzak olduğunu belirtti. “Bazı insanların iddialarına rağmen, günümüz yapay zeka sistemleri bunların hiçbirini yapabilme kapasitesine sahip değil” diye ekledi.
LeCun’a göre, şu anda kullanılan büyük dil modelleri (LLM’ler), Meta AI ve ChatGPT gibi sistemleri güçlendiren teknolojiler, insan seviyesinde yapay zekadan oldukça uzakta bulunuyor. LeCun, insan seviyesindeki yapay zekanın gerçekleştirilmesinin “yıllar, hatta on yıllar” sürebileceğini öne sürüyor.
Bugün kullanılan dil modelleri, yalnızca bir sonraki harfi ya da kelimeyi tahmin ederek çalışıyor, görüntü ve video modelleri ise bir sonraki pikseli tahmin ediyor. Yani dil modelleri, yalnızca tek boyutlu tahminciler ve görüntü/video modelleri iki boyutlu tahminciler. Bu modeller kendi boyutlarında oldukça iyi tahminlerde bulunsa da, üç boyutlu dünyayı tam anlamıyla anlayamıyorlar.
Bu nedenle, modern yapay zeka sistemleri insanların kolayca yaptığı basit görevleri yerine getiremiyor. LeCun, insanların 10 yaşında bir yemek masasını toplamayı, 17 yaşında ise araba kullanmayı birkaç saat içinde öğrenebildiğini vurguluyor. Ancak dünyanın en gelişmiş yapay zeka sistemleri, milyonlarca saatlik veriyle eğitilmiş olmalarına rağmen, fiziksel dünyada güvenilir bir şekilde işlem yapamıyorlar.
LeCun, daha karmaşık görevleri gerçekleştirebilmek için üç boyutlu modeller geliştirmeyi ve bu modellerin “dünya modeli” adı verilen yeni bir yapay zeka mimarisine dayanması gerektiğini savunuyor. LeCun, dünya modelini “dünyanın nasıl davrandığına dair zihinsel bir model” olarak tanımlıyor. Dünya modelinin işlevlerini tanımlarken LeCun, “Alacağınız bir dizi eylemi hayal edebilirsiniz ve dünya modeliniz, bu eylemlerin dünya üzerindeki etkilerini tahmin etmenizi sağlar” diyor.
Dünya modelleri, büyük dil modellerinden çok daha fazla veri alabilir, bu da onları hesaplama açısından oldukça yoğun hale getiriyor. Bu nedenle bulut sağlayıcıları, yapay zeka şirketleriyle iş birliği yaparak bu yoğun hesaplamayı karşılamaya çalışıyor.
Dünya modelleri, bugün birçok yapay zeka laboratuvarının peşinde olduğu büyük bir fikir haline gelmiş durumda ve bu terim hızla risk sermayesi yatırımlarını çekmek için bir cazibe merkezi haline geliyor. Önde gelen yapay zeka araştırmacılarından Fei-Fei Li ve Justin Johnson, dünya modellerinin daha akıllı yapay zeka sistemlerinin kilidini açacağına ikna olmuş durumda ve bu amaçla World Labs adlı girişimlerine 230 milyon dolarlık yatırım aldılar. OpenAI ise henüz piyasaya sürülmemiş Sora video üreticisini dünya modeli olarak tanımlıyor.
LeCun, 2022 yılında “hedef odaklı yapay zeka” üzerine yazdığı bir makalede, dünya modellerini insan seviyesindeki yapay zekayı yaratma aracı olarak öne sürmüştü. Kısaca, bir dünya modeline bir temel dünya temsili (örneğin, dağınık bir odanın videosu) ve hafıza veriliyor. Ardından dünya modeli, bu bilgiler temelinde dünyanın nasıl görüneceğini tahmin eder. Son olarak, modele hedefler (örneğin temiz bir oda) ve insanlara zarar vermeden bu hedefe ulaşması için sınırlar (örneğin, odayı temizlerken bana zarar verme) veriliyor. Dünya modeli, bu hedeflere ulaşmak için bir dizi eylemde bulunuyor.
Meta’nın uzun vadeli yapay zeka araştırma laboratuvarı FAIR (Fundamental AI Research), LeCun’a göre, şu anda dünya modelleri ve hedef odaklı yapay zeka geliştirme çalışmalarına yoğunlaşıyor. FAIR, eskiden Meta’nın yeni ürünleri için yapay zeka geliştiriyordu, ancak son yıllarda uzun vadeli yapay zeka araştırmalarına odaklandı. LeCun, FAIR’in artık büyük dil modellerini bile kullanmadığını söylüyor.
Dünya modelleri, oldukça ilgi çekici bir fikir olsada LeCun bu sistemleri gerçeğe dönüştürme yolunda fazla ilerleme kaydetmediğimizi belirtiyor. Bugünkü seviyemizden bu hedefe ulaşmak için çözülmesi gereken birçok zor problem olduğunu ve bu sürecin düşündüğümüzden daha karmaşık olduğunu ifade ediyor.