OpenAI’ın yeni modeli, daha fazla “düşünerek” kullanıcılara yanıt veriyor!
OpenAI, geçtiğimiz günlerde yeni o1 modellerini piyasaya sürdü ve ChatGPT kullanıcılarına bu modelleri deneme fırsatı sundu. “Strawberry” kod adıyla geliştirilen bu modeller, yanıt vermeden önce “düşünme” yeteneğine sahip olmalarıyla ön plana çıkıyor. Ancak, bu yeni modellerin beklenen devrimi gerçekleştirip gerçekleştirmediği konusunda kesin bir sonuca varılamıyor.
Karmaşık sorularda güçlü, basit görevlerde yetersiz
OpenAI’ın o1 modeli, GPT-4o’ya kıyasla karmaşık sorulara yanıt vermede daha başarılı olsa da, kullanım maliyetinin yaklaşık dört kat daha yüksek olduğu biliniyor. Ancak o1 modeli, GPT-4o’nun sahip olduğu, farklı türdeki verileri (metin, görüntü, ses gibi) aynı anda işleyebilme ve hızla yanıt verebilme yeteneklerine sahip değil. GPT-4o, kullanıcıların metin, görsel ve ses verilerini bir arada kullanarak daha kapsamlı ve esnek çözümler sunabilirken, o1 modeli yalnızca metin tabanlı çalışmakta ve bu nedenle daha sınırlı bir model olarak kalmaktadır. OpenAI’ın yardım sayfasında, “GPT-4o’nun çoğu soru için hâlâ en iyi seçenek olduğu” belirtilirken, başka bir yerde de o1 modelinin basit görevlerde zorlandığı vurgulanıyor.
New York Üniversitesi’nde (NYU) yapay zeka modelleri üzerine çalışan Prof. Ravid Shwartz Ziv, “Etkileyici, ancak iyileştirme çok belirgin değil” diyerek, modelin bazı problemler üzerinde daha iyi performans gösterdiğini, ancak genel bir iyileşme sağlamadığını ifade ediyor.
OpenAI o1 modeli, karmaşık fikirleri “düşünerek” çözme yeteneğiyle ön plana çıkıyor. Model, büyük problemleri küçük adımlara bölerek her bir adımın doğru mu yoksa yanlış mı olduğunu belirlemeye çalışıyor. Bu “çok adımlı akıl yürütme” yöntemi yıllardır öneriliyordu, ancak bugüne kadar pratikte uygulanamamıştı. Workera CEO’su ve Stanford Üniversitesi’nde yardımcı öğretim görevlisi olan Kian Katanforoosh, “Bir dil modeli teknikleriyle birleştirilmiş bir pekiştirmeli öğrenme algoritması eğitebilirseniz, yapay zeka modelinin adım adım düşünerek büyük fikirlerden geriye doğru yürümesini sağlayabilirsiniz” diyor.
O1 modelinin yüksek maliyeti ve fazla “düşünme” sorunu
OpenAI o1’in bir diğer özelliği ise yüksek maliyeti. Çoğu modelde girdi ve çıktı belirteçleri için ödeme yaparken, o1 modeli büyük problemleri küçük parçalara bölerken gizli bir süreç ekleyerek hesaplamayı artırıyor. Bu sürecin maliyeti, kullanıcılar tarafından “akıl yürütme belirteçleri” olarak ödeniyor. Bu nedenle, OpenAI o1’i kullanırken dikkatli olunması tavsiye ediliyor. Aksi takdirde, Nevada’nın başkentinin neresi olduğu gibi basit bir soruya bile çok fazla belirteç harcayarak ücret ödemeniz gerekebilir.
OpenAI o1 modeli, daha basit sorularda çok fazla düşünüyor. Örneğin, Türkiye’de çam ağaçlarının nerede bulunduğu gibi bir soruda, model ülke genelindeki tüm çam ağaçları türlerini, bilimsel adlarını da içerecek şekilde 800 kelimelik bir yanıt veriyor. Bu tür basit sorular için GPT-4o’nun verdiği yanıtlar daha kullanışlı gözüküyor.
Yapay zeka dünyası, Strawberry kod adlı bu yeni modelin beklentileri tam anlamıyla karşılamadığını kabul ediyor. OpenAI CEO’su Sam Altman, o1 modelinin AGI olmadığını açıkça belirtti ve “o1 hâlâ kusurlu, hâlâ sınırlı ve hâlâ ilk denemede olduğundan daha etkileyici bir izlenim bırakıyor” diyerek lansman öncesi beklentileri azalttı.
Yapay zeka topluluğu, o1 modelinin GPT-4’ün endüstri için yarattığı devrim niteliğindeki etkisini tekrarlayıp tekrarlayamayacağı konusunda kararsız gözüküyor. ReWorkd araştırma mühendisi Rohan Pandey, o1’in, GPT-4’ün yetersiz kaldığı belirli karmaşık problem kümelerini çözmek için yeterince güçlü olmasını umduğunu belirtiyor. Ancak Brightwave CEO’su Mike Conover, “Herkes yeteneklerde büyük bir sıçrama bekliyor, ancak bu model açıkça böyle bir şey sunmuyor” şeklinde görüşünü belirtti.