Google, Gemini 2.0. ile büyük ses getirdi!
Google, yapay zeka dünyasında devrim yaratacak yeni modeli Gemini 2.0’ı tanıttı. Bu model, yalnızca metin işleme değil, aynı zamanda görsel ve ses üretimi gibi çok yönlü yetenekleriyle dikkat çekiyor. Google DeepMind CEO’su Demis Hassabis, Gemini 2.0’ın, önceki modellere kıyasla bir üst seviyede performans ve maliyet etkinliği sunduğunu belirtti.
Gemini 2.0, metin tabanlı işlemlerle sınırlı kalmayıp, aynı zamanda görsel ve işitsel içerik üretimi konusunda olağanüstü bir yetkinliğe sahip olmasıyla dikkat çekiyor. Model, Google’ın ileri teknoloji projeleri olan “Astra” ve “Mariner” gibi yenilikçi uygulamalara altyapı sağlıyor. Astra, kullanıcılara günlük hayatta kaybolan kişisel eşyalarını bulma gibi insanlara rutin hayatlarında rehberlik ederken, Mariner ise tarayıcı kullanımını tamamen otomatik hale getirerek zamandan tasarruf sağlamayı hedefleyen araçlar olarak ön plana çıkıyor. Ayrıca, geliştiriciler için tasarlanmış olan “Jules”, yazılım geliştirme sürecini kolaylaştırarak kod hatalarını tespit edip düzeltme işlemlerini hızlandıran devrim niteliğinde bir araç olarak öne çıkıyor. Bu projeler, Gemini 2.0’ın çok yönlü yeteneklerini hem bireysel hem de kurumsal kullanıcılar için erişilebilir hale getiriyor.
DeepMind CEO’su Demis Hassabis, “2025 yılı, yapay zeka tabanlı ajanların gerçek anlamda kullanıldığı bir dönem olacak. Gemini 2.0, bu geleceğin temel taşıdır. Google’ın hedefi, Gemini 2.0’ı arama motorlarından iş uygulamalarına kadar tüm platformlarında etkin şekilde kullanmak” açıklamasında bulundu.
Şu anda Gemini 2.0’ın Flash sürümü, deneme aşamasında kullanıcılara sunulmuş durumda. Modelin tam özellikli sürümünün ise 2025’te tüm Google hizmetlerinde yer alması planlanıyor.
Yeni geliştirilen “Deep Research” özelliği ise, araştırma asistanı olarak karmaşık konuları keşfetme ve raporlar oluşturma yeteneği sunuyor. Bu özelliğin, 2025’te tam sürümle birlikte Google hizmetlerinde yer alacağı biliniyor.
Gemini 2.0 Teknik Detaylar
Gemini 2.0’ın performans detayları, yeni modelin yeteneklerini gözler önüne seriyor:
- Genel Performans: Gemini 2.0, MMLU-Pro benchmark testinde %76.4 başarı oranı yakalayarak, önceki sürümlere kıyasla üstün bir başarı gösteriyor.
- Kod Üretimi: Python, Java, C++, JS ve Go dillerinde kod üretimi gerçekleştiren Natural2Code testinde %92.9 oranında başarı elde edilmiştir. SQL dönüşümleri için Bird-SQL benchmark testi %56.9 başarıyla tamamlanmıştır.
- Doğruluk: FACTS Grounding benchmark testinde %83.6 ile belgelerden doğru bilgi sağlama konusunda önemli bir ilerleme kaydedilmiştir.
- Matematik: Matematik problemleri için HiddenMath benchmark testi, %63.0 başarı oranıyla dikkat çekmiştir. Genel matematik problemlerinde ise %89.7 başarı sağlanmıştır.
- Muhakeme: GPQA benchmark testi, biyoloji, fizik ve kimya gibi alanlarda %62.1 başarı oranıyla öne çıkmıştır.
- Uzun Bağlam: MRCR (1M) testi, yazıları uzun bağlamda anlama alanında eski modellere nazaran daha düşük %69.2 başarı oranı sağlanmıştır.
- Görsel: Görsel analizde MMMU benchmark testinde %70.7 başarı, günlük görsel senaryoları değerlendiren Vibe-Eval testinde ise %56.3 başarı oranı sağlanmıştır.
- Ses: Otomatik konuşma çevirisi (BLEU skoru) CoVoST2 benchmark testi ile %39.2 başarı elde edilmiştir. Bu başarı Gemini 1.5 Pro’nu %40.1’lik başarısını geçememiştir.
- Video: Çoklu alanlarda video analizi yapan EgoSchema testinde %71.5 başarı sağlanmıştır.
Bu detaylar, Gemini 2.0’ın yalnızca performans açısından değil, aynı zamanda farklı alanlardaki gelişmelerini de gösteriyor.
Gemini 2.0’ın potansiyeli, yeni güvenlik ve etik tartışmalarını da beraberinde getiriyor. Google, bu yeni modelin kullanımında güvenlik önlemleri almak adına “hardened sandbox” adı verilen test ortamlarını öneriyor. Ancak, bu tür yapay zeka ajanlarının bağımsız çalışması, dünya genelinde nasıl bir etki yaratacağına dair pek çok soruyu gündeme getiriyor.
Project Astra: Ajanların Gerçek Dünyaya Geçişi
Google’ın I/O etkinliğinde tanıttığı Project Astra, Android telefonlar üzerinden güvenilir test kullanıcılarının geri bildirimleriyle sürekli gelişim gösteriyor. Bu proje, evrensel bir yapay zeka asistanının pratikte nasıl çalışabileceğine dair önemli bilgiler sunuyor.
Gemini 2.0 ile geliştirilen Project Astra, çoklu dil desteği, aksan ve nadir kelimeleri daha iyi anlama, Google araçlarını kullanma yeteneği, 10 dakikaya kadar hafıza kapasitesi ve insan konuşması hızında dil anlama özellikleriyle dikkat çekiyor. Bu iyileştirmeler, kullanıcı deneyimini daha kişiselleştirilmiş ve etkili hale getiriyor.
Google, bu yetenekleri Gemini uygulaması ve diğer ürünlere entegre etmeyi planlıyor. Ayrıca, bu özellikleri test eden kullanıcı grubunu genişletiyor ve yakında prototip gözlükler üzerinde Project Astra’yı test etmeye başlayacağını belirtiyor.
Project Mariner: Karmaşık Görevleri Tamamlayabilen Ajanlar
Gemini 2.0 ile geliştirilen erken araştırma prototipi Project Mariner, insan-ajan etkileşiminin geleceğini keşfetmeye odaklanıyor ve tarayıcılarla başlıyor. Bu prototip, tarayıcı ekranındaki metin, kod, görseller ve formlar gibi bilgileri anlayabiliyor ve bu bilgileri deneysel bir Chrome eklentisi aracılığıyla görevleri tamamlamak için kullanabiliyor.
WebVoyager benchmark testine göre, Project Mariner, gerçek dünya görevlerini uçtan uca tamamlamada %83.5 oranında başarılı olarak çığır açıcı bir sonuç elde etti. Henüz erken aşamada olmasına rağmen, tarayıcı içinde gezinme gibi teknik olarak mümkün olan görevlerin hızla gelişmesi bekleniyor.
Bu projeyi güvenli ve sorumlu bir şekilde geliştirmek için yeni risk türleri ve azaltma yolları üzerinde aktif olarak araştırma yapılıyor. Örneğin, Project Mariner yalnızca aktif sekmede yazma, kaydırma veya tıklama gibi eylemler gerçekleştirebiliyor ve bir satın alma işlemi gibi hassas işlemler için kullanıcıdan nihai onay almadan harekete geçmiyor.
Jules: Geliştiriciler İçin Yapay Zeka Ajanları
Gemini 2.0, geliştiriciler için önemli bir araç olan Jules ile kod geliştirme sürecine destek oluyor. Jules, GitHub iş akışına doğrudan entegre edilen deneysel bir yapay zeka kod ajanı olarak sunuluyor. Sorunları analiz edebilir, bir plan geliştirebilir ve tüm bunları geliştiricinin yönlendirmesi ve denetimi altında gerçekleştirebilecek kapasitesi. Bu çalışma, yapay zeka ajanlarının yalnızca kodlama değil, tüm alanlarda faydalı olmasını hedefleyen uzun vadeli bir vizyonun parçası olarak ön plana çıkıyor.
Google, Gemini 2.0 Flash ve araştırma prototipleriyle AI teknolojisini ileriye taşırken güvenlik ve sorumluluğu önceliklendiriyor. Bu süreçte, potansiyel riskleri analiz etmek, güvenilir bilgi kaynakları oluşturmak ve kullanıcıları korumak için yeni yöntemler geliştirilmiştir. Farklı girdi tipleri ile çalışabilme ve mantık yetenekleriyle desteklenen bu teknolojiler, yapay zekanın güvenli ve faydalı bir şekilde kullanımını sağlamayı hedefliyor.