Yapay zekanın sınırları zorlanmaya devam ediyor!
Google, Salı günü düzenlenen Google I/O 2024 geliştirici konferansının açılış konuşmasında, yapay zeka alanında önemli yeniliklerini açıkladı. Bu yılın en büyük teknoloji etkinliklerinden biri olan Google I/O, yapay zeka odaklı birçok yenilikle karşımıza çıktı. CEO Sundar Pichai’nin açılış konuşması, Google’ın yapay zekanın gücünü nasıl kullandığını ve gelecekte bizleri nelerin beklediğini gözler önüne serdi.
Google’ın yeni modeli: Gemini 1.5 Pro ve yeni özellikler
Şirketin mevcut amiral gemisi olarak bilinen Gemini 1.5 Pro modelinin 2 milyon token kapasiteye kadar bilgi işleyebilen yeni bir sürümünün özel önizlemesi duyuruldu. Bu token kapasitesi, önceki sürümün maksimum sahip olduğu miktarının iki katı olup piyasadaki modeller arasından en fazla bilgi kapasitesini destekleyen model olarak dikkat çekiyor. İşte bu modelin yeni özellikleri ve dikkat edilmesi gereken önemli noktalar:
- Gemini 1.5 Pro: 2 milyon token’a kadar veri işleme kapasitesine sahip olan bu model, piyasada bulunan tüm yapay zeka modelleri arasında en büyük girdiyi destekliyor. Bu, daha fazla veri işleyebilme ve daha doğru, bağlamsal yanıtlar sağlayabilme anlamına geliyor.
- Belirteçlerin Anlamı: Yapay zeka alanında “belirteçler”, ham veri parçalarını ifade ediyor. 2 milyon token, yaklaşık 1,4 milyon kelimeye, iki saatlik videoya veya 22 saatlik ses kaydına eşdeğerdir.
- Geliştirilmiş Performans: Daha fazla belirteç alabilen modeller, genellikle daha iyi performans elde eder. Gemini 1.5 Pro, büyük bağlamlı modeller arasında yer alarak, aldıkları veri akışını daha iyi kavrayarak daha zengin yanıtlar üretiyor.
- Geliştirici Erişimi: Gemini 1.5 Pro’yu 2 milyon token kapasitesindeki bağlamla denemek isteyen geliştiriciler, Google’ın üretici yapay zeka geliştirme aracı olan Google AI Studio’daki bekleme listesine isimlerini ekleyebilirler.
- Algoritmik İyileştirmeler: Google, Gemini 1.5 Pro’nun son birkaç ay içinde algoritmik iyileştirmelerle geliştirildiğini belirtti. Bu model, kod yazmada, mantıksal muhakeme yaparak planlamada, ses ve görüntü verilerini anlamada daha iyi performans gösteriyor.
- Gemini 1.5 Flash: Daha küçük ve verimli bir model olan Flash, metin üretimi ve diğer modlarla analiz yapma kabiliyetine sahip. En fazla 2 milyon jetonluk bir bağlam penceresine sahip olan Flash, özellikle özetleme, sohbet uygulamaları, resim ve video altyazıları, uzun belge ve tablolardan veri çıkarma gibi görevler için çok kullanışlı olduğu öne sürülüyor.
- Bağlam Önbelleğe Alma: Geliştiricilerin büyük miktarda bilgiyi Gemini modellerinin hızlı ve nispeten ucuz bir şekilde erişebileceği bir önbellekte saklamalarına olanak tanıyan bir özellik olarak bağlam kısmının geliştirildiği de biliniyor.
- Vertex AI Güncellemeleri: Google’ın kurumsal odaklı üretken yapay zeka geliştirme platformu Vertex AI’da, sınıflandırma, duygu analizi, veri çıkarma ve açıklama oluşturma gibi iş yüklerini ele almak için daha uygun maliyetli bir yol sunan ücretsiz Batch API ile kontrollü üretim özellikleri de sunum sırasında yer aldı.
Google’ın yapay zeka alanındaki bu yenilikleri, geliştiricilere daha geniş veri işleme kapasiteleri ve daha verimli araçlar sunarak, üretken yapay zeka teknolojisinin geleceğine yön verecek gibi duruyor.
Google, görüntü oluşturma teknolojisi ile rakiplerinden geri kalmıyor
Salı günü Mountain View’da düzenlenen Google I/O geliştirici konferansında, Google teknoloji devinin Imagen üretken yapay zeka modeli ailesinin en yenisi olan Imagen 3’ü tanıttı.
Google’ın yapay zeka araştırma bölümü DeepMind’ın CEO’su Demis Hassabis, Imagen 3’ün bir önceki versiyonu olan Imagen 2’ye kıyasla metin komutlarını daha doğru anladığını ve nesillerinde daha “yaratıcı ve ayrıntılı” olduğunu belirtti. Ayrıca, modelin daha az “dikkat dağıtıcı yapaylık” ve hata ürettiğini ifade etti. Hassabis, “Bu, görüntü oluşturma modelleri için bir zorluk olan metin oluşturma konusunda da şimdiye kadarki en iyi modelimiz” dedi.
Google, sahte görsel oluşturma potansiyeli konusundaki endişeleri gidermek için Imagen 3 tarafından oluşturulan görsellerin medya tarafında görünmeyeceği, kriptografik filigranları görsel üzerine uygulamak için DeepMind tarafından geliştirilen SynthID teknolojisini kullanacağını açıkladı.
Imagen 3 için özel önizleme kayıtları Google’ın ImageFX aracında mevcut olup, modelin yakında Google’ın kurumsal üretken yapay zeka geliştirme platformu Vertex AI’yı kullanan geliştiricilere ve kurumsal müşterilere sunulacağı belirtildi.
Google, genellikle yapay zeka modellerini eğitmek için kullandığı verilerin kaynağı hakkında fazla bilgi vermiyor. Bu etkinlikte de bu konudaki tavrını koruduğu görüldü. Eğitim verilerinin çoğu, web’deki halka açık sitelerden, depolardan ve veri setlerinden alınmakta olduğu söylense de bu verilerin bir kısmı, özellikle de içerik oluşturucularından izin alınmadan elde edilen telif hakkıyla korunan veriler, fikri mülkiyetle ilgili davaların kaynağını oluşturuyor.
Google’ın web yayıncı denetimleri, web yöneticilerinin şirketin web sitelerinden fotoğraf ve videolar da dahil olmak üzere veri kazımasını engellemelerine olanak tanıyor. Ancak, Google kullanıcıların verilerinin bu tür işlemlerde kullanılmamasını istemelerine olanak tanıyan bir “vazgeçme” aracı sunmamakta ve bazı rakiplerinin aksine, hak sahiplerine eğitim veri kümelerine yaptıkları katkılar için tazminat ödemeyi taahhüt etmemektedir.
Bu şeffaflık eksikliği, özellikle Google gibi kaynaklara sahip bir şirket için hayal kırıklığı yaratıyor.
Fotoğraflara Soru Sorma Özelliği
Google Fotoğraflar, kullanıcı deneyimini yeni bir seviyeye taşıyan “Fotoğraflara Sor” adlı yapay zeka destekli bir özellik ile güçlendirildi. Bu yazın sonlarına doğru kullanıma sunulacak olan bu özellik, kullanıcıların fotoğraf koleksiyonlarında yapay zekanın fotoğraf içeriği ve diğer meta veriler hakkındaki anlayışından yararlanarak doğal dil sorgularını kullanarak arama yapmalarına olanak tanıyacak. Bu sayede kullanıcılar, sadece basit anahtar kelimelerle değil, daha karmaşık ve detaylı sorgularla istedikleri fotoğrafları bulabilecekler.
Örneğin, “ziyaret ettiğim ulusal parkların en iyi fotoğraflarını bul” gibi bir sorgu yapıldığında, yapay zeka bu talebi analiz ederek fotoğrafları aydınlatma, bulanıklık ve arka plan bozulması gibi çeşitli kriterlere göre değerlendirerek en iyi fotoğrafları belirleyecek. Bu sayede, kullanıcılar yüzlerce fotoğraf arasında manuel arama yapmak zorunda kalmadan en yüksek kalitedeki görüntülere hızlıca erişebilecekler.
Özelliklerin Kullanımı ve Avantajları:
- Doğal Dil Sorguları: Kullanıcılar, “2020 yılında çektiğim en iyi doğa fotoğraflarını göster” veya “çocuğumun son üç doğum günü partisindeki en iyi fotoğraflar” gibi doğal dilde sorgular yapabilirler. Bu, arama işlemlerini daha sezgisel ve kullanıcı dostu hale getirir.
- Meta Veri Analizi: Yapay zeka, fotoğrafların meta verilerini analiz ederek, tarih, konum, ve içerik bilgilerini kullanarak en uygun fotoğrafları belirler. Örneğin, “İstanbul’da çektiğim gece manzaraları” şeklinde yapılan bir arama, belirli bir yer ve zaman dilimine göre filtrelenmiş sonuçlar sunar.
- Karmaşık Sorgulara Cevap: Fotoğraflardaki içerik ve bağlamı anlamada gelişmiş yetenekleri sayesinde, yapay zeka daha karmaşık sorgulara yanıt verebilir. Örneğin, “aile tatillerinde en mutlu anlarımızı göster” gibi bir sorgu, yapay zekanın fotoğraflardaki yüz ifadelerini analiz ederek sonuç sunmasını sağlar.
Google, Salı günü yaptığı açıklamada, bu yeni yapay zeka yükseltmesinin doğal dil işleme sayesinde doğru içeriği bulmayı daha sezgisel hale getireceğini ve manuel arama sürecini büyük ölçüde azaltacağını duyurdu. Önceden kullanıcılar, fotoğraflarında belirli kişileri, yerleri veya nesneleri arayabilirken, artık yapay zekaya daha karmaşık ve detaylı sorular sorma imkanı bulacaklar.
Örnekler ve Senaryolar:
- Özel Anların Bulunması: Bir ebeveyn, Google Fotoğraflar’a çocuğunun son dört doğum günü partisinde hangi temaların kullanıldığını sorabilir. Yapay zeka, bu temalara dair denizkızı, prenses veya tek boynuzlu at gibi temaları içeren fotoğrafları ve ne zaman kullanıldıklarını gösterebilir.
- Yüzme Gelişimi: Kullanıcı, yapay zekadan çocuğunun yüzme gelişimini göstermesini isteyebilir. Yapay zeka, zaman içinde çekilmiş yüzme fotoğraflarını ve videolarını analiz ederek gelişimi gösteren önemli noktaları bir araya getirebilir.
- Görsel Anılar: Kullanıcılar, belirli bir tatil veya etkinlikte çekilen en iyi fotoğrafları görmek için yapay zekaya başvurabilir. Örneğin, “Geçen yılki yaz tatilimizden en iyi plaj fotoğraflarını göster” gibi bir talep, yapay zekanın hem fotoğraf kalitesini hem de içeriğini değerlendirerek en iyi sonuçları sunmasını sağlar.
Bu yeni özellikler, Google Fotoğraflar’ın kullanıcılarına daha fazla kolaylık ve sezgisel bir deneyim sunmayı amaçlıyor. Kullanıcılar, bu yenilikler sayesinde fotoğraf koleksiyonlarını daha etkin bir şekilde yönetebilir ve aradıkları anılara hızlıca ulaşabilirler.
Güvenlik ve Gizlilik
Kişisel Verilerin Reklamlarda Kullanılmaması: Google, “Fotoğraflara Sor” gibi yapay zeka özelliklerinin kullanıcıların kişisel verilerini reklam amaçlı kullanmadığını vurguladı. Bu, kullanıcıların fotoğraflarındaki bilgilerin reklam hedeflemesi için analiz edilmeyeceği ve bu verilerin tamamen kullanıcıların kontrolünde kalacağı anlamına geliyor.
Veri İncelemesi ve Yapay Zeka Eğitimi: Google, yapay zeka konuşmaları ve kişisel verilerin manuel olarak incelenmediğini ve bu verilerin başka yapay zeka ürünlerini eğitmek için kullanılmadığını belirtti. Bu, kullanıcıların özel verilerinin üçüncü taraflara veya farklı yapay zeka modellerine aktarılmayacağına dair ek bir güvence sağlıyor. Google, kullanıcıların mahremiyetine saygı göstererek, veri güvenliği ve gizliliği konusunda yüksek standartlar uygulamayı sürdürüyor.
Yapay Zeka Güvenlik Önlemleri: Google, yapay zeka sistemlerinin güvenliğini sağlamak için çeşitli korkuluklar ve güvenlik önlemleri uyguladığını açıkladı. Özellikle saldırgan veya uygunsuz içeriklerin yayılmasını önlemek amacıyla yapay zeka modelleri, eğitim sürecinde belirli filtrelemelerden geçirilerek geliştiriliyor. Bu, kullanıcıların yapay zeka sistemlerini güvenle ve sorunsuz bir şekilde kullanabilmelerini amaçlıyor.
Google’ın bu güvenlik ve gizlilik önlemleri, kullanıcıların verilerinin korunmasını ve yapay zeka özelliklerinin güvenle kullanılmasını sağlıyor. Bu sayede, kullanıcılar kişisel bilgilerini paylaşırken ve Google’ın yapay zeka çözümlerini kullanırken içleri daha rahat olabilir.