OpenAI, yapay zeka alanında devrimsel bir adım atarak GPT-4o ‘omni’ modelini 13 Mayıs 2024’te canlı bir şekilde yayınlanan bir etkinlikle duyurdu!
Yeni model, “omni” adını alarak, sesli komutlara ve görüntü analizine daha etkili yanıtlar verebilme gibi birden fazla yeteneğe sahip bir model olarak önümüze çıkıyor. Şirket, bu modelin ChatGPT’nin kullanıcı deneyimini zenginleştirerek, metin, ses ve görüntü arasında daha entegre bir etkileşim sağlayacağını belirtti.
OpenAI’ın CTO’su Mira Murati’nin San Francisco’daki ofisteki yaptığı açıklamada, “GPT-4o, ses, metin ve görüntü arasında bağlantı kurarak, insanlar ve makineler arasındaki etkileşimi yeniden şekillendiriyor” dedi. Etkinlikte, ChatGPT ve GPT-4 için planlanan güncellemelerin yanı sıra, yeni kişisel asistan uygulamalarının demoları da gösterildi.
GPT-4o’nun en dikkat çekici yeniliği, kullanıcıların ses tonunu algılayarak farklı duygusal tarzlarda anında yön değiştirerek yanıt verebilme yeteneği olarak ön plana çıkıyor. Ayrıca bu model, verilen bir fotoğraf veya ekran görüntüsü üzerinden hızlıca çeşitli konular hakkında bilgi sağlayabiliyor. Örneğin model, bir yazılım kodu üzerinde ne olup bittiğini ya da bir kişinin giydiği tişört üzerinden kişinin hangi pantolonu giymesi gerektiğini belirleyebilen yeteneklerle donatılmış durumda.
OpenAI ayrıca, ChatGPT’nin arayüzünü yeniden tasarlayarak kullanıcıların daha doğal ve kolay bir etkileşim deneyimi yaşamasını amaçlıyor. Yeni arayüz, minimalizm akımını yansıtan sade bir nokta olarak tasarlanmış ve bu tasarım anlayışının da Apple’ın estetik anlayışı ile uyumlu olduğu düşünülüyor. Tasarımda verilen kararların temel amacı, kullanıcıların sadece ChatGPT ile yapacakları işlere odaklanmalarını sağlamak olarak ön plana çıkıyor.
OpenAI, ChatGPT ile etkileşim sırasında, kullanıcının konuşmasını algılayarak bilgi istemi alanının bir dalga formuna dönüşen bir siyah nokta tasarımı kullanıyor. Bu stilize dalga formu, konuşma ve işbirliğini vurgulayarak, makinenin iç yüzünü ustalıkla gizliyor. Video analizleri sırasında, bu nokta büyük bir göz gibi sizi izlemek yerine gördüklerini canlı bir görüntü olarak sunuyor.
OpenAI bu tasarımıyla, yapay zeka estetiğinde sade ve geometrik bir yaklaşım benimsiyor. Bu durum, bazılarına ünlü yönetmen Stanley Kubrick ve bilim kurgu yazarı Arthur C. Clarke’ın eserlerindeki distopik ve zorba yapay zekaları anımsatıyor. Kubrick ve Clarke, “2001: A Space Odyssey” gibi işlerde yapay zeka temasını işlemeleri ile bilinen kişilerdir.
Yapılan diğer gelişmelerden bir tanesi ise yazılım geliştiricilerini ilgilendiriyor. GPT-4o, OpenAI’ın API servisi ile Microsoft’un Azure OpenAI hizmetinde de kullanılmak üzere geliştirilerek GPT-4 Turbo’dan iki kat daha hızlı çalışıyor. Ses alanındaki bu yeniliklerin, kötüye kullanım risklerini azaltmak için ilk aşamada sınırlı sayıdaki kullanıcıya sunulacağı biliniyor.
OpenAI, GPT-4o’nun öncekine nazaran daha fazla dil ile desteklendiğini ve yaklaşık 50 dilde gelişmiş performansa sahip olduğunu iddia ediyor. Şirket, desteklediği dillerin yanında anlık olarak dilleri birbirine çevirme noktasında da oldukça ilerlemiş gözüküyor. Artık çevirmen ihtiyacı olmadan iki farklı dilde konuşan insan rahatlıkla birbirleri ile iletişime geçebilecek gibi gözüküyor.
GPT-4o, OpenAI tarafından geliştirilen yeni yapay zeka modeli, bugünden itibaren ChatGPT’nin hem ücretsiz katmanında hem de mesaj limitleri 5 kat daha yüksek olan premium ChatGPT Plus ve Team planlarını da kullanıma sunuluyor. Bu model, kullanıcılar hız limitine ulaştığında otomatik olarak daha eski GPT-3.5 modeline geçiş yapacak şekilde tasarlanmış. Ayrıca, GPT-4o destekli gelişmiş ses deneyimi, önümüzdeki ay Plus kullanıcıları için alfa sürümünde sunularak kurumsal odaklı seçenekler içereceği biliniyor.
OpenAI ayrıca, ChatGPT kullanıcı arayüzünü yenileyerek daha etkileşimli bir ana ekran ve mesaj düzeni sunacak. MacOS için yeni bir masaüstü sürümü, kullanıcıların klavye kısayollarıyla soru sormasına veya ekran görüntüsü almasına olanak tanıyacak ve bu yıl içinde Windows için de bir sürüm çıkacak. Ücretsiz katman kullanıcıları, ChatGPT’nin tercihlerini hatırlamasını, dosya ve fotoğraf yüklemesini ve web’de arama yapmasını sağlayan özelliklerden yararlanabilecekler. Ayrıca, GPT Store adında, üçüncü taraf sohbet robotları içeren kütüphanede bulunan araçlar da ücretsiz bir şekilde kullanıcılar tarafından kullanılabilecek.
Bu yenilikler, ChatGPT’nin kullanıcı deneyimini önemli ölçüde geliştirecek ve yapay zekanın günlük yaşamdaki rolünü daha da önemli hale getirecek. GPT-4o’nun gelişmiş çoklu modda işleme yetenekleri sayesinde, kullanıcılar daha doğal ve zengin etkileşimler ile yapay zekanın eğitimden sağlığa, müşteri hizmetlerinden kişisel asistanlığa kadar birçok alanda daha etkin rol almasını sağlayacak. Ayrıca, bu teknoloji, dil engellerini aşarak küresel iletişimi kolaylaştırma ve erişilebilirliği artırma potansiyeline sahip. Sonuç olarak, OpenAI’ın bu son yenilikleri, teknolojinin sadece günlük işlerimizi nasıl kolaylaştırdığını değil, aynı zamanda sosyal etkileşimlerimizi ve karar alma süreçlerimizi nasıl dönüştürebileceğini de gösteriyor.”