Google DeepMind, bir hayali gerçeğe dönüştürüyor!
DeepMind, oyun içi kodlara veya kurallara erişimi olmayan ve bir insan oyuncunun oyun oynama videolarından öğrenen, ölçeklenebilir, talimat verilebilen SIMA isimli bir yapay zeka geliştirdi. Bu model, oyun içinde görsel temsiller ve oyuncu etkileşimlerini anlayarak, gerçekçi bir deneyim sunuyor. Elbette bu tür yeteneklere sahip yapay zeka ya da bilgisayar karakterleri var. Ancak bu yetenekler daha çok NPC’lerde (oyuncu olmayan karakterlerde) bulunuyor.
DeepMind’ın SIMA adlı yapay zekası, oyun kurallarına erişim sağlamadan, insanların oyun oynarken çekilmiş uzun videolarını izleyerek öğreniyor. Bu videolar ve ek açıklamalar sayesinde, model nesneleri, hareketleri ve bunlar arasındaki etkileşimleri anlıyor. Ayrıca, oyuncuların birbirlerine talimatlar verdiği durumlar da model tarafından öğreniliyor.
Örneğin, ekrandaki piksellerin belirli bir düzende nasıl hareket ettiğinden, bu hareketin “ilerlemek” olarak adlandırılan bir eylem olduğunu veya karakter, kapı benzeri bir nesneye yaklaştığında ve kapı tokmağı görünümlü nesneyi kullandığında bunun bir “kapı açmak eylemi” olduğunu öğreniyor. Bunun gibi basit aktiviteler, birkaç saniye süren ancak bir tuşa basmaktan veya bir şeyi tanımlamaktan daha fazlası olan görevler olarak öne çıkıyor.
“Valheim” gibi hayatta kalma oyunlarından “Goat Simulator 3” gibi daha eğlenceli ve absürt oyunlara kadar geniş bir yelpazedeki oyunlarda çekilen eğitim videoları, yapay zeka modelinin çeşitli oyun senaryolarında nasıl davranması gerektiğini öğrenmesi için kullanılıyor. Bu, yapay zekanın, oyunun her bir dinamiğini ve oyuncu davranışlarını daha iyi anlamasını sağlayarak, gerçekçi ve etkili bir şekilde eğitilmesine yardımcı oluyor. Araştırmacılar basınla yaptıkları görüşmede ana hedeflerden birinin, bir yapay zekayı, bir dizi oyunu oynaması için eğitmenin, genelleme adı verilen bir süreçle, onu görmediği diğer oyunları da oynayabilecek hale getirip getirmediğini görmek olduğunu söylüyor. Araştırmalara göre, birden fazla oyun üzerinde eğitilen yapay zeka ajanları, daha önce maruz kalmadıkları oyunlarda daha iyi performans gösteriyor. Ancak elbette birçok oyun, en iyi hazırlanmış yapay zekayı bile zorlayacak özel ve benzersiz mekanikler veya terimler içeriyor.
Projenin liderlerinden Tim Harley, “Karşınızda insanüstü bir ajana sahip olmaktansa, yanınızda işbirliği yapan, talimatlar verebileceğiniz SIMA oyuncuları olabilir” dedi. Yapay zeka ajanlarının oynarken tek gördükleri oyun ekranındaki pikseller olduğu için, bizim yaptığımız gibi bir şeyleri nasıl yapacaklarını öğrenmeleri gerekiyor. Ajanlar, 3D simülasyonlarda hızlı deneyler yaparak oyunun kurallarını kendi kendilerine öğrenerek, çok fazla açıklama olmadan davranışlarını şekillendirebiliyorlar.
Harley, “Geleneksel simülatör tabanlı ajan eğitimi için pekiştirmeli öğrenme kullanılır ve bu da oyunun ya da ortamın ajanın öğrenmesi için bir ödül sinyali sağlamasını gerektirir. Ortaklarımızın ticari oyunlarında ise bizim kullandığımız oyunlardaki gibi böyle bir ödül sinyaline erişimimiz yok. Dahası, açık uçlu metinlerde tanımlanan çok çeşitli görevleri yerine getirebilen aracılarla ilgileniyoruz. Her oyunun olası her hedef için bir ödül sinyalini değerlendirmesi mümkün değil. Bunun yerine, metinde hedefler verilen insan davranışından taklit ederek öğrenme yöntemini kullanarak ajanlarımızı eğitiyoruz” dedi.
Başka bir ifadeyle, ajanların katı bir ödül yapısına bağlı kaldıklarında sadece skorları artırmaya odaklandığı ve yeni şeyler denemedikleri gözlemleniyor. Ancak ajanlar daha soyut olan, gözlemlenen davranışların benzerliğine değer vererek gelişirlerse, eğitim verilerini temsil ettikleri müddetçe çeşitli eylemleri denemeye daha açık hale gelecekleri söyleniyor.