DeepMind, Genie 3 adını verdiği son yapay zeka modelini tanıttı. Bu sistem, kullanıcıdan aldığı metin komutlarıyla hem fotogerçekçi hem de hayal ürünü sanal dünyalar oluşturabiliyor. Oluşturulan ortamlar gerçek zamanlı ve fizik kurallarına tutarlı biçimde işliyor.
TEKNİK ÖZELLİKLER VE YENİLİKLER
- Genie 3, önceki sürümler Genie 2 ile video üretim modeli Veo 3’ün yeteneklerini tek bir çatı altında topluyor.
- Model, 720p çözünürlükte saniyede 24 kare hızında, dakikalar süren interaktif 3D sahneler üretebiliyor.
- Bu, Genie 2’nin 10–20 saniyelik sahne üretim kapasitesine kıyasla büyük bir sıçrama anlamına geliyor.
ÖĞRENME VE TUTARLILIK
Modelin en dikkat çeken özelliği, daha önce ürettiği görüntüleri hatırlayarak olayların mantıklı şekilde gelişimini kendi başına planlayabilmesi. DeepMind araştırmacıları, bu tutarlılığı yapay kodlama yerine modelin öğrenme süreciyle kazandığını vurguluyor. Shlomi Fruchter’a göre, “Gerçek dünyayı taklit edecek biçimde eğitmedik; o, bu tutarlılığı kendi öğrendi.”

İNTERAKTİF KOMUTLARLA YÖNETİM
Genie 3, sahnede yer alan karakterlerin hareketlerini doğrudan metin komutlarıyla değiştirebiliyor. Örneğin:
- “Yeşil çöp presine doğru yaklaş”
- “Kırmızı forklifte doğru yürü”
gibi talimatlar verildiğinde model, depo ortamını oluşturuyor ve yapay zeka karakterini bu dünyada eyleme geçiriyor. DeepMind testleri, bu görevlerin başarıyla tamamlandığını gösteriyor.
MEVCUT SINIRLILIKLAR
- Kar simülasyonlarında gerçekçi tepki eksikliği (örneğin kayakçının ardından kar püskürtme)
- Çoklu bağımsız karakter etkileşimlerinde yetersizlik
- Sadece birkaç dakikalık simülasyonlar, saatler sürebilecek eğitim süreçleri için henüz yeterli değil
Araştırmacılar, Genie 3’ün yapay zekânın plan yapma, çevresini keşfetme, bilinmeze yönelme ve deneyim yoluyla gelişme gibi insana özgü davranış biçimlerini taklit etmede önemli bir adım olduğunu belirtiyor. Bu teknoloji gelecekte genel amaçlı yapay zeka modellerinin eğitiminde devrim yaratabilir.