PNAS Nexus’ta yayımlanan yeni araştırma, GPT‑5, Claude ve Gemini gibi ileri dil modellerinin, psikolojinin en temel dikkat ölçüm araçlarından biri olan “Stroop görevi”nde beklenmedik biçimde başarısız olduğunu ortaya koydu. Bu test, kelimenin anlamı ile mürekkep renginin çeliştiği durumlarda doğru yanıt verme becerisini ölçüyor. İnsan beyni bu çelişkiyi bastırıp hedefe odaklanmayı sürdürebilirken, yapay zekâ sistemleri karmaşıklık arttıkça hedefi unuttu ve yanlış yanıtlara yöneldi. Araştırmacılar, bu durumun yapay zekânın bilişsel tutarlılık sınırlarını gözler önüne serdiğini belirtiyor.
STROOP GÖREVİ NEDİR?
1930’lardan bu yana kullanılan Stroop testi, insan dikkatinin “otomatik” ve “kontrollü” süreçleri arasındaki çatışmayı ölçer. Katılımcılardan, kelimenin anlamını görmezden gelerek mürekkebin rengini söylemeleri istenir. “Kırmızı” kelimesi mavi renkle yazıldığında, beyin otomatik okuma refleksini bastırmak zorunda kalır. Bu süreç, yürütücü kontrol olarak bilinen zihinsel mekanizmayı devreye sokar; yani dikkat dağıtıcılara rağmen hedefe odaklanma yeteneği. Stroop testi, yıllardır dikkat eksikliği, bilişsel yorgunluk ve nörolojik bozuklukların ölçümünde kullanılıyor.
YAPAY ZEKA NEREDE TAKILDI?
Araştırmacılar, kısa kelime listelerinde GPT‑4o’nun %91 doğrulukla başarılı olduğunu, ancak liste uzadıkça performansın dramatik biçimde düştüğünü belirledi. 40 kelimelik listelerde doğruluk oranı yalnızca %15’e geriledi. Claude 3.5 Sonnet ve GPT‑5 de benzer şekilde odak kaybı yaşadı. Model, kelimenin anlamını bastırmak yerine giderek otomatik okuma eğilimine geri döndü. Bu durum, yapay zekânın “dikkat” kavramını yalnızca istatistiksel bir ağırlık olarak ele aldığını, bilişsel bir niyet olarak sürdüremediğini gösteriyor.
İNSAN BEYNİ İLE YAPAY DİKKAT ARASINDAKİ FARK
İnsan beyni, uzun süreli görevlerde bile hedefi koruyabilirken, yapay zekâ sistemleri talimatın amacını unutma eğilimi gösterdi. Beyinde dikkat, prefrontal korteks ve anterior singulat korteks gibi bölgelerin etkileşimiyle dinamik biçimde yönetilir; bu sistem, hataları algılayıp stratejiyi yeniden düzenleyebilir. Oysa transformer tabanlı modellerde dikkat, yalnızca matematiksel bir dağılım olarak işler; yani model, hangi kelimeye “bakacağını” olasılıksal olarak seçer, ama neden baktığını bilmez. Bu fark, yapay zekânın insan benzeri odaklanma yeteneğine ulaşmasının önünde temel bir engel oluşturuyor.
NE ANLAMA GELİYOR?
Bu bulgular, yapay zekânın yazma, kodlama ve muhakeme gibi alanlarda etkileyici olsa da, uzun süreli odaklanma ve bilişsel esneklik gerektiren görevlerde hâlâ insana kıyasla zayıf olduğunu gösteriyor. GPT‑5’in başarısızlığı, gelecekteki modellerin yalnızca bilgi değil, dikkat ve amaç sürdürülebilirliği üzerine de eğitilmesi gerektiğini hatırlatıyor. Araştırmacılar, “Yapay zekâya dikkat öğretmek, ona düşünmeyi öğretmek kadar zor” diyor.
YAPAY ZEKA PSİKOLOJİSİNİN YENİ ALANI
Bu çalışma, “Yapay Zekâ Psikolojisi” olarak adlandırılan yeni bir araştırma alanının kapılarını aralıyor. Bilim insanları artık modellerin yalnızca ne bildiğini değil, nasıl odaklandığını, nasıl unuttuğunu ve nasıl dikkat dağıldığını da inceliyor. Bu, gelecekte yapay zekânın insanla daha doğal etkileşim kurabilmesi için kritik bir adım olabilir.