Anthropic, 4.5 serisinin son halkası Opus 4.5’i tanıttı. Yeni sürüm, kodlama, araç entegrasyonu ve uzun bağlamlı bellek yönetimi alanlarında geliştirilen yetenekleriyle öne çıkıyor ve önceki Sonnet 4.5 ile Haiku 4.5 sürümlerinin ardından seriyi tamamlıyor.
KIYASLAMA PERFORMANSI
Opus 4.5, kodlama testleri (SWE‑Bench, Terminal‑bench), araç kullanımı ölçümleri (tau2‑bench, MCP Atlas) ve genel problem çözme değerlendirmelerinde yüksek performans sergiliyor. Özellikle SWE‑Bench doğrulamasında yüzde 80’in üzerinde puan alması dikkat çekiyor ve modelin mühendislik odaklı görevlerde iddialı olduğunu gösteriyor.
TARAYICI VE ELEKTRONİK TABLO ENTEGRASYONLARI
Anthropic, Opus 4.5’in bilgisayar ve elektronik tablo görevlerindeki yetkinliğini vurguluyor. Claude for Chrome ve Claude for Excel gibi daha önce pilot aşamasında olan ürünler, Opus 4.5 ile birlikte daha geniş kullanıcı gruplarına açılacak; Chrome eklentisi Max kullanıcılarına, Excel odaklı çözüm ise Max, Team ve Enterprise abonelerine sunulacak.
UZUN BAĞLAMLI BELLEK VE “SONSUZ SOHBET”
Model, uzun bağlamlı işlemler için bellek yönetiminde iyileştirmeler getiriyor. Anthropic’in ürün yöneticileri, yalnızca daha büyük bağlam pencerelerinin yeterli olmadığını; önemli ayrıntıların seçilmesinin ve belleğin akıllı yönetiminin kaliteyi artırdığını belirtiyor. Bu yaklaşım, ücretli Claude kullanıcılarının talep ettiği kesintisiz (sonsuz) sohbet deneyimini mümkün kılacak; bağlam dolduğunda sohbeti sonlandırmak yerine arka planda belleği sıkıştırarak konuşmanın devam etmesi hedefleniyor.
ARAÇ KULLANIMINA ODAKLI YÜKSELTMELER
Çoğu geliştirme, Haiku destekli alt araç grubunun liderlik ettiği araç kullanım senaryolarına yönelik. Amaç, büyük kod tabanları ve uzun belgelerle çalışırken güçlü bir çalışma belleği hakimiyeti sağlayarak modelin ne zaman önceki bilgilere dönüp kontrol etmesi gerektiğini doğru biçimde belirleyebilmesi.
REKABET VE KONUMLANDIRMA
Opus 4.5, yakın zamanda duyurulan diğer ileri seviye modellerle aynı pazarda yer alacak ve OpenAI’nin GPT 5.1 ile Google’ın Gemini 3 gibi rakiplerle doğrudan karşılaştırılabilir performans hedefliyor. Anthropic, özellikle kodlama, araç kullanımı ve uzun bağlam performansındaki iyileştirmelerle rekabette güçlü bir konum elde etmeyi amaçlıyor.