Yapay Zeka

Fable 5 Geri Dönüyor: Neden Kapatıldı, Ne Değişti?

ahmet
3 dakikalık okuma
#Fable 5#Anthropic#Claude#Yapay Zeka Güvenliği
Çiçek ve yapraklarla bezenmiş '5' rakamı ve üstünde Fable 5 yazısı
Anthropic'in Fable 5 modeli neden birkaç haftalığına kapatıldı, hangi güvenlik önlemleri eklendi ve ne zaman geri geliyor? Olayın sade ve net bir özeti.

Anthropic'in en yetenekli modellerinden Fable 5, birkaç hafta önce sessizce erişime kapanmıştı. 1 Temmuz itibarıyla geri dönüyor. Peki tam olarak ne oldu, model neden kapatıldı ve bu süre içinde neler değişti? Gürültüden uzak durup olayı olduğu gibi anlatalım.

Kısa hikaye: model neden kapandı?

Olayın kökeninde teknik bir arızadan çok politik bir karar var. 12 Haziran 2026'da ABD hükümeti, Claude Fable 5 ve Claude Mythos 5 için ihracat kontrolleri getirdi. Bu kontroller, modele yabancı uyruklu kişilerin erişimini kısıtlamayı gerektiriyordu. Anthropic'in elinde ise bir kullanıcının uyruğunu anlık doğrulayacak bir sistem yoktu. Geriye tek pratik seçenek kalmıştı: iki modeli de herkese kapatmak.

Kararın fitilini ateşleyen şey, Amazon'daki bir araştırma ekibinin bulgusuydu. Ekip, Fable 5'i belirli yazılım açıklarını bulmaya ve bir örnekte bu açığın nasıl sömürülebileceğini göstermeye ikna eden bir yöntem keşfetmişti. Kağıt üzerinde bu, alarm zillerini çaldıracak bir senaryo.

Bulunan açık gerçekte ne kadar ciddiydi?

Anthropic olayı kendi içinde incelediğinde tablo göründüğü kadar dramatik çıkmadı. Aynı açıkları, Fable 5'ten çok daha mütevazı modeller de bulabiliyordu. Test edilen Claude Opus 4.8, GPT-5.5 ve Kimi K2.7 dahil her model, aynı zafiyetleri tespit edip aynı sömürü örneğini üretebildi. Yani ortada Mythos seviyesinde, yalnızca bu modele özgü bir siber yetenek yoktu. Yapılan iş, savunma amaçlı sıradan bir güvenlik analizinden ibaretti.

Bu ayrım önemli. Bir modelin gerçekten "tehlikeli" sayılması için, kimsenin başka türlü ulaşamayacağı yeni bir kapı açması gerekir. Herkesin zaten yapabildiği bir işi biraz daha hızlı yapmak o eşiği geçmez.

Anthropic ne değiştirdi?

Anthropic, bu spesifik atlatma yöntemini hedefleyen yeni bir güvenlik sınıflandırıcısı devreye aldı. Şirketin resmi duyurusunda paylaştığı rakama göre bu sınıflandırıcı, söz konusu yöntemi yüzde 99'un üzerinde bir başarıyla yakalıyor. Lansman öncesinde güvenlik araştırma ekibini iki katına çıkardılar ve tek bir savunma katmanına güvenmek yerine üst üste binen birden çok katmandan oluşan bir "derinlemesine savunma" yaklaşımını benimsediler.

Normal koruma önlemleri ile Fable 5'in daha geniş güvenlik marjının karşılaştırması
Normal koruma önlemleri (A) ile Fable 5'in genişletilmiş güvenlik marjı (B). Fable 5, daha fazla yanlış alarmı göze alarak korumayı sıkılaştırıyor.

Sınıflandırıcıların çalışma mantığı şöyle: sistem, zararsız bir istekle zararlı bir istek arasına bilinçli olarak geniş bir tampon bırakıyor. Buna güvenlik marjı deniyor. Marj ne kadar genişse, zararlı bir çıktının sızma ihtimali o kadar düşüyor. Bunun bedeli ise zararsız bazı isteklerin de yanlışlıkla engellenmesi. Fable 5 için bu marj, önceki sürümlere kıyasla belirgin biçimde genişletildi. Anthropic burada daha fazla yanlış alarmı göze alıp korumayı sıkılaştırmayı seçti.

Jailbreak'ler nasıl sınıflandırılıyor?

Anthropic her jailbreak'i aynı kefeye koymuyor. Ciddiyetine göre kabaca üç gruba ayırıyorlar.

Hafif, dar kapsamlı ve evrensel jailbreak türlerinin güvenlik marjıyla ilişkisi
Jailbreak türleri: hafif jailbreak yalnızca güvenlik marjına sızar; dar kapsamlı olan belirli bir zararlı davranışı açar; evrensel jailbreak geniş bir zararlı sınıfı serbest bırakır.

Hafif jailbreak'ler yalnızca güvenlik marjına sızıyor, asıl zararlı davranışlara ulaşamıyor. Dar kapsamlı zararlı jailbreak'ler belirli ve sınırlı bir tehlikeli davranışın kilidini açıyor. Evrensel jailbreak'ler ise geniş bir zararlı davranış sınıfını birden serbest bırakıyor; en tehlikeli olanı bu. Şirket, Fable 5 için bugüne kadar evrensel bir jailbreak bulunmadığını söylüyor. Yine de bir modeli jailbreak'lere tamamen bağışık kılmanın muhtemelen imkansız olduğunu da açıkça kabul ediyorlar.

Bu şeffaflık aslında sağlıklı. "Sistemimiz kırılmaz" demek yerine, riski derecelendiren ve tam olarak nerede durduklarını söyleyen bir dil kullanıyorlar.

Fable 5'e ne zaman ve nasıl erişeceksiniz?

  • 30 Haziran: İhracat kontrolleri kaldırıldı.
  • 1 Temmuz: Fable 5, Claude Platform, Claude.ai, Claude Code ve Claude Cowork üzerinde küresel olarak erişime açıldı.
  • 7 Temmuz'a kadar: Pro, Max, Team ve seçili Enterprise planlarında haftalık kullanım limitinin yüzde 50'sine kadar dahil.
  • 7 Temmuz sonrası: Kullanım kredileriyle erişilebilir.

AWS, Google Cloud ve Microsoft Foundry gibi bulut platformlarında yeniden etkinleştirme de mümkün olan en kısa sürede yapılacak.

Geriye ne kalıyor?

Açıkçası bu olay hakkında net bir his edinmek kolay değil. Bir yanda, herkeste bulunan bir yeteneği bahane eden ve güçlü bir modeli haftalarca çevrimdışı bırakan bir düzenleme var. Öte yanda, riski ciddiye alıp güvenlik ekibini büyüten, sınıflandırıcısını sıkılaştıran ve süreci şeffaf biçimde anlatan bir şirket. İkisi aynı anda doğru olabilir.

Somut sonuç şu: Fable 5 geri döndü, öncekinden daha sıkı korunuyor ve ilk haftaki kullanım koşulları oldukça cömert. Modeli kullanmayı planlıyorsanız 7 Temmuz'a kadar açık olan bu pencereyi değerlendirmek mantıklı. KRITM olarak yapay zeka tarafındaki gelişmeleri takip etmeye devam edeceğiz; yeni modelleri kendi iş akışlarınıza nasıl oturtacağınızı konuşmak isterseniz bize yazın.