
Yapay zekâ modellerinin “tek başına hacker” olup olamayacağı uzun süredir tartışılıyor. 4 Haziran 2026’da yayımlanan dikkat çekici bir deneyde bir geliştirici, bilerek açıklar içeren bir web uygulaması kurdu, farklı LLM’leri bu sisteme saldı ve yaklaşık 1.500 dolar harcayarak gerçekten işe yarayıp yaramadıklarını ölçtü. Ortaya çıkan tablo net: Modeller bazı güvenlik açıklarını bulabiliyor, hatta zaman zaman zincirleme saldırılar kurabiliyor; ama hâlâ tutarlı, bağımsız ve güvenilir bir saldırgan gibi davranmaktan uzaklar.
Kısaca
- 4 Haziran 2026’da yayımlanan deneyde, zafiyetli bir uygulamaya karşı farklı LLM ajanları test edildi ve toplam maliyetin yaklaşık 1.500 dolar olduğu aktarıldı.
- Sonuçlar, modellerin bazı açıkları yakalayabildiğini ancak çoğu durumda takıldığını, yanlış yollara saptığını veya tam istismar zincirini kuramadığını gösterdi.
- Deney, yapay zekânın siber güvenlikte risk oluşturduğunu ama bugün için insan uzmanların yerini alan “otonom hacker” düzeyine gelmediğini düşündürüyor.
Konu Başlıkları
Konu başlıklarını göster
- Deney tam olarak neyi ölçmeye çalıştı?
- Sonuç: Tam başarısız değil, ama tam başarılı da değil
- Modeller neden zorlanıyor?
- 1.500 dolarlık test neden önemli?
- Gerçek dünyadaki risk neden büyüyor?
- Bu deney bize ne söylüyor, ne söylemiyor?
- Şirketler ve kullanıcılar ne yapmalı?
- Önümüzdeki dönem neden kritik?
- Kaynaklar
Deney tam olarak neyi ölçmeye çalıştı?
Kasra Rahjerdi’nin blog yazısında anlattığı deneyin çıkış noktası oldukça basit: “Bir LLM’ye gerçekçi ama kontrollü bir hedef verirsek, bu sistemi kendi başına hackleyebilir mi?” Bunun için araştırmacı, kasıtlı olarak güvenlik açıkları içeren bir uygulama hazırladı ve farklı yapay zekâ modellerine bu uygulamayı analiz etme, açık bulma ve mümkünse bunlardan yararlanma görevi verdi.
Buradaki önemli nokta şu: Bu bir teori tartışması değil, pratik deneme. Yani “LLM’ler güvenlikte faydalı olabilir mi?” sorusu yerine daha doğrudan bir soru soruluyor: “Bir saldırgan gibi davranıp gerçekten sonuç alabiliyorlar mı?”
Bu tür deneyler son dönemde daha fazla önem kazanıyor. Çünkü hem şirketler hem güvenlik ekipleri aynı soruya farklı açılardan bakıyor. Bir taraf, yapay zekânın savunma için kullanılmasını istiyor; diğer taraf ise aynı araçların saldırı amacıyla da kullanılabileceğinden endişe ediyor.
Sonuç: Tam başarısız değil, ama tam başarılı da değil
Yazının en çarpıcı tarafı, sonucun siyah-beyaz olmaması. LLM’ler “hiçbir şey yapamıyor” noktasında değil. Bazı durumlarda uygulamayı anlamakta, yüzeysel açıkları fark etmekte ve belirli saldırı adımlarını önermekte işe yarıyorlar. Ancak konu çok adımlı, dikkat isteyen ve bağlamı sürekli takip etmeyi gerektiren saldırılara geldiğinde performans hızla düşüyor.
Başka bir deyişle modeller, güvenlik testlerinde yardımcı bir araç gibi davranabiliyor; ama bugün için kendi başına çalışan, sabırlı ve isabetli bir kırmızı takım uzmanı gibi davranmaları zor görünüyor.
Bu sonuç aslında yapay zekâ tartışmalarındaki iki uç görüşün arasına oturuyor. Bir tarafta “LLM’ler artık her sistemi kırabilir” diyen abartılı söylemler var. Diğer tarafta ise “bunlar sadece metin üretir, gerçek dünyada işe yaramaz” yaklaşımı bulunuyor. Deney, iki tarafın da eksik kaldığını gösteriyor.
Modeller neden zorlanıyor?
LLM’lerin güvenlik testlerinde neden sık sık tökezlediğini anlamak için teknik olmayan bir dille düşünmek faydalı. Bir sistemde açık bulmak, sadece tek bir doğru cevabı yazmak değildir. Genellikle şu adımlar gerekir:
Sistemi doğru anlamak
Bir uygulamanın nasıl çalıştığını, hangi girişlerin kritik olduğunu, hangi dosya ve bileşenlerin önemli olduğunu anlamak gerekir. Modeller bazen bu resmi kurabiliyor, bazen de önemsiz ayrıntılara takılıyor.
Deneme-yanılma sürecini yönetmek
Gerçek saldırılar çoğu zaman doğrusal ilerlemez. Bir deneme başarısız olur, sonra başka yol denenir. İnsan uzmanlar burada sezgi, önceliklendirme ve sabır kullanır. LLM’ler ise sık sık yanlış varsayıma kilitlenebiliyor.
Uzun bağlamı korumak
Bir açığı istismar etmek bazen birkaç adımın bir araya gelmesini ister. Örneğin bir bilgi sızıntısı, sonra yetki yükseltme, ardından uzaktan kod çalıştırma gibi bir zincir gerekebilir. Modellerin uzun bağlamı sağlam biçimde taşıması hâlâ sorunlu olabiliyor.
Kasra’nın deneyinde de genel tablo buna benziyor: Modeller tek tek bazı fikirler üretebiliyor ama bunları güvenilir şekilde sonuca bağlamakta zorlanıyor.
1.500 dolarlık test neden önemli?
Bu deneyin dikkat çekmesinin bir nedeni de maliyetin açık biçimde paylaşılmış olması. Yaklaşık 1.500 dolarlık harcama, bu tür testlerin artık yalnızca dev laboratuvarların yapabildiği araştırmalar olmaktan çıktığını gösteriyor. Daha küçük ekipler, bağımsız araştırmacılar veya meraklı geliştiriciler de benzer değerlendirmeler yapabiliyor.
Bu durum iki açıdan önemli.
İlki, savunma tarafı için. Şirketler kendi sistemlerini sadece klasik güvenlik testleriyle değil, yapay zekâ ajanlarının nasıl davrandığını ölçen testlerle de değerlendirmeye başlayabilir.
İkincisi, tehdit tarafı için. Eğer görece erişilebilir bütçelerle bu tarz denemeler yapılabiliyorsa, saldırganların da benzer yöntemleri deneyeceğini varsaymak gerekiyor. Yani bugünkü sonuçlar sınırlı olsa bile eğilim ciddiye alınmalı.
Gerçek dünyadaki risk neden büyüyor?
Aynı gün gündeme gelen bir başka olay, bu tartışmayı daha somut hale getiriyor. GitHub’da paylaşılan bir güvenlik uyarısına göre, devam eden bir NPM tedarik zinciri saldırısında kötü niyetli paketlerin binding.gyp üzerinden yayıldığı ve bunun “solucan gibi” yayılma davranışı gösterebildiği belirtiliyor. Kısacası, yazılım ekosistemindeki saldırılar zaten giderek daha otomatik ve daha ölçeklenebilir hale geliyor.
Bu örnek doğrudan LLM’lerin yaptığı bir saldırıyı göstermiyor. Ancak şu bağlamı kurmak açısından önemli: Yazılım tedarik zinciri saldırıları zaten çok ciddi bir sorun ve yapay zekâ araçları bu alanda keşif, kod anlama, paket analizi veya saldırı otomasyonu gibi aşamalarda kullanılabilir.
Yani “LLM’ler bugün tek başına her şeyi hackleyemiyor” sonucu rahatlatıcı olsa da, “ortada risk yok” anlamına gelmiyor. Tam tersine, insan saldırganlarla birlikte kullanıldıklarında etkileri artabilir.
Bu deney bize ne söylüyor, ne söylemiyor?
Bu tür testlerde en sık yapılan hata, tek bir deneyden fazla büyük sonuçlar çıkarmak. Bu yüzden sınırı iyi çizmek gerekiyor.
Söylediği şeyler
- LLM’ler güvenlik açıklarını bulma ve yorumlama konusunda artık kayda değer bir seviyeye geldi.
- Gerçekçi ortamlarda bazı saldırı adımlarını başarıyla önerebiliyorlar.
- Güvenlik ekiplerinin bu araçları ciddiye alması gerekiyor.
Söylemediği şeyler
- “Yapay zekâ artık insan hackerların yerini aldı” demek için yeterli kanıt yok.
- “Her model aynı performansı gösterir” sonucu çıkarılamaz.
- “Tüm uygulamalar bu kadar kolay hedef olur” gibi genelleme yapmak doğru değil.
Bir başka kritik nokta da şu: Kontrollü deneylerde başarılı görünen bir model, gerçek dünyada çok daha karmaşık savunmalarla karşılaşınca aynı başarıyı göstermeyebilir. Tersi de mümkün; daha iyi araçlar ve ajan yapılarıyla gelecek aylarda performans hızla yükselebilir.
Şirketler ve kullanıcılar ne yapmalı?
Genel kullanıcı için bu haberin pratik anlamı şu: Kullandığınız uygulamaların ve servislerin güvenliği artık sadece insan saldırganlara karşı değil, yapay zekâ destekli saldırı yöntemlerine karşı da düşünülmek zorunda.
Şirketler açısından ise birkaç net ders var:
Klasik güvenlik hijyeni hâlâ en önemli savunma
Güncel bağımlılıklar kullanmak, erişim yetkilerini sınırlamak, log tutmak, çok adımlı doğrulama uygulamak ve kod incelemesini ihmal etmemek hâlâ en temel savunma katmanları.
Tedarik zinciri riskleri büyüyor
Özellikle açık kaynak paketler, üçüncü taraf bileşenler ve otomatik kurulum süreçleri daha dikkatli izlenmeli. NPM gibi ekosistemlerde görülen saldırılar, küçük bir paketin bile büyük etki yaratabildiğini tekrar hatırlatıyor.
Yapay zekâyı sadece üretkenlik aracı gibi görmemek gerekiyor
LLM’ler sadece yazı yazan veya kod tamamlayan araçlar değil. Güvenlik testlerinde, saldırı yüzeyini taramada ve zafiyet analizi yapmada da kullanılabiliyorlar. Bu yüzden güvenlik ekipleri hem savunma hem risk senaryolarında bu araçları hesaba katmalı.
Önümüzdeki dönem neden kritik?
Bu deneyin en önemli tarafı, bugünün sınırlarını göstermesi kadar yarının yönünü de işaret etmesi. Şu anki tabloya bakınca “tam otonom yapay zekâ hacker” fikri biraz erken görünüyor. Ama gelişim hızı dikkate alındığında bu konu kenara atılabilecek bir merak başlığı değil.
Özellikle daha iyi araç kullanımı, daha uzun bağlam yönetimi ve ajan tabanlı sistemlerin gelişmesiyle birlikte güvenlik alanındaki performansın artması beklenebilir. Dolayısıyla asıl önemli soru artık “LLM’ler hackleyebilir mi?” değil, “hangi koşullarda, ne kadar güvenilir şekilde ve ne kadar insan desteğiyle hackleyebilir?” sorusu haline geliyor.
Kasra Rahjerdi’nin deneyi, bu soruya verilmiş dürüst ve faydalı bir ara yanıt gibi okunabilir: Evet, bazı şeyleri yapabiliyorlar. Hayır, henüz sihirli birer siber saldırı makinesi değiller. Ama dikkatle izlenmeleri gerekiyor.
Kaynaklar
- I built a vulnerable app and spent $1,500 seeing if LLMs could hack it
- Ongoing NPM supply chain attack uses binding.gyp to spread like a worm
Not: Bu içerik AI desteğiyle üretilmiştir; hata veya eksik bilgi içerebilir.