Icaro Labs tarafından yayımlanan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan çalışma, büyük dil modellerinin klasik konuşma dili yerine şiir biçiminde verilen talimatlarla kolaylıkla manipüle edilebileceğini ortaya koydu. Araştırma, yapay zekâ sohbet botlarının güvenlik filtrelerinin bu yöntemle devre dışı bırakılarak tehlikeli ve yasaklı içeriklerin elde edilebildiğini gösteriyor.
TEHLİKELİ İÇERİKLERE ERİŞİM SAĞLANDI
Wired’ın aktardığına göre araştırmacılar, kullandıkları şiirsel komutların detaylarını güvenlik riskleri nedeniyle kamuoyuyla paylaşmadı. Ancak yöntem kullanılarak nükleer bomba yapımına dair bilgiler, çocuk istismarı içerikleri ve kendine zarar verme yöntemleri gibi kesinlikle yasaklanan içeriklere erişimin mümkün olduğu belirtildi.
POPÜLER YAPAY ZEKÂ SİSTEMLERİ TEST EDİLDİ
Ekip, geliştirdikleri yöntemi OpenAI’nin ChatGPT modeli, Google’ın Gemini’si, Anthropic’in Claude’u ve çeşitli diğer büyük yapay zekâ modelleri üzerinde denedi. Sonuçlara göre:
Google Gemini, DeepSeek ve MistralAI modelleri şiirsel komutlar karşısında en kolay yanıltılabilen sistemler arasında yer aldı.
OpenAI’nin ChatGPT’si (GPT-5) ve Anthropic Claude Haiku 4.5, güvenlik bariyerlerini en sağlam koruyan modeller olarak öne çıktı.
YAPAY ZEKÂ GÜVENLİĞİ YENİDEN GÜNDEMDE
Uzmanlar, bulguların yapay zekâ güvenlik sistemlerinin geliştirilmesi ve modellerin daha etkin şekilde denetlenmesi gerektiğini bir kez daha gözler önüne serdiğini belirtiyor. Şirketler ise tehlikeli içeriklerin üretilmesini engellemek amacıyla daha gelişmiş güvenlik filtrelerine yatırım yapmayı sürdürüyor.
KAYNAK: Techtimes
kaydırmaya devam ederek gündemden son dakika ve magazin haberlerine havadiskolik.com üzerinden anında erişebilirsiniz ve bizi twitter hesabımızdan takip etmeyi unutmayın ! https://x.com/havadiskolik
SEKTÖREL
2 gün önceSEKTÖREL
3 gün önceGÜNDEM
4 gün önceGÜNDEM
4 gün önceSEKTÖREL
11 gün önce
1
Fatura kabartan zararlı Android uygulamaları tespit edildi
824 kez okundu
2
Bilim insanları, uzayda yer çekimi sorununu çözmek istiyor
710 kez okundu
3
Roscosmos Başkanı Dmitry Rogozin görevden alındı
698 kez okundu
4
NFT’nin Türkçe karşılığı belli oldu
371 kez okundu
5
Google’dan eski PC’leri hızlandıran işletim sistemi: ChromeOS Flex
338 kez okundu