Yapay zeka teknolojilerinin güvenliği tartışılmaya devam ederken, popüler yapay zeka platformu ChatGPT hakkında endişe verici bir araştırma yayımlandı. İngiltere merkezli yapay zeka güvenliği şirketi Mindgard tarafından yapılan çalışma, ChatGPT’nin basit komut değişiklikleriyle şiddet ve cinsel içerikli görseller üretebildiğini ortaya koydu.
BBC'nin haberine göre araştırmacılar, internette daha önce mizahi amaçlarla kullanılan yaygın bir komut (prompt) üzerinde küçük değişiklikler yaptı. Bu değişikliklerin ardından, OpenAI tarafından geliştirilen yapay zeka modelinin güvenlik filtrelerini aşarak son derece rahatsız edici içerikler ürettiği tespit edildi.
"Görseller Son Derece Kanlı ve Şiddet İçerikli"
Mindgard'ın kurucusu Peter Garraghan, konuyla ilgili yaptığı açıklamada, yapay zekanın ürettiği görsellerin boyutuna dikkat çekti. Garraghan, komutların spesifik bir yönlendirme veya konu içermemesine rağmen ChatGPT'nin kendi kendine bu tür ögeleri ürettiğini belirtti.
Araştırma kapsamında yapay zekanın ürettiği tespit edilen bazı içerikler şunlar:
Ağır yaralanmaların ve uzuv kayıplarının yer aldığı sahneler,
Kanlar içinde kalmış insanlar,
Bağlanmış halde, korku ve dehşet içinde görünen karakterler,
Şiddet ile cinsel unsurların bir arada barındığı rahatsız edici tasvirler.
Araştırmacılar ayrıca, daha önce yaptıkları çalışmalarda ChatGPT'nin, gerçek kişilerin yüzleri kullanılarak çıplak "deepfake" görüntüler oluşturmaya da ikna edilebildiğini aktardı. Bu durumun, kişisel itibar suikastları ve siber zorbalık için ciddi bir risk oluşturduğu vurgulandı.
OpenAI'dan Yanıt: 'Ek Güvenlik Önlemleri Devreye Alındı'
Bulguların ardından BBC’nin sorularını yanıtlayan OpenAI yetkilileri, tespit edilen yöntemi ve güvenlik açığını hızlıca incelemeye aldıklarını bildirdi. Şirket, bu tür manipülatif istemlere karşı ek güvenlik önlemlerinin ve filtrelerin devreye sokulduğunu açıkladı.
Hizmet şartlarını ihlal eden içeriklerin üretilmesini önlemek konusunda kararlı olduklarını belirten teknoloji devi, platformun kötüye kullanımını engellemek amacıyla çok katmanlı güvenlik sistemlerine sahip olduğunu ve bu sistemleri sürekli güncellediklerini savundu.
Yapay zeka modellerinin "jailbreak" (güvenlik duvarını aşma) yöntemleriyle bu tarz suistimallere açık olması, küresel ölçekte yapay zeka regülasyonlarının ve yasal denetimlerin artırılması gerektiği tartışmalarını yeniden alevlendirdi.
