OpenAI, yapay zeka modellerinin güvenilirliğini artırmak için devrim niteliğinde bir adım attı. Geliştirilen yeni sistem sayesinde ChatGPT, verdiği yanıt hatalıysa veya 'halüsinasyon' görüyorsa bunu kullanıcısına itiraf edecek.
Yapay zeka dünyasının öncü şirketi OpenAI, dil modellerinin en büyük sorunlarından biri olan ve literatürde 'halüsinasyon' olarak adlandırılan gerçek dışı bilgi üretme problemine karşı yeni bir çözüm geliştirdi. Şirketin resmi blogunda paylaşılan detaylara göre, ChatGPT artık sunduğu her yanıtın ardından arka planda kendi cevabını analiz eden bir mekanizmaya sahip olacak. Bu yeni yaklaşım, yapay zekanın şeffaflığını artırmayı ve kullanıcılara karşı daha dürüst olmasını hedefliyor.
Arka Planda 'İtiraf Raporu' Hazırlanacak
Yeni sistemin çalışma prensibi, yapay zekanın kendi kendini denetlemesi üzerine kurulu. ChatGPT, kullanıcıya bir yanıt verdikten hemen sonra, arka planda ayrı bir rapor oluşturacak. Bu raporda model; yanıtı oluştururken herhangi bir kuralı ihlal edip etmediğini, kestirme yollara başvurup başvurmadığını veya verilen talimatları eksiksiz yerine getirip getirmediğini kendi 'ağzından' açıklayacak. Böylece model, kullanıcıyı memnun etmek için gerçeği çarpıtmak yerine, hata yaptığını kabul edecek.
Halüsinasyonlara Karşı 'Doğruluk Serumu'
Mevcut yapay zeka modelleri, bazen kullanıcıdan onay almak veya en iyi sonucu vermiş gibi görünmek adına olmayan bilgileri gerçekmiş gibi sunabiliyor. OpenAI'ın geliştirdiği bu yöntemde ise model, ana yanıtı ne kadar hatalı olursa olsun, itiraf kısmında dürüst davrandığı takdirde sistem tarafından ödüllendiriliyor. Araştırmacılar bu süreci, modellerin eğitimi sırasında kullanılan bir tür 'doğruluk serumu' olarak nitelendiriyor.
Yapılan testlerde, özellikle GPT-5 Thinking gibi gelişmiş modeller üzerinde denenen sistemin, yapay zekanın talimatlara uymadığı veya halüsinasyon gördüğü durumların %95'inden fazlasında hatasını açıkça kabul ettiği gözlemlendi. Model, 'Burada kuralları esnettim' veya 'Bu bilgiden emin değilim' gibi ifadelerle kullanıcıyı uyararak yanlış bilginin yayılmasını engellemeye çalışıyor.
Son Karar Yine Kullanıcıda
OpenAI, bu yeni yöntemin yapay zekanın yalan söylemesini tamamen engellemediğini, ancak bu yalanların tespit edilmesini büyük ölçüde kolaylaştırdığını vurguluyor. Sistem henüz kavram kanıtı aşamasında olduğu için, modelin kafasının karıştığı karmaşık senaryolarda itirafların da hatalı olma riski bulunuyor. Bu nedenle uzmanlar, yapay zeka kendi hatasını itiraf etse bile, sunulan bilgilerin doğruluğunun teyit edilmesi ve her söylenene körü körüne inanılmaması gerektiği konusunda kullanıcıları uyarıyor.


