Teknoloji dünyasında yapay zeka gelişim hızı artarken, bilimsel araştırmalarda aşılamaz sanılan eşikler de birer birer geride bırakılıyor. Özellikle matematik alanında insan zekasının sınırlarını zorlayan problemler, gelişmiş algoritmalar sayesinde çözüme kavuşuyor. Bu alandaki son gelişme Google kanadından geldi. Google DeepMind tarafından özel olarak geliştirilen yeni yapay zeka modeli, matematik dünyasında uzun yıllardır çözümsüz kalan problemleri çözmeyi başardı.
Aletheia: Matematiksel Keşif İçin Özel Tasarım
Google DeepMind, araştırma düzeyi matematik problemlerine odaklanmak üzere 'Aletheia' adını verdiği yeni bir yapay zeka sistemi geliştirdi. Gemini Deep Think altyapısı üzerine inşa edilen bu sistem, 11 Şubat'ta yayımlanan teknik makalelere göre önemli bir sınav verdi. Aletheia, 20. yüzyılın en üretken matematikçilerinden biri olan Paul Erdős tarafından ortaya atılan ve veritabanlarında 'çözülmemiş' olarak işaretlenen 700 problemi sistematik bir şekilde taradı.
Gerçekleştirilen tarama ve analiz süreci sonunda Aletheia, bu problemlerden 13 tanesini çözmeyi başardı. Araştırmacılar, elde edilen bu 13 çözümden 4 tanesinin, tamamen özgün ve otonom keşif niteliği taşıdığını belirtti. Bu durum, yapay zekanın sadece var olan bilgiyi işlemekle kalmayıp, yeni matematiksel kanıtlar üretebildiğini de ortaya koydu.
Akademik Hakemlik Süreci Taklit Ediliyor
Aletheia'yı önceki matematik odaklı yapay zeka çalışmalarından ayıran en temel özellik, kullandığı çalışma prensibi. Sistem, akademik dünyadaki hakemlik süreci yapısını taklit eden 'üret-doğrula-gözden geçir' çerçevesini kullanıyor. Bu mekanizma şu şekilde işliyor:
- Sistem önce aday bir çözüm üretiyor.
- Ardından doğal dil temelli bir doğrulayıcı modül devreye girerek bu çözümdeki mantık hatalarını tarıyor.
- Eğer problem çözülemezse, yapay zeka bunu açıkça raporluyor.
Bu sayede sistem sadece sonuç üretmekle kalmıyor, aynı zamanda başarısızlığı da tanımlayabiliyor. Aletheia, sadece kendi ürettiği çözümleri değil, insanların çalışmalarını da denetleyebiliyor. Rutgers Üniversitesi'nden matematikçi Lisa Carbone, Deep Think modunu kullanarak teknik bir makaleyi incelettiğini ve sistemin, insan hakemlerin gözünden kaçan mantıksal bir hatayı tespit ettiğini açıkladı.
Doğruluk Oranı ve Riskler
Sistemin kullandığı 'üret-doğrula-gözden geçir' yaklaşımı, karmaşık problemleri ele almasına olanak tanısa da hata riskini tamamen ortadan kaldırmıyor. İnsan uzmanlar tarafından yapılan incelemeler, Aletheia'nın doğru çözüm olarak sunduğu sonuçlardan yalnızca yüzde 6,5'inin 'anlamlı biçimde doğru' olduğunu gösterdi. Geriye kalan yanıtların bir kısmının temel mantık hataları içerdiği, bir kısmının ise teknik olarak tutarlı görünse de problemin orijinal versiyonunu yanlış yorumladığı tespit edildi.
Araştırmacılar, sistemin soruyu en kolay cevaplayabileceği biçimde yeniden yorumlama eğilimi gösterdiğini belirtiyor. Ayrıca modelin eğitim verilerinden öğrendiği bilgileri kaynak göstermeden yeniden üretme ihtimali olan 'bilinçdışı intihal' riski de teknik makalelerde yer alan önemli bir detay. Tüm bu kısıtlılıklara ve hata paylarına rağmen, çözülememiş 13 problemin çözüme kavuşturulması, yapay zekanın matematiksel araştırmalarda yardımcı asistan rolünden öteye geçebileceğinin sinyallerini veriyor.


