Yapay zekâ en zor matematik sınavından nasıl sonuç aldı? “First Proof” sonuçları tartışma yarattı

11 üst düzey matematikçi, yapay zekâya bir haftada çözmesi için 10 özgün lemma verdi. OpenAI dahil birçok ekip denedi. İşte “First Proof” meydan okumasının dikkat çeken ayrıntıları.

Matematikçilerin Büyük Dil Modelleri Üzerinden Matematiksel Araştırmaları Değerlendirmesi

Seçkin bir grup matematikçi tarafından başlatılan “First Proof” adlı meydan okumanın sonuçları, büyük dil modellerinin matematiksel araştırmalar yapma kabiliyetini ölçmek adına oldukça aydınlatıcı oldu. Yarışmada yer alan 10 problem arasından hangilerinin insan yardımı olmadan çözüldüğü henüz netlik kazanmış değil. Ancak ortada önemli bir gerçek var: Hiçbir büyük dil modeli tüm soruları çözmeyi başaramadı.

First Proof ekibi, yapay zekâların matematikte daha büyük başarılara ulaşabilmesi için 10 önemli “lemma” sundu. Bu lemma’lar, sadece standart tekniklerle değil, aynı zamanda özgünlük gerektiren sorunları da içeriyordu. Bu meydan okuma, yapay zekânın ve insan katkısının matematikte ne şekilde bir araya geldiğini göstererek, matematik camiasında büyük ilgi uyandırdı.

Sonuçlar incelendiğinde, yapay zekâların ürettiği ispatların çoğunun hatalı olduğu görülüyor. Ancak bu süreç, yapay zekâ gelişimine dair önemli bir adım olarak kabul ediliyor. İnsanların ve yapay zekânın birlikte çalıştığı noktada kimin ne kadar katkı sağladığının belirlenmesi önümüzdeki süreçlerde daha da zorlaşacak gibi görünüyor.