Mesin Tes Ujian Matematika AI Baru pada Masalah yang Belum Terpecahkan

21
Mesin Tes Ujian Matematika AI Baru pada Masalah yang Belum Terpecahkan

Ahli matematika terkemuka telah meluncurkan “Bukti Pertama”, sebuah tantangan unik yang dirancang untuk menguji secara ketat kemampuan matematika dari kecerdasan buatan. Ujian ini menyajikan sistem AI dengan masalah aktual yang belum terpecahkan yang diambil langsung dari penelitian saat ini, sehingga sistem tersebut diberi waktu satu minggu untuk menemukan solusinya. Hal ini menandai langkah signifikan melampaui pengujian yang sudah ada, yang sering kali mengandalkan kumpulan data yang sudah ada atau masalah persaingan.

Masalah pada Tes Matematika AI Saat Ini

Upaya sebelumnya untuk mengukur kecakapan matematika AI telah mengalami kegagalan. Meskipun model seperti Gemini Deep Think dari Google telah mencapai nilai tinggi di Olimpiade Matematika Internasional, tes ini menggunakan soal standar yang tidak mencerminkan penelitian sebenarnya. Selain itu, beberapa “solusi” yang dihasilkan oleh AI ternyata merupakan penemuan kembali bukti-bukti yang tidak jelas dan telah diterbitkan sebelumnya—yang pada dasarnya merupakan penelusuran literatur canggih yang menyamar sebagai karya asli. Seperti yang dicatat oleh profesor Yale Daniel Spielman, banyak laporan terobosan datang dari perusahaan yang mengembangkan AI sendiri, sehingga menimbulkan pertanyaan tentang objektivitas.

Bukti Pertama: Eksperimen Terkendali

Inisiatif Bukti Pertama bertujuan untuk memperbaiki masalah ini. Sebelas ahli matematika terkemuka, termasuk pemenang Fields Medal, menciptakan masalah orisinal yang belum pernah muncul dalam data pelatihan AI mana pun. Solusinya dienkripsi dan akan diumumkan pada 13 Februari untuk memastikan pengujian yang adil.

Soal-soal tersebut tidak dirancang untuk menjadi teorema yang inovatif, melainkan “lemma”—langkah-langkah kecil dan penting dalam pembuktian yang lebih besar. Ini adalah jenis penghitungan yang membosankan namun krusial dan menyita waktu para ahli matematika. Penyelesaiannya akan menunjukkan potensi AI untuk mempercepat penelitian dengan mengotomatiskan tugas-tugas dasar ini.

Mengapa Ini Penting: Masa Depan AI dalam Matematika

Fokus pada kegunaan praktis dibandingkan hasil yang mencolok adalah kuncinya. Ahli matematika Andrew Sutherland berpendapat bahwa dampak jangka pendek AI tidak akan terasa pada penyelesaian permasalahan besar yang belum terpecahkan, namun menjadi alat yang sangat diperlukan bagi para ahli matematika. Jika AI dapat dengan andal menangani “pekerjaan kasar” pembuktian teorema, hal ini dapat memberikan kebebasan bagi para peneliti untuk fokus pada tugas-tugas yang lebih kreatif dan konseptual.

“Ini mungkin tahun dimana lebih banyak orang mulai menaruh perhatian”
-Andrew Sutherland, MIT

Bukti Pertama bukan sekadar ujian; ini adalah tolok ukur masa depan matematika yang dibantu AI, dengan potensi untuk mengubah cara penelitian dilakukan.