Kecerdasan buatan belum mampu menggantikan ahli matematika manusia, menurut hasil tantangan “Bukti Pertama” – sebuah tes ketat yang dirancang untuk menilai kemampuan model bahasa besar (LLM) untuk melakukan penelitian matematika asli. Dirilis pada Hari Valentine, tantangan ini menghadirkan sepuluh “lemma” (teorema minor) kompleks pada AI, tugas yang biasanya diberikan kepada mahasiswa pascasarjana berbakat. Hasilnya? Tidak ada LLM yang menyelesaikan sepuluh masalah secara mandiri.
Tantangan dan Tujuannya
Inisiatif First Proof, yang dipelopori oleh sebelas ahli matematika terkemuka, bertujuan untuk mendorong AI lebih dari sekedar memuntahkan teknik yang sudah ada. Masalah-masalah tersebut dirancang untuk menuntut orisinalitas asli, memaksa LLM untuk mensintesis solusi baru daripada sekadar mencampurkan solusi yang sudah dikenal. Tes ini menggarisbawahi kenyataan penting: meskipun AI unggul dalam pengenalan pola dan pemrosesan data, AI masih kesulitan dengan kreativitas dan pemikiran abstrak yang mendorong terobosan matematika.
Keterlibatan Tak Terduga dari Pengembang AI
Tantangan ini secara tak terduga menarik perhatian besar dari perusahaan AI seperti OpenAI, yang mengerahkan sumber daya besar untuk mengatasi masalah tersebut. Mohammed Abouzaid dari Universitas Stanford, salah satu anggota tim First Proof, menyatakan, “Kami tidak menyangka bahwa perusahaan AI akan menganggapnya serius dan mengerahkan banyak tenaga untuk hal ini.” Hal ini menyoroti meningkatnya persaingan dalam industri AI untuk mengembangkan model yang mampu melakukan penalaran matematis asli.
Hasil: Keyakinan Tidak Sama dengan Kebenaran
Tim Bukti Pertama mengungkapkan bahwa LLM dengan percaya diri menghasilkan bukti untuk semua sepuluh masalah, namun hanya dua yang diverifikasi sebagai benar. Salah satu bukti ini telah didokumentasikan, dan bukti lainnya sebagian berasal dari sketsa yang diarsipkan oleh seorang ahli matematika terkenal. Selain itu, banyak solusi yang diajukan terbukti meyakinkan namun pada akhirnya memiliki kelemahan, sehingga menggarisbawahi sulitnya membedakan antara wawasan asli dan masuk akal yang dihasilkan oleh AI.
Sekilas tentang “Gaya” Matematika AI
Menariknya, solusi tepat yang dihasilkan oleh AI menunjukkan pendekatan matematika khas abad ke-19, menurut Abouzaid. Hal ini menunjukkan bahwa meskipun AI dapat meniru metode yang sudah ada, AI belum berevolusi menuju teknik mutakhir yang mendefinisikan matematika modern.
Masa Depan AI dalam Matematika
Eksperimen Bukti Pertama bukan hanya tentang kegagalan. Ini adalah kesempatan belajar. Tim tersebut merencanakan putaran kedua dengan kontrol yang lebih ketat, yang menunjukkan komitmen untuk menyempurnakan metodologi dan mendorong AI lebih jauh. Meskipun terdapat keterbatasan saat ini, kemajuan pesat dalam kemampuan LLM menunjukkan bahwa AI akan terus memainkan peran yang semakin besar dalam penelitian matematika. Beberapa ahli matematika percaya bahwa alat yang dibantu AI sudah siap untuk mengubah bidang ini, seperti yang dicatat oleh Scott Armstrong dari Universitas Sorbonne: “Alat ini akan mengubah matematika, dan hal ini sedang terjadi sekarang.”
Tantangan Pembuktian Pertama memperkuat poin penting: meskipun AI dapat mempercepat aspek-aspek tertentu dari pekerjaan matematika, AI belum mencapai penalaran independen dan kreatif yang diperlukan untuk menggantikan manusia matematikawan.
