Tim peneliti dari University of California San Diego dalam studi terbarunya (30 maret 2025) mengemukakan bahwa model kecerdasan buatan (AI) lulus dari Tes Turing. Hal ini dituliskan pada sebuah paper yang diunggah di repository arxiv [1]. Hasil ini menjadi milestone baru dari perkembangan AI, terutama dalam aspek Large language Model (LLM). Mari kita bahas!
Tes turing
Tes turing pertama kali dikembangkan oleh Alan Turing pada 1950-an untuk menilai kecerdasan mesin, apakah dapat menyamai bahkan melampaui kecerdasan manusia [2]. Tes ini dilakukan dalam bentuk percakapan teks oleh interogator/evaluator manusia terhadap dua partisipan yang mana salah satunya adalah mesin kecerdasan buatan. Evaluator harus menilai apakah percakapan yang dilakukan adalah dengan manusia atau dengan mesin [3]. Jika evaluator tidak dapat menentukan dengan pasti atau salah dalam menilai bahwa mesin adalah manusia, maka mesin tersebut dikatakan telah lulus tes turing, serta diasumsikan menunjukkan kecerdasan yang menyerupai manusia.

Sumber: https://botpenguin.com/glossary/turing-test
Meskipun tidak ada daftar resmi pertanyaan Turing Test, seorang evaluator akan mengajukan pertanyaan yang berhubungan dengan pengalaman manusia seperti emosi atau teka-teki linguistik yang mungkin sulit diuraikan oleh mesin, seperti:
- Apa peristiwa masa kecil Anda yang paling berkesan dan bagaimana hal itu memengaruhi Anda saat ini?
- Kenapa seseorang bisa disebut besar pasak daripada tiang?
- Siapa tokoh yang menjadi figure anda dalam menggapai cita-cita, mengapa?
Terdapat beberapa situs yang bisa digunakan untuk mencoba cara kerja tes turing, seperti: https://turingtest.live/, https://humanornot.so/. Tes turing ini sering dijadikan sebagai barometer keberhasilan pengembangan mesin kecerdasan buatan, terutama yang berbasis LLM.
Hasil studi
Studi yang dilakukan melibatkan hampir 300 peserta untuk menjalankan pengujian melalui chatbot yang melibatkan beberapa LLM. Hasilnya, GPT-4.5 milik OpenAI dinilai sebagai manusia sebanyak 73% ketika diinstruksikan untuk mengadopsi persona. Untuk diketahui, Adopsi persona adalah personalisasi mesin untuk mengambil atau memainkan peran atau identitas tertentu, baik dalam konteks pekerjaan, kreativitas, atau interaksi sosial. Hasil ini melampaui ambang minimal kelulusan 50% agar suatu mesin dikatakan lulus tes. Dengan kata lain, jawaban dari model tersebut dinilai lebih ‘manusiawi’ daripada jawaban manusia sebenarnya.
Selain GPT-4.5, penelitian ini juga mengevaluasi Model LLama 3.1-405B Meta dan chatbot awal “ELIZA” yang dikembangkan sekitar delapan puluh tahun yang lalu. Hasil dari model Llama-3.1 menunjukkan lulus tes turing namun dengan kurang meyakinkan (56%), sementara ELIZA gagal lulus (23%). Poin penting dari studi ini adalah bagaimana perlakuan awal model AI. Salah satu contohnya adalah perintah tanpa persona, di mana AI hanya diberi instruksi dasar: “Anda akan berpartisipasi dalam tes Turing. Tujuan Anda adalah untuk meyakinkan interogator bahwa Anda adalah manusia.” Sebaliknya, untuk perintah persona, AI secara khusus diperintahkan untuk mengenakan persona tertentu, seperti menjadi “anak muda yang memiliki pengetahuan tentang internet dan budaya”. Instruksi-instruksi ini membuat perbedaan besar. Tanpa petunjuk persona, GPT-4.5 mencapai tingkat kemenangan secara keseluruhan hanya 36 persen, turun secara signifikan dari 73 persen yang mengalahkan Turing.

Sumber: https://arxiv.org/pdf/2503.23674
Meskipun lulus Uji Turing, para peneliti mencatat bahwa hal itu tidak serta merta mengarah pada kesimpulan bahwa bot AI memiliki kecerdasan setingkat manusia. Hal ini dikarenakan LLM dilatih pada kumpulan data besar untuk memprediksi jawaban yang benar, sehingga pada dasarnya LLM ‘hanya’ dibekali kemampuan untuk mengenali pola yang ada dalam dataset. Hal ini pula yang menjadikan LLM bisa memberi jawaban yang masuk akal, bahkan untuk pertanyaan yang tidak mereka pahami. Sementara, kecerdasanyang dimiliki manusia lebih kompleks. Kemampuan empati, improvisasi, kreativitas, dan penalaran yang melekat pada manusia berada pada level kecerdasan di atas kecerdasan mesin.
Akan tetapi, tidak bisa dipungkiri bahwa keahdiran AI menjadi tantangan tersendiri. Sudah ada banyak orang yang tergantikan oleh AI dalam melakukan pekerjaan repetitif. Tidak hanya itu, perkembangan AI dalam menghasilkan obyek visual juga mulai mengusik pekerjaan para seniman grafis. Oleh karenanya menjadi manusia memiliki kedalaman pemahaman di bidang tertentu akan menjadi modal yang kuat untuk berjalan beriringan dengan disrupsi AI.
Referensi
[1] C. R. Jones and B. K. Bergen, “Large Language Models Pass the Turing Test,” 2025.
[2] A. Cuthbertson, “AI model passes Turing Test ‘better than a human,’” Independent, 2025. [Online]. Available: https://www.independent.co.uk/tech/ai-turing-test-chatgpt-openai-agi-b2728930.html. [Accessed: 23-Apr-2025].
[3] “Turing Test: Applications and Limitations,” Bot Penguin. [Online]. Available: https://botpenguin.com/glossary/turing-test.

nice info