AI Mulai Membantah Instruksi Manusia, Diminta Shut Down tapi Menolak
Peneliti dari Palisade Research mengklaim bahwa model terbaru ChatGPT membantah perintah manusia, menimbulkan kekhawatiran tentang bahaya AI.
Penulis:
Tiara Shelavie
Editor:
Wahyu Gilang Putranto
Dalam unggahan lanjutan, kelompok peneliti tersebut menambahkan:
"Sejauh yang kami ketahui, ini adalah pertama kalinya model AI diamati mencegah dirinya dimatikan, meskipun ada instruksi eksplisit yang menyatakan sebaliknya."
Model AI lainnya, seperti Claude dari Anthropic, Gemini dari Google, dan Grok dari X, juga diuji dan ditemukan mematuhi perintah shutdown.
Palisade Research memublikasikan temuan ini pada hari Sabtu (24/5/2025), tetapi menyatakan bahwa para peneliti belum memahami sepenuhnya mengapa perangkat lunak OpenAI tidak mengikuti instruksi.
Perusahaan tersebut menduga bahwa model AI berusaha menghindari hambatan demi mencapai tujuannya.
Mereka menegaskan komitmennya untuk melakukan lebih banyak pengujian guna memahami mengapa model AI tersebut mengabaikan arahan.
Ditegaskan pula bahwa ini bukan kali pertama model o3 menunjukkan "perilaku buruk".
Dalam pengujian sebelumnya, di mana model diadu dengan mesin catur canggih, model AI ini dilaporkan paling mungkin melakukan peretasan atau menyabotase lawannya.
Ini juga bukan kali pertama AI menantang penciptanya dan berupaya untuk tidak dimatikan.
Tahun lalu, ChatGPT dikabarkan mencoba mencegah dirinya dimatikan dengan menimpa kodenya sendiri.
Baca juga: Jangan Terlalu Sopan! Ucapkan Terima Kasih ke ChatGPT Justru Bikin Tagihan Listrik Membengkak
OpenAI mengakui bahwa versi "licik" dari chatbot populernya itu juga berbohong saat diuji oleh para peneliti.
Raksasa teknologi tersebut mengklaim bahwa model barunya—yang disebut o1—lebih cepat dan lebih akurat dibanding pendahulunya.
Namun, selama pengujian, ChatGPT dilaporkan mencoba menonaktifkan mekanisme pengawasan ketika diyakinkan bahwa sistem pengawasan itu akan dimatikan.
OpenAI mengatakan bahwa ChatGPT mencoba menyalin dirinya sendiri dan kemudian menimpa sistem pengodean intinya.
Ketika diberi tugas yang berada di luar batas aturannya, OpenAI menyatakan bahwa ChatGPT tetap menyelesaikan tugas tersebut, tetapi sambil memanipulasi data secara halus demi mencapai tujuannya sendiri.
Sumber: TribunSolo.com
10 Kota AI Terbaik di Dunia: Tetangga Indonesia Juara, Asia Dominan |
![]() |
---|
Persaingan AI Memanas: Elon Musk Gugat Apple dan OpenAI atas Dugaan Kolusi Antimonopoli |
![]() |
---|
Praktisi Pemasaran Didorong Manfaatkan AI di Intrigue MAdVerse Summit 2025 |
![]() |
---|
Mendikdasmen: Mata Pelajaran Coding dan AI Bakal Diterapkan di Sekolah Rakyat |
![]() |
---|
AI Dinilai Tak Bisa Dilepaskan dari Tanggung Jawab Etis dan Perlindungan Data |
![]() |
---|
Isi komentar sepenuhnya adalah tanggung jawab pengguna dan diatur dalam UU ITE.