Model Baru Claude Lebih ‘Jujur’ Saat Mengalami Kesalahan

Admin Akasta

2 bulan ago

berita.akasta.ac.id – Anthropic akan meluncurkan Claude Opus 4.8 pada hari Kamis, menekankan aspek “kejujuran” dari model tersebut. Menurut perusahaan, semua model yang mereka kembangkan dilatih untuk menjadi jujur, termasuk dalam menghindari klaim yang tidak dapat mereka dukung. Namun, mereka mengakui bahwa masalah umum yang dihadapi model AI adalah kecenderungan untuk menyimpulkan dengan cepat, terkadang mengklaim kemajuan meskipun bukti yang ada masih minim.

Laboratorium AI ini mengungkapkan bahwa pengujian awal menunjukkan Opus 4.8 memiliki kecenderungan yang lebih besar untuk menyampaikan ketidakpastian dalam hasil kerjanya dan lebih jarang membuat klaim yang tidak berdasar. Dalam evaluasi perusahaan, model ini dilaporkan sekitar empat kali lebih kecil kemungkinannya dibanding pendahulunya untuk melewatkan cacat dalam kode yang ditulisnya tanpa memberi perhatian.

Selain perbaikan dalam kejujuran, dengan peluncuran Opus 4.8, pengguna dapat mengatur jumlah usaha yang dikeluarkan oleh Claude dalam menyelesaikan suatu tugas. Respons yang lebih berusaha akan menggunakan lebih banyak token, memberikan opsi bagi pengguna untuk memilih respons dengan usaha lebih rendah jika mereka ingin menghemat penggunaan batasan yang dimiliki.

Anthropic juga memperkenalkan fitur baru bernama “dynamic workflows” dalam versi uji coba penelitian. Fitur ini memungkinkan Claude untuk mengerjakan tugas yang lebih besar dengan merencanakan pekerjaan dan menjalankan ratusan subagen secara paralel dalam satu sesi. Dengan Opus 4.8, agen-agen tersebut dapat beroperasi lebih lama, dan Claude akan memverifikasi outputnya sebelum melaporkan hasil kepada pengguna.