Site icon fost-nepal

EAGLET Tingkatkan Kinerja AI untuk Tugas Jangka Panjang

[original_title]

fost-nepal.org – EAGLET, sebuah kerangka akademis baru yang dikembangkan oleh peneliti dari Tsinghua University dan Peking University, menawarkan solusi untuk meningkatkan kemampuan agen kecerdasan buatan dalam menyelesaikan tugas-tugas kompleks yang membutuhkan langkah panjang. Menurut CEO Nvidia, Jensen Huang, tahun 2025 diprediksi sebagai tahun “agen AI”, di mana banyak penyedia model AI terkemuka, termasuk OpenAI dan Google, telah merilis aplikasi yang dirancang untuk menyelesaikan tugas-tugas tertentu.

Namun, tantangan utama yang dihadapi adalah bagaimana membuat agen AI tetap fokus ketika tugas-tugas tersebut melibatkan beberapa langkah dan waktu yang lama. Penelitian menunjukkan bahwa model AI mengalami tingkat kesalahan yang lebih tinggi seiring dengan jumlah langkah yang diperlukan untuk menyelesaikan sebuah tugas. EAGLET dirancang untuk menghadapi permasalahan ini dengan memperkenalkan modul perencanaan global yang bekerja tanpa perlu pelabelan data manual.

EAGLET memanfaatkan model bahasa yang disempurnakan untuk memahami instruksi tugas dan menciptakan rencana tingkat tinggi. Proses perencanaan ini tidak terhambat oleh kesalahan dalam pelaksanaan, yang sering terjadi pada model sebelumnya. Dengan menggunakan metode pelatihan dua tahap, EAGLET dapat merampingkan pelatihan agen tanpa memerlukan anotasi manusia.

Hasil pengujian menunjukkan bahwa agen yang menggunakan EAGLET mengalami peningkatan signifikan dalam kemampuan penyelesaian tugas dibandingkan dengan agen yang tidak menggunakan perencanaan. Di berbagai benchmark, EAGLET meningkatkan kinerja agen, bahkan pada model-model canggih seperti GPT-4.1 dan GPT-5.

Namun, tidak ada kode publik yang tersedia untuk EAGLET saat ini, dan masih ada pertanyaan mengenai penerapannya dalam lingkungan komersial. Meskipun diklaim plug-and-play, integrasi dalam kerangka kerja populernya masih memerlukan klarifikasi lebih lanjut. EAGLET menawarkan potensi besar untuk meningkatkan efisiensi dan keandalan dalam penerapan AI bisnis, terutama dalam sektor yang memerlukan perencanaan bertahap.

Exit mobile version