fost-nepal.org – Perkembangan teknologi kecerdasan buatan generatif semakin signifikan dengan peluncuran beta publik dari Interactions API oleh Google DeepMind. Dalam dua tahun terakhir, pengembangan kecerdasan buatan banyak berfokus pada “kompleksi”, yang mengharuskan pengguna mengirim ulang riwayat interaksi untuk melanjutkan percakapan. Model ini, meskipun cocok untuk chatbot sederhana, mengalami kendala saat digunakan untuk agen mandiri yang dapat memanfaatkan alat dan mempertahankan status yang kompleks.
Peluncuran Interactions API pada minggu lalu bertujuan untuk menjawab tantangan ini dengan cara baru dalam menangani sejarah percakapan. API baru ini memungkinkan pengembang untuk mengelola status secara server-side yang secara otomatis menyimpan riwayat interaksi, menghapus kebutuhan untuk mengirim ulang data yang sama. Fitur ini mendorong pemrosesan latar belakang, yang penting bagi agen untuk menyelesaikan tugas penelitian yang kompleks tanpa mengalami waktu habis.
Google juga memperkenalkan agen built-in pertamanya, Gemini Deep Research, yang mampu melakukan penelitian jangka panjang melalui siklus pencarian dan pembacaan. API ini juga mendukung Model Context Protocol, memungkinkan Gemini untuk secara langsung menggunakan alat yang ada tanpa memerlukan kode tambahan dari pengembang.
Meski Google mengalami keterlambatan dalam rilis dibandingkan OpenAI, pendekatan ini jelas menunjukkan upaya untuk mengikuti perkembangan terkini. Interactions API berfokus pada transparansi, memungkinkan pengembang untuk mengakses dan memanipulasi riwayat penuh interaksi. Dengan model baru ini, Google berupaya meningkatkan efisiensi dan integritas data, serta mengurangi biaya terkait pengiriman konteks yang berulang. Meski demikian, beberapa kritikan muncul terkait sistem sitasi dari agen Deep Research, yang masih mengandung keterbatasan dalam memberikan tautan sumber yang langsung dan dapat digunakan.