fost-nepal.org – Saat ini, banyak perusahaan telah mulai menerapkan sistem RAG (Retrieval-Augmented Generation) untuk mempermudah akses ke pengetahuan korporat mereka. Namun, dalam sektor yang bergantung pada rekayasa berat, hasil yang diperoleh seringkali tidak memuaskan. Para insinyur mengajukan pertanyaan spesifik mengenai infrastruktur, tetapi sistem sering kali memberikan jawaban yang tidak akurat. Masalah ini bukan terletak pada model LLM (Large Language Model) itu sendiri, melainkan pada proses pemrosesan awal yang digunakan.
Dalam praktiknya, banyak pipeline RAG standar menganggap dokumen sebagai string teks datar, dengan menggunakan “chunking” berukuran tetap, yang dapat merusak logika panduan teknis. Misalnya, jika tabel spesifikasi keselamatan terdiri dari 1.000 token dan ukuran chunk-nya 500, maka bagian penting seperti judul dan nilai dapat terpisah, menyebabkan kekacauan dalam pemahaman data.
Solusi untuk meningkatkan keandalan RAG terletak pada penggunaan chunking semantik, yang mempertimbangkan struktur dokumen daripada hanya menghitung jumlah karakter. Dengan alat pemrosesan yang peka terhadap tata letak, segmen-segmen data akan dijaga kesatuannya, sehingga hubungan antar elemen penting tetap utuh.
Lebih jauh lagi, banyak informasi penting perusahaan tersimpan dalam bentuk gambar seperti diagram dan skema, yang tidak dapat dipahami oleh model embedding standar. Oleh karena itu, sistem perlu melakukan langkah pra-pemrosesan multimodal, yang mencakup ekstraksi teks dari gambar dan pembuatan deskripsi otomatis. Ini memungkinkan sistem untuk menjawab pertanyaan dengan lebih akurat, bahkan ketika sumber aslinya adalah file gambar.
Akhirnya, untuk peningkatan adopsi di kalangan perusahaan, penting untuk memastikan tidak hanya akurasi, tetapi juga kemampuan verifikasi informasi yang diberikan oleh sistem RAG. Dengan merancang antarmuka pengguna yang menunjukkan bukti visual dari informasi yang dihasilkan, kepercayaan pengguna terhadap teknologi ini dapat dibangun. Transformasi ini akan mengonversi sistem RAG dari sekadar alat pencari kata kunci menjadi asisten pengetahuan yang andal.