fost-nepal.org – Banyak data perusahaan terjebak dalam dokumen PDF, dan meskipun alat kecerdasan buatan (AI) dapat menganalisisnya, akurasi serta biaya yang diperlukan belum memadai. Teknologi baru yang dikembangkan oleh Databricks, bernama “ai_parse_document”, bertujuan menangani masalah ini. Dalam penjelasannya, Databricks menunjukkan bahwa sekitar 80% pengetahuan perusahaan masih terkunci dalam dokumen yang sulit diproses oleh sistem AI.
Erich Elsen, ilmuwan penelitian utama di Databricks, mengungkapkan bahwa tantangan dalam memproses PDF bukan hanya ketidakstrukturan, melainkan juga kompleksitas dokumen yang menggabungkan konten digital dengan halaman yang dipindai. Dalam konteks ini, teknik pengenalan karakter optik (OCR) sering kali gagal mengekstrak data terstruktur yang dapat digunakan, menghambat aplikasi AI lebih lanjut.
Sebagian besar perusahaan mengandalkan beberapa alat yang tidak sempurna untuk mengekstrak informasi, yang menghabiskan waktu dan sumber daya. Dengan teknologi ai_parse_document, Databricks berkomitmen untuk menyediakan data terstruktur dari dokumen nyata, sehingga perusahaan dapat lebih mudah mengakses dan menganalisis data yang tidak terstruktur.
Dengan integrasi mendalam pada platform Agent Bricks Databricks, teknologi ini menawarkan pelatihan end-to-end yang mengoptimalkan proses ekstraksi data. Beberapa perusahaan besar, termasuk Rockwell Automation dan Emerson Electric, telah menerapkan ai_parse_document untuk meningkatkan efisiensi operasi dan mengurangi alur kerja yang rumit. Rockwell mengurangi overhead konfigurasi, sementara Emerson mempercepat pembuatan aplikasi yang memanfaatkan data tidak terstruktur.
Inovasi ini menunjukkan bahwa solusi baru dapat merombak cara perusahaan memanfaatkan data PDF, berdampak pada strategi penggunaan AI di berbagai sektor secara lebih efisien.