Site icon fost-nepal

Meta Kembali ke Sumber Terbuka dengan Model ASR Omnilingual

[original_title]

fost-nepal.org – Meta baru-baru ini meluncurkan sistem pengenalan suara otomatis multibahasa (ASR) yang mendukung lebih dari 1.600 bahasa, jauh lebih banyak dibandingkan model Whisper dari OpenAI yang hanya mendukung 99 bahasa. Peluncuran ini terjadi pada 10 November, dan sistem ini dirancang untuk mempermudah pengembang dalam menambahkan dukungan untuk ribuan bahasa lain melalui fitur pembelajaran kontekstual dalam model.

Omnilingual ASR memungkinkan pengguna memberikan contoh audio dan teks dalam bahasa baru tanpa perlu pelatihan ulang, sehingga memperluas cakupan hingga lebih dari 5.400 bahasa yang terdaftar. Selain menonjolkan kemampuan untuk beradaptasi dengan cepat, sistem ini terbuka bagi umum di bawah lisensi Apache 2.0, memungkinkan para peneliti dan pengembang untuk menggunakan dan menerapkannya secara gratis dalam proyek mereka.

Sistem ASR ini merupakan langkah signifikan bagi Meta untuk kembali ke jalur inovasi multibahasa, setelah melewati masa-masa sulit terkait peluncuran model Llama 4 yang menuai kritik. Dalam upayanya, Meta bekerja sama dengan berbagai organisasi dan peneliti di Afrika dan Asia untuk mengumpulkan dataset yang mencakup 3.350 jam rekaman suara dalam 348 bahasa berpenduduk rendah.

Dari aspek teknis, Omnilingual ASR memiliki beberapa varian model yang mampu mengkonversi bahasa lisan menjadi teks tertulis, sehingga cocok untuk berbagai aplikasi seperti asisten suara dan alat transkripsi. Dengan pengurangan kebutuhan akan data-label yang besar, model ini menjanjikan kemudahan dalam menambahkan bahasa yang kurang terwakili.

Dengan peluncuran ini, Meta tidak hanya menunjukkan komitmennya terhadap keberagaman bahasa tetapi juga berupaya menghapus batasan akses digital bagi komunitas yang sering kali terpinggirkan. Ini adalah strategi penting bagi Meta di tahun 2025 untuk menghadapi tantangan dalam industri AI global.

Exit mobile version