[original_title]

Olmo 3.1 dari Ai2 Perpanjang Pelatihan Pembelajaran Penguatan

fost-nepal.org – Allen Institute for AI (Ai2) baru saja meluncurkan model terbaru mereka yang diberi nama Olmo 3.1. Inovasi ini merupakan pengembangan dari model sebelumnya, Olmo 3, yang bertujuan untuk meningkatkan efisiensi serta transparansi dalam penggunaan di kalangan perusahaan. Peluncuran Olmo 3.1 mengikuti serangkaian pelatihan reinforcement learning (RL) yang lebih mendalam untuk memastikan kemampuan model yang lebih baik.

Model Olmo 3.1 terdiri dari tiga varian, termasuk Olmo 3.1 Think 32B yang ditujukan untuk penelitian tingkat lanjut dan Olmo 3.1 Instruct 32B yang dioptimalkan untuk instruksi serta dialog multi-langkah. Varian ketiga, Olmo 3-Base, didesain untuk pemrograman serta pemahaman matematika. Ai2 mengumumkan bahwa mereka telah memperpanjang pelatihan model Think dengan jadwal yang lebih lama, menghasilkan peningkatan signifikan dalam sejumlah tolok ukur penting, termasuk AIME dan ZebraLogic.

Proses pengembangan Olmo 3.1 Instruct melibatkan penerapan teknik yang sama dari ukuran lebih kecilnya, Olmo 3 Instruct 7B, untuk varian yang lebih besar. Model ini kini dianggap sebagai salah satu model chat terbuka yang paling mumpuni, siap digunakan dalam aplikasi dunia nyata.

Model terbaru ini menunjukkan performa yang lebih baik dibandingkan dengan model Olmo 3 serta mampu bersaing dengan model open-source lainnya. Ai2 juga memperbarui model RL-Zero 7B yang fokus pada matematika dan pemrograman, mendapatkan hasil positif dari pelatihan yang lebih stabil dan berkepanjangan.

Ai2 berkomitmen untuk memberikan transparansi yang lebih besar kepada pengguna dalam melatih model. Dengan kemampuan untuk menambahkan dan melatih ulang data, perusahaan dan laboratorium penelitian dapat memiliki kontrol yang lebih baik atas model yang digunakan. Hal ini sejalan dengan misi Ai2 untuk menjaga keseimbangan antara keterbukaan dan performa yang tinggi dalam perkembangan teknologi AI.

Leave a Reply

Your email address will not be published. Required fields are marked *