Site icon fost-nepal

OpenAI Luncurkan Model Pengkodean GPT-5.1-Codex-Max Selesai Tugas 24 Jam

[original_title]

fost-nepal.org – OpenAI telah meluncurkan GPT‑5.1-Codex-Max, model coding terbaru yang hadir di lingkungan pengembang Codex. Peluncuran ini menjadi tonggak penting dalam rekayasa perangkat lunak berbantuan kecerdasan buatan, menawarkan peningkatan dalam pemahaman jangka panjang, efisiensi, dan kemampuan interaksi secara real-time. GPT‑5.1-Codex-Max kini menggantikan model sebelumnya, GPT‑5.1-Codex, sebagai model default di berbagai aplikasi Codex.

Model baru ini dirancang sebagai agen pengembangan perangkat lunak yang berfungsi secara berkelanjutan. Ia mampu menangani refaktorisasi kompleks, debugging, dan tugas berskala proyek melalui banyak konteks sekaligus. Pengumuman ini muncul setelah Google meluncurkan model Gemini 3 Pro, tetapi GPT‑5.1-Codex-Max berhasil outperform pada beberapa tolok ukur coding penting.

Dalam evaluasi SWE-Bench Verified, model ini mencapai akurasi 77,9% dengan usaha pemikiran yang tinggi, melampaui 76,2% dari Gemini 3 Pro. Selain itu, dalam Terminal-Bench 2.0, akurasinya adalah 58,1%, dibandingkan dengan Gemini 3 Pro yang hanya mencapai 54,2%.

GPT‑5.1-Codex-Max juga menunjukkan perbaikan dalam arsitektur teknis yang memungkinkan pemrosesan input-output jangka panjang menggunakan metode disebut kompaksi. Metode ini membantu model untuk mempertahankan informasi kontekstual yang penting sambil mengabaikan detail yang tidak relevan, memungkinkan penyelesaian tugas yang berlangsung lebih dari 24 jam.

Saat ini, GPT‑5.1-Codex-Max tersedia dalam berbagai lingkungan Codex, termasuk CLI resmi OpenAI dan beberapa ekstensi IDE, meskipun belum tersedia melalui API publik. OpenAI menambahkan bahwa model ini dapat digunakan untuk mendeteksi kerentanan keamanan secara otomatis, meskipun dengan pembatasan keamanan yang ketat.

Peluncuran GPT‑5.1-Codex-Max menandai langkah signifikan dalam strategi pengembangan alat bantu AI oleh OpenAI, mendorong batasan kemampuan dan interaksi di bidang rekayasa perangkat lunak.

Exit mobile version