Scroll untuk baca artikel
Teknologi

Alibaba Tetapkan Standar Baru AI Open-Source dengan Hybrid Reasoning Lewat Peluncuran Qwen3

96
×

Alibaba Tetapkan Standar Baru AI Open-Source dengan Hybrid Reasoning Lewat Peluncuran Qwen3

Sebarkan artikel ini
Alibaba Cloud
BISNISASIA.CO.ID, JAKARTA – Alibaba meluncurkan Qwen3, generasi terbaru dari seri large language model (LLM) open-source miliknya, yang menetapkan standar baru dalam inovasi kecerdasan buatan atau AI.
Seri Qwen3 terdiri atas enam dense model dan dua model Mixture-of-Experts (MoE), yang memberikan fleksibilitas bagi para developer mengaplikasikan generasi berikutnya di berbagai perangkat seperti ponsel, kacamata pintar, kendaraan otonom, hingga robotika serta perangkat lainnya.
Seluruh model Qwen3, termasuk dense model  (dengan parameter 0.6B, 1.7B, 4B, 8B, 14B, dan 32B) serta model MoE (30B dengan 3B aktif, dan 235B dengan 22B aktif), kini telah dirilis secara open-source dan tersedia secara global.
Hybrid Reasoning yang Menggabungkan Mode Berpikir dan Non-Berpikir
Qwen3 menandai debut Alibaba dalam model hybrid reasoning, yang menggabungkan kemampuan tradisional LLM dengan penalaran dinamis tingkat lanjut. Model Qwen3 dapat dengan mulus beralih dari mode berpikir untuk tugas-tugas yanng kompleks, dan memerlukan beberapa langkah seperti matematika, pengkodean, dan deduksi logis, ke mode tanpa berpikir untuk respons yang cepat dan umum.
Bagi para developer yang mengakses Qwen3 melalui API, model ini menawarkan kontrol yang terperinci terhadap durasi berpikir (hingga 38.000 token), memungkinkan keseimbangan optimal antara kinerja cerdas dan efisiensi komputasi. Selain itu, model MoE Qwen3-235B-A22B mampu mengurangi biaya penerapan secara signifikan dibandingkan dengan model mutakhir lainnya, sekaligus memperkuat komitmen
Alibaba terhadap pengembangan AI berkinerja tinggi yang tetap mudah diakses.
Terobosan dalam Keterampilan Multibahasa, Kemampuan Agen, Penalaran, dan Penyesuaian Manusia
Dilatih dengan dataset masif berisi 36 triliun token–dua kali lipat dari pendahulunya Qwen2.5–Qwen3 menghadirkan kemajuan signifikan dalam penalaran, pemahaman instruksi, penggunaan alat atau aplikasi, dan tugas multibahasa.
Kemampuan utama Qwen3 meliputi:
Penguasaan Multibahasa: Mendukung 119 bahasa dan dialek, dengan performa terdepan dalam penerjemahan dan mengikuti instruksi multibahasa.
⁠Integrasi Agen yang Canggih: Mendukung secara native Model Context Protocol (MCP) dan pemanggilan fungsi yang andal, menjadikan Qwen 3 pemimpin di antara model open-source untuk tugas berbasis agen AI yang kompleks.
Penalaran Unggul: Melampaui model Qwen sebelumnya (QwQ dalam mode berpikir dan Qwen2.5 dalam mode non-berpikir) dalam tolok ukur matematika, pengkodean, dan penalaran logis.
Penyelarasan AI dengan Preferensi Manusia yang Lebih Baik:  Menghasilkan pengalaman menulis kreatif, bermain peran, dan dialog bergilir yang terasa lebih alami dan menarik.
Berkat kemajuan dalam arsitektur model, peningkatan volume data pelatihan, dan metode pelatihan yang lebih efektif, model Qwen3 berhasil meraih hasil unggulan di berbagai tolok ukur industri seperti AIME25 (penalaran matematika), LiveCodeBench (kemampuan pengkodean), BFCL (kemampuan penggunaan alat dan pemrosesan fungsi), dan Arena-Hard (tolok ukur untuk LLM yang dilatih mengikuti instruksi).
Selain itu, untuk mengembangkan model hybrid reasoning ini, Alibaba menerapkan proses pelatihan empat tahap yang mencakup long chain-of-thought (CoT) cold start, reinforcement learning (RL) berbasis penalaran, thinking mode fusion, dan reinforcement learning secara umum.
Akses Terbuka untuk Mendorong Inovasi
Model Qwen3 kini tersedia secara gratis untuk diunduh melalui Hugging FaceGitHub, dan ModelScope, serta dapat diakses langsung melalui chat.qwen.ai.
Akses API akan segera tersedia melalui platform pengembangan model AI Alibaba, Model Studio.
Qwen3 juga menjadi teknologi inti di balik Quark, aplikasi asisten super AI unggulan Alibaba.
Sejak diluncurkan, seri model Qwen telah menarik lebih dari 300 juta unduhan secara global. Para developer telah menciptakan lebih dari 100.000 model turunan berbasis Qwen di Hugging Face, menjadikan Qwen salah satu seri model AI open-source yang paling banyak diadopsi di dunia.
Baca Juga :   Menanti Kejutan Baru dari OpenAI hari Senin,  Sam Altman : Terasa Seperti Sihir