JAKARTA: Perusahaan teknologi raksasa asal China, Alibaba, baru saja meluncurkan seri model bahasa besar (LLM) terbarunya bernama Qwen3, dan langsung mencuri perhatian komunitas AI global. Model open source ini diklaim sebagai salah satu LLM terbaik saat ini, bahkan mengungguli performa model-model populer seperti OpenAI o1 dan DeepSeek R1 di berbagai benchmark.
Yang membuat Qwen3 menonjol adalah dukungan multibahasa yang luas, mencakup 119 bahasa dan dialek—termasuk bahasa daerah di Indonesia seperti Jawa, Sunda, dan Bali. Hal ini membuka peluang besar bagi pengembangan teknologi AI yang lebih inklusif dan relevan secara lokal.
Alibaba merilis Qwen3 dalam dua jenis model: Dense dan MoE (Mixture of Experts). Model dense, seperti Qwen3-32B, mengaktifkan seluruh parameternya saat inferensi. Ini membuat hasilnya konsisten, namun membutuhkan daya komputasi tinggi. Sementara itu, model MoE seperti Qwen3-235B-A22B hanya mengaktifkan sebagian parameternya berdasarkan konteks tugas, menjadikannya jauh lebih efisien namun tetap bertenaga.
Qwen3 juga dilengkapi dengan fitur canggih bernama Hybrid Reasoning, yang memungkinkan pengguna memilih mode berpikir cepat atau mendalam saat menjawab pertanyaan kompleks. Fitur ini dapat diakses melalui Qwen Chat maupun API khusus.
Dari segi pelatihan, Qwen3 menggunakan dataset dua kali lebih besar dibanding pendahulunya, Qwen2.5, yakni sekitar 36 triliun token. Model MoE andalannya, Qwen3-235B-A22B, memiliki 235 miliar parameter total, tetapi saat digunakan, hanya 22 miliar parameter yang aktif, berkat arsitektur MoE. Ini membuatnya sangat efisien untuk penggunaan nyata.
Meski belum dirilis untuk umum (masih terbatas untuk internal), performa Qwen3-235B-A22B dalam pengujian publik sangat mengesankan. Dalam benchmark ArenaHard, model ini mencetak skor 95,6—lebih tinggi dari OpenAI o1 (92,1) dan DeepSeek R1 (93,2), serta hanya sedikit di bawah Google Gemini 2.5 Pro (96,4).
Dalam uji kemampuan matematika dan sains AIME’24 dan AIME’25, Qwen3 mencatat skor 85,7 dan 81,5, mengalahkan OpenAI o1 dan Grok 3 dari xAI. Untuk pengujian coding di LiveCodeBench, Qwen3 unggul dengan skor 70,7, serta mencatat skor CodeForces 2.056, melebihi skor Gemini 2.5 Pro (2.001).
Menariknya, versi dense seperti Qwen3-32B juga tampil kompetitif meski lebih kecil secara arsitektur. Secara keseluruhan, peluncuran Qwen3 menandai tonggak penting dalam dunia AI open source. Ia bukan hanya bersaing, tetapi berhasil mengungguli model-model komersial milik raksasa seperti OpenAI, Google, dan xAI.
Dengan kemampuan tinggi dan sifat terbuka, Qwen3 membuka jalan bagi pengembangan AI global yang lebih terjangkau, fleksibel, dan inklusif. Dunia kini menyambut babak baru dalam evolusi AI, di mana kekuatan tidak lagi eksklusif dimiliki perusahaan teknologi Barat.

