Scroll untuk baca artikel
Teknologi

DeepSeek Ungkap Metode Penalaran AI Baru Jelang Peluncuran Model R2

18
×

DeepSeek Ungkap Metode Penalaran AI Baru Jelang Peluncuran Model R2

Sebarkan artikel ini
DeepSeek AI (gadgetinsiders)

BISNISASIA.CO.ID, TIONGKOK – Startup kecerdasan buatan (AI) asal Tiongkok, DeepSeek, telah memperkenalkan pendekatan baru untuk meningkatkan kemampuan penalaran pada model bahasa besar (LLM), di tengah meningkatnya antisipasi publik terhadap peluncuran model generasi berikutnya dari perusahaan tersebut.

Bekerja sama dengan peneliti dari Universitas Tsinghua, DeepSeek mengembangkan teknik yang menggabungkan dua metode yang disebut generative reward modelling (GRM) dan self-principled critique tuning, menurut makalah yang diterbitkan pada hari Jumat.

Pendekatan ganda ini bertujuan untuk memungkinkan LLM memberikan hasil yang lebih baik dan lebih cepat dalam menjawab pertanyaan umum.

Model DeepSeek-GRM yang dihasilkan berhasil melampaui metode yang ada, dengan “mencapai performa kompetitif” dibandingkan model reward publik terkemuka, tulis para peneliti. Reward modelling adalah proses yang membimbing LLM agar sesuai dengan preferensi manusia.

Baca Juga :   HUAWEI Resmi Buka Experience Store di Cibinong City Mall

Para peneliti menyatakan bahwa DeepSeek berencana untuk membuat model GRM ini menjadi open source, namun belum memberikan jadwal pastinya.

Makalah akademik ini diterbitkan di repositori makalah ilmiah online arXiv, di tengah spekulasi mengenai langkah selanjutnya dari startup tersebut setelah perhatian global yang didapat oleh model fondasi V3 dan model penalaran R1 milik perusahaan.

Dikutip dari SCMP,  Reuters melaporkan bulan lalu bahwa DeepSeek-R2, penerus dari R1, kemungkinan akan dirilis secepatnya bulan ini, seiring upaya perusahaan untuk memanfaatkan sorotan publik yang sedang meningkat. Peluncuran DeepSeek-R1 sebelumnya menggemparkan komunitas teknologi global dengan performa efisien dari segi biaya yang mampu menyaingi model-model terkemuka.

DeepSeek masih bungkam terkait rumor peluncuran R2.

Baca Juga :   Hadirkan Galaxy AI, Simak Daftar Flagship Samsung yang Dukung Galaxy AI

Mereka  belum memberikan komentar resmi, namun akun layanan pelanggan mereka membantah laporan tersebut dalam obrolan grup bersama klien bisnis, seperti dilaporkan oleh media Tiongkok bulan lalu.

DeepSeek juga tidak segera menanggapi permintaan komentar pada hari Jumat.

Meskipun berbasis di Hangzhou dan baru didirikan pada tahun 2023 oleh pengusaha Liang Wenfeng, DeepSeek telah menjadi sorotan global dalam beberapa bulan terakhir.

Namun, perusahaan ini cenderung menghindari komunikasi publik dan lebih memilih untuk fokus pada penelitian dan pengembangan.

Bulan lalu, perusahaan ini memperbarui model V3-nya, yang dinamakan DeepSeek-V3-0324, dan menyebutkan bahwa model ini menawarkan “peningkatan kemampuan penalaran, pengembangan web front-end yang dioptimalkan, dan peningkatan kemampuan menulis dalam bahasa Mandarin.”

Pada Februari, DeepSeek juga membuka lima repositori kode sumbernya, memungkinkan para pengembang untuk meninjau dan berkontribusi pada pengembangan perangkat lunaknya. Startup ini berjanji untuk membuat “kemajuan yang tulus dengan transparansi penuh.”

Baca Juga :   Bocoran Harga Google Pixel 8a Jelang Peluncuran hingga Misteri Fitur Kecerdasan Buatan 

Pada bulan yang sama, Liang menerbitkan studi teknis mengenai native sparse attention, metode untuk meningkatkan efisiensi LLM dalam memproses data dalam jumlah besar.

Liang, 40 tahun, juga merupakan pendiri perusahaan induk DeepSeek, yaitu High-Flyer Quant, sebuah hedge fund yang dananya mendukung kemajuan teknis startup ini.

Pada akhir Februari, sang pengusaha turut serta dalam simposium bersama para pengusaha teknologi yang diselenggarakan oleh Presiden Tiongkok Xi Jinping di Beijing, saat startup tersebut dipuji sebagai tanda ketangguhan Tiongkok di tengah upaya AS untuk membendung kemajuan AI negara tersebut. (SCMP)