Scroll untuk baca artikel
HeadlineTeknologi

OpenAI Klaim Model GPT-4o Gratis Bisa Berbicara, Tertawa, Bernyanyi dan Melihat Seperti Manusia

55
×

OpenAI Klaim Model GPT-4o Gratis Bisa Berbicara, Tertawa, Bernyanyi dan Melihat Seperti Manusia

Sebarkan artikel ini
OpenAI, Senin mengumumkan GPT-4o, sebuah model AI baru yang menurut perusahaan tersebut selangkah lebih dekat dengan “interaksi manusia-komputer yang jauh lebih alami.” Model baru ini menerima kombinasi teks, audio dan gambar sebagai input dan dapat menghasilkan output dalam ketiga format tersebut.

BISNISASIA.CO,ID, JAKARTA – OpenAI, Senin mengumumkan GPT-4o, sebuah model AI baru yang menurut perusahaan tersebut selangkah lebih dekat dengan “interaksi manusia-komputer yang jauh lebih alami.”

Model baru ini menerima kombinasi teks, audio dan gambar sebagai input dan dapat menghasilkan output dalam ketiga format tersebut.

Ia juga mampu mengenali emosi, memungkinkan Anda menyela di tengah-tengah pembicaraan, dan merespons hampir secepat manusia selama percakapan.

“Hal yang istimewa dari GPT-4o adalah ia memberikan kecerdasan setingkat GPT-4 kepada semua orang, termasuk pengguna gratis kami,” ujar CTO OpenAI Mira Murati dalam sebuah presentasi yang disiarkan secara langsung seperti dilansir Engaget.

Baca Juga :   Jokowi Minta Ketersediaan dan Stabilitas Harga Pangan Terjaga hingga Idul Fitri

“Ini adalah pertama kalinya kami membuat langkah besar dalam hal kemudahan penggunaan,” katanya.

Selama presentasi, OpenAI memamerkan GPT-4o yang menerjemahkan secara langsung antara bahasa Inggris dan Italia, membantu seorang peneliti memecahkan persamaan linier secara real time di atas kertas dan memberikan panduan tentang pernapasan dalam kepada eksekutif OpenAI lainnya hanya dengan mendengarkan napasnya.

Baca Juga :   Aplikasi inDrive Kembali Raih Prestasi, Urutan Kedua Paling Banyak Diunduh

Huruf “o” pada GPT-4o merupakan singkatan dari “omni”, yang merujuk pada kemampuan multimodal model ini.

OpenAI mengatakan bahwa GPT-4o dilatih melalui teks, penglihatan, dan audio, yang berarti bahwa semua input dan output diproses oleh jaringan saraf yang sama.

Hal ini berbeda dengan model perusahaan sebelumnya, GPT-3.5 dan GPT-4, yang memungkinkan pengguna untuk mengajukan pertanyaan hanya dengan berbicara, tetapi kemudian mentranskripsikan ucapan tersebut ke dalam teks.

Hal ini menghilangkan nada dan emosi dan membuat interaksi menjadi lebih lambat.

Baca Juga :   Hadapi Puasa dan Lebaran, Bulog Pastikan Stok Beras Cukup

OpenAI menyediakan model baru ini untuk semua orang, termasuk pengguna ChatGPT gratis, dalam beberapa minggu ke depan dan juga merilis versi desktop ChatGPT, awalnya untuk Mac, yang dapat diakses oleh pengguna berbayar mulai hari ini.

Pengumuman OpenAI ini dilakukan sehari sebelum Google I/O, konferensi pengembang tahunan perusahaan.

Tak lama setelah OpenAI mengungkapkan GPT-4o, Google menggoda versi Gemini, chatbot AI-nya sendiri, dengan kemampuan serupa.