OpenAI Klaim Model GPT-4o Gratis Bisa Berbicara, Tertawa, Bernyanyi dan Melihat Seperti Manusia

BISNISASIA.CO,ID, JAKARTA – OpenAI, Senin mengumumkan GPT-4o, sebuah model AI baru yang menurut perusahaan tersebut selangkah lebih dekat dengan “interaksi manusia-komputer yang jauh lebih alami.”

Model baru ini menerima kombinasi teks, audio dan gambar sebagai input dan dapat menghasilkan output dalam ketiga format tersebut.

Ia juga mampu mengenali emosi, memungkinkan Anda menyela di tengah-tengah pembicaraan, dan merespons hampir secepat manusia selama percakapan.

“Hal yang istimewa dari GPT-4o adalah ia memberikan kecerdasan setingkat GPT-4 kepada semua orang, termasuk pengguna gratis kami,” ujar CTO OpenAI Mira Murati dalam sebuah presentasi yang disiarkan secara langsung seperti dilansir Engaget.

“Ini adalah pertama kalinya kami membuat langkah besar dalam hal kemudahan penggunaan,” katanya.

Selama presentasi, OpenAI memamerkan GPT-4o yang menerjemahkan secara langsung antara bahasa Inggris dan Italia, membantu seorang peneliti memecahkan persamaan linier secara real time di atas kertas dan memberikan panduan tentang pernapasan dalam kepada eksekutif OpenAI lainnya hanya dengan mendengarkan napasnya.

Huruf “o” pada GPT-4o merupakan singkatan dari “omni”, yang merujuk pada kemampuan multimodal model ini.

OpenAI mengatakan bahwa GPT-4o dilatih melalui teks, penglihatan, dan audio, yang berarti bahwa semua input dan output diproses oleh jaringan saraf yang sama.

Hal ini berbeda dengan model perusahaan sebelumnya, GPT-3.5 dan GPT-4, yang memungkinkan pengguna untuk mengajukan pertanyaan hanya dengan berbicara, tetapi kemudian mentranskripsikan ucapan tersebut ke dalam teks.

Hal ini menghilangkan nada dan emosi dan membuat interaksi menjadi lebih lambat.

OpenAI menyediakan model baru ini untuk semua orang, termasuk pengguna ChatGPT gratis, dalam beberapa minggu ke depan dan juga merilis versi desktop ChatGPT, awalnya untuk Mac, yang dapat diakses oleh pengguna berbayar mulai hari ini.

Pengumuman OpenAI ini dilakukan sehari sebelum Google I/O, konferensi pengembang tahunan perusahaan.

Tak lama setelah OpenAI mengungkapkan GPT-4o, Google menggoda versi Gemini, chatbot AI-nya sendiri, dengan kemampuan serupa.

Post Views: 190