OpenAI Perkenalkan Sora: Transformasi Teks ke Video dengan Kecerdasan Buatan

TEKNOLOGI

OpenAI telah memperkenalkan Sora, sebuah model kecerdasan buatan yang mampu mengubah teks menjadi video, memungkinkan pengguna untuk membuat video fotorealistik hingga satu menit berdasarkan instruksi tertulis.

Sora memiliki kemampuan untuk menciptakan adegan yang kompleks dengan banyak karakter, gerakan spesifik, serta detail subjek dan latar belakang yang akurat. Perusahaan juga mencatat bahwa model ini dapat memahami bagaimana objek berinteraksi dalam dunia fisik, serta dapat menghasilkan karakter yang menarik dan mengungkapkan emosi yang hidup.

Selain itu, Sora juga dapat menghasilkan video berdasarkan gambar diam, mengisi frame yang kosong pada video yang ada, atau memperluasnya. Meskipun beberapa tahun yang lalu model teks-ke-gambar seperti Midjourney menjadi perhatian utama dalam bidang ini, namun sekarang perusahaan seperti Runway dan Pika juga telah menunjukkan kemampuan model mereka dalam mengubah teks menjadi gambar yang mengesankan.

Model serupa dengan Sora adalah Lumiere dari Google, yang juga memberikan pengguna alat untuk membuat video dari gambar diam. Saat ini, Sora hanya tersedia untuk “red teamers” yang mengevaluasi potensi risiko model ini, tetapi OpenAI juga memberikan akses kepada seniman visual, desainer, dan pembuat film untuk memberikan umpan balik.

Perusahaan menyadari bahwa model yang ada mungkin tidak selalu akurat dalam mensimulasikan fisika adegan yang kompleks dan mungkin tidak memahami dengan benar beberapa hubungan sebab-akibat. Sebelumnya, OpenAI juga telah menambahkan tanda air ke alat teks-ke-gambar mereka, DALL-E 3, sebagai langkah untuk mengatasi masalah keaslian konten.

Seperti halnya produk AI lainnya, OpenAI harus menghadapi konsekuensi dari penyebaran video AI fotorealistik palsu yang dapat keliru dianggap sebagai sesuatu yang nyata. Ini merupakan tantangan yang harus dihadapi oleh perusahaan dalam mengembangkan teknologi ini.