Vidu, alat AI Tiongkok yang membuat video dari teks, adalah harapan negara tersebut untuk mengejar OpenAI

Kesulitan: Summiteer (Level 3)

Tiongkok telah mengembangkan alat kecerdasan buatan (AI) teks-ke-video yang disebut Vidu yang dapat menghasilkan video tidak lebih dari 16 detik. Videonya lebih pendek dibandingkan Sora, model serupa dari perusahaan AS OpenAI yang dapat membuat video berdurasi 60 detik.

Vidu diluncurkan bulan lalu oleh perusahaan rintisan Shengshu Technology dalam upaya bersama dengan Universitas Tsinghua yang berbasis di Beijing. Model ini dapat membuat video dengan resolusi 1080p berdasarkan perintah teks sederhana.

“Vidu adalah pencapaian terbaru dalam inovasi mandiri, dengan terobosan di banyak bidang,” kata Zhu Jun, kepala ilmuwan di Shengshu yang juga wakil dekan di Institut AI Tsinghua.

Zhu mengumumkan model tersebut di Forum Zhongguancun yang diadakan di ibu kota Tiongkok. Dia menambahkan bahwa model tersebut juga dapat memahami “elemen Tiongkok”.

Selama peluncuran model tersebut, Shengshu merilis beberapa klip demo, termasuk satu klip yang menampilkan panda bermain gitar sambil duduk di rumput dan satu lagi menampilkan anak anjing yang berenang di kolam. Kedua klip tersebut menunjukkan detail yang jelas.