Microsoft kembangkan alat AI yang dapat mengubah foto menjadi video realistis dan bisa bernyanyi

Microsoft kembangkan alat AI yang dapat mengubah foto menjadi video realistis dan bisa bernyanyi

Techno.id - Microsoft Research Asia telah meluncurkan alat AI eksperimental baru bernama VASA-1 yang dapat mengambil gambar diam seseorang dan file audio yang ada untuk membuat wajah berbicara secara real time.

Alat ini memiliki kemampuan untuk menghasilkan ekspresi wajah dan gerakan kepala untuk gambar diam yang ada dan gerakan bibir yang sesuai untuk mencocokkan pidato atau lagu. Para peneliti mengunggah banyak sekali contoh di halaman proyek mereka, dan hasilnya terlihat cukup bagus sehingga mereka dapat meyakini orang dengan berpikir bahwa itu nyata.

Sementara gerakan bibir dan kepala dalam contoh masih bisa terlihat sedikit robotik dan tidak sinkron setelah diperiksa lebih dekat. Masih jelas bahwa teknologi tersebut dapat disalahgunakan untuk membuat video deepfake dengan mudah dan cepat dari orang sungguhan.

Para peneliti menyadari potensi itu dan telah memutuskan untuk tidak merilis demo online, API, produk, detail implementasi tambahan, atau penawaran terkait apa pun sampai mereka yakin bahwa teknologi tersebut akan digunakan secara bertanggung jawab dan sesuai dengan peraturan yang tepat.

Namun, mereka tidak mengatakan apakah berencana menerapkan pengamanan tertentu untuk mencegah orang tidak bertanggungjawab menggunakannya untuk tujuan jahat, seperti membuat pornografi deepfake atau kampanye informasi yang salah.

Para peneliti percaya teknologi mereka memiliki banyak manfaat meskipun berpotensi disalahgunakan. Mereka mengatakan itu dapat digunakan untuk meningkatkan kesetaraan pendidikan, serta untuk meningkatkan aksesibilitas bagi mereka yang memiliki tantangan komunikasi, mungkin dengan memberi mereka akses ke avatar yang dapat berkomunikasi untuk mereka.

Menurut makalah yang diterbitkan dengan pengumuman tersebut, VASA-1 dilatih pada Kumpulan Data VoxCeleb2, yang berisi lebih dari 1 juta ucapan untuk 6.112 selebritas yang diambil dari video YouTube. Meskipun alat ini dilatih pada wajah asli, alat ini juga berfungsi pada foto artistik seperti Mona Lisa, yang secara lucu digabungkan oleh para peneliti dengan file audio dari video viral Anne Hathaway tentang Paparazzi Lil Wayne.

(brl/red)