Microsoft kembangkan alat AI yang dapat mengubah foto menjadi video realistis dan bisa bernyanyi

foto: microsoft
Techno.id - Microsoft Research Asia telah meluncurkan alat AI eksperimental baru bernama VASA-1 yang dapat mengambil gambar diam seseorang dan file audio yang ada untuk membuat wajah berbicara secara real time.
Alat ini memiliki kemampuan untuk menghasilkan ekspresi wajah dan gerakan kepala untuk gambar diam yang ada dan gerakan bibir yang sesuai untuk mencocokkan pidato atau lagu. Para peneliti mengunggah banyak sekali contoh di halaman proyek mereka, dan hasilnya terlihat cukup bagus sehingga mereka dapat meyakini orang dengan berpikir bahwa itu nyata.
- Manipulasi video dan audio makin canggih, hoax makin menggila? Teknologi memudahkan produksinya.
- OpenAI memperkenalkan alat kloning suara, bisa meniru ucapan seseorang OpenAI menerapkan serangkaian langkah keamanan yang ketat
- Foto avatar Lensa Ai di Instagram tengah viral, ini cara membuatnya Foto dapat diubah menjadi ilustrasi, foto kartun, foto yang layaknya lukisan di kanvas, dan masih banyak lagi.
Sementara gerakan bibir dan kepala dalam contoh masih bisa terlihat sedikit robotik dan tidak sinkron setelah diperiksa lebih dekat. Masih jelas bahwa teknologi tersebut dapat disalahgunakan untuk membuat video deepfake dengan mudah dan cepat dari orang sungguhan.
Para peneliti menyadari potensi itu dan telah memutuskan untuk tidak merilis demo online, API, produk, detail implementasi tambahan, atau penawaran terkait apa pun sampai mereka yakin bahwa teknologi tersebut akan digunakan secara bertanggung jawab dan sesuai dengan peraturan yang tepat.
Namun, mereka tidak mengatakan apakah berencana menerapkan pengamanan tertentu untuk mencegah orang tidak bertanggungjawab menggunakannya untuk tujuan jahat, seperti membuat pornografi deepfake atau kampanye informasi yang salah.
Para peneliti percaya teknologi mereka memiliki banyak manfaat meskipun berpotensi disalahgunakan. Mereka mengatakan itu dapat digunakan untuk meningkatkan kesetaraan pendidikan, serta untuk meningkatkan aksesibilitas bagi mereka yang memiliki tantangan komunikasi, mungkin dengan memberi mereka akses ke avatar yang dapat berkomunikasi untuk mereka.
Menurut makalah yang diterbitkan dengan pengumuman tersebut, VASA-1 dilatih pada Kumpulan Data VoxCeleb2, yang berisi lebih dari 1 juta ucapan untuk 6.112 selebritas yang diambil dari video YouTube. Meskipun alat ini dilatih pada wajah asli, alat ini juga berfungsi pada foto artistik seperti Mona Lisa, yang secara lucu digabungkan oleh para peneliti dengan file audio dari video viral Anne Hathaway tentang Paparazzi Lil Wayne.
RECOMMENDED ARTICLE
- Adobe kembangkan GenAI, alat yang bisa mengubah permintaan teks menjadi musik
- 6 AI generator untuk menghasilkan gambar paling fotorealistik yang layak dicoba
- 4 Cara menggunakan AI agar dapat mempermudah kamu bekerja dengan file PDF
- 5 Fitur Character AI yang harus dicoba, bisa ngobrol bareng superstar sampai mendiang tokoh terkenal
- Meta luncurkan Llama 3 yang diklaim sebagai raja AI dan akan terintegrasi dengan media sosial
HOW TO
-
Cara menjalankan aplikasi dan game Windows di Android menggunakan Winlator terbaru di 2025
-
Cara record Zoom di laptop dan MacBook yang simpel dan mudah, sekaligus trik merangkum meeting pakai A
-
5 Langkah preventif merawat baterai HP di tengah musim pancaroba 2025, ternyata ini yang bikin rusak
-
Cara mengetahui dan memeriksa jumlah siklus baterai iPhone terbaru 2025, ini 5 langkah merawatnya
-
Cara menghentikan baterai laptop agar tidak terisi daya di atas 80% di Windows 11, ini alasannya
TECHPEDIA
-
Ini sejarah dan kegunaan teks viral "Lorem Ipsum" di tugu IKN, sudah ada sejak abad ke 16
-
Penjelasan mengapa port USB punya banyak warna, format terbaru di 2025 punya kecepatan 80 Gbps
-
10 Cara download gambar di Pinterest kualitas HD, cepat dan mudah dicoba
-
Cara download game PS2 dan PS3 di laptop dan HP, bisa main berdua
-
10 Fitur canggih iPhone 16E, bakal jadi HP Apple termurah di bawah Rp 10 juta?
LATEST ARTICLE
TECHPEDIA Selengkapnya >
-
Ini sejarah dan kegunaan teks viral "Lorem Ipsum" di tugu IKN, sudah ada sejak abad ke 16
-
Penjelasan mengapa port USB punya banyak warna, format terbaru di 2025 punya kecepatan 80 Gbps
-
10 Cara download gambar di Pinterest kualitas HD, cepat dan mudah dicoba
-
Cara download game PS2 dan PS3 di laptop dan HP, bisa main berdua