Microsoft kembangkan alat AI yang dapat mengubah foto menjadi video realistis dan bisa bernyanyi
![Microsoft kembangkan alat AI yang dapat mengubah foto menjadi video realistis dan bisa bernyanyi](https://cdn-brilio-net.akamaized.net/webp/news/2024/04/20/282012/1200xauto-microsoft-kembangkan-alat-ai-yang-dapat-mengubah-foto-menjadi-video-realistis-dan-bisa-bernyanyi-240420g.jpg)
foto: microsoft
Techno.id - Microsoft Research Asia telah meluncurkan alat AI eksperimental baru bernama VASA-1 yang dapat mengambil gambar diam seseorang dan file audio yang ada untuk membuat wajah berbicara secara real time.
Alat ini memiliki kemampuan untuk menghasilkan ekspresi wajah dan gerakan kepala untuk gambar diam yang ada dan gerakan bibir yang sesuai untuk mencocokkan pidato atau lagu. Para peneliti mengunggah banyak sekali contoh di halaman proyek mereka, dan hasilnya terlihat cukup bagus sehingga mereka dapat meyakini orang dengan berpikir bahwa itu nyata.
Sementara gerakan bibir dan kepala dalam contoh masih bisa terlihat sedikit robotik dan tidak sinkron setelah diperiksa lebih dekat. Masih jelas bahwa teknologi tersebut dapat disalahgunakan untuk membuat video deepfake dengan mudah dan cepat dari orang sungguhan.
Para peneliti menyadari potensi itu dan telah memutuskan untuk tidak merilis demo online, API, produk, detail implementasi tambahan, atau penawaran terkait apa pun sampai mereka yakin bahwa teknologi tersebut akan digunakan secara bertanggung jawab dan sesuai dengan peraturan yang tepat.
Namun, mereka tidak mengatakan apakah berencana menerapkan pengamanan tertentu untuk mencegah orang tidak bertanggungjawab menggunakannya untuk tujuan jahat, seperti membuat pornografi deepfake atau kampanye informasi yang salah.
Para peneliti percaya teknologi mereka memiliki banyak manfaat meskipun berpotensi disalahgunakan. Mereka mengatakan itu dapat digunakan untuk meningkatkan kesetaraan pendidikan, serta untuk meningkatkan aksesibilitas bagi mereka yang memiliki tantangan komunikasi, mungkin dengan memberi mereka akses ke avatar yang dapat berkomunikasi untuk mereka.
Menurut makalah yang diterbitkan dengan pengumuman tersebut, VASA-1 dilatih pada Kumpulan Data VoxCeleb2, yang berisi lebih dari 1 juta ucapan untuk 6.112 selebritas yang diambil dari video YouTube. Meskipun alat ini dilatih pada wajah asli, alat ini juga berfungsi pada foto artistik seperti Mona Lisa, yang secara lucu digabungkan oleh para peneliti dengan file audio dari video viral Anne Hathaway tentang Paparazzi Lil Wayne.
RECOMMENDED ARTICLE
- Adobe kembangkan GenAI, alat yang bisa mengubah permintaan teks menjadi musik
- 6 AI generator untuk menghasilkan gambar paling fotorealistik yang layak dicoba
- 4 Cara menggunakan AI agar dapat mempermudah kamu bekerja dengan file PDF
- 5 Fitur Character AI yang harus dicoba, bisa ngobrol bareng superstar sampai mendiang tokoh terkenal
- Meta luncurkan Llama 3 yang diklaim sebagai raja AI dan akan terintegrasi dengan media sosial
HOW TO
-
3 Cara menghentikan kunci otomatis layar perangkat Windows
-
3 Cara melacak iPhone yang hilang menggunakan perangkat Android
-
7 Tanda kamu perlu mengganti router agar koneksi internet tetap aman dan lancar
-
Cara mengaktifkan atau menonaktifkan teks otomatis di Instagram
-
Cara memperbaiki kesalahan “Perubahan Jaringan Terdeteksi” di Chrome
TECHPEDIA
-
Indosat gandeng AionOS, akselerasikan kedaulatan AI di Indonesia
-
Meta AI di WhatsApp sekarang lebih cerdas, lebih kreatif, dan sepenuhnya multibahasa
-
WhatsApp sedang menyiapkan Nearby Share, fitur berbagi file mirip AirDrop iPhone
-
Kini Microsoft Word dapat membantu kamu meringkas dokumen yang panjang dengan bantuan AI Copilot
-
OpenAI rilis GPT-4o mini yang menawarkan AI Smarts dengan harga yang lebih terjangkau
LATEST ARTICLE
TECHPEDIA Selengkapnya >
-
Indosat gandeng AionOS, akselerasikan kedaulatan AI di Indonesia
-
Meta AI di WhatsApp sekarang lebih cerdas, lebih kreatif, dan sepenuhnya multibahasa
-
WhatsApp sedang menyiapkan Nearby Share, fitur berbagi file mirip AirDrop iPhone
-
Kini Microsoft Word dapat membantu kamu meringkas dokumen yang panjang dengan bantuan AI Copilot