Categories
Teknologi

Microsoft Perkenalkan Teknologi AI Ubah Foto Jadi Video Berbicara Secara Langsung

tonosgratis.mobi, Jakarta – Microsoft Research Asia telah merilis alat kecerdasan buatan eksperimental baru yang disebut VASA-1. Kecerdasan buatan dapat mengubah gambar orang menjadi file audio real-time, membuat wajah dalam gambar tersebut berbicara.

Dikutip Senin (22/4/2024) dari Engadget VASA-1 mampu menganimasikan wajah dan kepala berdasarkan gambar yang diunggah. Tak hanya itu, AI juga bisa mencocokkan gerakan bibir dengan suara atau lagu dan gambar yang diunggah untuk diubah menjadi video.

Peneliti Microsoft sedang menguji VASA-1 dengan mengunggah beberapa contoh produk yang dihasilkan AI ke situs proyek. Terakhir, video yang dihasilkan AI ini terlihat sangat nyata sehingga dapat mengelabui orang lain agar mengira video AI tersebut adalah video nyata.

VASA-1 terus melakukan pengembangan meskipun gerakan bibir dan kepala dalam video yang dihasilkan AI tidak sesuai dengan audio yang diunggah, dan video yang dibuat oleh AI mungkin serupa dengan video aslinya. .

Namun kemampuan AI pada VASA-1 disebut-sebut berpotensi disalahgunakan oleh pihak yang tidak bertanggung jawab untuk membuat video yang dalam dan cepat.

Peneliti Microsoft sudah mengetahui hal ini. Oleh karena itu, mereka memutuskan untuk tidak merilis demo online, API, produk, detail implementasi lainnya, atau proposal sampai mereka yakin bahwa teknologi tersebut dapat digunakan sesuai dengan standar yang ada.

Microsoft mengatakan VASA-1 dapat digunakan untuk meningkatkan pemerataan pendidikan dan meningkatkan aksesibilitas dalam bentuk avatar interaktif untuk orang-orang dengan kesulitan komunikasi.

Namun, mereka tidak mengungkapkan apakah mereka berencana menerapkan aturan khusus untuk mencegah pelaku kejahatan menggunakan konten AI untuk menyamar sebagai pejabat publik untuk tujuan jahat, seperti menciptakan atau menyebarkan penipuan.

Menurut siaran pers yang menyertai pengumuman tersebut, VASA-1 dilatih di database VoxCeleb2, yang berisi lebih dari 1 juta kata dari 6.112 selebriti yang diambil dari video YouTube.

Di sisi lain, penggunaan AI yang tidak bertanggung jawab dapat menyebabkan penyebaran penipuan yang lebih luas dan bahkan mengancam perekonomian global.

Forum Ekonomi Dunia (WEF) mengumumkan bahwa risiko terbesar yang dihadapi perekonomian global tahun ini adalah disinformasi atau penipuan yang dihasilkan oleh kecerdasan buatan (AI). Demokrasi seperti itu, menurut mereka, dapat mengancam, melemahkan dan mempolarisasi masyarakat.

Laporan tersebut, berdasarkan survei terhadap hampir 1.500 akademisi, pemimpin bisnis dan pembuat kebijakan, dirilis menjelang pertemuan tahunan para CEO dan pemimpin dunia di Davos, Swiss.

Studi tersebut mencatat bahwa pesatnya perkembangan teknologi telah menyebabkan munculnya permasalahan baru dan menempatkan misinformasi dan disinformasi sebagai masalah paling serius dalam dua tahun ke depan.

Para peneliti memperingatkan bahwa pengembangan chatbot AI yang kreatif seperti ChatGPT tidak lagi terbatas pada pengembangan konten sintetis yang kompleks untuk pengawasan massa.

Caroline Klint, direktur manajemen risiko di Marsh, mengatakan kecerdasan buatan dapat digunakan oleh pihak yang tidak bertanggung jawab untuk menciptakan penipuan dan memengaruhi perilaku manusia.

“Seiring dengan semakin sulitnya pemeriksaan fakta, masyarakat cenderung menjadi semakin terpolarisasi. Disinformasi juga dapat digunakan untuk menimbulkan keraguan terhadap legitimasi pemerintahan terpilih, yang menunjukkan bahwa proses demokrasi dapat dirusak dan semakin mempolarisasi masyarakat,” kata Clint Voice of America pada hari Sabtu. (20 April 2024).

Di sisi lain, penelitian menemukan bahwa organisasi media tidak memiliki kebijakan mengenai gambar yang dihasilkan AI.

Penelitian ini dipimpin oleh RMIT University dan juga melibatkan Washington State University dan Queensland University of Technology Media Research Centre. Laporan ini mewawancarai 20 editor foto dari 16 organisasi media publik dan komersial di Eropa, Australia, dan Amerika Serikat tentang penerapan AI kreatif dalam teknologi jurnalisme visual.

Lima dari 16 organisasi melarang karyawannya menggunakan AI untuk membuat gambar, tiga organisasi hanya melarang gambar fotorealistik, dan satu organisasi melarang karyawan menggunakan AI untuk menghasilkan gambar.

Peneliti utama TJ Thomson, dosen senior di RMIT University, mengatakan: “Editor gambar ingin transparan kepada audiensnya saat menggunakan teknologi AI yang kreatif, namun organisasi media tidak memiliki kendali atas perilaku manusia atau bagaimana platform lain menampilkan informasi.”

“Organisasi media harus transparan mengenai kebijakan mereka sehingga khalayak dapat percaya bahwa konten mereka dibuat atau diedit sesuai dengan klaim organisasi tersebut,” kata Thomson.

Ia juga menambahkan bahwa jika organisasi berita mengembangkan kebijakan AI, mereka harus mempertimbangkan semua bentuk komunikasi, termasuk gambar dan video, dan memberikan pedoman yang lebih spesifik. Oleh karena itu, penggunaan kecerdasan buatan yang kreatif di redaksi dapat mencegah misinformasi dan disinformasi.