Mona Lisa yang tersenyum dan tersenyum telah dikenali di seluruh dunia, tetapi wajah terkenal itu baru-baru ini memperlihatkan pelbagai ungkapan baru yang mengejutkan, sifat kecerdasan buatan (AI).
Dalam video yang dikongsi ke YouTube pada 21 Mei, tiga klip video menunjukkan contoh-contoh Mona Lisa yang membingungkan apabila dia menggerakkan bibirnya dan menghidupkan kepalanya. Dia diciptakan oleh rangkaian neural convolutional - sejenis AI yang memproses maklumat seperti otak manusia, untuk menganalisis dan memproses imej.
Para penyelidik melatih algoritma untuk memahami bentuk umum wajah dan cara mereka bersikap relatif terhadap satu sama lain, dan kemudian menerapkan maklumat tersebut pada imej pegun. Hasilnya adalah urutan video realistik ekspresi wajah baru dari satu bingkai tunggal.
Untuk video Mona Lisa, AI "belajar" pergerakan wajah dari dataset tiga subjek manusia, menghasilkan tiga animasi yang sangat berbeza. Walaupun setiap satu daripada tiga klip itu masih dikenali sebagai Mona Lisa, variasi model dan gaya tingkah laku yang dipamerkan oleh model latihan "memaparkan" personaliti kepada "potret hidup," Egor Zakharov, seorang jurutera dengan Institut Sains dan Teknologi Skolkovo, dan Samsung AI Center (kedua-duanya terletak di Moscow), dijelaskan dalam video.
Zakharov dan rakan-rakannya juga menghasilkan animasi dari gambar ikon budaya abad ke-20 seperti Albert Einstein, Marilyn Monroe dan Salvador Dali. Para penyelidik menyifatkan penemuan mereka, yang tidak dikaji semula, dalam kajian yang diterbitkan dalam talian pada 20 Mei dalam jurnal pra arXiv.
Menghasilkan video asal seperti ini, yang dikenali sebagai deepfakes, tidak mudah. Kepala manusia geometri kompleks dan sangat dinamik; Model kepala 3D mempunyai "puluhan juta parameter," kata penulis kajian.
Lebih-lebih lagi, sistem penglihatan manusia sangat baik untuk mengenal pasti "kesilapan kecil" dalam kepala manusia 3D model, menurut kajian itu. Melihat sesuatu yang kelihatan hampir manusia - tetapi tidak cukup - mencetuskan sensasi kebencian mendalam yang dikenali sebagai kesan lembah yang luar biasa.
AI sebelum ini telah menunjukkan bahawa menghasilkan deepfakes yang meyakinkan adalah mungkin, tetapi ia memerlukan beberapa sudut subjek yang dikehendaki. Untuk kajian baru, jurutera memperkenalkan AI kepada kumpulan data rujukan yang sangat besar yang menunjukkan wajah manusia dalam tindakan. Para saintis menubuhkan mercu muka muka yang akan digunakan untuk sebarang wajah, untuk mengajar rangkaian saraf bagaimana menghadapi bersikap secara umum.
Kemudian, mereka melatih AI untuk menggunakan ungkapan rujukan untuk memetakan pergerakan ciri sumber. Ini membolehkan AI untuk mencipta kejayaan walaupun hanya mempunyai satu imej untuk berfungsi, penyelidik melaporkan.
Dan lebih banyak imej sumber memberikan hasil yang lebih terperinci dalam animasi akhir. Video yang dihasilkan daripada 32 imej, bukan hanya satu, mencapai "realisme sempurna" dalam kajian pengguna, para saintis menulis.