▷ Generator suara kecerdasan buatan ini bisa memalsukan suara siapa pun

Berbicara terasa seperti hal paling sederhana yang dilakukan tubuh manusia, tetapi cukup rumit untuk ditiru oleh komputer. Amazon Alexa, Siri Apple dan bahkan asisten suara Google sama seperti suara manusia seperti AI apa pun, tetapi bahkan suara itu seperti komputer. Lyrebird, sebuah startup yang berbasis di Montreal, telah mengembangkan generator suara AI yang dapat meniru suara siapa pun lengkap dengan sedikit emosi alami manusia. Sistem ini belum sempurna, tetapi cukup brilian untuk memulai. Kita bisa berjalan menuju masa depan di mana suara akan semudah dipalsukan seperti foto.

Seiring kemajuan sistem text-to-speech, mereka akan memiliki masalah khusus karena kami terus menggunakan kata-kata yang direkam sebelumnya dari aktor suara. Kata-kata ini ketika digabungkan ke dalam rantai kalimat terdengar sangat robotik tanpa inspirasi, emosi, atau dampak pada pengiriman. Tanpa melupakan suara monoton yang sama yang harus kita dengarkan berulang kali. Beberapa orang bahkan mengeluh bahwa asisten suara hanya memiliki suara wanita. Ada banyak alasan untuk itu, tetapi Anda tidak dapat membiarkan siapa pun setuju dengan satu suara itu.

Algoritma peniruan suara Lyrebird dapat meniru suara siapa pun dan bahkan membaca teks dengan emosi yang sudah ditentukan sebelumnya. Algoritme tidak membutuhkan lebih dari satu menit audio yang direkam sebelumnya untuk membuat ulang suara dengan intonasi sempurna. Perusahaan menggunakan rekaman Barack Obama, Hillary Clinton dan Donald Trump dan menghasilkan audio simulasi sebagai bagian dari kampanye promosinya.

Selain menyalin suara, sistem dapat menghasilkan kalimat yang sama dengan beberapa intonasi berbeda.

Algoritma mengenali pola-pola dalam ucapan seseorang menggunakan jaringan saraf tiruan dan kemudian mereproduksi pola yang sama menggunakan ucapan simulasi. José Sotelo, pakar sintesis suara di Lyrebird, menjelaskan: “Kami melatih model kami dalam kumpulan data besar dengan ribuan speaker. Kemudian, untuk pembicara baru, kami mengompres informasi mereka menjadi kunci kecil yang berisi DNA suara mereka. Kami menggunakan kunci ini untuk mengucapkan doa baru. “

Bentuk algoritma saat ini memiliki kemampuan seperti itu, tetapi masih jauh dari suara manusia yang sebenarnya memiliki masalah kejelasan. Sistem ini membutuhkan data suara jauh lebih sedikit daripada sistem lain dari jenis ini, dan bagian terbaiknya adalah ia bekerja secara real time. José Sotelo mengatakan: “Kami saat ini mengumpulkan dana dan meningkatkan tim teknik kami. Kami sedang berupaya meningkatkan kualitas audio agar tidak terlalu robot, dan kami berharap untuk memulai pengujian beta segera. “

Rencana perusahaan adalah menjual sistem kepada pengembang untuk digunakan dalam aplikasi seperti narasi buku audio dan sintesis suara untuk orang-orang cacat dan asisten pribadi intelijen buatan. Di masa depan, Anda dapat membuat asisten suara Anda terdengar seperti orang yang Anda inginkan.

Bahkan sebelum mendengar tentang penggunaan algoritma yang brilian, orang dapat membayangkan masalah etika dan keamanan yang berpotensi menyebabkannya. Setelah sistem disempurnakan dengan kemampuan imitasi yang sempurna, hampir tidak mungkin untuk membedakan antara suara manusia yang sebenarnya atau algoritma imitasi. Dunia kebenaran dan kebohongan yang sudah ambigu akan menjadi murmur total di mana ucapan salah siapa pun dapat digunakan untuk menipu bahkan para pakar keamanan. Ini bisa menjadi akhir dari era di mana perekaman audio dapat diandalkan dan Lyrebird mengetahuinya.

“Kami menganggap serius aplikasi berbahaya teknologi kami. Kami ingin teknologi ini digunakan untuk tujuan yang baik: untuk memberikan kembali suara kepada orang-orang yang kehilangannya karena sakit, untuk dapat merekam diri mereka pada berbagai tahap kehidupan mereka dan untuk mendengar suara mereka nanti, dll. Karena teknologi ini dapat dikembangkan oleh Dalam grup lain untuk tujuan jahat, kami percaya bahwa hal yang benar untuk dilakukan adalah mempublikasikannya, sehingga kami berhenti bergantung pada rekaman audio. [as evidence].

Dengan masalah muncul solusinya, dan dengan beberapa solusi muncul masalah. Meskipun tampaknya menakutkan, kita semua telah melalui waktu ketika bukti gambar menjadi tidak dapat diandalkan dengan kemajuan perangkat lunak manipulasi foto. Ini akan serupa, tetapi meskipun manusia mungkin tertipu oleh peniru, komputer mungkin sangat membedakan suara yang diproduksi dari yang asli. Sistem dapat dikembangkan untuk mendeteksi tanda-tanda yang dapat berupa tidak adanya kebisingan latar belakang, ruang akustik palsu, atau perbedaan serupa.

Suatu hari, teknologi sintesis ucapan dapat disempurnakan cukup untuk dapat mereplikasi semuanya, baik itu kualitas suara, suara nafas, pukulan bibir, atau detail halus lainnya, ke titik di mana bahkan mesin tidak dapat membedakannya. dari yang asli. Peniru. Pada hari itu, semua rekaman audio atau bukti suara akan kehilangan kredibilitasnya.

Table of Contents

Generator suara kecerdasan buatan ini bisa memalsukan suara siapa pun

Direkomendasikan: