Deepfake: definición, usos y riesgos

Amine Kacete, ingeniero en el laboratorio de IA de IRT B<>com, Laurent Amsaleg, director de investigación y jefe del equipo de Linkmedia y Alain Droniou, estudiante de doctorado en el Instituto de Sistemas Inteligentes y Robótica, nos cuentan un poco más sobre el world of deepfakes en una conferencia Digital Tech, organizada por Arnaud Wassmer.

¿Qué es un deepfake?

“Básicamente, el término deepfake se usó para el rostro humano. Desde el momento en que cambiamos la imagen de un rostro humano, estamos hablando de deepfake”, explica Amine Kacete. Deepfake es un término inglés que corresponde al término francés “hypertrucage”: una técnica de síntesis multimedia basada en inteligencia artificial.

En realidad, en deepfakes, hay varias categorías:

El cambio de cara: la técnica más conocida. Tomas la cara de alguien y se la pones a otra persona, de una manera ultrarrealista.
El resumen completo: una técnica que te permite crear una foto de una persona que no existe. Se le pide a la máquina que genere una cara ultrarrealista.
Otras posibilidades: use la foto original de una sola persona y solo cambie ciertos rasgos faciales o ciertos atributos faciales (color de cabello, por ejemplo). También es posible adoptar la apariencia de otra persona en un video (como puede hacer el comediante Canteloup).

Amine Kacete da un ejemplo de un deepfake de Barack Obama dirigido por el actor estadounidense Jordan Peel, que puedes ver a continuación. Este video realizado en 2018 comenzó a alertar sobre el impacto que podría tener un deepfake de este nivel.

Otro ejemplo con esta cuenta de TikTok que publica deepfakes del actor Tom Cruise:

@deeptomcruise¡Así es como me visto!♬ sonido original – Tom

¿Cómo se generan los deepfakes?

Laurent Amsaleg detalla los deepfakes realizados mediante síntesis integral: “viene del ‘deep learning’, es una forma de hacer Inteligencia Artificial, no es edición, no es artesanal, son rostros que se generan gracias a la máquina que tiene aprendido lo que es un rostro humano. Le dieron de comer millones de caras y aprendió las características faciales a través de un sofisticado sistema algorítmico. Lo que somos capaces de generar es bastante asombroso. »

Pero, ¿cómo se detectan los deepfakes “maliciosos”?

Amine Kacet destaca que la calidad de los deepfakes ha mejorado mucho en los últimos años: “hoy conseguimos generar caras en resolución HD (1024×2024). Es por eso que ahora es más fácil manipular fotos y videos usando técnicas de deepfake. Pero entonces, ¿cómo detectarlos?

Gracias a las bases de datos formadas por expresiones faciales humanas es posible detectar más fácilmente los deepfakes: “son bases de datos con las que nos podemos comparar, y sobre todo obtener métricas objetivas para desarrollar un detector que funcione, tenemos bases de datos muy exigentes, con diferentes escenarios y diferentes calidades de imagen, y ahí podemos cuantificar objetivamente la efectividad del algoritmo”, explica el ingeniero de B<>com.

En las fotos deepfake podemos distinguir una desventaja visible: “sobre las personas que generamos de manera integral, nunca cierran los ojos, las técnicas generativas que las diseñan no pueden generar eso. Los ojos son a menudo una región atípica para las falsificaciones profundas. »

Los deepfakes también están diseñados por buenas razones…

Los deepfakes no solo se utilizan con fines maliciosos. Laurent Amsaleg se remonta a ciertas razones científicas para la invención de los deepfakes: “el punto de partida es el uso de la Inteligencia Artificial para hacer las modificaciones extremadamente realistas, saliendo de lo artesanal, donde haremos Photoshop. Por ejemplo, existe el deseo de animar personajes realistas en videojuegos. También hay algoritmos que se han inventado para comprender la forma en que se mueven los labios de las personas, esto se usa en particular en la industria del cine para lograr un doblaje más realista de películas en otros idiomas. »

A pesar de estas buenas razones, el director de investigación advierte de los excesos de este avance porque poder mover los labios de cualquiera es poder hacer que cualquiera diga cualquier cosa. Y aquí es donde puede volverse peligroso.

Con el progreso tecnológico, ¿qué futuro para los videos deepfake? ¿Qué riesgos?

Alain Droniou habla sobre el tema: “Todavía sabemos cómo volver a los datos de origen si se han utilizado datos de origen. Hoy en dia no es posible generar un video de la nada pero si nos proyectamos hacia el futuro y con la evolucion que hemos visto en los ultimos años, quizas en unos años podamos hacerlo, y ahi por definicion sera será imposible volver al video fuente manipulado ya que habrá sido generado en su totalidad. Amine Kacet agrega: “somos capaces de generar una imagen estática de la nada pero no podemos generar una persona que hable de la nada. »

No estamos muy lejos de poder generar contenido completamente artificial a partir de una descripción textual, concluye Laurent Amsaleg

Botón volver arriba