¿Puede la tecnología garantizar el anonimato de los testigos protegidos?

Los tradicionales métodos de enmascaramiento han quedado obsoletos. Nuevas investigaciones trabajan en la no reversibilidad de estos procesos.

Anahí Di Santo.

Periodista.

Guardar

La tecnología proporciona nuevas herramientas para preservar la identidad de los testigos protegidos.
La tecnología proporciona nuevas herramientas para preservar la identidad de los testigos protegidos.

En el último tiempo nos hemos sorprendido con los logros del Deepfake, primero las imágenes faciales y videos, luego la voz humana. Hemos descubierto herramientas como Vall-E, una inteligencia artificial creada por Microsoft que promete recrear la voz de una persona a partir de algunos segundos de muestra. Aunque este prototipo todavía no está disponible para el público y por el momento, necesita que el sonido original coincida con las muestras que posee en sus datos de entrenamiento.

En el mismo sentido, y en cuanto a las imágenes, los expertos sostienen que solamente es posible realizar videos deepfake de un modo realmente creíble sobre personas públicamente expuestas, de las que se puedan obtener horas de grabaciones de alta calidad que permiten a los softwares obtener toda la información necesaria para recrear gestos y movimientos. Sin embargo, la tecnología avanza a pasos de gigante y se vuelve cada día más difícil detectar si el contenido que se difunde por Internet es falso o verídico.

Ahora bien, ¿qué sucede cuando la tecnología es un recurso para proteger la identidad de una persona y mantener su anonimato en contextos judiciales o periodísticos? En circunstancias donde la seguridad de los testigos no está garantizada, además de la utilización de nombres ficticios y la ocultación de los datos personales, suele utilizarse el enmascaramiento de la imagen y la voz.

Recientemente, un artículo publicado por la Comisión Nacional de la Informática y las Libertades de Francia (CNIL), autoridad competente en materia de privacidad y protección de datos personales, ha confirmado que las técnicas utilizadas para distorsionar la voz en los casos de protección de testigos son completamente reversibles. Es decir, si un delincuente u organización quisiera averiguar quién dio testimonio para una causa en la que se los investiga, y tiene los medios tecnológicos o económicos para revertir esas técnicas de ocultamiento, podría dar con la persona y amedrentarla, acosarla u otros medios de presión, por citar un ejemplo hipotético.

Cómo funcionan los distorsionadores de voz

Las técnicas más frecuentes tienen que ver con el “cambio de tono” o “pitch shifting”, es decir, se mueve el sonido de la voz hacia los agudos o hacia los graves. Esta es una herramienta que se encuentra disponible en cualquier software gratuito de edición de sonido, música o video y su utilización es de lo más sencillo. Al mismo tiempo, realizar la operación inversa, es decir, devolver a la voz su tono original o a uno similar, sólo requiere de algunos intentos.

La modulación lineal de la señal, señala la CNIL, “parece por tanto una medida de protección extremadamente débil en el contexto de la protección de un testigo o en el de la protección de las fuentes. Esta técnica podía ser de interés cuando los costos de ingeniería inversa eran altos y accesibles solo para un número limitado de personas hace unas décadas, cosa que ya no ocurre con el paso al formato digital y la accesibilidad del software”.

A esto se suma que la expresividad oral no está formada sólo por el sonido de la voz: la forma de hablar, los tics del lenguaje, los modismos o el acento también pueden dar pistas que ayuden a identificar a una persona con información contextual. Precisamente esas características que la IA busca imitar para que la voz sintética sea lo más cercana posible a una real, son al mismo tiempo las huellas personales de cada uno.

Por eso, investigadores especializados en la relación de la voz y su identificación en el marco de la justicia y el derecho trabajan en nuevas técnicas, y lo que parece ser más conveniente en la actualidad es la síntesis de voz, o cambios de modulación aleatorios y complejos, bloqueando la posibilidad de encontrar un tono fijo cercano a la realidad.

Voces sintéticas

Durante la edición 2022 del Voice Privacy Challenge, una iniciativa que busca desarrollar soluciones tecnológicas para preservar la privacidad de los discursos, varios equipos propusieron soluciones de inteligencia artificial destinadas a anonimizar las grabaciones de voz. La que podría ser más prometedora según el jurado de especialistas de esa competencia fue propuesta por el Instituto para el Procesamiento del Lenguaje Natural de la Universidad de Stuttgart, Alemania, y se denomina “Cascada de Reconocimiento Fonético del Habla, Incrustaciones de Altavoces GAN y Síntesis del Habla de Multihablantes”.

Consiste en varios pasos o módulos, que implican primero la transcripción del discurso a fonemas mediante un algoritmo, luego se realiza una codificación del hablante, que es una representación matemática de sus características (tono, alternancia de volumen en su voz, etc.) para entrenar una red adversarial generativa (GAN), que permitirá producir representaciones matemáticas de la voz de personas ficticias.

Esto habilitará finalmente, en un tercer módulo, generar voces sintéticas mediante un algoritmo de generación de voz que reproduce los fonemas de la grabación a anonimizar dada por el primer módulo, según las características vocales de una persona ficticia generada por el segundo módulo.

Afortunadamente, el trabajo en los laboratorios y las investigaciones son constantes, y este es solo un prototipo de muchos en los que se está trabajando.

Es sabido que en general las leyes van corriendo detrás de los nuevos delitos y los logros tecnológicos, y, muchas veces, estos llevan una cómoda delantera. Una alianza entre la justicia de los Estados y nuevas herramientas de no reversibilidad como la citada en estas líneas podría dar solución a una técnica que ha quedado obsoleta dejando a los testigos de casos clave expuestos a distintos modos de presión, que los obligan no sólo a cambiar de nombre y residencia, sino a modificar su vida por completo.