Cómo funciona el sistema que reconstruye el rostro desde la voz

(Por Eduardo Aguirre) Una pregunta recurrente tanto en charlas de café como en ámbitos académicos es ¿hasta dónde pueden llegar los desarrollos tecnológicos tales como machine learning e inteligencia artificial? La respuesta es cada vez más difícil de imaginar. 

Es que logros propios del cine y la literatura han abandonado el mundo de la ficción y hoy son realidades tangibles.

Uno de los más recientes y asombrosos ejemplos es Speech2Face, el sistema desarrollado por investigadores del MIT (Massachusetts Institute of Technology) que permite reconstruir el rostro de una persona con solo escuchar algunos segundos de su voz, tal como podés ver en el video que acompaña esta nota.

En la publicación en la cual expusieron los resultados de la investigación los seis responsables afirmaron: ¿Cuánto podemos inferir sobre la apariencia de una persona por la forma en que habla?
En este artículo, estudiamos la tarea de reconstruir una imagen facial de una persona a partir de una breve grabación de su voz hablando. Diseñamos y entrenamos una red neuronal profunda para realizar esta tarea utilizando millones de videos naturales de personas que hablan en sitios como YouTube. Durante la capacitación, nuestro modelo aprende sobre los rostros de las personas y sus correlaciones de voz. Esto le permite producir imágenes que capturan varios atributos físicos de los hablantes, como la edad, el género y la etnia. Esto se hace de manera auto-supervisada, utilizando la co-ocurrencia natural de rostros y habla en videos de Internet, sin la necesidad de modelar los atributos explícitamente. Nuestras reconstrucciones, obtenidas directamente del audio, revelan las correlaciones entre caras y voces. Evaluamos y cuantificamos numéricamente cómo, y de qué manera, nuestras reconstrucciones del audio de Speech2Face se asemejan a las verdaderas imágenes faciales de los altavoces.

Desde luego este tipo de experimentos conllevan un dilema ético al cual los investigadores no le rehúyen. “Aunque se trata de una investigación puramente académica, creemos que es importante discutir explícitamente en el documento un conjunto de consideraciones éticas debido a la posible sensibilidad de la información facial”, sostienen al abrir ese capítulo y añaden que el modelo informático no puede recuperar la verdadera identidad de una persona (es decir, una imagen exacta de su rostro). Esto se debe a que está capacitado para capturar características visuales (relacionadas con la edad, el género, etnia, etc.) que son comunes a muchas personas, y solo en los casos en que existe evidencia lo suficientemente sólida como para conectar esas características visuales con los atributos. Como tal, el modelo solo producirá caras de apariencia promedio, con características visuales que se correlacionan con el habla de entrada. No producirá imágenes de individuos específicos.

Los científicos utilizaron en el momento de la prueba para las reconstrucciones de rostros segmentos de voz de entrada de 3 segundos y 6 segundos respectivamente (en ambos casos usamos el mismo modelo). Como se observa en la imagen que acompaña esta nota, con una mayor duración del habla las caras reconstruidas capturan mejor los atributos faciales. Por cierto, en algunos casos, los resultados obtenidos son realmente asombrosos.

¿Qué más podrán lograr estas tecnologías de redes neuronales? No hay límites a la vista.

El paper completo con los resultados de la experiencia está aquí.

Una bolsa de cemento por favor, ¡pero blanco!: Holcim presenta su nuevo producto (pensado para trabajos decorativos y artísticos)

Holcim continúa innovando en el mundo de la construcción, y presenta “Blanco”, su nuevo cemento destinado a trabajos decorativos y artísticos, ofreciendo a los profesionales de la construcción una nueva herramienta para dar vida a sus proyectos de una manera creativa. Esta nueva variedad de soluciones cementicias cuenta con más del 80% de blancura logrando un gran aspecto estético y visual. 

El que sale a la hora 16 (y a otras horas, también): cómo opera y qué recorridos realiza el Tren de las Sierras (el tramo más caro a $ 160)

(Por Rocío Vexenat) Citando al gran Pappo Napolitano en su famosa canción "el Tren de las 16" (y tarareada por el mismísimo Pepe Argento en un capítulo de Casados con Hijos), el Tren de las Sierras es un servicio turístico que recorre todo el Valle de Punilla en la provincia de Córdoba. ¿Solo sale a las 16? No, tiene varias frecuencias, recorridos y horarios, y su particularidad es el tan bajo costo que tienen los pasajes a sus respectivos destinos. En la nota te cuento un poco más.

¿Disney o fiesta de 15?: con un dólar estable cuánto sale hoy el viaje mágico y soñado (mano a mano con Juan Toselli)

(Por Diana Lorenzatti) El dólar hizo la “plancha” y las quinceañeras la hacen en Cocoa Beach, una de las paradas incluidas en el viaje a Disney que ofrece la operadora cordobesa Toselli. En esta coyuntura, cómo repuntó este viaje soñado -a pesar de la crisis económica- y cuánto sale hoy. Lo comparamos con el que hacen a Europa, en este mano a mano con Juan Toselli.

Mostri TV apuesta fuerte en el streaming cordobés con "Buena Data Social Club" (el programa que conduce Caio Lamberti)

(Por Josefina Lescano / RdF) El consumo de plataformas, la elección on demand de producción digital, llegó para imponerse. El streaming es prácticamente un clásico en la generación “centennials”. En Buenos Aires compiten los tanques del mercado como Olga y Luzu TV (aunque hay más, muchos más). Y Córdoba no se queda atrás: una de las apuestas es la del periodista Caio Lamberti. De qué se trata Mostri TV, su nueva propuesta que promete cautivar a una amplia audiencia ávida de contenido fresco y relevante. 

Casi un puente aéreo: Copa Airlines anuncia otras 3 frecuencias semanales Buenos Aires - Panamá (31 vuelos EZE - PTY desde septiembre)

A partir del 19 de septiembre la aerolínea panameña, miembro de la red global de aerolíneas Star Alliance, contará con tres nuevos vuelos desde el Aeropuerto Internacional de Ezeiza Ministro Pistarini. Con la apertura de estas frecuencias, Copa Airlines contará con 31 vuelos semanales directos desde Buenos Aires hacia Panamá con conexión para 32 países de América Central, Caribe, Canadá y Estados Unidos.