Investigadores argentinos buscan un Siri perfecto

(Por Eduardo M. Aguirre - @EduAguirre) Una de las múltiples investigaciones sobre las cuales están trabajando los científicos del Conicet, consiste en desentrañar las claves del lenguaje humano y desarrollar sistemas que permitan a las personas ‘hablar’ con las computadoras (algo como el sistema Siri de Apple, pero absolutamente idéntico al habla humana).  En qué etapa están estos desarrollos.

Image description

Un grupo de investigadores del Conicet trabaja para comprender y esquematizar cómo debería ser un sistema que replique de manera perfecta el habla humana. Están generando conocimientos que luego distintas empresas (de hecho ya están trabajando con algunas) podrán utilizar para generar sistemas que "dialoguen" tal como lo haría una persona.
Uno de los científicos que está aplicando sus conocimientos a este tema es Agustín Gravano quien sintetiza su labor diciendo: “Trabajo para que la computadora hable de manera natural”. Su objetivo es que la computadora pueda no sólo reconocer las palabras, sino además la dinámica de la conversación. Una tarea poco sencilla, si se tiene en cuenta que hablar no es simplemente enlazar una palabra atrás de la otra. Durante una conversación “cambiamos la forma de procesar las palabras mientras hablamos, sin darnos cuenta”, explica y agrega: “A esto tanto actores, locutores, políticos –quienes estudian oratoria- aprenden a manejarlo, estos cambios en la inflexiones de la voz es lo más difícil de replicar”.
Según Gravano las personas modifican la intensidad, el tono y el volumen de acuerdo al tipo de charla. “Si contamos un chiste va a ser de una manera, y si leemos un obituario, va a ser de otra”, cuenta. El desafío pasa por identificar, codificar y enseñar a la computadora las múltiples variantes del diálogo, para que cuando “hable” suene natural. En su tesis, Gravano logró identificar el proceso que da a entender al interlocutor que una persona está por terminar de hablar. A medida que se acerca el final de la última frase la persona baja su tono de voz, se vuelve más rasposa y va perdiendo intensidad. “Se modifica ligeramente la forma de hablar para poder intercambiar turnos en la conversación”, ejemplifica.
Desde Buenos Aires, Agustín nos cuenta que están trabajando en enseñarle a las computadoras a identificar, a partir de un texto, cómo deben leerlo. Parte importante de esta labor consiste en generar cientos de grabaciones en condiciones especiales de acústica en estudios profesionales ya que deben estar carentes de todo sonido ambiental.
Sostiene que los sistemas que comercialmente conocemos (como Siri, por ejemplo) no cumplen con las expectativas que los usuarios tienen al respecto, puesto que éstas son realmente muy altas, “en esto el cine no ayuda mucho”, afirma, refiriéndose a las películas (como Ironman) donde la interacción hombre-máquina mediante el habla es absolutamente natural.
Para determinar el grado de avance de este tipo de investigaciones, Gravano nos cuenta que periódicamente son sometidas al Test de Turing que, como bien se explica en Wikipedia, es una prueba propuesta por Alan Turing para demostrar la existencia de inteligencia en una máquina. Fue expuesto en 1950 en un artículo (Computing machinery and intelligence) para la revista Mind, y sigue siendo uno de los mejores métodos para los defensores de la Inteligencia Artificial.  La prueba consiste en un desafío. Se ubica a una persona en una habitación, y a una máquina y a otro ser humano en otras. La primera persona al interactuar con ellos debe descubrir cuál es el ser humano y cuál es la máquina. Cabe señalar que hasta la fecha ningún sistema de reproducción del habla ha logrado sortear con efectividad este test, ni siquiera con textos cortos.
Jorge Gurlekian, investigador independiente de Conicet en el Instituto de Inmunología, Genética y Metabolismo apunta a “entender cómo se produce la comunicación entre los seres humanos, ya sea en la producción y generación de voz como en la parte de percepción y reconocimiento” del discurso, asegura. Para eso estudian la prosodia humana, es decir el conocimiento del acento, entonación y ritmo del diálogo. Tras analizar diferentes patrones y conversaciones, lo transforman en lenguaje matemático y lo programan en una computadora, con el objetivo de que pueda comunicarse verbalmente.
María Eugenia Torres, investigadora independiente del Conicet y directora del Laboratorio de Señales y Dinámicas no Lineales de la Universidad Nacional de Entre Ríos sostiene que “hay cierto tipo de patologías de la voz que no son fácilmente diferenciables”. Torres y su equipo desarrollan técnicas de análisis y procesamiento de señales en la voz. Después, a partir de la información oculta en ella pueden identificarla y clasificarla. “Las posibles aplicaciones van desde el área de seguridad hasta call centers, para identificar si la persona que se está comunicando está atemorizada, miente o en estado de pánico, por ejemplo”, dice Torres.

Tu opinión enriquece este artículo:

Cuesta como un departamento, se vive como un departamento, pero no es un departamento: así es el lujoso motorhome (cordobés) que arranca de US$ 60.000

(Por Juliana Pino) Si de turismo y aventura se trata, Gibertcar tiene la solución: motorhomes que combinan funcionalidad y lujo. Desde su inicio en 1985, esta empresa familiar se adaptó a las necesidades del mercado ofreciendo modelos personalizados y de serie. Sus precios arrancan en US$ 60.000 y, dependiendo de los accesorios, pueden superar los US$ 80.000.

Córdoba, un paso adelante en la industria textil: llega la Mimaki Tiger 600-1800 TS, la sublimadora más rápida del país (solo hay dos)

(Por Rocío Vexenat) Dxprint es cordobesa y la única empresa de la provincia especializada en la comercialización de equipos de sublimación textil. Acaba de presentar su último “bicho”; la impresora Mimaki Tiger 600-1800 TS, un equipo que cuesta unos 145.000 dólares (más IVA) que puede producir 550 metros cuadrados por hora. Y sí: es la Speedy Gonzalez del mercado argentino.

Un arquitecto cordobés dibujó el auto de Colapinto, Williams lo compartió en sus redes y ahora vende las láminas

(Por Josefina Lescano /RdF) El arquitecto y artista Gastón Castellano encontró la manera de fusionar sus dos grandes pasiones: la arquitectura y los autos de carrera. Su ilustración del Williams de Franco Colapinto no solo deslumbró en redes sociales, sino que fue seleccionada por el equipo británico en su sección "Fan Art", marcando un hito para el talento argentino.

Con la industria del juicio vivita y coleando, las ART le dan un ultimátum a la Justicia por los Cuerpos Médicos Forenses (solo Mendoza lo constituyó)

El panorama de los juicios laborales en Argentina es cada vez más alarmante. En octubre, el sistema judicial registró el inicio de 11.851 nuevas demandas por riesgos del trabajo, lo que representa un aumento del 14,3% con respecto al mismo mes del año anterior. En total, durante los primeros 10 meses de 2024 se contabilizaron 105.960 nuevos juicios, y las proyecciones indican que el número superará los 128.000 para fin de año. Esta creciente judicialización pone en jaque a las ART (Aseguradoras de Riesgos del Trabajo), que aseguran a más de 10 millones de trabajadores en el país.

Bancor abre el camino: Mastercard Débito ya está disponible en Google Pay

El Banco de la Provincia de Córdoba marca un hito en la banca argentina al ser la primera entidad financiera del país en integrar tarjetas Mastercard Débito a la plataforma Google Pay. Con esta nueva funcionalidad, la tarjeta Cordobesa Débito se suma como método de pago a la billetera virtual, reforzando el liderazgo de Bancor en innovación tecnológica. En la nota te cuento cómo usarla.