Un joven mexicano innovador en el campo de la audición robótica

“Lo que siento con este reconocimiento son nervios bienvenidos”, expresó Caleb Rascón

22 de agosto 2014.-En 2014, la edición en español de MIT Technology Review eligió a 10 innovadores mexicanos menores de 35 años. Uno de ellos fue el doctor Caleb Antonio Rascón Estebané, del Instituto de Investigaciones en Matemáticas Aplicadas y Sistemas de la UNAM, quien desde hace cuatro años es parte del equipo de investigación del Grupo Golem, que entre otras cosas, se centra en el modelado cognitivo de la interacción entre humanos y sistemas computacionales.

et_calebrascon_18082014
Caleb Antonio Rascón busca que las máquinas adquieran la habilidad de escucha del humano. Diseño:Erika López

“Lo que siento con este reconocimiento son nervios bienvenidos”, expresó Caleb Rascón, uno de los jóvenes que se eligieron por sus aportaciones al mundo de la ciencia y la tecnología, y considerado uno de los mexicanos menores de 35 años más brillantes.

Robot encara a persona

Lo que hoy se identifica como Grupo Golem tuvo sus inicios hace más de una década y se conocía como Grupo DIME (Diálogos Inteligentes Multimodales en Español). Sus primeras investigaciones consistían en modelar conversaciones entre una computadora y un humano, trabajos de los cuales se identificaron distintos elementos en términos de interacción humano-computadora. Cabe destacar que el doctor Luis Pineda ha coordinado este trabajo desde que inició.

Posteriormente, varios de los resultados que se obtuvieron de este primer grupo decidieron aplicarlos en un robot. Cuando Caleb Rascón se integró a él ya existía una plataforma de interacción, producto de muchos años de investigación y de la aportación de distintos investigadores. Sin embargo, se quería complementar dicho trabajo logrando que el robot pudiera encarar a una persona.

Así, uno de los primeros trabajos de Caleb Rascón en el grupo fue lograr que el robot Golem tuviera esta capacidad independientemente de lo que estuviera sucediendo en el espacio acústico. En ese momento, el equipo trabajó con tres micrófonos y una sola fuente y luego, en que Golem pudiera seguir a una persona no por medio del rango visual, sino auditivo, es decir, que reconociera de qué dirección provenía la fuente de sonido que le estaba llamando.

Gracias a esta manera en que se aplicó la técnica y permitió que con una sola fuente Golem pudiera reconocer y orientarse hacia la fuente de sonido –pese al ruido que existía alrededor– fue que el Grupo obtuvo el tercer lugar en la German Open 2012 competencia nacional que se llevó a cabo en Alemania del RoboCup@Home.

Aportación en audición robótica

Otros grupos de investigación en el mundo también han trabajado en audición robótica, pero por lo regular lo han hecho con 8 o 10 micrófonos, mientras que el doctor Rascón Estebané empezó a trabajar sólo con 3, lo que les ha permitido atacar el problema de una manera diferente, pues con esa cantidad de micrófonos han podido detectar hasta cuatro fuentes de sonido.

Esto ha sido importante porque en el ámbito de la audición robótica y de la identificación de las fuentes de sonido y la dirección de donde provienen, distintos grupos de investigación colocan muchos micrófonos para identificar varias fuentes de sonido. Sin embargo, la propuesta del investigador universitario fue innovadora ya que con menos micrófonos puede identificar más fuentes de sonido. Esto a pesar de que existe una regla que indica que no se pueden detectar más fuentes con menos micrófonos.

Explicó que como el Grupo Golem tiene entre sus principales objetivos la interacción, decidieron aplicar esta parte del desarrollo en el robot y le asignaron a Golem la tarea de ser un mesero. De esta manera, pueden llamarlo desde lejos y éste detecta la dirección de dónde le están llamando. Asimismo, al dirigirse hacia la fuente de sonido, es capaz de detectar si cuando va en movimiento alguien más le habla.

Además Rascón Estebané explicó que como en ocasiones hay varias personas en una misma mesa y pueden hablar al mismo tiempo, Golem ha sido programado para que a través de las fuentes de sonido que posee y los reconocedores de voz, decida encarar a una de esas personas y con amabilidad ponga orden en la mesa.

Cada una de estas funciones pueden hacerla con pocos micrófonos, lo que ha hecho de estos desarrollos algo innovador en el ámbito de la audición robótica, la cual de acuerdo con el investigador tiene como objetivo entregar la habilidad de escucha humana a un ente no humano.

Agregó que estas metodologías de audición robótica podrían aplicarse en un futuro, en dispositivos de ayuda auditiva para los seres humanos que han perdido la capacidad de escuchar.

Información: Ciencia Unam