Audición robótica, con amplias posibilidades de desarrollo

12 enero, 2018 ·

Caleb RascÃ³n, del Instituto de Investigaciones en MatemÃ¡ticas Aplicadas y en Sistemas, participÃ³ en la 4Âª Escuela de Invierno de RobÃ³tica de la Universidad Veracruzana

Caleb Antonio RascÃ³n

David Sandoval RodrÃguez

12/01/2018, Xalapa, Ver.- La audiciÃ³n robÃ³tica ha logrado avances importantes pero debe aspirar a emular la audiciÃ³n humana en cuanto al procesamiento de la informaciÃ³n, explicÃ³ Caleb Antonio RascÃ³n EstebanÃ©, investigador del Instituto de Investigaciones en MatemÃ¡ticas Aplicadas y en Sistemas (IIMAS) de la Universidad Nacional AutÃ³noma de MÃ©xico (UNAM).

AsÃ lo planteÃ³ en su conferencia â€œAudiciÃ³n robÃ³ticaâ€, que impartiÃ³ en la 4Âª Escuela de Invierno de RobÃ³tica (EIR), organizada por el Centro de InvestigaciÃ³n en Inteligencia Artificial (CIIA) de la Universidad Veracruzana (UV) y que tuvo como recinto el Casino XalapeÃ±o.

El acadÃ©mico forma parte del Grupo Golem, proyecto que desarrolla robots de servicio para asistir a las personas en su quehacer diario, con una orientaciÃ³n primordial hacia la inteligencia artificial y a la interacciÃ³n humano-robot.

En la audiciÃ³n robÃ³tica, uno de los mayores retos es localizar la fuente de sonido y su clasificaciÃ³n implica una tarea que requiere mayor investigaciÃ³n y desarrollo para poder distinguir entre una fuente de interÃ©s, como puede ser una persona o una fuente de distracciÃ³n como el ruido o la interferencia, comentÃ³.

Al explicar todos los pasos que conlleva una escucha pormenorizada, recalcÃ³ que â€œen este momento no hay una computadora que pueda llevar a cabo todas las tareas, tampoco un sistema de audiciÃ³n robÃ³tica que pueda realizarlo y no es porque falte procesamiento en el aspecto algorÃtmico sino en la audiciÃ³nâ€.

ExplicÃ³ la importancia de generar investigaciÃ³n y trabajo en emular la escucha humana ya que al hacer evidente que un robot se dirige o dirige sus micrÃ³fonos hacia una persona, Ã©sta responde en la direcciÃ³n de aquÃ©l, lo cual facilita la interacciÃ³n entre ambos, como ocurre entre dos personas.

â€œComo humanos esperamos que haya una persona dentro de la carcasaâ€, bromeÃ³ el ponente antes de exponer un video donde prueban al robot Golem como un mesero que debe atender tres solicitudes verbales al mismo tiempo y debe discernir a cuÃ¡l atender primero. Los resultados ya fueron publicados y muestran que eligiÃ³ al mÃ¡s prÃ³ximo, avanzÃ³ hacia Ã©l pero atendiÃ³ con un movimiento de su cabeza a otra persona y le respondiÃ³ que lo atenderÃa despuÃ©s.

Se han realizado experimentos de interacciÃ³n entre Golem y Justina, otro robot con el cual se trabaja en el IIMAS; no obstante, planteÃ³ que cada uno de los proyectos trabaja con plataformas y robots distintos en los que se reflejan tambiÃ©n sus diferencias de software, por ello propuso que una de las posibilidades para comunicarse, mÃ¡s allÃ¡ de los cÃ³digos de programaciÃ³n y lenguajes algorÃtmicos, puede ser el sonido emitido por los robots, es decir, que se comuniquen expresÃ¡ndose con palabras.

â€œUno de los grandes problemas que enfrenta la audiciÃ³n robÃ³tica es el hecho de que el micrÃ³fono estÃ© alejado de la persona que habla, limitando el reconocimiento de la voz, ademÃ¡s de sumarse la reverberaciÃ³n de la misma voz e incluso voces de otras personasâ€, comentÃ³.

â€œTodos los reconocedores de voz que tenemos en la actualidad asumen que solamente una persona estÃ¡ hablando, pero en la realidad no siempre hablamos con una persona a la vez y lo que queremos llevar a cabo es el reconocimiento de voz y que sea posible trasladar los avances mÃ¡s allÃ¡ de la lÃnea de robots de servicio.â€

Una razÃ³n importante para continuar trabajando en esta Ã¡rea radica en que â€œla escucha humana sigue siendo un misterio para nosotros en muchos aspectosâ€, se conoce el funcionamiento del oÃdo pero se conoce muy poco de cÃ³mo el cerebro humano identifica, localiza y comprende a la persona.

â€œSerÃa fenomenal emular la audiciÃ³n de un ser humano y a lo mejor esto abra una pequeÃ±a ventana para entender cÃ³mo programar, porque se requiere de una enorme cantidad de datosâ€.

RascÃ³n EstebanÃ© dijo que en 2018 esperan reducir el espacio que utilizan los micrÃ³fonos en el robot, ya que han trabajado con tres y tienen el propÃ³sito de no incluir mÃ¡s en el equipo; esto conlleva solucionar las dificultades que implica para el reconocimiento de voz.

Por otra parte, una estudiante de maestrÃa comenzarÃ¡ como su proyecto de tesis la identificaciÃ³n de los locutores, es decir, que tenga la capacidad de diferenciar entre las voces. Este no es un tema nuevo, sin embargo el enfoque de su propuesta se enfoca en que el robot no tenga que aprender las palabras del nuevo individuo sino que pueda discernir y aplique lo que ha aprendido al reconocimiento de la nueva persona.