Google profundiza en la creación de un sistema que pueda detectar el lenguaje de señas
Google Research, desarrollo un prototipo de detección en tiempo real basado en la estimación de las poses que puede identificar a las personas mientras se comunican con señas por videollamadas.
En busca que hacer más accesible el servicio, la compañía estudia el nuevo prototipo que permite detectar movimientos en una videollamada. Viendo además, la necesidad de detectar quienes hablan en voz alta en reuniones grupales, para evitar el daño en personas con problemas audición cuando se comunican mediante lengua de signos.
Basado en un patrón de poses que pueden ser identificadas, el nuevo sistema de google fue presentado en la conferencias europea de visión computarizada ECCV’20, emplea un diseño ligero con el que reduce la cantidad de carga de CPU necesaria para ejecutarlo, para no afectar así a la calidad de las llamadas.
Conocido como PoseNet, modelo que delimita poses de brazos y manos, que reduce los datos de la imagen a una serie de marcadores en los ojos, nariz, manos y hombros de los usuarios, entre otros, de manera que se detecta también el movimiento.
Además, añadieron una capa adicional al modelo, de arquitectura de memoria a largo y corto plazo, que incluye memoria sobre los pasos de tiempo anteriores, pero sin retroceso, y con la que logra una gran efectividad.