Regressão múltipla com redes neurais convolucionais para estimativa conjunta da intensidade de Action Units

Abstract: Este trabalho apresenta uma rede neural convolucional (CNN - Convolutional Neural Network) para efetuar a estimativa conjunta da intensidade de Action Units (AUs) em imagens de faces. A estimativa da intensidade de AUs é essencial durante a análise de expressões faciais. Os métodos existentes não levam em consideração a possibilidade de estimativa conjunta para vários AUs em uma face e precisam de um modelo para cada AU; métodos que fazem uso dessa informação precisam reestruturar o problema como aprendizado estruturado com grafos, aumentando a complexidade. Portanto, este trabalho propõe um modelo de regressão múltipla para realizar essa estimativa conjunta e permitir a otimização de um modelo end-to-end. O modelo proposto foi avaliado na base BP4D (Binghamton-Pittsburgh 3D Dynamic Spontaneous Facial Expression Database), utilizada no Facial Expression Recognition and Analysis Challenge (FERA) 2015, que possui anotações da intensidade para cinco AUs em imagens com ambiente controlado. Os resultados obtidos, na média das cinco AUs, superam os baselines propostos e são similares ao estado-da-arte, superando-o em uma das AUs.

In 2018 31st Conference on Graphics, Patterns and Images (SIBGRAPI'18).

http://sibgrapi.sid.inpe.br/col/sid.inpe.br/sibgrapi/2018/10.19.10.43/doc/wtd-julio.pdf