Captura de movimiento y reconocimiento de actividades para múltiples personas mediante un enfoque bayesiano

A. Marcos, D. Pizarro, M. Marrón, M. Mazo

Resumen

Se presenta un método general para la detección, de forma no invasiva, de la postura corporal de varias personas a partir de la información capturada por múltiples cámaras. Se sigue una filosofía basada en el entrenamiento previo de un modelo articulado y posterior seguimiento. La principal aportación es la posibilidad de detectar varias personas simultáneamente. Se utiliza un modelo articulado para definir las posturas que puede adoptar una persona. Mediante bases de datos de captura de movimiento se selecciona un conjunto de clases o actividades predefinidas. El entrenamiento reduce la complejidad del modelo articulado a partir de técnicas no lineales de reducción de dimensionalidad. Así, las diferentes actividades de una persona quedan definidas de manera compacta por un conjunto de valores de baja dimensionalidad. Posteriormente, un filtro de partículas mixto (estados discretos y continuos) es utilizado para detectar la postura y el tipo de movimiento simultáneamente. Las hipótesis resultantes, seleccionadas automáticamente a partir de la distribución de partículas, son refinadas usando un optimizador no lineal que hace uso de funciones ‘a priori’ del tipo de movimiento entrenado. La propuesta se ha evaluado con un método simple pero estándar, basado en la comparación de volúmenes cilíndricos articulados con volúmenes del cuerpo humano, extraidos automáticamente a partir de las imágenes. Se consigue una precisión cercana a trabajos del estado del arte que no tienen en cuenta a más de una persona y ofrece un marco de trabajo flexible para futuras investigaciones.

Palabras clave

Visión artificial; Aplicaciones de seguimiento; Sistemas multidimensionales; Visión estéreo

Texto completo:

PDF

Referencias

Bartoli, A., Pizarro, D., Loog, M., 2010. Stratified Generalized Procrustes Analysis. British Machine Vision Conference.

Bernardo, J., Berger, J., Dawid, A., Smith, A., 1992. Some Bayesian Numerical Analysis. Bayesian Statistics, Vol. 4.

Bottino, A., Laurentini, A., 2001. A silhouette based technique for the reconstruction of human movement. Computer Vision and Image Understanding 83 (1), 79–95.

Chu, C., Jenkins, O., Mataric, M., 2003. Markerless kinematic model and motion capture from volume sequences.

Doucet, A., 1997. Monte-Carlo methods for bayesian estimation of HiddenMarkov models. Application to Radiation Signal. Ph.D. thesis, University of Paris-Sud, France.

Gall, J., Rosenhahn, B., Brox, T., Seidel, H., 2010a. Optimization and filtering for human motion capture. International journal of computer vision 87 (1), 75–92.

Gall, J., Stoll, C., De Aguiar, E., Theobalt, C., Rosenhahn, B., Seidel, H., 2009. Motion capture using joint skeleton tracking and surface estimation.

Gall, J., Yao, A., Van Gool, L., 2010b. 2d action recognition serves 3d human pose estimation. Computer Vision–ECCV 2010, 425–438.

Grochow, K., Martin, S., Hertzmann, A., Popovic, Z., 2004. Style-based inverse kinematics. In: ACM Transactions on Graphics (TOG). Vol. 23. ACM, pp. 522–531.

Isard, M., Blake, A., 1998. A mixed-state condensation tracker with automatic model-switching. In: Computer Vision, 1998. Sixth International Conference on. IEEE, pp. 107–112.

Lawrence, N., 2005. Probabilistic non-linear principal component analysis with Gaussian process latent variable models. The Journal of Machine Learning Research 6, 1783–1816.

Liu, Y., Stoll, C., Gall, J., Seidel, H., Theobalt, C., 2011. Markerless motion capture of interacting characters using multi-view image segmentation. Computer Vision and Pattern Recognition.

Marquardt, D., 1963. An algorithm for least-squares estimation of nonlinear parameters. Journal of the society for Industrial and Applied Mathematics 11 (2), 431–441.

Shotton, J., Fitzgibbon, A., Cook, M., Sharp, T., Finocchio, M., Moore, R., Kipman, A., Blake, A., 2011. Real-time human pose recognition in parts from single depth images. In: In CVPR.

Sigal, L., Balan, A., Black, M., 2010. Humaneva: Synchronized video and motion capture dataset and baseline algorithm for evaluation of articulated human motion. International Journal of Computer Vision 87 (1), 4–27.

Urtasun, R., 2006. Motion Models for Robust 3D Human Body Tracking. Ph.D. thesis, ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE.

Wang, J., Fleet, D., Hertzmann, A., 2006. Gaussian process dynamical models. Advances in neural information processing systems 18, 1441.

Williams, C., 1998. Prediction with Gaussian processes: From linear regression to linear prediction and beyond. NATO ASI SERIES D BEHAVIOURAL AND SOCIAL SCIENCES 89, 599–621.

Abstract Views

469
Metrics Loading ...

Metrics powered by PLOS ALM


 

Citado por (artículos incluidos en Crossref)

This journal is a Crossref Cited-by Linking member. This list shows the references that citing the article automatically, if there are. For more information about the system please visit Crossref site

1. Conteo de personas con un sensor RGBD comercial
M. Castrillón-Santan, J. Lorenzo-Navarro, D. Hernández-Sosa
Revista Iberoamericana de Automática e Informática Industrial RIAI  vol: 11  num.: 3  primera página: 348  año: 2014  
doi: 10.1016/j.riai.2014.05.006



Creative Commons License

Esta revista se publica bajo una Licencia Creative Commons Attribution-NonCommercial-CompartirIgual 4.0 International (CC BY-NC-SA 4.0)

Universitat Politècnica de València     https://doi.org/10.4995/riai

e-ISSN: 1697-7920     ISSN: 1697-7912