Medida de similitud basada en saliencia

Sergio Domínguez

Resumen

La proliferación en todos los ámbitos de la producción multimedia está dando lugar a la aparición de nuevos paradigmas de recuperación de información visual. Dentro de éstos, uno de los más significativos es el de los sistemas de recuperación de información visual, VIRS (Visual Information Retrieval Systems), en los que una de las tareas más representativas es la ordenación de una población de imágenes según su similitud con un ejemplo dado. En este trabajo se presenta una propuesta original para la evaluación de la similitud entre dos imágenes, basándose en la extensión del concepto de saliencia desde el espacio de imágenes al de características para establecer la relevancia de cada componente de dicho vector. Para ello se introducen metodologías para la cuantificación de la saliencia de valores individuales de características, para la combinación de estas cuantificaciones en procesos de comparación entre dos imágenes, y para, finalmente, establecer la mencionada ponderación de cada característica en atención a esta combinación. Se presentan igualmente los resultados de evaluar esta propuesta en una tarea de recuperación de imágenes por contenido en comparación con los obtenidos con la distancia euclídea. Esta comparación se realiza mediante la evaluación de ambos resultados por voluntarios.

Palabras clave

Bases de datos de imágenes; recuperación basada en contenido; medidas de similitud; modelos perceptuales; análisis de imágenes

Texto completo:

PDF

Referencias

Ashby, F., Perrin, N., 1988. Toward a unified theory of similarity and recognition. Psychological Review 95 (1), 124–150.

Chen, G., Xie, W., 2011. Wavelet-based moment invariants for pattern recognition. Optical Engineering 50 (7).

Eidenberger, H., 2006. Evaluation and analysis of similarity measures for content based visual information retrieval. ACM Multimedia Systems Journal 12 (2), 71–87.

Fairhall, A. L., Lewen, G. D., Bialek, W., de Ryiter van Steveninck, R. R., August 2001. Efficiency and ambiguity in an adaptive neural code. Nature 412 (6849), 787–792.

Fisher, R., 2011. URL: homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm

Itti, L., Baldi, P., 2009. Byesian surprise attracts human attention. Vision Research 49, 1295–1306.

Itti, L., Koch, C., March 2001. Computational modelling of visual attention. Nature Reviews Neuroscience 2, 194–203.

Itti, L., Koch, C., Niebur, E., November 1998. A model of saliency-based visual attention for rapid scene analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence 20 (11), 1254–1259.

Kim, H.-K., Kim, J.-D., Sim, D.-G., Oh, D.-I., 2000. A modified zernike moment shape descriptor invariant to translation, rotation and scale for similarity-based image retrieval. IEEE International Conference on Multimedia 1, 307–310.

Kim, Y., Kim, W., 1998. Content-based trademark retrieval using a visually salient feature. Image and Vision Computing 16, 931–939.

Koch, C., Ullman, S., 1985. Shifts in selective visual attention: Towards the underlying neural circuitry. Human Neurobiology 4, 219–227.

Larkey, L. B., Markman, A. B., 2005. Processes of similarity judgement. Cognitive Science 29, 1061–1076.

Rao, R. P. N., Ballard, D. H., January 1999. Predictive coding in the visual cortex: A functional interpretation of some extra-classical receptive-field effects. Nature Neuroscience 2 (1), 79–87.

Santini, S., Jain, R., September 1999. Similarity measures. IEEE Transactions on Pattern Analysis and Machine Intelligence 21 (9), 871–883.

Shepard, R. N., June 1962a. The analysis of proximities: Multidimensional scaling with an unknown distance function. i. Psycometrika 27 (2), 125–140.

Shepard, R. N., September 1962b. The analysis of proximities: Multidimensional scaling with an unknown distance function.ii. Psycometrika 27 (3), 219–246.

Teh, C.-H., Chin, R. T., !’July 1988. On image analysis by the methods of moments. IEEE Transactions on Pattern Analysis and Machine Intelligence 10 (4), 496–512.

Treue, S., 2003. Visual attention: the where, what, how and why of saliency. Current Opinion in Neurobiology 13, 428–432.

Tsotsos, J. K., Culhane, S. M., Wai, W. Y. K., Lai, Y., Davis, N., Nuflo, F., 1995. Modeling visual attention via selective tuning. Artificial Intelligence 78, 507–545.

Tversky, A., July 1977. Features of similarity. Psychological Review 84 (4), 327–352.

Tversky, A., Gati, I., 1982. Simiarity, separability and the triangle equation. Psychological Review 89, 123–154.

Urdan, T. C., 2005. Statistics in plain english. Lawrence Erlbaum Associates

Abstract Views

498
Metrics Loading ...

Metrics powered by PLOS ALM


 

Citado por (artículos incluidos en Crossref)

This journal is a Crossref Cited-by Linking member. This list shows the references that citing the article automatically, if there are. For more information about the system please visit Crossref site

1. Textile Retrieval Based on Image Content from CDC and Webcam Cameras in Indoor Environments
Oscar García-Olalla, Enrique Alegre, Laura Fernández-Robles, Eduardo Fidalgo, Surajit Saikia
Sensors  vol: 18  num.: 5  primera página: 1329  año: 2018  
doi: 10.3390/s18051329



Creative Commons License

Esta revista se publica bajo una Licencia Creative Commons Attribution-NonCommercial-CompartirIgual 4.0 International (CC BY-NC-SA 4.0)

Universitat Politècnica de València     https://doi.org/10.4995/riai

e-ISSN: 1697-7920     ISSN: 1697-7912