Algoritmos de Binarización Robusta de Imágenes con Iluminación No Uniforme

Edgar Molina, Julia Diaz, Hugo Hidalgo-Silva, Edgar Chávez

Resumen

La binarización es una técnica básica de procesamiento digital de imágenes. Los métodos de binarización han sido progresivamente mejorados para tratar con imágenes en condiciones más realistas. De particular importancia es considerar la condición de iluminación no uniforme de las imágenes a binarizar, presente cuando se realiza la adquisición de imágenes con equipo no especializado (e.g. un teléfono celular). En este trabajo se propone un nuevo enfoque para la binarización de imágenes de texto que fueron adquiridas bajo iluminación no uniforme. La idea central es obtener una iluminación más uniforme (apropiada para binarización) a partir de la fusión de dos imágenes iluminadas complementariamente. Para probar el desempeño de nuestra propuesta capturamos un conjunto grande de imágenes de texto reales, obtenidas con un teléfono celular, con diversas condiciones de iluminación no uniforme. Comparamos nuestra propuesta con diversas técnicas del estado del arte y mostramos que tenemos mejores resultados usando distintas métricas de binarización.


Palabras clave

Binarización; Iluminación; Fusión de Imágenes

Texto completo:

PDF

Referencias

Bernsen, J., 1986. Dynamic thresholding of grey-level images. Proceedings of International Conference on Pattern Recognition, 1251–1255.

Bradley, D., Roth, G., 2007. Adaptive thresholding using the integral image. Journal of Graphics, GPU and Game Tools 12 (2), 13–21.

Calderon, F., Garnica-Carrillo, A., Flores, J. J., 2016. Fusión de imágenes multi foco basado en la combinación lineal de imágenes utilizando imágenes incrementales. Revista Iberoamericana de Automática e Informática Industrial RIAI 13 (4), 450–461. https://doi.org/10.1016/j.riai.2016.07.002

Feng, M.-L., Tan, Y.-P., 2004. Adaptive binarization method for document image analysis. In: Multimedia and Expo, 2004. ICME'04. 2004 IEEE International Conference on. Vol. 1. IEEE, pp. 339–342.

Gatos, B., Pratikakis, I., Perantonis, S. J., 2006. Adaptive degraded document image binarization. Pattern recognition 39 (3), 317–327. https://doi.org/10.1016/j.patcog.2005.09.010

Gonzalez, R., Woods, R., 2002. Digital image processing. Pearson Education. Howe, N. R., 2013. Document binarization with automatic parameter tuning. International Journal on Document Analysis and Recognition (IJDAR) 16 (3), 247–258.

Khurshid, K., Siddiqi, I., Faure, C., Vincent, N., 2009. Comparison of niblack inspired binarization methods for ancient documents. DRR 7247, 1–10. https://doi.org/10.1117/12.805827

Lu, H., Kot, A. C., Shi, Y. Q., 2004. Distance-reciprocal distortion measure for binary document images. IEEE Signal Processing Letters 11 (2), 228–231. https://doi.org/10.1109/LSP.2003.821748

Niblack,W., 1986. An Introduction to Digital Image Processing. Prentice-Hall. Otsu, N., 1979. A threshold selection method from gray-level histograms. IEEE Transactions on System, Man and Cybernetics 6 (3), 62–66.

Pratikakis, I., Gatos, Basilis. Konstantinos, N., 2010. H-dibco 2010 – handwritten document image binarization competition. International Conference on Frontiers in Handwriting Recognition, 727–732. https://doi.org/10.1109/ICFHR.2010.118

Pratikakis, I., Gatos, Basilis. Konstantinos, N., 2013. Icdar 2013 document image binarization contest (dibco 2013). International Conference on Document Analysis and Recognition, 1471–1476. https://doi.org/10.1109/ICDAR.2013.219

Sauvola, J., Pietikainen, M., 2000. Adaptive document image binarization. Pattern Recognition 33, 225—-236.

Singh, T., Roy, Sudipta. Singh, O., Sinam, T., Singh, M., 2011. A new local adaptive thresholding technique in binarization. IJCSI International Journal of Computer Science Issues 8 (6), 271–277.

Soille, P., 2004. Morphological Image Analysis: Principles and Applications. Springer. https://doi.org/10.1007/978-3-662-05088-0

Valizadeh, M., Kabir, E., 2012. Binarization of degraded document image based on feature space partitioning and classification. International Journal on Document Analysis and Recognition 15 (1), 57–69. https://doi.org/10.1007/s10032-010-0142-4

Viola, P., Jones, M. J., Snow, D., 2005. Detecting pedestrians using patterns of motion and appearance. International Journal of Computer Vision 63 (2), 153–161. https://doi.org/10.1007/s11263-005-6644-8

Wolf, C., Jolion, J.-M., Chassaing, F., 2002. Text localization, enhancement and binarization in multimedia documents. In: Pattern Recognition, 2002. Proceedings. 16th International Conference on. Vol. 2. IEEE, pp. 1037–1040. https://doi.org/10.1109/ICPR.2002.1048482

Abstract Views

339
Metrics Loading ...

Metrics powered by PLOS ALM


 

Citado por (artículos incluidos en Crossref)

This journal is a Crossref Cited-by Linking member. This list shows the references that citing the article automatically, if there are. For more information about the system please visit Crossref site

1. Oil Spill Detection in Terma-Side-Looking Airborne Radar Images Using Image Features and Region Segmentation
Pablo Gil, Beatriz Alacid
Sensors  vol: 18  num.: 2  primera página: 151  año: 2018  
doi: 10.3390/s18010151



Esta revista se publica bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional

Universitat Politècnica de València

e-ISSN: 1697-7920     ISSN: 1697-7912