Sistema basado en conocimiento para la obtención de flujos de trabajo aplicables al realce de imágenes digitales de archivos históricos

Autores/as

  • Yuniel Guzmán Bazán, Ing (1) Universidad de Granma (UDG), Departamento de Desarrollo de Software, Granma – Cuba
  • Juan Valentín Lorenzo Ginori, Dr.C Universidad Central de Las Villas (UCLV), Centro de Estudios Informáticos (CEI), Villa Clara – Cuba
  • Julio Cedeño Ferrín, MSc. Universidad Estatal del Sur de Manabí, Ecuador.

DOI:

https://doi.org/10.37117/s.v2i11.124

Resumen

Hoy en día existe un creciente deterioro en los documentos custodiados en las instituciones archivísticas cubanas. La manipulación de los investigadores, las manchas, huecos y la humedad, han provocado que sea poco legible el contenido de estos documentos. Por tal razón, se trabaja sobre su vertimiento a formato digital como medida de conservación preventiva. Las imágenes resultado de la digitalización requieren una restauración que mejore su legibilidad. Con tal propósito se creó la aplicación DocLux. Actualmente el proceso de restauración no es efectivo. Los especialista de los Archivos Históricos deben seleccionar el flujo de trabajo (transformaciones y parámetros) necesario para la restauración de cada documento digitalizado. La inexperiencia de estos especialistas en procesamiento de imágenes digitales afecta la productividad de la restauración. En este trabajo se presenta una herramienta de apoyo para los especialistas de los Archivos Históricos con el objetivo de asistirlos en el proceso de restauración de las imágenes digitales. La herramienta recomienda el flujo de trabajo necesario para restaurar las imágenes digitalizadas. La parte central de la herramienta la constituye un sistema de razonamiento basado en casos y como técnica de extracción de características de imágenes el histograma de color. La recuperación de los casos más similares se realizó aplicando el coeficiente de correlación de Pearson. Las pruebas realizadas mostraron que con la herramienta propuesta se disminuye el tiempo necesario para restaurar las imágenes.

 

Palabras Claves: Realce de imágenes digitales, razonamiento basado en casos, histogramas de color, instituciones archivísticas, flujo de trabajo

Abstract: Enhancement of digital images, case-based reasoning, color histograms, archival institutions, workflow

Nowadays, there is an increasing deterioration in documents held in Cuban archival institutions. The handling of the researchers, stains, holes and humidity have turned the content of this documents to be unreadable. For this reason, it has being working on their migration into digital format as a measure of preventive conservation. The result of the scan images requires a restoration to improve readability. To this end, the Doclux application was created. Currently the restoration process is not effective. The specialists of the Archives must select the workflow (transformations and parameters) necessary for the restoration of each scanned document. The inexperience of these specialists on digital image processing affects the productivity of the restoration. This paper presents a support tool for specialists of the Archives, in order to assist in the restoration process of digital images. The tool recommends the workflow necessary to restore the scanned images. The central part of the tool is constituted by a case based reasoning system and the color histogram as feature images extraction technique. The recovery of the most similar cases was performed using the Pearson correlation coefficient. Tests showed that with the proposed tool, the time to restore the images decreases.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Aamodt, A. (1994). Case-Based Reasoning: Foundational Issues , Methodological Variations , and System Approaches, 7, 39-59.

Althoff, K. (2001). Case-Based Reasoning. Handbook of Software Engineering and Knowledge Engineering. Fraunhofer Institute for Experimental Software. Fraunhofer Institute for Experimental Software Engineering (IESE), Kaisersalutern, 1, 549-587.

Benítez, R., Escudero, G., Kanaan, S., & Rodó, D. M. (2014). Inteligencia artificial avanzada. (E. UOC, Ed.).

Bescos, J. (1989). Image processing algorithms for readability enhancement of old manuscripts. Proc. Int’l Electronic Imaging Exposition and Conf, 392-397.

Bescos, J., & Jaque, F. (1989). Reflectance and Optical Contrast of Old Manuscripts: Wavelength Dependence. Intl Congress on Optical Science and Engineering. International Society for Optics and Photonics, 258-262.

Bescos, J., Secilla, J. P., & Navarro, J. (1990). Filtering and compression of old manuscripts by adaptive processing techniques. Proceedings of the Society for Information Display Symposium (Vol. 21, pp. 384-387).

Borrego, S., Marta, A., Reyes, C., & Cisneros, G. G. (2009). Diagnóstico del estado de conservación de colecciones fotográficas del Archivo Nacional de la República de Cuba. Códice, 5(1), 67-82.

Boussellaa, W., Alimi, A., & Zahour, A. (2007). A Methodology for the Separation of Foreground / Background in Arabic Historical Manuscripts using Hybrid Methodss. En Proceedings of the 2007 ACM symposium on Applied computing. ACM (Vol. 14, pp. 605-609).

Dubitzky, W. (1997). Knowledge Integration in Case-Based Reasoning: A Concept-Centred Approach. University of Ulster.

Esposito, F., Malerba, D., Semeraro, G., Ferilli, S., Altamura, O., Basile, T. M. A., Berrardi, M., et al. (2004). Machine Learning methods for automatically processing historical documents: from paper acquisition to XML transformation. In C. Society (Ed.), First International Workshop on Document Image Analysis for Libraries (DIAL’04) (pp. 328-335). IEEE. Retrieved from http://www.di.uniba.it/~ceci/Papers/Pubblicazioni/International Collections/IC.18__20880328.pdf

Fernández, S. P., & Díaz, S. P. (2001). Investigación: Relación entre variables cuantitativas, 4, 1-8.

Gallego, A. (2006). Modelos visuales en el análisis de la calidad de imagen. Universidad Politécnica de Madrid. Retrieved from http://optica.csic.es/papers/pfc_ana.pdf

González, M. J. A.-C. (1996). El Departamento de Coordinación y Normalización: Organización y funcionamiento. Boletín de la ANABAD, 46(1), 261-280.

González, P. (1994). El Archivo General de Indias y su proyecto de informatización: nuevas posibilidades para la investigación. Cuadernos de historia moderna, (15), 231-249. Retrieved from http://revistas.ucm.es/index.php/CHMO/article/download/CHMO9494110231A/23708

Kolodner, J. L. (1992). An Introduction to Case-Based Reasoning, 6(1), 3-34.

Mantiuk, R. K., Tomaszewska, A., & Mantiuk, R. (2012). Comparison of Four Subjective Methods. Computer Graphics Forum, 31(8), 2478-2491. doi:10.1111/j.1467-8659.2012.03188.x

Mariel, F. (1994). “CBR: A categorized bibliography”. The Knowledge Engineering Review, 9, 1-36.

Marín, F. M. (1992). La conservación y utilización de textos en el futuro inmediato, 75(4), 1010-1023. Retrieved from http://www.lllf.uam.es/~fmarcos/articulo/92Hadmyte.pdf

Mello, C. A. B., & Lins, R. D. (2002). Generation of Images of Historical Documents by Composition. In Proceedings of the 2002 ACM symposium on Document engineering (pp. 127-133). Brazil.

Moreno, A. V. (2004). El tiempo de la archivística : un estudio de sus espacios de racionalidad histórica, II(15), 76-96. Retrieved from http://www.scielo.br/pdf/ci/v33n3/a10v33n3

Neches, R., Fikes, R., Finin, T., Gruber, T., Patil, R., Senator, T., & Swartout, W. R. (1991). Enabling Technology for Knowledge Sharing. AI magazine, 12(3).

Orera Orera, L. (2008). Preservación digital y bibliotecas: un nuevo escenario. Revista general de información y documentación, 18, 9-24.

Pina, A. N. (2010). Clasificación y búsqueda de imágenes usando características visuales. Universidad de Murcia.

Térmens, M. (2009). Investigación y desarrollo en preservación digital: un balance internacional. El profesional de la información, 18(6), 613-624. doi:10.3145/epi.2009.nov.04

Publicado

2018-02-24

Cómo citar

Guzmán Bazán, Y., Lorenzo Ginori, J. V., & Cedeño Ferrín, J. (2018). Sistema basado en conocimiento para la obtención de flujos de trabajo aplicables al realce de imágenes digitales de archivos históricos. Revista Científica Sinapsis, 2(11). https://doi.org/10.37117/s.v2i11.124

Número

Sección

Tecnologías de la Información y las Comunicaciones