Del píxel a las resonancias visuales: La imagen con voz propia

##plugins.themes.bootstrap3.article.main##

##plugins.themes.bootstrap3.article.sidebar##

Publicado 12-07-2016
Pilar Rosado Rodrigo Eva Figueras Ferrer Ferran Reverter Comes

Resumen

Esta investigación aborda el problema de la detección aspectos latentes en grandes colecciones de imágenes de obras de artista abstractas, atendiendo sólo a su contenido visual. Se ha programado un algoritmo de descripción de imágenes utilizado en visión artificial cuyo enfoque consiste en colocar una malla regular de puntos de interés en la imagen y seleccionar alrededor de cada uno de sus nodos una región de píxeles para la que se calcula un descriptor que tiene en cuenta los gradientes de grises encontrados. Los descriptores de toda la colección de imágenes se pueden agrupar en función de su similitud y cada grupo resultante pasará a determinar lo que llamamos 'palabras visuales'. El método se denomina Bag-of-Words (bolsa de palabras). Teniendo en cuenta la frecuencia con que cada 'palabra visual'  ocurre en cada imagen, aplicamos el modelo estadístico pLSA (Probabilistic Latent Semantic Analysis), que clasificará de forma totalmente automática las imágenes según su categoría formal. Esta herramienta resulta de utilidad tanto en el análisis de obras de arte como en la producción artística.

Cómo citar

Rosado Rodrigo, P., Figueras Ferrer, E., & Reverter Comes, F. (2016). Del píxel a las resonancias visuales: La imagen con voz propia. AusArt, 4(1). https://doi.org/10.1387/ausart.16670
Abstract 387 | PDF Downloads 333

##plugins.themes.bootstrap3.article.details##

Keywords

VISIÓN ARTIFICIAL, MODELO BAG-OF-WORDS, CBIR (RECUPERACIÓN DE IMÁGENES POR CONTENIDO), PLSA (ANÁLISIS PROBABILÍSTICO DE ASPECTOS LATENTES), PALABRA VISUAL

References
Flusser, Vilém. 2009. Una filosofía de la fotografía. Traducción, Thomas Schilling. El Espíritu y la Letra 5. Madrid: Síntesis

Hofmann, Thomas. 2001. "Unsupervised learning by probabilistic latent semantic analysis". Machine Learning 42

Kandinsky, Vasili Vasilievich (1912) 1987. La gramática de la creación. El futuro de la pintura. Ed. y notas de Philippe Sers. Barcelona: Paidós

Kandinsky, Vasili Vasilievich (1926) 1996. Punto y línea sobre el plano: Contribución al análisis de los elementos pictóricos. Traducción Roberto Echavarren. Barcelona: Paidós

Koffka, Kurt. (1935). 2014. Principles of Gestalt Psychology. Milano: Mimesis International

Köhler, Wolfgang. (1947) 1992. Gestalt psychology: An introduction to new concepts in modern psychology. New York: Liveright

Lazebnik, Svetlana, Cordelia Schmid & Jean Ponce. 2006. "Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories". IEEE Computer Society Conference on Computer Vision and Pattern Recognition 2: 2169-78. Doi: doi.ieeecomputersociety.org/10.1109/CVPR.2006.68

Lowe, David G. 2000. "Towards a computational model for object recognition in IT cortex". En Biologically motivated computer vision: First IEEE International Workshop, BMCV 2000 Seoul, Korea, May 15-17: Proceedings, Seong-Whan Lee Heinrich H. Bülthoff & Tomaso Poggio, eds., 20-31. Berlin: Springer

Lowe, David G. 2004. "Distinctive image features from scale invariant keypoints". International Journal of Computer Vision 60(2): 91-110

Reverter Comes, Ferrán, Eva Figueras Ferré, Miquel Planas Rosselló & Pilar Rosado Rodrigo. 2013. Ideación y catalogación artística basada en métodos de visión artificial. Barcelona: Raima

Rosado Rodrigo, Pilar, Ferrán Reverter Comes, Eva Figueras Ferré & Miquel Planas Rosselló. 2014. "Semantic-based image analysis with the goal of assisting artistic creation". Lecture Notes in Computer Science 8671: 526-33. Doi: 10.1007/978-3-319-11331-9

Rosado Rodrigo, Pilar, Eva Figueras Ferré & Ferrán Reverter Comes. 2014. "Intersecciones entre visión artificial y mirada artística". Brac 2(1): 1-54. Doi:10.4471/brac.2014.01
Sección
Artículos