Del píxel a las resonancias visuales: La imagen con voz propia

Pilar Rosado Rodrigo; Eva Figueras Ferrer; Ferran Reverter Comes

doi:10.1387/ausart.16670

Del píxel a las resonancias visuales La imagen con voz propia

PDF

Publicado 12-07-2016

DOI https://doi.org/10.1387/ausart.16670

Pilar Rosado Rodrigo

Universitat de Barcelona. Dpt. d'Escultura

https://orcid.org/0000-0001-7142-5047

Eva Figueras Ferrer

Universitat de Barcelona. Dpt. d'Escultura

https://orcid.org/0000-0003-4045-9062

Ferran Reverter Comes

Universitat de Barcelona. Dpt. Genètica, Microbiologia i Estadística

Resumen

Esta investigación aborda el problema de la detección aspectos latentes en grandes colecciones de imágenes de obras de artista abstractas, atendiendo sólo a su contenido visual. Se ha programado un algoritmo de descripción de imágenes utilizado en visión artificial cuyo enfoque consiste en colocar una malla regular de puntos de interés en la imagen y seleccionar alrededor de cada uno de sus nodos una región de píxeles para la que se calcula un descriptor que tiene en cuenta los gradientes de grises encontrados. Los descriptores de toda la colección de imágenes se pueden agrupar en función de su similitud y cada grupo resultante pasará a determinar lo que llamamos 'palabras visuales'. El método se denomina 'bag-of-words' (bolsa de palabras). Teniendo en cuenta la frecuencia con que cada 'palabra visual' ocurre en cada imagen, aplicamos el modelo estadístico PLSA (probabilistic latent semantic analysis), que clasificará de forma totalmente automática las imágenes según su categoría formal. Esta herramienta resulta de utilidad tanto en el análisis de obras de arte como en la producción artística.

Cómo citar

Rosado Rodrigo, Pilar, Eva Figueras Ferrer, y Ferran Reverter Comes. 2016. «Del píxel a Las Resonancias Visuales: La Imagen Con Voz Propia». AusArt 4 (1). https://doi.org/10.1387/ausart.16670.

Abstract 1771 | PDF Downloads 579

Keywords

VISIÓN ARTIFICIAL, MODELO BAG-OF-WORDS, CBIR (RECUPERACIÓN DE IMÁGENES POR CONTENIDO), PLSA (ANÁLISIS PROBABILÍSTICO DE ASPECTOS LATENTES), PALABRA VISUAL

References

Flusser, Vilém. 2009. Una filosofía de la fotografía. Traducción, Thomas Schilling. Madrid: Síntesis

Hofmann, Thomas. 2001. «Unsupervised learning by probabilistic latent semantic analysis». Machine Learning 42

Kandinsky, Vasili Vasilievich (1912) 1987. La gramática de la creación: El futuro de la pintura. Ed. y notas de Philippe Sers. Barcelona: Paidós

Kandinsky, Vasili Vasilievich (1926) 1996. Punto y línea sobre el plano: Contribución al análisis de los elementos pictóricos. Traducción, Roberto Echavarren. Barcelona: Paidós

Koffka, Kurt. (1935) 2014. Principles of Gestalt psychology. Milano: Mimesis International. https://doi.org/10.4324/9781315009292

Köhler, Wolfgang. (1947) 1992. Gestalt psychology: An introduction to new concepts in modern psychology. New York: Liveright

Lazebnik, Svetlana, Cordelia Schmid & Jean Ponce. 2006. «Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories» . IEEE Computer Society Conference on Computer Vision and Pattern Recognition 2: 2169-2178. https://doi.org/10.1109/CVPR.2006.68

Lowe, David G. 2000. «Towards a computational model for object recognition in IT cortex». En Biologically motivated computer vision: First IEEE International Workshop, BMCV 2000 Seoul, Korea, May 15-17; Proceedings, Seong-Whan Lee Heinrich H. Bülthoff & Tomaso Poggio, eds., 20-31. Berlin: Springer

Lowe, David G. 2004. «Distinctive image features from scale invariant keypoints». International Journal of Computer Vision 60(2): 91-110. https://doi.org/10.1023/B:VISI.0000029664.99615.94

Reverter Comes, Ferrán, Eva Figueras Ferré, Miquel Planas Rosselló & Pilar Rosado Rodrigo. 2013. Ideación y catalogación artística basada en métodos de visión artificial. Barcelona: Raima

Rosado Rodrigo, Pilar, Ferrán Reverter Comes, Eva Figueras Ferré & Miquel Planas Rosselló. 2014. «Semantic-based image analysis with the goal of assisting artistic creation». Lecture Notes in Computer Science 8671: 526-533. https://doi.org/10.1007/978-3-319-11331-9

Rosado Rodrigo, Pilar, Eva Figueras Ferré & Ferrán Reverter Comes. 2014. «Intersecciones entre visión artificial y mirada artística». Brac 2(1): 1-54. https://doi.org/10.17583/brac.2014.v2i1.a891.1-54

Número

Vol. 4 Núm. 1 (2016): Visualidad, energía, conectividad

Sección

Artículos

Esta obra está bajo una licencia internacional Creative Commons Atribución-CompartirIgual 4.0.

Resultado de imagen de CC BY-SA 3.0)

Atribución-CompartirIgual 4.0 Internacional (CC BY-SA 4.0)

Usted es libre de:

Compartir — copiar y redistribuir el material en cualquier medio o formato
Adaptar — remezclar, transformar y construir a partir del material para cualquier propósito, incluso comercialmente.

https://creativecommons.org/licenses/by-sa/4.0/deed.es

Del píxel a las resonancias visuales La imagen con voz propia

Resumen

Cómo citar

Usted es libre de:

Artículos más leídos del mismo autor/a

Artículos similares

##plugins.themes.bootstrap3.article.main##

##plugins.themes.bootstrap3.article.sidebar##

Resumen

Cómo citar

##plugins.themes.bootstrap3.article.details##

Usted es libre de:

Artículos más leídos del mismo autor/a

Artículos similares