@mastersthesis {xGris-Sarabia, title = {Pyxel, una llibreria per a l{\textquoteright}anotació automàtica de fotografies}, year = {2015}, abstract = {

Tutor:\ Xavier Gir{\'o}-i-Nieto\ (UPC)\ 

Grau: Enginyeria en Sistemes Audiovisuals (4 anys) a l{\textquoteright}Escola d{\textquoteright}Enginyeria de Terrassa (UPC)

Donat que actualment la generació i difusió de contingut multimèdia ha incrementat molt, s{\textquoteright}està fent recerca per trobar eines d{\textquoteright}anotació automàtica o semiautomàtica d{\textquoteright}imatges, sons, vídeos, etc.

Aquest document recull la informació sobre el desenvolupament i funcionament de la llibreria Pyxel, orientada, concretament, a l{\textquoteright}anotació d{\textquoteright}imatges mitjançant la informació visual de la imatge i la informació textual que l{\textquoteright}acompanya, les metadades.

El Pyxel és un conjunt de classes desenvolupades en llenguatge de programació Python per dur a terme una cadena d{\textquoteright}anotació d{\textquoteright}imatges complerta, es a dir, permet l{\textquoteright}extracció de característiques visuals amb descriptors SIFT i l{\textquoteright}extracció de característiques textuals de metadades mitjançant l{\textquoteright}algoritme de processat de text TF-IDF, així com eines per crear ambdós vocabularis. També proporciona eines per l{\textquoteright}entrenament i la detecció d{\textquoteright}un classificador SVM.

Per tal de gestionar les dades de grans volums d{\textquoteright}imatges les eines del Pyxel estan pensades per fer processat d{\textquoteright}imatges en paral{\textperiodcentered}lel, molt útil per aprofitar d{\textquoteright}una manera optima els recursos d{\textquoteright}un servei de computació gestionat amb SLURM.

Qualificaci{\'o} final: A (9/10)

Thesis defence by Irene Gris Sarabia, with Pyxel developer team.

Defensa del Projecte de Fi de Grau de la Irene Gris Sarabia (23 de gener de 2015)
}, keywords = {image classification, python}, author = {Gris-Sarabia, Irene}, editor = {Xavier Gir{\'o}-i-Nieto} } @conference {cManchon-Vizuete, title = {Photo Clustering of Social Events by Extending PhotoTOC to a Rich Context}, booktitle = {ICMR 2014 Workshop on Social Events in Web Multimedia (SEWM)}, year = {2014}, month = {04/2014}, publisher = {ACM}, organization = {ACM}, address = {Glasgow, Scotland}, abstract = {

The popularisation of the storage of photos on the cloud has opened new opportunities and challenges for the organisation and extension of photo collections. This paper presents a light computational solution for the clustering of web photos based on social events. The proposal combines a first over-segmentation of the photo collections of each user based on temporal cues, as previously proposed in PhotoTOC. On a second stage, the resulting mini-clusters are merged based on contextual metadata such as geolocation, keywords and user IDs. Results indicate that, although temporal cues are very relevant for event clustering, robust solutions should also consider all these additional features.

[Conference website]

Photo Clustering of Social Events by Extending PhotoTOC to a Rich Context from Xavi Gir{\'o}

}, keywords = {Clustering, Event Detection, Photo Collections}, url = {http://hdl.handle.net/2117/23009}, author = {Manchon-Vizuete, Daniel and Gris-Sarabia, Irene and Xavier Gir{\'o}-i-Nieto} }