Abstract

TutorXavier Giró-i-Nieto (UPC) 

Grau: Enginyeria en Sistemes Audiovisuals (4 anys) a l'Escola d'Enginyeria de Terrassa (UPC)

Donat que actualment la generació i difusió de contingut multimèdia ha incrementat molt, s'està fent recerca per trobar eines d’anotació automàtica o semiautomàtica d'imatges, sons, vídeos, etc.

Aquest document recull la informació sobre el desenvolupament i funcionament de la llibreria Pyxel, orientada, concretament, a l'anotació d'imatges mitjançant la informació visual de la imatge i la informació textual que l'acompanya, les metadades.

El Pyxel és un conjunt de classes desenvolupades en llenguatge de programació Python per dur a terme una cadena d'anotació d'imatges complerta, es a dir, permet l'extracció de característiques visuals amb descriptors SIFT i l'extracció de característiques textuals de metadades mitjançant l'algoritme de processat de text TF-IDF, així com eines per crear ambdós vocabularis. També proporciona eines per l'entrenament i la detecció d'un classificador SVM.

Per tal de gestionar les dades de grans volums d'imatges les eines del Pyxel estan pensades per fer processat d'imatges en paral·lel, molt útil per aprofitar d'una manera optima els recursos d’un servei de computació gestionat amb SLURM.

Qualificació final: A (9/10)


Thesis defence by Irene Gris Sarabia, with Pyxel developer team.

Defensa del Projecte de Fi de Grau de la Irene Gris Sarabia (23 de gener de 2015)