Abstract

Advisors: Xavier Giro-i-Nieto and Carles Ventura-Royo

 

This Bachelor of Science thesis addresses the problem of image classification combining two popular visual representations: points and regions. Firstly, the study explores bundling interest points with regions. These regions are generated with an initial SLIC partition and using Binary Partition Tree (BPT), considering different scales of resolution in the segmentation. Secondly, it explores modelling visual classes as a group of points extracted from different images. Based on Naive-Bayes Nearest Neighbor (NBNN), we are using 1-Nearest Neighbor with SURF descriptor on the 17 Category Flower Dataset with 1360 images of flowers distributed into 17 classes, 80 images per class. We have verified that grouping interest points of the same class improves the F1-score a 9.2%. However, bundling interest points into regions using segmentation worsens the F1-score between 1% and 7%, depending on the number of regions in the segmentation.

[Extended summary on Bitsearch blog]

Author's website: jordisanchez.info

Grade: A (9.3/10)

(This BSc thesis was written in Catalan language.)

 

---------------------------------

Aquest Treball Final de Grau aborda el problema de la classificació d'imatges combinant dues representacions visuals populars: els punts i les regions. En primer lloc, l'estudi explora l'agrupació de punts d'interès amb les regions. Aquestes regions es generen amb una partició inicial SLIC i s'utilitzen els Arbres de Partició Binària (Binary Partition Tree, BPT), considerant diferents escales de resolució en la segmentació. En segon lloc, s'estudia modelar les classes com a grup de punts d'interès extrets d'imatges diferents. Basant-nos en el classificador Naive-Bayes Nearest Neighbor (NBNN), hem utilitzat el veï més proper amb un descriptor SURF sobre la base de dades 17 Category Flower Dataset, que conté 1360 imatges de flors distribuïdes en 17 classes, amb 80 imatges per classe. Hem pogut verificar que el fet d'ajuntar els punts d'interès de les imatges d'una mateixa classe millora la puntuació F1 en un 9,2%. No obstant, l'agrupació de punts d'interès en regions utilitzant una segmentació de la imatge empitjora la puntuació F1 entre l'1% i el 7%, depenent del nombre de regions de la segmentació.

Lloc web de l'autor: jordisanchez.info

 Qualificació: A (9.3/10)

Jordi Sanchez Escue