Étude paramétrique de YOLOv3

Eliott Segard

Eliott Segard

R&D Reconnaissance d'images
22 mai 2019

Dans le cadre de la reconnaissance d’images, nous avons étudié plusieurs modèles de détection d’objets, notamment YOLOv3. C’est un modèle robuste qui a déjà fait ses preuves sur d’autres cas d’usage et qui se prête bien à la détection de produits. Il fonctionne de façon analogue à tous les autres algorithmes de détection : il faut initialement l’entraîner sur des images connues et par la suite, il prend en entrée les images que l’on veut tester et donne en sortie des propositions de boîtes avec un score de confiance allant de 0 à 1.

Afin d’en extraire les meilleures performances possibles, nous avons mené une étude paramétrique qui vise à déterminer les réglages optimaux pour notre cas d’usage particulier: la détection de produits sur des rayons.

Les paramètres que nous évaluons sont:
- la taille (en pixels) des images sur lesquelles nous entraînons le modèle
- la taille (en pixels) des images sur lesquelles nous faisons des prédictions
- le seuil de confiance à partir duquel nous considérons une détection comme pertinente

Pour mesurer les performances, nous utilisons l’indice “mean Average Performance” (mAP) (en % dans le tableau) qui est le benchmark de référence pour les problèmes de détection d’objets. C’est une moyenne entre la précision (la proportion d’objets correctement détectés parmi tous les objets détectés) et le rappel (la proportion d’objets correctement détectés parmi tous les objets présents dans l’image).

On peut observer que, aussi bien pour l’entraînement que pour la prédiction, les résultats s’améliorent quand on augmente la taille des images. C’est un constat assez intuitif car, quand on augmente la résolution des images, le modèle dispose de plus d’informations pour détecter les objets. Cependant augmenter la taille des images a aussi un impact sur les temps d’entraînement et de prédiction, il s’agit donc de trouver le bon compromis en fonction des contraintes de temps et de performance.

Voici le résultat sur une image de rayon. L’indice de confiance s’affiche au-dessus de chaque produit et nous sert d’indicateur pour vérifier que l’algorithme fonctionne correctement. Par exemple, le carré en bas à droite : 0,33, cela signifie que notre algorithme détecte à 33% que c’est un produit.

Optimisez vos process avec les dernières technologies d'Intelligence Artificielle.

Plus d'articles

2013-2019 Mobeye S.A.S All rights reserved