2025-04-23 11:27:45 +02:00

45 lines
1.9 KiB
Markdown

# Corrections pour le tri d'images avec llama-vision
Ce document décrit les corrections apportées pour résoudre les problèmes de tri d'images avec llama-vision.
## Problèmes identifiés
1. **Détection incomplète des images** : Seulement 2 images sur 4 étaient analysées après déduplication
2. **Classification trop stricte** : Toutes les images étaient classées comme non pertinentes
3. **Reconnaissance de formats limitée** : Certains formats d'images n'étaient pas correctement détectés
## Corrections apportées
### 1. Amélioration du prompt système (agent_image_sorter.py)
Le prompt système a été entièrement revu pour :
- Définir plus clairement ce qui constitue une image pertinente
- Adopter une approche "par défaut pertinent" en cas de doute
- Élargir la définition des images pertinentes
- Rendre le classement plus inclusif
### 2. Amélioration de la détection des images (orchestrator_llama.py)
La méthode `_lister_images` a été optimisée pour :
- Supporter davantage de formats d'images (ajout de .tiff, .tif)
- Vérifier que chaque fichier est bien une image valide
- Corriger la détection de l'extension .jpg (qui avait une erreur de syntaxe)
- Ajouter des logs pour faciliter le débogage
## Comment tester
Pour tester spécifiquement le tri d'images avec llama-vision, utilisez la commande suivante :
```bash
python main_llama.py <ticket_id> --skip-ticket-analysis --skip-image-analysis --skip-report
```
Après exécution, vérifiez :
1. Le fichier `tri_image_llama*.json` dans le dossier pipeline
2. Le nombre d'images analysées doit correspondre au nombre d'images uniques dans `rapport_de_deduplication.json`
3. Le classement des images devrait être plus généreux (plus d'images "pertinentes")
## Notes supplémentaires
- Le prompt a été optimisé pour llama-vision tout en conservant la consigne de répondre en français
- L'approche de tri est maintenant plus inclusive ("mieux vaut inclure trop que pas assez")