mirror of
https://github.com/Ladebeze66/llm_ticket3.git
synced 2025-12-16 14:47:47 +01:00
45 lines
1.9 KiB
Markdown
45 lines
1.9 KiB
Markdown
# Corrections pour le tri d'images avec llama-vision
|
|
|
|
Ce document décrit les corrections apportées pour résoudre les problèmes de tri d'images avec llama-vision.
|
|
|
|
## Problèmes identifiés
|
|
|
|
1. **Détection incomplète des images** : Seulement 2 images sur 4 étaient analysées après déduplication
|
|
2. **Classification trop stricte** : Toutes les images étaient classées comme non pertinentes
|
|
3. **Reconnaissance de formats limitée** : Certains formats d'images n'étaient pas correctement détectés
|
|
|
|
## Corrections apportées
|
|
|
|
### 1. Amélioration du prompt système (agent_image_sorter.py)
|
|
|
|
Le prompt système a été entièrement revu pour :
|
|
- Définir plus clairement ce qui constitue une image pertinente
|
|
- Adopter une approche "par défaut pertinent" en cas de doute
|
|
- Élargir la définition des images pertinentes
|
|
- Rendre le classement plus inclusif
|
|
|
|
### 2. Amélioration de la détection des images (orchestrator_llama.py)
|
|
|
|
La méthode `_lister_images` a été optimisée pour :
|
|
- Supporter davantage de formats d'images (ajout de .tiff, .tif)
|
|
- Vérifier que chaque fichier est bien une image valide
|
|
- Corriger la détection de l'extension .jpg (qui avait une erreur de syntaxe)
|
|
- Ajouter des logs pour faciliter le débogage
|
|
|
|
## Comment tester
|
|
|
|
Pour tester spécifiquement le tri d'images avec llama-vision, utilisez la commande suivante :
|
|
|
|
```bash
|
|
python main_llama.py <ticket_id> --skip-ticket-analysis --skip-image-analysis --skip-report
|
|
```
|
|
|
|
Après exécution, vérifiez :
|
|
1. Le fichier `tri_image_llama*.json` dans le dossier pipeline
|
|
2. Le nombre d'images analysées doit correspondre au nombre d'images uniques dans `rapport_de_deduplication.json`
|
|
3. Le classement des images devrait être plus généreux (plus d'images "pertinentes")
|
|
|
|
## Notes supplémentaires
|
|
|
|
- Le prompt a été optimisé pour llama-vision tout en conservant la consigne de répondre en français
|
|
- L'approche de tri est maintenant plus inclusive ("mieux vaut inclure trop que pas assez") |