Ladebeze66/llm_ticket3

mirror of https://github.com/Ladebeze66/llm_ticket3.git synced 2026-05-11 23:46:33 +02:00

History

Ladebeze66 06b31b8663 2304-11:27translate

2025-04-23 11:27:45 +02:00

..

analyse_differences.md

2304-11:27translate

2025-04-23 11:27:45 +02:00

README.md

2304-11:27translate

2025-04-23 11:27:45 +02:00

test_tri_images.py

2304-11:27translate

2025-04-23 11:27:45 +02:00

README.md

Corrections pour le tri d'images avec llama-vision

Ce document décrit les corrections apportées pour résoudre les problèmes de tri d'images avec llama-vision.

Problèmes identifiés

Détection incomplète des images : Seulement 2 images sur 4 étaient analysées après déduplication
Classification trop stricte : Toutes les images étaient classées comme non pertinentes
Reconnaissance de formats limitée : Certains formats d'images n'étaient pas correctement détectés

Corrections apportées

1. Amélioration du prompt système (agent_image_sorter.py)

Le prompt système a été entièrement revu pour :

Définir plus clairement ce qui constitue une image pertinente
Adopter une approche "par défaut pertinent" en cas de doute
Élargir la définition des images pertinentes
Rendre le classement plus inclusif

2. Amélioration de la détection des images (orchestrator_llama.py)

La méthode _lister_images a été optimisée pour :

Supporter davantage de formats d'images (ajout de .tiff, .tif)
Vérifier que chaque fichier est bien une image valide
Corriger la détection de l'extension .jpg (qui avait une erreur de syntaxe)
Ajouter des logs pour faciliter le débogage

Comment tester

Pour tester spécifiquement le tri d'images avec llama-vision, utilisez la commande suivante :

python main_llama.py <ticket_id> --skip-ticket-analysis --skip-image-analysis --skip-report

Après exécution, vérifiez :

Le fichier tri_image_llama*.json dans le dossier pipeline
Le nombre d'images analysées doit correspondre au nombre d'images uniques dans rapport_de_deduplication.json
Le classement des images devrait être plus généreux (plus d'images "pertinentes")

Notes supplémentaires

Le prompt a été optimisé pour llama-vision tout en conservant la consigne de répondre en français
L'approche de tri est maintenant plus inclusive ("mieux vaut inclure trop que pas assez")