coffreobsidian/inbox/Modules OCR et Traduction.md
2025-04-23 17:23:33 +02:00

98 lines
6.3 KiB
Markdown

┌─────────────────────────────────┐
│ MAIN_LLAMA.PY │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ CHARGEMENT DU TICKET │
│ TicketDataLoader.charger() │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ INITIALISATION DES AGENTS │
│ LlamaVision → modèle Vision │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ ANALYSE DU TICKET │
│ │
│ 1. Texte FR → Traduction EN │
│ 2. Analyse par LlamaVision │
│ 3. Résultat EN → Traduction FR │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ TRI DES IMAGES │
│ │
│ 1. Liste de toutes les images │
│ 2. Analyse par LlamaVision │
│ 3. Classification par pertinence│
│ 4. OCR sur images pertinentes │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ ANALYSE DES IMAGES │
│ │
│ 1. Pour chaque image pertinente │
│ 2. Contexte FR → Traduction EN │
│ 3. Analyse par LlamaVision │
│ 4. Résultat EN → Traduction FR │
│ 5. Extraction des URLs │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ GÉNÉRATION DU RAPPORT │
│ │
│ 1. Compilation des données │
│ 2. Données FR → Traduction EN │
│ 3. Analyse par LlamaVision │
│ a. Synthèse du ticket │
│ b. Questions identifiées │
│ c. Résumé croisé texte/image │
│ d. Tableau d'échanges │
│ 4. Résultat EN → Traduction FR │
│ 5. Ajout de marqueurs de │
│ traduction pour lisibilité │
└───────────────┬─────────────────┘
┌─────────────────────────────────┐
│ SAUVEGARDE DES RÉSULTATS │
│ │
│ 1. Format JSON avec métadonnées │
│ 2. Version texte pour lisibilité│
│ 3. Versions EN/FR disponibles │
└─────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ PHASES OCR ET TRADUCTION │
└───────────────────────────────┬─────────────────────────────────┘
┌───────────────────────────┴───────────────────────────┐
│ │
▼ ▼
┌─────────────────────────┐ ┌─────────────────────────┐
│ PHASE OCR │ │ PHASE TRADUCTION │
└───────────┬─────────────┘ └───────────┬─────────────┘
│ │
▼ ▼
┌─────────────────────────┐ ┌─────────────────────────┐
│ 1. Extraction de texte │ │ 1. FR → EN (Entrée) │
│ des images par OCR │ │ Méthode fr_to_en() │
│ │ │ │
│ 2. Deux versions: │ │ 2. Analyse en anglais │
│ a. OCR en français │ │ par LlamaVision │
│ b. OCR en anglais │ │ (english_only=True) │
│ │ │ │
│ 3. Sauvegarde des deux │ │ 3. EN → FR (Sortie) │
│ versions dans les │ │ Méthode en_to_fr() │
│ métadonnées de │ │ │
│ l'image │ │ 4. Marqueurs de début │
│ │ │ et fin des sections │
└─────────────────────────┘ │ traduites │
└─────────────────────────┘