coffreobsidian/inbox/Modules OCR et Traduction.md
2025-04-23 17:23:33 +02:00

6.3 KiB

┌─────────────────────────────────┐ │ MAIN_LLAMA.PY │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ CHARGEMENT DU TICKET │ │ TicketDataLoader.charger() │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ INITIALISATION DES AGENTS │ │ LlamaVision → modèle Vision │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ ANALYSE DU TICKET │ │ │ │ 1. Texte FR → Traduction EN │ │ 2. Analyse par LlamaVision │ │ 3. Résultat EN → Traduction FR │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ TRI DES IMAGES │ │ │ │ 1. Liste de toutes les images │ │ 2. Analyse par LlamaVision │ │ 3. Classification par pertinence│ │ 4. OCR sur images pertinentes │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ ANALYSE DES IMAGES │ │ │ │ 1. Pour chaque image pertinente │ │ 2. Contexte FR → Traduction EN │ │ 3. Analyse par LlamaVision │ │ 4. Résultat EN → Traduction FR │ │ 5. Extraction des URLs │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ GÉNÉRATION DU RAPPORT │ │ │ │ 1. Compilation des données │ │ 2. Données FR → Traduction EN │ │ 3. Analyse par LlamaVision │ │ a. Synthèse du ticket │ │ b. Questions identifiées │ │ c. Résumé croisé texte/image │ │ d. Tableau d'échanges │ │ 4. Résultat EN → Traduction FR │ │ 5. Ajout de marqueurs de │ │ traduction pour lisibilité │ └───────────────┬─────────────────┘ │ ▼ ┌─────────────────────────────────┐ │ SAUVEGARDE DES RÉSULTATS │ │ │ │ 1. Format JSON avec métadonnées │ │ 2. Version texte pour lisibilité│ │ 3. Versions EN/FR disponibles │ └─────────────────────────────────┘

┌─────────────────────────────────────────────────────────────────┐ │ PHASES OCR ET TRADUCTION │ └───────────────────────────────┬─────────────────────────────────┘ │ ┌───────────────────────────┴───────────────────────────┐ │ │ ▼ ▼ ┌─────────────────────────┐ ┌─────────────────────────┐ │ PHASE OCR │ │ PHASE TRADUCTION │ └───────────┬─────────────┘ └───────────┬─────────────┘ │ │ ▼ ▼ ┌─────────────────────────┐ ┌─────────────────────────┐ │ 1. Extraction de texte │ │ 1. FR → EN (Entrée) │ │ des images par OCR │ │ Méthode fr_to_en() │ │ │ │ │ │ 2. Deux versions: │ │ 2. Analyse en anglais │ │ a. OCR en français │ │ par LlamaVision │ │ b. OCR en anglais │ │ (english_only=True) │ │ │ │ │ │ 3. Sauvegarde des deux │ │ 3. EN → FR (Sortie) │ │ versions dans les │ │ Méthode en_to_fr() │ │ métadonnées de │ │ │ │ l'image │ │ 4. Marqueurs de début │ │ │ │ et fin des sections │ └─────────────────────────┘ │ traduites │ └─────────────────────────┘