# Module OCR Avancé (Llama Vision) Ce module contient les outils pour l'extraction de texte avancée utilisant le modèle Llama Vision. ## Fichiers principaux - `image_preparer.py` : Prépare les images pour être utilisées avec le modèle Llama Vision - `ocr_cleaner.py` : Nettoie et améliore le texte extrait par l'OCR - Dictionnaires de nettoyage : - `ocr_clean_dict.json` : Corrections de base pour l'OCR - `hallucination_filter.json` : Filtres pour les hallucinations du modèle - `translation_clean_dict.json` : Corrections pour les erreurs de traduction ## Utilisation ```python from utils.ocr_avance import prepare_image_for_llama_vision, clean_text_with_profiles # Préparation d'une image pour Llama Vision image_pretraitee = prepare_image_for_llama_vision("chemin/vers/image.jpg") # Nettoyage du texte extrait texte_propre = clean_text_with_profiles(texte_brut, active_profiles=("ocr", "hallucination")) ``` ## Résultats Les images prétraitées et les résultats de l'OCR sont sauvegardés dans le répertoire `results/ocr_avance/`. ## Intégration avec l'agent Ce module est utilisé par l'agent `AgentVisionOCR` situé dans `agents/llama_vision/agent_vision_ocr.py`.