mirror of
https://github.com/Ladebeze66/llm_ticket3.git
synced 2025-12-13 12:36:50 +01:00
1.2 KiB
1.2 KiB
Module OCR Avancé (Llama Vision)
Ce module contient les outils pour l'extraction de texte avancée utilisant le modèle Llama Vision.
Fichiers principaux
image_preparer.py: Prépare les images pour être utilisées avec le modèle Llama Visionocr_cleaner.py: Nettoie et améliore le texte extrait par l'OCR- Dictionnaires de nettoyage :
ocr_clean_dict.json: Corrections de base pour l'OCRhallucination_filter.json: Filtres pour les hallucinations du modèletranslation_clean_dict.json: Corrections pour les erreurs de traduction
Utilisation
from utils.ocr_avance import prepare_image_for_llama_vision, clean_text_with_profiles
# Préparation d'une image pour Llama Vision
image_pretraitee = prepare_image_for_llama_vision("chemin/vers/image.jpg")
# Nettoyage du texte extrait
texte_propre = clean_text_with_profiles(texte_brut, active_profiles=("ocr", "hallucination"))
Résultats
Les images prétraitées et les résultats de l'OCR sont sauvegardés dans le répertoire results/ocr_avance/.
Intégration avec l'agent
Ce module est utilisé par l'agent AgentVisionOCR situé dans agents/llama_vision/agent_vision_ocr.py.