Ladebeze66/llm_ticket3

mirror of https://github.com/Ladebeze66/llm_ticket3.git synced 2025-12-13 12:36:50 +01:00

Ladebeze66 6b96513438 0705-17:12

2025-05-07 17:12:50 +02:00

1.2 KiB

Raw Permalink Blame History

Module OCR Avancé (Llama Vision)

Ce module contient les outils pour l'extraction de texte avancée utilisant le modèle Llama Vision.

Fichiers principaux

image_preparer.py : Prépare les images pour être utilisées avec le modèle Llama Vision
ocr_cleaner.py : Nettoie et améliore le texte extrait par l'OCR
Dictionnaires de nettoyage :
- ocr_clean_dict.json : Corrections de base pour l'OCR
- hallucination_filter.json : Filtres pour les hallucinations du modèle
- translation_clean_dict.json : Corrections pour les erreurs de traduction

Utilisation

from utils.ocr_avance import prepare_image_for_llama_vision, clean_text_with_profiles

# Préparation d'une image pour Llama Vision
image_pretraitee = prepare_image_for_llama_vision("chemin/vers/image.jpg")

# Nettoyage du texte extrait
texte_propre = clean_text_with_profiles(texte_brut, active_profiles=("ocr", "hallucination"))

Résultats

Les images prétraitées et les résultats de l'OCR sont sauvegardés dans le répertoire results/ocr_avance/.

Intégration avec l'agent

Ce module est utilisé par l'agent AgentVisionOCR situé dans agents/llama_vision/agent_vision_ocr.py.