mirror of
https://github.com/Ladebeze66/llm_ticket3.git
synced 2025-12-15 20:36:50 +01:00
32 lines
1.2 KiB
Markdown
32 lines
1.2 KiB
Markdown
# Module OCR Avancé (Llama Vision)
|
|
|
|
Ce module contient les outils pour l'extraction de texte avancée utilisant le modèle Llama Vision.
|
|
|
|
## Fichiers principaux
|
|
|
|
- `image_preparer.py` : Prépare les images pour être utilisées avec le modèle Llama Vision
|
|
- `ocr_cleaner.py` : Nettoie et améliore le texte extrait par l'OCR
|
|
- Dictionnaires de nettoyage :
|
|
- `ocr_clean_dict.json` : Corrections de base pour l'OCR
|
|
- `hallucination_filter.json` : Filtres pour les hallucinations du modèle
|
|
- `translation_clean_dict.json` : Corrections pour les erreurs de traduction
|
|
|
|
## Utilisation
|
|
|
|
```python
|
|
from utils.ocr_avance import prepare_image_for_llama_vision, clean_text_with_profiles
|
|
|
|
# Préparation d'une image pour Llama Vision
|
|
image_pretraitee = prepare_image_for_llama_vision("chemin/vers/image.jpg")
|
|
|
|
# Nettoyage du texte extrait
|
|
texte_propre = clean_text_with_profiles(texte_brut, active_profiles=("ocr", "hallucination"))
|
|
```
|
|
|
|
## Résultats
|
|
|
|
Les images prétraitées et les résultats de l'OCR sont sauvegardés dans le répertoire `results/ocr_avance/`.
|
|
|
|
## Intégration avec l'agent
|
|
|
|
Ce module est utilisé par l'agent `AgentVisionOCR` situé dans `agents/llama_vision/agent_vision_ocr.py`. |