llm_ticket3/results/README.md
2025-05-07 17:12:50 +02:00

31 lines
1.1 KiB
Markdown

# Résultats des Traitements OCR
Ce répertoire contient les résultats des différents traitements OCR effectués sur les images.
## Structure
- `ocr_brut/` : Résultats de l'OCR basique (Tesseract)
- Images prétraitées par les différents profils
- Fichiers texte extraits des images
- `ocr_avance/` : Résultats de l'OCR avancé (Llama Vision)
- Images préparées pour le modèle Llama Vision
- Texte extrait par le modèle avec structure enrichie
## Organisation des Fichiers
### OCR Brut
- `preprocessed/[profil]/*.png` : Images prétraitées par profil
- `optimized_*.png` : Version finale prétraitée
- `ocr_*.txt` : Texte extrait par Tesseract
### OCR Avancé
- `vision_ready_*.png` : Images préparées pour Llama Vision (672x672)
- `ocr_*.txt` : Texte structuré extrait par le modèle
## Utilisation
Ces résultats peuvent être utilisés pour :
- Comparer les performances des différentes méthodes d'OCR
- Vérifier les étapes de prétraitement des images
- Fournir des données d'entraînement pour améliorer les dictionnaires de correction"