mirror of
https://github.com/Ladebeze66/llm_ticket3.git
synced 2025-12-13 09:06:51 +01:00
Résultats des Traitements OCR
Ce répertoire contient les résultats des différents traitements OCR effectués sur les images.
Structure
-
ocr_brut/: Résultats de l'OCR basique (Tesseract)- Images prétraitées par les différents profils
- Fichiers texte extraits des images
-
ocr_avance/: Résultats de l'OCR avancé (Llama Vision)- Images préparées pour le modèle Llama Vision
- Texte extrait par le modèle avec structure enrichie
Organisation des Fichiers
OCR Brut
preprocessed/[profil]/*.png: Images prétraitées par profiloptimized_*.png: Version finale prétraitéeocr_*.txt: Texte extrait par Tesseract
OCR Avancé
vision_ready_*.png: Images préparées pour Llama Vision (672x672)ocr_*.txt: Texte structuré extrait par le modèle
Utilisation
Ces résultats peuvent être utilisés pour :
- Comparer les performances des différentes méthodes d'OCR
- Vérifier les étapes de prétraitement des images
- Fournir des données d'entraînement pour améliorer les dictionnaires de correction"