mirror of
https://github.com/Ladebeze66/llm_ticket3.git
synced 2025-12-16 00:56:50 +01:00
31 lines
1.1 KiB
Markdown
31 lines
1.1 KiB
Markdown
# Résultats des Traitements OCR
|
|
|
|
Ce répertoire contient les résultats des différents traitements OCR effectués sur les images.
|
|
|
|
## Structure
|
|
|
|
- `ocr_brut/` : Résultats de l'OCR basique (Tesseract)
|
|
- Images prétraitées par les différents profils
|
|
- Fichiers texte extraits des images
|
|
|
|
- `ocr_avance/` : Résultats de l'OCR avancé (Llama Vision)
|
|
- Images préparées pour le modèle Llama Vision
|
|
- Texte extrait par le modèle avec structure enrichie
|
|
|
|
## Organisation des Fichiers
|
|
|
|
### OCR Brut
|
|
- `preprocessed/[profil]/*.png` : Images prétraitées par profil
|
|
- `optimized_*.png` : Version finale prétraitée
|
|
- `ocr_*.txt` : Texte extrait par Tesseract
|
|
|
|
### OCR Avancé
|
|
- `vision_ready_*.png` : Images préparées pour Llama Vision (672x672)
|
|
- `ocr_*.txt` : Texte structuré extrait par le modèle
|
|
|
|
## Utilisation
|
|
|
|
Ces résultats peuvent être utilisés pour :
|
|
- Comparer les performances des différentes méthodes d'OCR
|
|
- Vérifier les étapes de prétraitement des images
|
|
- Fournir des données d'entraînement pour améliorer les dictionnaires de correction" |