2025-05-07 17:12:50 +02:00
..
2025-05-07 17:12:50 +02:00
2025-05-07 17:12:50 +02:00
2025-05-07 17:12:50 +02:00

Résultats des Traitements OCR

Ce répertoire contient les résultats des différents traitements OCR effectués sur les images.

Structure

  • ocr_brut/ : Résultats de l'OCR basique (Tesseract)

    • Images prétraitées par les différents profils
    • Fichiers texte extraits des images
  • ocr_avance/ : Résultats de l'OCR avancé (Llama Vision)

    • Images préparées pour le modèle Llama Vision
    • Texte extrait par le modèle avec structure enrichie

Organisation des Fichiers

OCR Brut

  • preprocessed/[profil]/*.png : Images prétraitées par profil
  • optimized_*.png : Version finale prétraitée
  • ocr_*.txt : Texte extrait par Tesseract

OCR Avancé

  • vision_ready_*.png : Images préparées pour Llama Vision (672x672)
  • ocr_*.txt : Texte structuré extrait par le modèle

Utilisation

Ces résultats peuvent être utilisés pour :

  • Comparer les performances des différentes méthodes d'OCR
  • Vérifier les étapes de prétraitement des images
  • Fournir des données d'entraînement pour améliorer les dictionnaires de correction"