llm_ticket3/utils/__init__.py
2025-05-07 17:12:50 +02:00

25 lines
888 B
Python

"""
Package utils contenant des utilitaires pour le traitement d'images et autres fonctionnalités.
"""
# Pas besoin de préfixer avec 'utils.' quand on est déjà dans le package
from .image_dedup import filtrer_images_uniques
# Compatibilité avec les anciens imports après la réorganisation des fichiers OCR
from utils.ocr_brut import extraire_texte, extraire_texte_fr, preprocess_image, preprocess_image_with_profile, PREPROCESSING_PROFILES
from utils.ocr_avance import prepare_image_for_llama_vision, clean_text_with_profiles
# Exposer les fonctions principales
__all__ = [
# OCR Brut (Tesseract)
'extraire_texte',
'extraire_texte_fr',
'preprocess_image',
'preprocess_image_with_profile',
'PREPROCESSING_PROFILES',
# OCR Avancé (Llama Vision)
'prepare_image_for_llama_vision',
'clean_text_with_profiles',
'filtrer_images_uniques'
]