llm_ticket3/retrieve_ticket.py
2025-04-09 16:13:20 +02:00

178 lines
7.4 KiB
Python
Executable File

#!/usr/bin/env python3
"""
Script principal pour récupérer un ticket depuis Odoo et extraire ses données.
Ce script fait appel aux utilitaires dans le package utils pour effectuer l'extraction.
"""
import os
import sys
import json
import argparse
from datetime import datetime
from odoo.auth_manager import AuthManager
from odoo.ticket_manager import TicketManager
from core.utils import setup_logging, log_separator
from formatters.json_to_markdown import create_markdown_from_json
# Importation de l'extracteur d'images HTML (optionnel)
try:
from utils.image_extractor import extract_images_from_ticket
from utils.image_extractor.extract_all_images import enhance_ticket_data_with_images
HTML_IMAGE_EXTRACTOR_AVAILABLE = True
except ImportError:
HTML_IMAGE_EXTRACTOR_AVAILABLE = False
def parse_arguments():
"""Parse les arguments de ligne de commande."""
parser = argparse.ArgumentParser(description="Récupère un ticket Odoo par son code et extrait ses données.")
parser.add_argument("ticket_code", help="Code du ticket à extraire")
parser.add_argument("--output", "-o", help="Répertoire de sortie", default=None)
parser.add_argument("--config", "-c", help="Fichier de configuration", default="config.json")
parser.add_argument("--verbose", "-v", action="store_true", help="Mode verbeux")
parser.add_argument("--no-md", action="store_true", help="Désactiver la génération automatique du fichier Markdown")
parser.add_argument("--extract-html-images", action="store_true", help="Activer l'extraction des images intégrées dans le HTML")
return parser.parse_args()
def load_config(config_file):
"""Charge le fichier de configuration."""
try:
with open(config_file, 'r') as f:
return json.load(f)
except Exception as e:
print(f"Erreur lors du chargement du fichier de configuration: {e}")
sys.exit(1)
def main():
"""Fonction principale du script."""
args = parse_arguments()
config = load_config(args.config)
# Configurer la journalisation
log_level = "DEBUG" if args.verbose else "INFO"
setup_logging(log_level)
# Extraire les informations de connexion
odoo_config = config.get("odoo", {})
url = odoo_config.get("url")
db = odoo_config.get("db")
username = odoo_config.get("username")
api_key = odoo_config.get("api_key")
if not all([url, db, username, api_key]):
print("Informations de connexion Odoo manquantes dans le fichier de configuration")
sys.exit(1)
# Définir le répertoire de sortie
output_dir = args.output or os.path.join(config.get("output_dir", "output"), f"ticket_{args.ticket_code}")
# Créer le répertoire de sortie spécifique au ticket avec horodatage
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
ticket_dir = os.path.join(output_dir, f"{args.ticket_code}_{timestamp}")
os.makedirs(ticket_dir, exist_ok=True)
print(f"Extraction du ticket {args.ticket_code}...")
try:
# Initialiser l'authentification
auth_manager = AuthManager(
url=url,
db=db,
username=username,
api_key=api_key
)
if not auth_manager.login():
print("Échec de l'authentification à Odoo")
sys.exit(1)
# Extraire les données du ticket
ticket_manager = TicketManager(auth_manager)
result = ticket_manager.extract_ticket_data(args.ticket_code, ticket_dir)
if not result:
print(f"Échec de l'extraction du ticket {args.ticket_code}")
sys.exit(1)
# Extraire les images intégrées dans le HTML si demandé
html_images = []
if args.extract_html_images and HTML_IMAGE_EXTRACTOR_AVAILABLE:
print("Extraction des images intégrées dans le HTML...")
html_images = extract_images_from_ticket(ticket_dir)
if html_images:
# Ajouter les images HTML au résultat
result["html_images"] = html_images
result["html_images_count"] = len(html_images)
# Créer un fichier JSON avec toutes les images
# Récupérer d'abord les images standard
ticket_data = {
"ticket_dir": ticket_dir,
"attachments": result.get("attachments", [])
}
# Enrichir les données avec toutes les images
enhanced_data = enhance_ticket_data_with_images(ticket_data)
# Sauvegarder le résultat
all_images_path = os.path.join(ticket_dir, "all_images.json")
with open(all_images_path, 'w', encoding='utf-8') as f:
json.dump({
"images": enhanced_data.get("images", []),
"standard_images": enhanced_data.get("standard_images", []),
"embedded_images": enhanced_data.get("embedded_images", []),
"stats": enhanced_data.get("images_stats", {})
}, f, indent=2, ensure_ascii=False)
print(f"Trouvé {len(html_images)} images intégrées dans le HTML")
# Générer un rapport de fin
summary = {
"timestamp": timestamp,
"ticket_code": args.ticket_code,
"output_directory": ticket_dir,
"message_count": result.get("messages_count", 0),
"attachment_count": result.get("attachments_count", 0),
"html_images_count": len(html_images) if HTML_IMAGE_EXTRACTOR_AVAILABLE and args.extract_html_images else 0,
"files_created": [
os.path.basename(result.get("ticket_info", "")),
os.path.basename(result.get("ticket_summary", "")),
os.path.basename(result.get("messages_file", "")),
os.path.basename(result.get("ticket_data_file", ""))
]
}
# Générer automatiquement le fichier Markdown si demandé
md_file_path = None
if not args.no_md:
json_file = result.get("messages_file", "")
if json_file and os.path.exists(json_file):
md_file_path = os.path.join(ticket_dir, "rapport.md")
print(f"Génération du rapport Markdown...")
if create_markdown_from_json(json_file, md_file_path):
print(f"Rapport Markdown créé: {md_file_path}")
summary["files_created"].append("rapport.md")
else:
print("Échec de la génération du rapport Markdown")
# Afficher le résumé
print("\nExtraction terminée avec succès")
print(f"Ticket: {args.ticket_code}")
print(f"Répertoire: {ticket_dir}")
print(f"Messages traités: {result.get('messages_count', 0)}")
print(f"Pièces jointes: {result.get('attachments_count', 0)}")
# Afficher le nombre d'images HTML si l'extracteur est disponible
if HTML_IMAGE_EXTRACTOR_AVAILABLE and args.extract_html_images:
print(f"Images HTML: {len(html_images)}")
if md_file_path:
print(f"Rapport Markdown: {md_file_path}")
except Exception as e:
print(f"Une erreur est survenue: {e}")
sys.exit(1)
if __name__ == "__main__":
main()