# Disparition de phrase dans les fichiers (2025-04-08 14:54:39)
_**User**_
Comme tu peux le constater la deuxième phrase de message a disparu entre all_messages.json et le rapport.md peux tu en trouver la cause
---
_**Assistant**_
Je vais analyser le contenu du fichier all_messages.json pour comprendre la cause de la disparition de la deuxième phrase.
---
Listed directory output/ticket_T0124 • **1** results
| Name |
|-------|
| 📁 `T0124_20250408_145939` |
---
Listed directory output/ticket_T0124/T0124_20250408_145939 • **7** results
| Name |
|-------|
| 📁 `T0124_rapports` |
| 📄 `structure.json` |
| 📄 `all_messages.txt` |
| 📄 `all_messages.json` |
| 📄 `messages_raw.json` |
| 📄 `ticket_info.json` |
| 📄 `ticket_summary.json` |
---
Listed directory output/ticket_T0124/T0124_20250408_145939/T0124_rapports • **2** results
| Name |
|-------|
| 📄 `T0124_rapport.json` |
| 📄 `T0124_rapport.md` |
---
Read file: output/ticket_T0124/T0124_20250408_145939/all_messages.txt
---
Read file: output/ticket_T0124/T0124_20250408_145939/T0124_rapports/T0124_rapport.md
---
Searched codebase "Traitement de texte ou nettoyage des messages dans le système de tickets" • **25** results
| File | Lines |
|------|-------|
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L61-97 |
| `utils/message_manager.py` | L269-302 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L3305-3351 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L6630-6897 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L5038-5078 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L17659-17710 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L10034-10078 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L2506-2595 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L4066-4270 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L17858-17898 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L7824-7871 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L4291-4459 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L3925-3960 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L10858-10933 |
| `utils/message_manager.py` | L217-251 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18259-18298 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L12015-12110 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L12381-12434 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L14172-14245 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L14403-14468 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L7871-7916 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18719-18770 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L2108-2148 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L7976-8018 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L13911-13985 |
---
Read file: output/ticket_T0124/T0124_20250408_145939/T0124_rapports/T0124_rapport.json
---
Searched codebase "Fonction nettoyage HTML ou transformation du corps des messages" • **25** results
| File | Lines |
|------|-------|
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L14172-14245 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L13911-13985 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L14711-14782 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18017-18039 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L16579-16622 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L14403-14468 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18335-18404 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18076-18146 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L15348-15383 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18506-18554 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L15383-15445 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L17659-17710 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L16622-16719 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L18259-18298 |
| `utils/clean_html.py` | L71-85 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L12673-12749 |
| `utils/message_manager.py` | L269-302 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L13734-13784 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L10034-10078 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L17775-17822 |
| `utils/clean_html.py` | L122-173 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L12309-12346 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L5078-5124 |
| `.specstory/history/2025-04-01_13-55-problème-d'exécution-du-programme.md` | L15239-15286 |
| `.specstory/history/2025-04-01_13-55-amélioration-de-l'extraction-des-pièces-jointes.md` | L7419-7529 |
---
Après avoir analysé tous les fichiers et recherches, j'ai identifié la cause de la disparition de la deuxième phrase dans le rapport.
La deuxième phrase du message original dans all_messages.json est :
"Nous sollicitions une assistance technique sur notre poste de travail CBAO suite au dysfonctionnement actuellement constaté."
Cette phrase a été supprimée lors du traitement du contenu HTML du message pour la génération du rapport.
La cause est liée à la fonction `clean_html` qui est utilisée pour nettoyer le contenu HTML des messages. Plusieurs versions de cette fonction ont été trouvées dans le code, avec différentes techniques de nettoyage qui peuvent supprimer certaines parties du message.
Le système utilise des expressions régulières pour nettoyer les messages et ces expressions régulières peuvent parfois supprimer plus de contenu que souhaité. Dans ce cas précis, il semble que la deuxième phrase ait été supprimée durant ce processus de nettoyage.
Dans les différentes versions de la fonction `clean_html` que j'ai trouvées, il y a plusieurs approches pour extraire le "corps utile" du message, en supprimant ce qui est considéré comme du bruit (signatures, formules de politesse, disclaimers, etc.). Une de ces approches a probablement identifié incorrectement la deuxième phrase comme du contenu à supprimer.
La solution serait de modifier la fonction de nettoyage pour qu'elle préserve mieux le contenu original tout en supprimant uniquement les parties vraiment non essentielles comme les signatures automatiques et les disclaimers.
---
_**User**_
que modifierais tu? pour ce cas de figure et mieux agencer clean_html
---
_**Assistant**_
Pour résoudre le problème spécifique et améliorer la fonction `clean_html`, je proposerais les modifications suivantes :
---
Grep search for "def clean_html" • **6** files
| File | Line | Match |
|------|------|-------|
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-04_13-46-correction-d%27anomalie-dans-clean-html-py.md` | L1631 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-04_13-46-correction-d%27anomalie-dans-clean-html-py.md` | L1948 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-04_13-46-correction-d%27anomalie-dans-clean-html-py.md` | L2087 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-04_13-46-correction-d%27anomalie-dans-clean-html-py.md` | L3108 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L13448 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L13530 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L13733 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L13843 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L13910 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14128 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14171 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14472 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14501 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14550 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14620 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L14710 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15238 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15347 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15610 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15619 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15802 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15826 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L15895 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L16578 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L17658 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L17774 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L17857 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L17978 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L18258 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L18505 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L18726 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-probl%C3%A8me-d%27ex%C3%A9cution-du-programme.md` | L19497 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L4387 | `+ def clean_html_content(html_content: str) -> str:` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L6527 | `def clean_html(html_content: str) -> str:` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L7325 | `- def clean_html(html_content: str) -> str:` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L7326 | `+ def clean_html(html_content: str,` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L10726 | `+ def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L13200 | `+ def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L13365 | `- def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L13795 | `+ def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/.specstory/history/2025-04-01_13-55-am%C3%A9lioration-de-l%27extraction-des-pi%C3%A8ces-jointes.md` | L14402 | `def clean_html(html_content):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/utils/utils.py` | L157 | `def clean_html(html_content: str,` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/utils/clean_html.py` | L11 | `def clean_html(html_content, is_description=False):` |
| `vscode-remote://wsl%2Bubuntu-24.04/home/fgras-ca/llm-ticket3/utils/clean_html.py` | L11 | `def clean_html(html_content, is_description=False):` |
---
Read file: utils/clean_html.py
---
Read file: utils/utils.py
---
Voici les modifications que je recommanderais pour améliorer la fonction `clean_html` afin de résoudre le problème spécifique de la disparition de la deuxième phrase et d'améliorer globalement son fonctionnement :
1. **Problème spécifique** : La fonction `clean_html` actuelle filtre trop agressivement le contenu, notamment quand elle détecte des mots-clés comme "CBAO" qui apparaissent dans la phrase manquante ("une assistance technique sur notre poste de travail CBAO").
2. **Solution proposée** :
```python
def clean_html(html_content, is_description=False):
"""
Nettoie le contenu HTML pour le Markdown en préservant mieux le corps principal du message.
Args:
html_content (str): Contenu HTML à nettoyer
is_description (bool): Indique si le contenu est une description de ticket
Returns:
str: Texte nettoyé
"""
if not html_content:
return "*Contenu vide*"
# 1. PRÉTRAITEMENT - Nettoyage basique du HTML
content = pre_clean_html(html_content)
# 2. PRÉSERVATION DU CONTEXTE - Identifier le contenu principal
# Découper en paragraphes
paragraphs = [p.strip() for p in content.split('\n\n')]
# Filtrage intelligent des paragraphes
preserved_paragraphs = []
signature_found = False
for para in paragraphs:
# Détecter les formules de salutation ou début de message
is_greeting = bool(re.match(r'^(bonjour|salut|bonsoir|cher|chère|madame|monsieur|hello)', para.lower()))
# Détecter les signatures et formules de politesse
is_signature = any(sig in para.lower() for sig in
["cordialement", "cdlt", "bien à vous", "salutations", "bien sincèrement"])
# Détecter les disclaimers et pieds de page
is_footer = any(footer in para.lower() for sig in
["afin d'assurer", "traçabilité", "support technique", "confidential",
"ce message électronique", "ce mail et les documents", "droit à la déconnexion"])
# Ne pas filtrer les 2-3 premiers paragraphes même s'ils contiennent des mots-clés
# qui seraient normalement filtrés
is_early_paragraph = len(preserved_paragraphs) < 3
# Conserver les paragraphes de message utiles
if (is_greeting or
(not is_footer and not signature_found) or
is_early_paragraph):
# Si c'est un paragraphe valide et avec du contenu significatif
if len(para) > 10:
preserved_paragraphs.append(para)
# Après avoir trouvé une signature, marquer pour arrêter la collecte
if is_signature:
signature_found = True
# Ajouter 1 paragraphe après la signature au maximum
preserved_paragraphs.append(para)
# Continuer à traiter un seul paragraphe supplémentaire
continue
# 3. ASSEMBLER LE CONTENU NETTOYÉ
content = '\n\n'.join(preserved_paragraphs)
# Si le contenu final est vide ou trop court, revenir à une méthode plus simple
if not content or len(content.strip()) < 20:
# Simple nettoyage des balises HTML
content = re.sub(r'<.*?>', '', html_content)
content = content.replace(' ', ' ')
content = re.sub(r'\s+', ' ', content).strip()
return content if content else "*Contenu non extractible*"
```
3. **Améliorations du prétraitement HTML** - Modifier la fonction `pre_clean_html` pour mieux gérer les balises HTML courantes :
```python
def pre_clean_html(html_content):
"""
Effectue un nettoyage préliminaire du HTML en préservant la structure et le formatage basique.
"""
# Remplacer les balises de paragraphe et saut de ligne par des sauts de ligne
content = re.sub(r'
|
]*>|
|]*>|
', '\n', html_content)
# Préserver le formatage de base (gras, italique, etc.)
content = re.sub(r'<(?:b|strong)>(.*?)(?:b|strong)>', r'**\1**', content)
content = re.sub(r'<(?:i|em)>(.*?)(?:i|em)>', r'*\1*', content)
# Transformer les listes
content = re.sub(r'(.*?)', r'- \1\n', content)
# Supprimer les balises HTML avec leurs attributs mais conserver le contenu
content = re.sub(r'<[^>]+>', '', content)
# Remplacer les entités HTML courantes
content = content.replace(' ', ' ')
content = content.replace('<', '<')
content = content.replace('>', '>')
content = content.replace('&', '&')
content = content.replace('"', '"')
# Nettoyer les espaces multiples
content = re.sub(r' {2,}', ' ', content)
# Nettoyer les sauts de ligne multiples (mais pas tous, pour préserver la structure)
content = re.sub(r'\n{3,}', '\n\n', content)
return content.strip()
```
4. **Solution spécifique pour le cas signalé** - Pour résoudre spécifiquement le problème du ticket T0124, il faudrait :
- Éviter de filtrer les paragraphes qui contiennent le mot "CBAO" lorsqu'ils sont au début du message
- Préserver les 2-3 premiers paragraphes, même s'ils contiennent des mots-clés qui seraient normalement filtrés
- Utiliser une approche qui identifie mieux le corps principal du message en préservant la structure narrative (salutation → corps → formule de politesse → signature)
Cette solution permettrait de conserver la deuxième phrase du message tout en continuant à nettoyer efficacement les parties non essentielles des messages.
---
_**User**_
pas de changement malgré cette modification
---
_**Assistant**_
Je vais analyser pourquoi votre modification n'a pas résolu le problème. Examinons le message original qui pose problème.
---
Could not find file 'output/ticket_T0124/T0124_20250408_145939/all_messages.txt' in the workspace.
---
Searched codebase "all_messages.json" • **10** results
| File |
|------|
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
| `undefined` |
---
Read file: output/ticket_T0124/T0124_20250408_151131/all_messages.json
---
Read file: output/ticket_T0124/T0124_20250408_151131/T0124_rapports/T0124_rapport.md
---
Le problème est clair - nous pouvons voir que la deuxième phrase du message original est toujours absente dans le rapport MD. Pour corriger ce problème, je propose la modification suivante du fichier `clean_html.py` :
```python
def clean_html(html_content, is_description=False):
"""
Nettoie le contenu HTML pour le Markdown en préservant le contenu original au début du message.
Args:
html_content (str): Contenu HTML à nettoyer
is_description (bool): Indique si le contenu est une description de ticket
Returns:
str: Texte nettoyé
"""
if not html_content:
return "*Contenu vide*"
# 1. PRÉ-NETTOYAGE - Sans filtrage pour obtenir un contenu de base propre
cleaned_basic = pre_clean_html(html_content)
# 2. IDENTIFICATION DES PREMIERS PARAGRAPHES - Conserver les 5 premiers paragraphes significatifs
# Cette partie est critique pour préserver le corps du message initial
paragraphs = [p for p in cleaned_basic.split('\n\n') if p.strip()]
# Si le message est une description ou a moins de 5 paragraphes, le conserver entièrement
if is_description or len(paragraphs) <= 5:
# Juste nettoyer les balises et retourner
return cleaned_basic
# 3. FILTRAGE DES LIGNES PROBLÉMATIQUES - Ne s'applique qu'après les 5 premiers paragraphes
# Identifier les 5 premiers paragraphes significatifs à préserver sans filtrage
important_paragraphs = []
for i, para in enumerate(paragraphs):
if len(para.strip()) > 5: # Paragraphe non vide
important_paragraphs.append(para)
if len(important_paragraphs) >= 5:
break
# Pour le reste des paragraphes, appliquer le filtrage
remaining_paragraphs = paragraphs[len(important_paragraphs):]
filtered_remaining = []
# Liste des indicateurs de lignes problématiques - NE PAS INCLURE "CBAO" ici
problematic_indicators = [
"développeur de rentabilité", "traçabilité",
"http://", "https://", ".fr", ".com",
"Envoyé par", "Afin d'assurer", "Affin d'assurer",
"!/web/image/"
]
for para in remaining_paragraphs:
# Ne pas filtrer les signatures courtes (nom, fonction, etc.)
if len(para) < 50:
filtered_remaining.append(para)
continue
# Vérifier si le paragraphe contient un indicateur problématique
is_problematic = any(indicator in para for indicator in problematic_indicators)
# Si le paragraphe est très long (plus de 500 caractères), le considérer comme problématique
if len(para) > 500:
is_problematic = True
# Ajouter le paragraphe seulement s'il n'est pas problématique
if not is_problematic:
filtered_remaining.append(para)
# 4. RECONSTITUTION DU MESSAGE
all_paragraphs = important_paragraphs + filtered_remaining
# Limiter à la signature
for i, para in enumerate(all_paragraphs):
if any(sig in para.lower() for sig in ["cordialement", "cdlt", "bien à vous", "salutations"]):
# Inclure ce paragraphe et au maximum 3 suivants (pour la signature)
all_paragraphs = all_paragraphs[:min(i+4, len(all_paragraphs))]
break
# 5. NETTOYAGE FINAL et DÉDUPLICATION
# Recombiner les paragraphes
content = '\n\n'.join(all_paragraphs)
# Nettoyer les espaces et lignes vides multiples
content = re.sub(r'\n{3,}', '\n\n', content)
content = content.strip()
# Résultat final
if not content or len(content.strip()) < 10:
return "*Contenu non extractible*"
return content
```
Cette modification:
1. **Préserve toujours les 5 premiers paragraphes** du message, ce qui garantit que le début du message n'est jamais filtré
2. **Retire "CBAO" de la liste des indicateurs problématiques** puisqu'il s'agit d'un terme légitime dans le contexte des messages
3. **Utilise une approche par paragraphes** plutôt que par lignes, ce qui préserve mieux le contexte
4. **Applique un filtrage plus intelligent** en étant moins strict sur les filtres et en prenant en compte la position du texte dans le message
Avec cette approche, la phrase "Nous sollicitions une assistance technique sur notre poste de travail CBAO suite au dysfonctionnement actuellement constaté" serait préservée car:
1. Elle fait partie des premiers paragraphes du message
2. Le mot "CBAO" n'est plus un critère de filtrage
3. La longueur du paragraphe est raisonnable
Cette solution est spécifiquement conçue pour résoudre le problème tout en améliorant la robustesse générale de la fonction `clean_html`.
---
_**User**_
avant de continuer je voudrai savoir s'il était possible de créer un fichier avec les rapports finaux affichant les prompts des différents agents utilisés pour tracer les modifications de prompt future
---
_**Assistant**_
Oui, il est tout à fait possible de créer un fichier de traçabilité pour les prompts des différents agents. Cette approche est excellente pour le suivi des modifications et l'amélioration continue des prompts.
Je propose la création d'un système de journalisation des prompts avec la structure suivante:
---
Listed current directory • **30** results
| Name |
|-------|
| 📄 `orchestrator.log` |
| 📁 `reports` |
| 📁 `output` |
| 📁 `.git` |
| 📁 `utils` |
| 📄 `test_tableau_qr.py` |
| 📄 `test_import.py` |
| 📁 `agents` |
| 📄 `test_agents_with_models.py` |
| 📄 `test_orchestrator_qwen.py` |
| 📄 `test_orchestrator_large.py` |
| 📄 `test_orchestrator.py` |
| 📁 `__pycache__` |
| 📄 `orchestrator.py` |
| 📄 `.gitignore` |
| 📄 `test_multiple_analyses.py` |
| 📄 `retrieve_ticket.py` |
| 📄 `README_TICKET_ANALYSER.md` |
| 📁 `llm_classes` |
| 📄 `orchestrator.py.backup` |
| 📄 `orchestrator.py.new` |
| 📄 `requirements.txt` |
| 📄 `test_models.py` |
| 📁 `venv` |
| 📁 `.specstory` |
| 📁 `prompt` |
| 📄 `retrieve_ticket.log` |
| 📄 `config.json` |
| 📄 `README.md` |
| 📄 `config.template.json` |
---
Listed directory prompt • **1** results
| Name |
|-------|
| 📄 `prompt.md` |
---
Listed directory agents • **6** results
| Name |
|-------|
| 📁 `__pycache__` |
| 📄 `agent_report_generator.py` |
| 📄 `agent_ticket_analyser.py` |
| 📄 `agent_image_sorter.py` |
| 📄 `agent_image_analyser.py` |
| 📄 `base_agent.py` |
---
Voici ma proposition pour implémenter un système de traçabilité des prompts:
1. **Créer un nouveau dossier `prompt_history`** pour stocker l'historique des prompts
2. **Créer une structure de fichier JSON** qui enregistrera:
- La date de modification
- La version du prompt
- Le prompt complet
- Un commentaire explicatif sur les modifications apportées
- L'agent concerné
- Les résultats observés (amélioration/régression)
3. **Implémenter une fonction de journalisation** des prompts dans le système
Voici le code que je propose:
```python
# prompt_logger.py
import os
import json
from datetime import datetime
import shutil
import hashlib
class PromptLogger:
"""
Système de journalisation des prompts pour les agents LLM.
Permet de tracer l'évolution des prompts et leurs modifications.
"""
def __init__(self, base_dir="prompt_history"):
"""
Initialiser le logger de prompts.
Args:
base_dir: Répertoire de base pour stocker l'historique des prompts
"""
self.base_dir = base_dir
os.makedirs(self.base_dir, exist_ok=True)
# Créer les sous-répertoires pour chaque agent
self.agents_dir = {
"ticket_analyser": os.path.join(self.base_dir, "ticket_analyser"),
"report_generator": os.path.join(self.base_dir, "report_generator"),
"image_analyser": os.path.join(self.base_dir, "image_analyser"),
"image_sorter": os.path.join(self.base_dir, "image_sorter"),
"orchestrator": os.path.join(self.base_dir, "orchestrator")
}
for dir_path in self.agents_dir.values():
os.makedirs(dir_path, exist_ok=True)
# Créer ou charger le fichier d'index
self.index_file = os.path.join(self.base_dir, "prompt_index.json")
if os.path.exists(self.index_file):
with open(self.index_file, "r", encoding="utf-8") as f:
self.index = json.load(f)
else:
self.index = {agent: [] for agent in self.agents_dir.keys()}
self._save_index()
def _save_index(self):
"""Sauvegarde l'index des prompts."""
with open(self.index_file, "w", encoding="utf-8") as f:
json.dump(self.index, f, indent=2, ensure_ascii=False)
def _get_prompt_hash(self, prompt_text):
"""
Génère un hash unique pour un prompt donné.
Args:
prompt_text: Texte du prompt
Returns:
Chaîne de caractères représentant le hash du prompt
"""
return hashlib.md5(prompt_text.encode("utf-8")).hexdigest()[:10]
def log_prompt(self, agent_name, prompt_text, comment="", results="", version=None):
"""
Enregistre un nouveau prompt ou une mise à jour.
Args:
agent_name: Nom de l'agent (ticket_analyser, report_generator, etc.)
prompt_text: Texte complet du prompt
comment: Commentaire explicatif sur les modifications
results: Résultats observés avec ce prompt
version: Version manuelle (si None, générée automatiquement)
Returns:
Dictionnaire contenant les métadonnées du prompt enregistré
"""
if agent_name not in self.agents_dir:
raise ValueError(f"Agent inconnu: {agent_name}. Agents valides: {list(self.agents_dir.keys())}")
# Générer un hash pour vérifier si le prompt a changé
prompt_hash = self._get_prompt_hash(prompt_text)
# Vérifier si le prompt existe déjà
existing_entries = [entry for entry in self.index[agent_name]
if entry["hash"] == prompt_hash]
if existing_entries and not version:
# Le prompt existe déjà, retourner l'entrée existante
return existing_entries[0]
# Déterminer la nouvelle version
if not version:
versions = [float(entry["version"]) for entry in self.index[agent_name]]
new_version = "1.0" if not versions else str(max(versions) + 0.1)
else:
new_version = version
# Créer l'entrée pour le nouveau prompt
timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
prompt_entry = {
"version": new_version,
"timestamp": timestamp,
"hash": prompt_hash,
"comment": comment,
"results": results,
"file": f"{agent_name}_v{new_version.replace('.', '_')}.json"
}
# Sauvegarder le prompt dans un fichier
prompt_file_path = os.path.join(self.agents_dir[agent_name], prompt_entry["file"])
with open(prompt_file_path, "w", encoding="utf-8") as f:
json.dump({
"metadata": prompt_entry,
"content": prompt_text
}, f, indent=2, ensure_ascii=False)
# Mettre à jour l'index
self.index[agent_name].append(prompt_entry)
self._save_index()
return prompt_entry
def get_prompt_history(self, agent_name):
"""
Récupère l'historique des prompts pour un agent donné.
Args:
agent_name: Nom de l'agent
Returns:
Liste des entrées de prompts pour cet agent
"""
if agent_name not in self.index:
return []
return sorted(self.index[agent_name], key=lambda x: float(x["version"]))
def get_prompt(self, agent_name, version="latest"):
"""
Récupère un prompt spécifique.
Args:
agent_name: Nom de l'agent
version: Version du prompt à récupérer (ou "latest" pour le plus récent)
Returns:
Contenu du prompt
"""
if agent_name not in self.index:
return None
if version == "latest":
# Trouver la version la plus récente
versions = [float(entry["version"]) for entry in self.index[agent_name]]
if not versions:
return None
version = str(max(versions))
# Trouver l'entrée correspondante
for entry in self.index[agent_name]:
if entry["version"] == version:
prompt_file = os.path.join(self.agents_dir[agent_name], entry["file"])
if os.path.exists(prompt_file):
with open(prompt_file, "r", encoding="utf-8") as f:
data = json.load(f)
return data["content"]
return None
def generate_report(self, output_file="prompt_evolution_report.md"):
"""
Génère un rapport sur l'évolution des prompts.
Args:
output_file: Fichier de sortie pour le rapport
Returns:
Chemin du fichier de rapport généré
"""
report = "# Évolution des prompts LLM\n\n"
for agent_name in self.agents_dir.keys():
history = self.get_prompt_history(agent_name)
if not history:
continue
report += f"## Agent: {agent_name}\n\n"
for entry in history:
prompt_file = os.path.join(self.agents_dir[agent_name], entry["file"])
if os.path.exists(prompt_file):
with open(prompt_file, "r", encoding="utf-8") as f:
data = json.load(f)
report += f"### Version {entry['version']} ({entry['timestamp']})\n\n"
if entry["comment"]:
report += f"**Modifications:**\n{entry['comment']}\n\n"
if entry["results"]:
report += f"**Résultats:**\n{entry['results']}\n\n"
report += "**Prompt:**\n```\n"
report += data["content"] + "\n```\n\n"
report += "---\n\n"
# Écrire le rapport dans un fichier
with open(output_file, "w", encoding="utf-8") as f:
f.write(report)
return output_file
```
**Exemple d'utilisation:**
```python
# Exemple d'utilisation dans les agents
from prompt_logger import PromptLogger
# Initialiser le logger
prompt_logger = PromptLogger()
# Charger le prompt courant
agent_name = "ticket_analyser"
current_prompt = prompt_logger.get_prompt(agent_name, "latest")
# Si le prompt est modifié, l'enregistrer avec un commentaire
new_prompt = """Nouvelle version du prompt pour l'analyse des tickets.
Instructions:
1. Analyser le contenu du ticket
2. Identifier les problèmes principaux
3. Proposer des solutions
"""
# Enregistrer le nouveau prompt avec des commentaires
prompt_logger.log_prompt(
agent_name=agent_name,
prompt_text=new_prompt,
comment="Amélioré les instructions pour être plus précises. Ajouté une étape pour proposer des solutions.",
results="Amélioration de 15% de la précision dans l'identification des problèmes."
)
# Génère un rapport de l'évolution des prompts
prompt_logger.generate_report("reports/prompt_evolution.md")
```
**Pour intégrer cette fonctionnalité dans votre système actuel**, vous pourriez:
1. Ajouter ce nouveau fichier `prompt_logger.py` dans le répertoire principal
2. Modifier les classes d'agents pour utiliser ce logger lors du chargement/modification des prompts
3. Ajouter une tâche dans l'orchestrateur pour générer périodiquement un rapport d'évolution des prompts
Cette solution permet de garder une trace complète des modifications de prompts, leurs justifications et leurs impacts, ce qui est très utile pour l'amélioration continue de votre système.
---
_**User**_
je voudrais ceal mais plus simple je voudrai qu'il soit avec les rapport générés T0124_rapport_fnal json et .md afin de bien voir les prmopts utilisés durant cette analyse précise et pouvoir les copiés allieurs as tu compris va au plus simple?
---
_**Assistant**_
Compris, allons au plus simple. Vous souhaitez simplement ajouter les prompts utilisés à chaque rapport généré, afin de garder une trace de quels prompts ont été utilisés spécifiquement pour chaque analyse de ticket.
Voici une solution simplifiée:
1. Créer une fonction qui ajoute les prompts au rapport final (JSON et MD)
2. Intégrer cette fonction dans le processus de génération de rapport
Voici le code minimal nécessaire:
```python
def ajouter_prompts_au_rapport(ticket_code, rapport_dir):
"""
Ajoute les prompts utilisés aux rapports finaux (JSON et MD)
Args:
ticket_code: Code du ticket (ex: T0124)
rapport_dir: Répertoire contenant les rapports
"""
# Chemins des fichiers
json_path = os.path.join(rapport_dir, f"{ticket_code}_rapport.json")
md_path = os.path.join(rapport_dir, f"{ticket_code}_rapport.md")
# Récupérer les prompts utilisés pour cette analyse
prompts = {
"ticket_analyser": get_agent_prompt("ticket_analyser"),
"report_generator": get_agent_prompt("report_generator"),
"image_analyser": get_agent_prompt("image_analyser") if has_images(ticket_code) else None,
"image_sorter": get_agent_prompt("image_sorter") if has_images(ticket_code) else None
}
# Filtrer les prompts None
prompts = {k: v for k, v in prompts.items() if v is not None}
# 1. Ajouter au rapport JSON
if os.path.exists(json_path):
with open(json_path, "r", encoding="utf-8") as f:
rapport_json = json.load(f)
# Ajouter la section des prompts
rapport_json["prompts_utilisés"] = prompts
# Sauvegarder le rapport JSON mis à jour
with open(json_path, "w", encoding="utf-8") as f:
json.dump(rapport_json, f, indent=2, ensure_ascii=False)
# 2. Ajouter au rapport MD
if os.path.exists(md_path):
with open(md_path, "r", encoding="utf-8") as f:
rapport_md = f.read()
# Ajouter la section des prompts à la fin
prompt_section = "\n\n## Prompts utilisés\n\n"
for agent, prompt in prompts.items():
prompt_section += f"### Agent: {agent}\n\n```\n{prompt}\n```\n\n"
# Ajouter la section au rapport
rapport_md += prompt_section
# Sauvegarder le rapport MD mis à jour
with open(md_path, "w", encoding="utf-8") as f:
f.write(rapport_md)
def get_agent_prompt(agent_name):
"""
Récupère le prompt actuel d'un agent.
Args:
agent_name: Nom de l'agent
Returns:
Texte du prompt
"""
# Chemin vers les prompts des agents
prompt_paths = {
"ticket_analyser": "prompt/ticket_analyser_prompt.txt",
"report_generator": "prompt/report_generator_prompt.txt",
"image_analyser": "prompt/image_analyser_prompt.txt",
"image_sorter": "prompt/image_sorter_prompt.txt"
}
if agent_name not in prompt_paths:
return None
path = prompt_paths[agent_name]
if not os.path.exists(path):
return None
with open(path, "r", encoding="utf-8") as f:
return f.read()
def has_images(ticket_code):
"""
Vérifie si le ticket contient des images.
Args:
ticket_code: Code du ticket
Returns:
True si le ticket contient des images, False sinon
"""
# Logique pour vérifier si le ticket contient des images
# À adapter selon votre système
# ...
return False # Par défaut, assumons qu'il n'y a pas d'images
```
Pour intégrer cette fonction, il faut l'appeler à la fin du processus de génération de rapport dans `agent_report_generator.py`. Voici comment l'intégrer:
```python
def generer_rapport(self, ticket_code, ticket_info, messages, attachments=None):
# Logique existante de génération de rapport
# ...
# Une fois les rapports JSON et MD générés, ajouter les prompts
ajouter_prompts_au_rapport(ticket_code, self.output_dir)
return rapport_json, rapport_md
```
Cette solution simple:
1. Récupère les prompts actuels des agents
2. Les ajoute à la fin des rapports JSON et MD
3. Permet de voir facilement quels prompts ont été utilisés pour chaque analyse
4. Est facile à implémenter et à maintenir
Vous aurez ainsi une section "Prompts utilisés" à la fin de chaque rapport, ce qui vous permettra de les copier facilement pour une utilisation ailleurs.
---
_**User**_
peux tu effectuer cette modification
---
_**Assistant**_
Pour effectuer cette modification, j'ai besoin d'identifier où ajouter ce code dans votre système. Examinons d'abord le fichier de génération de rapport.
---
Read file: agents/agent_report_generator.py
---
Read file: agents/agent_report_generator.py
---
Maintenant, je vais créer le code pour ajouter les prompts aux rapports. Je vais chercher d'abord où se trouvent les prompts actuels.
---
Listed directory prompt • **1** results
| Name |
|-------|
| 📄 `prompt.md` |
---
Read file: prompt/prompt.md
---
Maintenant que j'ai analysé le code, je vais créer la fonction pour ajouter les prompts aux rapports et l'intégrer dans le code existant. Voici l'implémentation complète:
---
Searched codebase "fonction generer_rapport dans agent_report_generator.py" • **25** results
| File | Lines |
|------|-------|
| `agents/agent_report_generator.py` | L323-372 |
| `agents/agent_report_generator.py` | L604-626 |
| `.specstory/history/2025-04-07_13-11-optimisation-des-rôles-des-agents-de-support.md` | L666-711 |
| `agents/agent_report_generator.py` | L111-136 |
| `agents/agent_report_generator.py` | L197-246 |
| `agents/agent_report_generator.py` | L544-582 |
| `agents/agent_report_generator.py` | L407-437 |
| `agents/agent_report_generator.py` | L504-526 |
| `agents/agent_report_generator.py` | L582-604 |
| `agents/agent_report_generator.py` | L1-35 |
| `agents/agent_report_generator.py` | L372-407 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L547-584 |
| `agents/agent_report_generator.py` | L162-197 |
| `agents/agent_report_generator.py` | L466-504 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L584-623 |
| `utils/report_formatter.py` | L1-51 |
| `agents/agent_report_generator.py` | L75-111 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L8088-8224 |
| `agents/agent_report_generator.py` | L526-544 |
| `.specstory/history/2025-04-07_07-12-analyse-de-code-et-ajout-de-logs.md` | L278-315 |
| `orchestrator.py` | L316-331 |
| `utils/report_formatter.py` | L51-76 |
| `.specstory/history/2025-04-07_07-12-analyse-de-code-et-ajout-de-logs.md` | L632-931 |
| `agents/agent_report_generator.py` | L788-815 |
| `agents/agent_report_generator.py` | L760-788 |
---
Basé sur l'analyse du code, je vais maintenant ajouter les modifications pour inclure les prompts dans les rapports:
---
Read file: agents/agent_report_generator.py
---
Après avoir analysé le code en profondeur, voici les modifications que je vais apporter:
1. Je vais ajouter une nouvelle fonction pour collecter les prompts des agents
2. Je vais modifier la méthode `executer` pour ajouter ces prompts au rapport final MD
Voici le code à ajouter au fichier `agents/agent_report_generator.py`:
---
Read file: agents/agent_ticket_analyser.py
---
Maintenant je vais créer les modifications nécessaires au fichier `agent_report_generator.py` pour ajouter les prompts aux rapports finaux:
```python
# Nouvelle fonction à ajouter après _collecter_info_agents
def _collecter_prompts_agents(self) -> Dict[str, str]:
"""
Collecte les prompts système de tous les agents impliqués dans l'analyse.
Returns:
Dictionnaire contenant les prompts des agents
"""
prompts = {
"rapport_generator": self.system_prompt
}
# Essayer de charger les prompts depuis les fichiers
prompt_dir = "prompt"
# Si le répertoire des prompts existe
if os.path.exists(prompt_dir):
# Essayer de charger les prompts des autres agents
for agent_file in [
"ticket_analyser_prompt.txt",
"image_analyser_prompt.txt",
"image_sorter_prompt.txt"
]:
file_path = os.path.join(prompt_dir, agent_file)
if os.path.exists(file_path):
try:
with open(file_path, "r", encoding="utf-8") as f:
agent_name = agent_file.replace("_prompt.txt", "")
prompts[agent_name] = f.read()
logger.info(f"Prompt chargé pour {agent_name}: {file_path}")
except Exception as e:
logger.warning(f"Erreur lors du chargement du prompt {file_path}: {str(e)}")
return prompts
# Nouvelle fonction pour ajouter les prompts au rapport Markdown
def _ajouter_prompts_au_rapport_md(self, md_path: str, prompts: Dict[str, str]) -> None:
"""
Ajoute les prompts utilisés au rapport Markdown.
Args:
md_path: Chemin du fichier Markdown
prompts: Dictionnaire des prompts par agent
"""
if not os.path.exists(md_path):
logger.warning(f"Impossible d'ajouter les prompts au rapport: {md_path} n'existe pas")
return
try:
# Lire le contenu actuel du rapport
with open(md_path, "r", encoding="utf-8") as f:
contenu = f.read()
# Ajouter une section pour les prompts
nouvelle_section = "\n\n## Prompts utilisés\n\n"
for agent, prompt in prompts.items():
# Limiter la taille du prompt pour éviter des fichiers trop volumineux
if len(prompt) > 2000:
# Garder le début et la fin du prompt
debut = prompt[:1000].strip()
fin = prompt[-1000:].strip()
prompt_tronque = f"{debut}\n\n[...]\n\n{fin}"
nouvelle_section += f"### Agent: {agent}\n\n```\n{prompt_tronque}\n```\n\n"
else:
nouvelle_section += f"### Agent: {agent}\n\n```\n{prompt}\n```\n\n"
# Écrire le nouveau contenu
with open(md_path, "w", encoding="utf-8") as f:
f.write(contenu + nouvelle_section)
logger.info(f"Prompts ajoutés au rapport Markdown: {md_path}")
except Exception as e:
logger.error(f"Erreur lors de l'ajout des prompts au rapport: {str(e)}")
```
Maintenant, je dois modifier la méthode `executer` pour intégrer ces nouvelles fonctions. Voici la modification à apporter à la fin de la méthode `executer`:
```python
# Dans la méthode executer, après avoir sauvegardé le fichier JSON
# ÉTAPE 2: Création du rapport Markdown pour présentation
# ... [code existant pour créer le rapport traité] ...
# Ajouter cette partie à l'endroit où le rapport Markdown est généré:
# Générer le rapport Markdown à partir du JSON
rapport_traite, _, _ = self._extraire_et_traiter_json(rapport_genere)
markdown_path = os.path.join(rapport_dir, f"{ticket_id}_rapport.md")
# Générer le titre et les métadonnées du rapport Markdown
markdown_rapport = f"# Ticket {ticket_id}: {ticket_data.get('name', '')}\n\n"
markdown_rapport += f"## Informations du ticket\n\n"
# Ajouter les champs importants du ticket
champs_importants = [
("id", "id"),
("code", "code"),
("name", "name"),
("project_name", "project_name"),
("stage_name", "stage_name"),
("user_id", "user_id"),
("partner_id/email_from", "partner_id_email_from"),
("create_date", "create_date"),
("write_date/last modification", "write_date")
]
for label, field in champs_importants:
value = ticket_data.get(field, "")
markdown_rapport += f"- **{label}**: {value}\n"
# Ajouter la description si elle existe
if "description" in ticket_data and ticket_data["description"]:
markdown_rapport += f"\n- **description**:\n\n{ticket_data['description']}\n\n"
# Ajouter le contenu principal du rapport
markdown_rapport += f"\n## Messages\n\n"
markdown_rapport += rapport_traite
# Ajouter les informations d'extraction
markdown_rapport += f"\n## Informations sur l'extraction\n\n"
markdown_rapport += f"- **Date d'extraction**: {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}\n"
markdown_rapport += f"- **Répertoire**: {rapport_dir}\n"
# Sauvegarder le rapport Markdown
with open(markdown_path, "w", encoding="utf-8") as f:
f.write(markdown_rapport)
logger.info(f"Rapport Markdown sauvegardé: {markdown_path}")
print(f" Rapport Markdown sauvegardé: {markdown_path}")
# NOUVELLE PARTIE: Ajouter les prompts au rapport Markdown
prompts = self._collecter_prompts_agents()
self._ajouter_prompts_au_rapport_md(markdown_path, prompts)
# NOUVELLE PARTIE: Ajouter les prompts au rapport JSON
rapport_data_complet["prompts_utilisés"] = prompts
# Mettre à jour le fichier JSON avec les prompts
with open(json_path, "w", encoding="utf-8") as f:
json.dump(rapport_data_complet, f, ensure_ascii=False, indent=2)
return json_path, markdown_path
```
Ces modifications permettront d'ajouter les prompts utilisés à la fois dans le rapport JSON et le rapport Markdown. Les prompts sont tronqués si nécessaire pour éviter des fichiers trop volumineux.
Pour les intégrer correctement, il faudrait procéder à une modification complète du fichier, mais je n'ai pas la possibilité de le faire directement. Vous pouvez utiliser ces extraits de code pour réaliser la modification vous-même.
---
_**User**_
n'avions nous pas transféré la fonctionalité markdown de ce fichier dans utils/report_formatter.py
---
_**Assistant**_
Oui, vous avez tout à fait raison. La fonctionnalité de génération du rapport Markdown a été transférée dans `utils/report_formatter.py`. C'est une approche plus propre qui sépare les responsabilités.
Au lieu de modifier directement `agent_report_generator.py`, nous devrions plutôt mettre à jour le module `report_formatter.py` pour ajouter la section des prompts aux rapports générés. Voici comment procéder:
---
Read file: utils/report_formatter.py
---
Voici la modification à apporter au fichier `utils/report_formatter.py` pour ajouter la section des prompts aux rapports générés. Nous devons ajouter du code juste avant le retour du contenu Markdown dans la fonction `_generate_markdown_content`:
```python
def _generate_markdown_content(rapport_data: Dict) -> str:
# ... [code existant] ...
# Juste avant le return final, ajouter la section des prompts
# Ajouter une section pour les prompts s'ils sont présents
if "prompts_utilisés" in rapport_data and rapport_data["prompts_utilisés"]:
markdown += "\n## Prompts utilisés\n\n"
prompts = rapport_data["prompts_utilisés"]
for agent, prompt in prompts.items():
# Si le prompt est trop long, le tronquer pour éviter des rapports trop volumineux
if len(prompt) > 2000:
debut = prompt[:1000].strip()
fin = prompt[-1000:].strip()
prompt_tronque = f"{debut}\n\n[...]\n\n{fin}"
markdown += f"### Agent: {agent}\n\n```\n{prompt_tronque}\n```\n\n"
else:
markdown += f"### Agent: {agent}\n\n```\n{prompt}\n```\n\n"
return markdown
```
Ensuite, il faut s'assurer que les prompts sont bien inclus dans le rapport JSON généré par `agent_report_generator.py`. Voici la modification minimale à apporter à ce fichier:
---
Searched codebase "rapport_data_complet dans agent_report_generator.py" • **25** results
| File | Lines |
|------|-------|
| `agents/agent_report_generator.py` | L544-582 |
| `.specstory/history/2025-04-07_13-11-optimisation-des-rôles-des-agents-de-support.md` | L666-711 |
| `agents/agent_report_generator.py` | L604-626 |
| `agents/agent_report_generator.py` | L323-372 |
| `agents/agent_report_generator.py` | L1-35 |
| `agents/agent_report_generator.py` | L582-604 |
| `.specstory/history/2025-04-08_09-12-comparaison-des-formats-ollama-et-mistral.md` | L970-1021 |
| `agents/agent_report_generator.py` | L372-407 |
| `agents/agent_report_generator.py` | L407-437 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L8088-8224 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L584-623 |
| `agents/agent_report_generator.py` | L111-136 |
| `agents/agent_report_generator.py` | L466-504 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L8051-8088 |
| `agents/agent_report_generator.py` | L504-526 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L547-584 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L2051-2139 |
| `agents/agent_report_generator.py` | L197-246 |
| `utils/report_formatter.py` | L51-76 |
| `.specstory/history/2025-04-07_13-11-optimisation-des-rôles-des-agents-de-support.md` | L1513-1544 |
| `.specstory/history/2025-04-07_07-12-analyse-de-code-et-ajout-de-logs.md` | L632-931 |
| `.specstory/history/2025-04-07_07-17-analyse-de-code-et-ajout-de-logs.md` | L5890-5936 |
| `.specstory/history/2025-04-08_09-12-comparaison-des-formats-ollama-et-mistral.md` | L2780-2973 |
| `orchestrator.py.new` | L138-180 |
| `agents/agent_report_generator.py` | L162-197 |
---
Après analyse complète du code, voici les étapes à suivre pour ajouter les prompts aux rapports:
1. Modifions d'abord la fonction `_generate_markdown_content` dans `utils/report_formatter.py` pour inclure les prompts des agents s'ils sont présents dans le JSON.
2. Ensuite, nous devons nous assurer que les prompts sont récupérés et ajoutés au rapport JSON dans `agent_report_generator.py`.
Commençons par la première modification:
---
Read file: utils/report_formatter.py
---
À présent, voici les modifications à apporter:
1. Modifions d'abord le fichier `utils/report_formatter.py` pour ajouter la section des prompts:
```python
# Ajouter ce code juste avant le return final dans la fonction _generate_markdown_content
# Ligne à ajouter vers la fin de la méthode, avant 'return markdown'
# Ajouter une section pour les prompts s'ils sont présents
if "prompts_utilisés" in rapport_data and rapport_data["prompts_utilisés"]:
markdown += "\n## Prompts utilisés\n\n"
prompts = rapport_data["prompts_utilisés"]
for agent, prompt in prompts.items():
# Si le prompt est trop long, le tronquer pour éviter des rapports trop volumineux
if len(prompt) > 2000:
debut = prompt[:1000].strip()
fin = prompt[-1000:].strip()
prompt_tronque = f"{debut}\n\n[...]\n\n{fin}"
markdown += f"### Agent: {agent}\n\n```\n{prompt_tronque}\n```\n\n"
else:
markdown += f"### Agent: {agent}\n\n```\n{prompt}\n```\n\n"
return markdown
```
2. Maintenant, nous devons ajouter une fonction pour collecter les prompts dans `agents/agent_report_generator.py`:
```python
def _collecter_prompts_agents(self) -> Dict[str, str]:
"""
Collecte les prompts système de tous les agents impliqués dans l'analyse.
Returns:
Dictionnaire contenant les prompts des agents
"""
prompts = {
"rapport_generator": self.system_prompt
}
# Charger les prompts depuis les fichiers si disponibles
prompt_dir = "prompt"
prompt_files = {
"ticket_analyser": "prompt.md",
"image_analyser": "prompt_image_analyser.md",
"image_sorter": "prompt_image_sorter.md"
}
if os.path.exists(prompt_dir):
for agent, filename in prompt_files.items():
file_path = os.path.join(prompt_dir, filename)
if os.path.exists(file_path):
try:
with open(file_path, "r", encoding="utf-8") as f:
prompts[agent] = f.read()
logger.info(f"Prompt chargé pour {agent}: {file_path}")
except Exception as e:
logger.warning(f"Erreur lors du chargement du prompt {file_path}: {str(e)}")
return prompts
```
3. Enfin, modifions la méthode `executer` pour ajouter les prompts au rapport JSON avant de le sauvegarder:
```python
# Dans la méthode executer, avant d'écrire le fichier JSON
# Ajouter ce code juste avant le bloc:
# with open(json_path, "w", encoding="utf-8") as f:
# json.dump(rapport_data_complet, f, ensure_ascii=False, indent=2)
# Collecter les prompts et les ajouter au rapport
prompts = self._collecter_prompts_agents()
rapport_data_complet["prompts_utilisés"] = prompts
```
Ces modifications permettront d'ajouter les prompts des agents au rapport JSON et de les inclure dans le rapport Markdown généré par le formateur de rapport. La section des prompts apparaîtra à la fin du rapport pour référence future.
Pour appliquer ces modifications, vous devez:
1. Ajouter le code de la section des prompts à la fin de la fonction `_generate_markdown_content` dans `utils/report_formatter.py`
2. Ajouter la nouvelle fonction `_collecter_prompts_agents` dans la classe `AgentReportGenerator`
3. Ajouter l'appel à cette fonction et l'ajout des prompts au rapport dans la méthode `executer`
Ces changements sont minimaux et n'affecteront pas le reste de la logique du système.
---
_**User**_
n'y a t il pas des éléments inutiles dans agent_report_generator.py concernant la gestion des markdown?
---
_**Assistant**_
Vous avez tout à fait raison, il y a effectivement des éléments devenus obsolètes dans `agent_report_generator.py` concernant la génération des rapports Markdown, puisque cette fonctionnalité a été transférée dans `utils/report_formatter.py`.
Voici les éléments qui peuvent être nettoyés dans `agent_report_generator.py`:
1. **Méthode `_generer_markdown_depuis_json`**: Cette méthode est devenue redondante puisque la génération du Markdown est maintenant gérée par `report_formatter.py`.
2. **Code de génération Markdown dans `executer`**: Tout le code qui génère directement le Markdown dans la méthode `executer` est probablement inutile.
3. **Appels directs à la génération Markdown**: Les appels directs pour générer et sauvegarder le fichier Markdown peuvent être remplacés par un appel à la méthode appropriée de `report_formatter.py`.
Pour nettoyer le code, voici ce que vous devriez faire:
1. Supprimer la méthode `_generer_markdown_depuis_json` complètement
2. Dans la méthode `executer`, remplacer le code de génération Markdown par un appel au formateur:
```python
# À la place du code de génération Markdown dans executer, après avoir sauvegardé le JSON
import sys
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
from utils.report_formatter import generate_markdown_report
# Sauvegarder d'abord le JSON avec les prompts inclus
with open(json_path, "w", encoding="utf-8") as f:
json.dump(rapport_data_complet, f, ensure_ascii=False, indent=2)
logger.info(f"Rapport JSON (format principal) sauvegardé: {json_path}")
print(f" Rapport JSON sauvegardé: {json_path}")
# Générer le rapport Markdown avec le formateur
md_success, md_path = generate_markdown_report(json_path)
if md_success:
logger.info(f"Rapport Markdown généré avec succès: {md_path}")
print(f" Rapport Markdown généré: {md_path}")
else:
logger.warning(f"Erreur lors de la génération du rapport Markdown: {md_path}")
md_path = None
# Retourner les deux chemins
return json_path, md_path
```
3. S'assurer que la méthode `executer` retourne maintenant un tuple avec les deux chemins:
```python
def executer(self, rapport_data: Dict, rapport_dir: str) -> Tuple[Optional[str], Optional[str]]:
"""
Génère un rapport à partir des analyses effectuées
Args:
rapport_data: Dictionnaire contenant toutes les données analysées
rapport_dir: Répertoire où sauvegarder le rapport
Returns:
Tuple contenant les chemins vers les rapports JSON et Markdown (None en cas d'erreur)
"""
# ... code existant ...
# Fin de la méthode:
return json_path, md_path # Retourne les deux chemins
```
Ces modifications permettront de nettoyer le code en supprimant les fonctionnalités dupliquées, tout en maintenant l'intégration de la nouvelle section des prompts dans les rapports générés.
---
_**User**_
peux tu corriger agent_report_generator.py des éléménts inutiles et mettre à jour report_formater.py pour récupérer les prompts des différents agents?
---
---