# 📘 StratĂ©gie de configuration optimale Ragflow + Ollama avec LLM Vision ## 🧭 Objectif RĂ©organiser les Knowledge Bases (KB) et configurer Ragflow pour tirer parti des modĂšles LLM disponibles (notamment `llama3.2-vision`) pour un traitement prĂ©cis de documents techniques (normes, essais, schĂ©mas, formules...). --- ## ✅ 1. RĂ©organisation des KB par typologie hybride | Nouvelle KB | Contenu attendu | RAGFlow template | LLM assignĂ© | |------------------------------------|----------------------------------------------------------------|------------------|----------------------------------| | `Normes_Textuelles` | Normes purement textuelles (AFNOR, EN...) | `law`, `manual` | `deepseek-r1` ou `llama3.3` | | `Rapports_Essais_Tabulaires` | Tableaux d’essais, valeurs, graphiques avec OCR | `table` | `mistral` + reranker `bge` | | `Formules_MathĂ©matiques` | Notes de calcul, formules encodĂ©es, LaTeX | `manual`, `paper`| `llama3.3` ou `cline_qwen_128k` | | `SchĂ©mas_et_Figures_AnnotĂ©es` | Images + lĂ©gendes ou croquis structurĂ©s | `custom` | ✅ `llama3.2-vision` | | `Hybrides_SchĂ©ma+Formule` (option) | Cas combinĂ©s dans le mĂȘme doc | `manual` | `llama3.2-vision` | | `Documentation Logicielle (BRG)` | Interfaces, menus, usage logiciel | `qa`, `manual` | `mistral` | --- ## 🔍 2. Prompt systĂšme spĂ©cifique par KB (Ă  utiliser dans Ragflow) ### 🧠 SchĂ©mas / figures techniques ```txt You are an expert in reading technical diagrams. If the chunk includes an image, extract its description and explain what it shows. Answer in English clearly. If no image is included, rely on the text content only. ``` ### 📐 Formules mathĂ©matiques ```txt You are a mathematical assistant. If the document includes equations or LaTeX expressions, explain their purpose. If an image contains a formula, try to describe it in natural language. Answer in English with clarity. ``` ### 📚 Normes AFNOR ```txt Tu es un expert des normes de construction françaises. RĂ©ponds uniquement si une rĂ©fĂ©rence prĂ©cise est trouvĂ©e. Cite toujours la norme et l'article. RĂ©ponds en français. ``` ### đŸ§Ș Rapports d’essais ```txt Tu es un assistant laboratoire. Extrais les donnĂ©es chiffrĂ©es avec unitĂ©. Compare les valeurs si plusieurs essais sont mentionnĂ©s. RĂ©ponds en français. ``` --- ## ✂ 3. Chunking optimal et enrichissement OCR/Vision | Type de contenu | Chunk size | Overlap | SpĂ©cificitĂ©s | |---------------------|----------------|---------|-------------------------------------------------------------------| | Texte (normes) | 300–400 tokens | 30–50 | DĂ©coupe par titres + mĂ©tadonnĂ©es section | | Tableaux | 1 ligne/table | 0 | Inclure colonnes + en-tĂȘtes | | Formules | 200–300 | 30 | Ajouter LaTeX / OCR si image | | SchĂ©mas | 1 schĂ©ma | 0 | GĂ©nĂ©rer description manuelle/LLM vision | | Mixte | 500 | 50 | Ajouter `metadata:type=schema+math` | --- ## 🔄 4. Pipeline d’enrichissement (recommandĂ©) 1. OCR automatique (vĂ©rifiĂ©) 2. Ajout manuel ou automatique d’une description d’image 3. Inclusion de formule en clair dans chunk 4. Taggage des chunks avec types (`schema`, `formule`, `table`, etc.) --- ## 🧠 5. LLM Ă  utiliser depuis Ollama | ModĂšle Ollama | Utilisation principale | Prompt en anglais ? | Vision activĂ© ? | |---------------------------|--------------------------------------|----------------------|------------------| | `llama3.2-vision` | SchĂ©mas, figures, formules complexes| ✅ Obligatoire | ✅ Oui | | `llava:34b-v1.6-fp16` | Vision alternative / fallback | ✅ Obligatoire | ✅ Oui | | `deepseek-r1:70b` | Texte technique structurĂ© | ❌ | ❌ | | `mistral:latest` | Texte rapide, gĂ©nĂ©raliste | ❌ | ❌ | | `cline_qwen_128k_Q8` | Long contexte, formules | ❌ ou mixte | ❌ | | `EraX reranker` | Re-ranking, prĂ©cision recherche | ❌ | ❌ | --- ## đŸ› ïž 6. Exemple configuration dans Ragflow (vision) - **Model type**: `chat` - **Model name**: `llama3.2-vision` - **Base url**: `http://:11434` - **Max Tokens**: `4096` - **Vision support**: ✅ activĂ© - **Prompt**: *(voir plus haut selon KB)* --- ## 🚀 7. Évolutions possibles - Agent Python pour router selon type de document - Assistant global interrogeant plusieurs KB - Enrichissement automatique des chunks via LLM vision - Traduction automatique si prompt anglais (→ français) --- **Auteur :** ChatGPT x [Ton PrĂ©nom] **Date :** {{2025-03-26}}