Retour à l'accueil
Étude de casMission client#rag#ai
Assistant de support IA — RAG 100% local
Une IA de support qui ne quitte jamais l'infrastructure.
Assistant de support N1/N2 capable d'exploiter un corpus documentaire et des tickets, entièrement hébergé en local, sans dépendance à une API d'IA externe pour l'inférence.
Contexte
Le besoin : des réponses contextualisées, traçables et confidentielles à partir d'un volume documentaire important, sans envoyer la moindre donnée à un service tiers.
Points clés
- Recherche hybride lexicale + vectorielle puis reranking pour la pertinence
- Génération locale (Qwen 14B) via vLLM ou Ollama selon le profil GPU/CPU
- Réponses accompagnées de leurs sources et d'une boucle de feedback
- Profils d'exécution mock / CPU / GPU pour développer sans matériel lourd
Le pipeline
- 1. Ingestion
- 2. Nettoyage & chunking
- 3. Embeddings
- 4. Indexation
- 5. Recherche hybride
- 6. Reranking
- 7. Contexte
- 8. Génération locale
- 9. Réponse sourcée
- 10. Feedback