Étude de casMission client#rag#ai

Assistant de support IA — RAG 100% local

Une IA de support qui ne quitte jamais l'infrastructure.

Assistant de support N1/N2 capable d'exploiter un corpus documentaire et des tickets, entièrement hébergé en local, sans dépendance à une API d'IA externe pour l'inférence.

Contexte

Le besoin : des réponses contextualisées, traçables et confidentielles à partir d'un volume documentaire important, sans envoyer la moindre donnée à un service tiers.

Points clés

Recherche hybride lexicale + vectorielle puis reranking pour la pertinence
Génération locale (Qwen 14B) via vLLM ou Ollama selon le profil GPU/CPU
Réponses accompagnées de leurs sources et d'une boucle de feedback
Profils d'exécution mock / CPU / GPU pour développer sans matériel lourd

Le pipeline

1. Ingestion
2. Nettoyage & chunking
3. Embeddings
4. Indexation
5. Recherche hybride
6. Reranking
7. Contexte
8. Génération locale
9. Réponse sourcée
10. Feedback