Aller au contenu
Retour à l'accueil
Étude de casMission client#rag#ai

Assistant de support IA — RAG 100% local

Une IA de support qui ne quitte jamais l'infrastructure.

Assistant de support N1/N2 capable d'exploiter un corpus documentaire et des tickets, entièrement hébergé en local, sans dépendance à une API d'IA externe pour l'inférence.

Contexte

Le besoin : des réponses contextualisées, traçables et confidentielles à partir d'un volume documentaire important, sans envoyer la moindre donnée à un service tiers.

Points clés

  • Recherche hybride lexicale + vectorielle puis reranking pour la pertinence
  • Génération locale (Qwen 14B) via vLLM ou Ollama selon le profil GPU/CPU
  • Réponses accompagnées de leurs sources et d'une boucle de feedback
  • Profils d'exécution mock / CPU / GPU pour développer sans matériel lourd

Le pipeline

  1. 1. Ingestion
  2. 2. Nettoyage & chunking
  3. 3. Embeddings
  4. 4. Indexation
  5. 5. Recherche hybride
  6. 6. Reranking
  7. 7. Contexte
  8. 8. Génération locale
  9. 9. Réponse sourcée
  10. 10. Feedback