RAG sur Pokémon

RAG sur Pokémon

  • Système de RAG spécialisé sur l'univers Pokémon, combinant données structurées issues de PokéAPI et contenus textuels de Poképédia, avec une interface Streamlit interactive.
2024
UTC

Technologies utilisées

PythonRetrieval-Augmented Generation (RAG)ChromaDBStreamlitGoogle GeminiLLM

Détails du projet

  • Collecte hybride : fusion de données textuelles et structurées, avec nettoyage, filtrage et indexation pour optimiser la pertinence et la performance.
  • Architecture orientée objet : encapsulation complète du système dans une classe RAGSystem, respectant les principes SOLID.
  • Base vectorielle avec ChromaDB : vectorisation des documents, gestion des modes de réponse (normal vs engagé) et nettoyage automatique des ressources.
  • Interface Streamlit : système interactif avec réglage de la température, affichage des passages utilisés, détection des hallucinations et outil d'évaluation intégré.
  • Évaluation fine : mesures RAGAS et internes (faithfulness, context precision, relevancy...), comparaison des modes, et pistes d'amélioration identifiées (hybrid search, enrichissement du corpus, tuning des prompts).

Intéressé par ce projet ?

N'hésitez pas à me contacter pour en discuter ou voir d'autres projets.