COURS INTERACTIFS

Chercher par le sens : bases vectorielles et retrieval

Un cours universitaire accessible sur la recherche sémantique. On part de la limite de la recherche par mot-clé, qui ignore le sens, pour reconstruire une recherche par le sens : représenter un texte par un vecteur, mesurer la proximité, indexer des millions de vecteurs sans tout comparer, rendre l'index durable, le marier au lexical, et enfin nourrir un modèle de langage. De la géométrie des embeddings au RAG.

  1. 00
    Avant-propos
    Pourquoi chercher par le sens, ce que ce cours couvre, et comment le lire.
    8 min
  2. 01
    Embeddings et géométrie de la similarité
    Le sens comme position dans l'espace, et trois façons de mesurer que deux sens sont proches.
    26 min
  3. 02
    Recherche exacte et malédiction de la dimension
    Comparer tous les vecteurs donne la réponse parfaite. Voici son prix, et le piège que la grande dimension tend à notre intuition.
    28 min
  4. 03
    HNSW : naviguer dans un graphe de proximité
    Et si trouver le plus proche voisin devenait une promenade de quelques sauts, au lieu d'un balayage de millions de vecteurs ?
    30 min
  5. 04
    Le paysage des index ANN
    Quatre familles d'index, trois richesses qu'on ne peut jamais toutes garder : comment choisir entre rappel, vitesse et mémoire ?
    28 min
  6. 05
    Tester l'approximatif : l'oracle différentiel
    Un index peut passer tous ses tests, deux revues, et rendre quand même de mauvais résultats. Comment attrape-t-on un algorithme qui ment ?
    26 min