COURS INTERACTIFS
Chercher par le sens : bases vectorielles et retrieval
Un cours universitaire accessible sur la recherche sémantique. On part de la limite de la recherche par mot-clé, qui ignore le sens, pour reconstruire une recherche par le sens : représenter un texte par un vecteur, mesurer la proximité, indexer des millions de vecteurs sans tout comparer, rendre l'index durable, le marier au lexical, et enfin nourrir un modèle de langage. De la géométrie des embeddings au RAG.
- 00 8 minAvant-proposPourquoi chercher par le sens, ce que ce cours couvre, et comment le lire.
- 01 26 minEmbeddings et géométrie de la similaritéLe sens comme position dans l'espace, et trois façons de mesurer que deux sens sont proches.
- 02 28 minRecherche exacte et malédiction de la dimensionComparer tous les vecteurs donne la réponse parfaite. Voici son prix, et le piège que la grande dimension tend à notre intuition.
- 03 30 minHNSW : naviguer dans un graphe de proximitéEt si trouver le plus proche voisin devenait une promenade de quelques sauts, au lieu d'un balayage de millions de vecteurs ?
- 04 28 minLe paysage des index ANNQuatre familles d'index, trois richesses qu'on ne peut jamais toutes garder : comment choisir entre rappel, vitesse et mémoire ?
- 05 26 minTester l'approximatif : l'oracle différentielUn index peut passer tous ses tests, deux revues, et rendre quand même de mauvais résultats. Comment attrape-t-on un algorithme qui ment ?