Concepts Fondamentaux du Machine Learning
Avant de lancer des algorithmes, il faut comprendre comment on "apprend".
1. Types d'Apprentissage
- Supervisé : On donne à la machine les données (X) et les réponses attendues (y). Elle apprend la relation X -> y. (Ex: Prédire le prix d'une maison).
- Non Supervisé : On donne seulement les données (X). La machine doit trouver des structures cachées. (Ex: Segmenter des clients).
- Par Renforcement : Un agent apprend en interagissant avec un environnement et en recevant des récompenses ou des punitions. (Ex: Apprendre à marcher).
2. Train / Test Split
On ne teste jamais un modèle sur les données qu'il a déjà vues ! On divise toujours nos données en deux :
- Training Set (80%) : Pour entraîner le modèle.
- Test Set (20%) : Pour évaluer sa performance réelle.
3. Overfitting (Surapprentissage)
C'est quand le modèle apprend "par cœur" les données d'entraînement, y compris le bruit. Il est excellent sur le training set mais nul sur le test set. C'est l'ennemi n°1 !
💪 À vous de jouer !
Utilisez le notebook interactif ci-dessous pour tester le code directement ici !