Régression Logistique
Attention au piège ! La régression logistique sert à la CLASSIFICATION (binaire généralement).
La Fonction Sigmoïde
Au lieu de prédire une valeur infinie comme la régression linéaire, on passe le résultat dans une fonction sigmoïde qui écrase la sortie entre 0 et 1.
p = 1 / (1 + e^-z)
Si p > 0.5, on classe en 1 (Positif). Sinon, 0 (Négatif).
Exemple : Spam ou Non Spam ?
from sklearn.linear_model import LogisticRegression
# [Nombre de mots clés, Longueur du mail]
X = [[5, 100], [0, 50], [10, 200], [1, 20]]
y = [1, 0, 1, 0] # 1 = Spam, 0 = Non Spam
model = LogisticRegression()
model.fit(X, y)
# Nouveau mail
print(model.predict([[4, 120]])) # Probablement 1 (Spam)
print(model.predict_proba([[4, 120]])) # Voir les probabilités
💪 À vous de jouer !
Utilisez le notebook interactif ci-dessous pour tester le code directement ici !