Intermédiaire

Sélection et Filtrage avec Pandas

Savoir extraire les données pertinentes est crucial. Pandas utilise principalement .loc (basé sur les étiquettes) et .iloc (basé sur les positions entières).

📚 Documentation Officielle

Exemples de Code

Loc et Iloc

# Sélectionner par étiquette
print(df.loc[0, 'Nom'])

# Sélectionner par position
print(df.iloc[0, 0])

# Slicing
print(df.iloc[0:5, :]) # 5 premières lignes

Filtrage conditionnel

# Personnes de plus de 30 ans
adults = df[df['Âge'] > 30]

# Conditions multiples
paris_adults = df[(df['Âge'] > 18) & (df['Ville'] == 'Paris')]

💪 À vous de jouer !

  • À partir d'un DataFrame, sélectionnez uniquement les lignes où une certaine colonne numérique est supérieure à la moyenne.
  • Sélectionnez les colonnes 2 à 4 pour les 10 premières lignes avec `.iloc`.