Formation 90 min de lecture Manipulation de donnΓ©es avec Pandas

πŸ“¦ Filtrage et sΓ©lection avec Pandas

Python & Data Science Chapitre : Manipulation de donnΓ©es avec Pandas Sous-chapitre : Filtrage et sΓ©lection

Objectifs d'apprentissage

🎯 Objectifs :\n
1SΓ©lectionner des colonnes\n2. Filtrer des lignes avec conditions\n3. Utiliser loc et iloc\n4. Trier les donnΓ©es

Introduction

πŸ“– La sΓ©lection et le filtrage des donnΓ©es sont essentiels en analyse de donnΓ©es.

Contenu thΓ©orique

SΓ©lection et filtrage :\n
PYTHON
\n# SΓ©lection d'une colonne\ndf["colonne"]\ndf.colonne\n\n# SΓ©lection de lignes\ndf.loc[0]           # Par index\ndf.iloc[0]          # Par position\n\n# Filtrage\ndf[df["age"] > 25]\ndf[(df["age"] > 25) & (df["ville"] == "Paris")]\n\n# Tri\ndf.sort_values("age", ascending=False)\n

Exemples pratiques

πŸ’» Exemple : Analyse de ventes\n
PYTHON
\nimport pandas as pd\n\nventes = pd.DataFrame({\n    "produit": ["A", "B", "C", "D", "E"],\n    "ventes": [100, 250, 150, 300, 200],\n    "region": ["Nord", "Sud", "Est", "Ouest", "Nord"]\n})\n\n# Produits avec ventes > 200\ntop_produits = ventes[ventes["ventes"] > 200]\nprint("Produits avec ventes > 200 :")\nprint(top_produits)\n\n# Ventes par rΓ©gion Nord\nnord = ventes[ventes["region"] == "Nord"]\nprint("\\nVentes rΓ©gion Nord :")\nprint(nord)\n\n# Tri par ventes dΓ©croissantes\ntrie = ventes.sort_values("ventes", ascending=False)\nprint("\\nTriΓ© par ventes :")\nprint(trie)\n

Bonnes pratiques

1Utiliser loc pour labels\nβœ… 2. Utiliser iloc pour positions\nβœ… 3. Utiliser & pour ET, | pour OU\nβœ… 4. Copier avant de modifier

Pièges à éviter

Modifier une vue au lieu d'une copie\n
Utiliser .copy() pour crΓ©er une copie

RΓ©sumΓ©

df["col"] : sΓ©lection colonne\nβœ… df[condition] : filtrage\nβœ… df.loc[] : sΓ©lection par label\nβœ… df.iloc[] : sΓ©lection par position\nβœ… df.sort_values() : tri

Ressources supplΓ©mentaires

πŸ“š pandas.pydata.org/docs/user_guide/indexing.html