Formation
90 min de lecture
Manipulation de donnΓ©es avec Pandas
π¦ Filtrage et sΓ©lection avec Pandas
Objectifs d'apprentissage
π― Objectifs :\n
1SΓ©lectionner des colonnes\n2. Filtrer des lignes avec conditions\n3. Utiliser loc et iloc\n4. Trier les donnΓ©es
Introduction
π La sΓ©lection et le filtrage des donnΓ©es sont essentiels en analyse de donnΓ©es.
Contenu thΓ©orique
SΓ©lection et filtrage :\n
PYTHON
\n# SΓ©lection d'une colonne\ndf["colonne"]\ndf.colonne\n\n# SΓ©lection de lignes\ndf.loc[0] # Par index\ndf.iloc[0] # Par position\n\n# Filtrage\ndf[df["age"] > 25]\ndf[(df["age"] > 25) & (df["ville"] == "Paris")]\n\n# Tri\ndf.sort_values("age", ascending=False)\nExemples pratiques
π» Exemple : Analyse de ventes\n
PYTHON
\nimport pandas as pd\n\nventes = pd.DataFrame({\n "produit": ["A", "B", "C", "D", "E"],\n "ventes": [100, 250, 150, 300, 200],\n "region": ["Nord", "Sud", "Est", "Ouest", "Nord"]\n})\n\n# Produits avec ventes > 200\ntop_produits = ventes[ventes["ventes"] > 200]\nprint("Produits avec ventes > 200 :")\nprint(top_produits)\n\n# Ventes par rΓ©gion Nord\nnord = ventes[ventes["region"] == "Nord"]\nprint("\\nVentes rΓ©gion Nord :")\nprint(nord)\n\n# Tri par ventes dΓ©croissantes\ntrie = ventes.sort_values("ventes", ascending=False)\nprint("\\nTriΓ© par ventes :")\nprint(trie)\nBonnes pratiques
1Utiliser loc pour labels\nβ
2. Utiliser iloc pour positions\nβ
3. Utiliser & pour ET, | pour OU\nβ
4. Copier avant de modifier
Pièges à éviter
Modifier une vue au lieu d'une copie\n
Utiliser .copy() pour crΓ©er une copie
RΓ©sumΓ©
df["col"] : sΓ©lection colonne\nβ
df[condition] : filtrage\nβ
df.loc[] : sΓ©lection par label\nβ
df.iloc[] : sΓ©lection par position\nβ
df.sort_values() : tri
Ressources supplΓ©mentaires
π pandas.pydata.org/docs/user_guide/indexing.html