Comment sélectionner (filtrer) les lignes d'une dataframe en utilisant une condition avec pandas en python ?

Comment sélectionner (filtrer) les lignes d'une dataframe en utilisant une condition avec pandas en python ?

Daidalos 15 mai 2020


Exemples de comment sélectionner (filtrer) les lignes d'une dataframe en utilisant une condition avec pandas en python:

1 -- Créer une dataframe

Commençons par créer une simple dataframe avec pandas:

>>> import pandas as pd
>>> data = {'Name':['Ben','Anna','Zow','Tom','John','Steve'], 'Age':[20,27,43,30,12,21], 'Sex':[1,0,0,1,1,1]}
>>> df = pd.DataFrame(data)

ce qui donne:

>>> df
   Age   Name  Sex
0   20    Ben    1
1   27   Anna    0
2   43    Zoe    0
3   30    Tom    1
4   12   John    1
5   21  Steve    1

2 -- Sélectionner les lignes en utilisant une condition

Exemple de comment sélectionner les lignes avec 'sex' = 1:

>>> df[ df['Sex'] == 1 ]
   Age   Name  Sex
0   20    Ben    1
3   30    Tom    1
4   12   John    1
5   21  Steve    1

3 -- Sélectionner les lignes en utilisant deux conditions

Autre exemple en utilisant deux conditions:

>>> df[ (df['Sex'] == 1) & (df['Age'] < 25 )]
   Age   Name  Sex
0   20    Ben    1
4   12   John    1
5   21  Steve    1

4 -- Références