Gegeven dit dataframe, hoe selecteer je alleen die rijen waarvan “Col2” gelijk is aan NaN
?
In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"])
In [57]: df
Out[57]:
0 1 2
0 0 1 2
1 0 NaN 0
2 0 0 NaN
3 0 1 2
4 0 1 2
Het resultaat zou dit moeten zijn:
Out[57]:
0 1 2
1 0 NaN 0
Antwoord 1, autoriteit 100%
Probeer het volgende:
df[df['Col2'].isnull()]
Antwoord 2, autoriteit 6%
@qbzenker leverde de meest idiomatische methode IMO
Hier zijn een paar alternatieven:
In [28]: df.query('Col2 != Col2') # Using the fact that: np.nan != np.nan
Out[28]:
Col1 Col2 Col3
1 0 NaN 0.0
In [29]: df[np.isnan(df.Col2)]
Out[29]:
Col1 Col2 Col3
1 0 NaN 0.0