pythonのpandasのデータフレームの特定のカラムの中である文字列を含むものだけ取り出したいと思いました。
df_文字列= df[df[‘特定のカラム名’].str.contains(‘文字列’)]
というコードを実行したところ、
ValueError: Cannot mask with non-boolean array containing NA / NaN values
というエラーになりました。このエラーの原因は何かというと、カラムの中に「空欄」が存在していたからなんですね。
以下のようにNAを無視するように na=Falseを付け加えたら、
df_文字列 = df[df[‘特定のカラム名’].str.contains(‘文字列’, na=False)]
エラーを回避できました。
この手のエラーは、空欄を含むスプレッドシートをデータフレームとして読み込んで何か処理をしようとするときには必ず遭遇してしまうと思います。空欄に関しては、何らかの例外処理が必要ということですね。