蛇使いな彼女BLOG
【第15回】 ライブラリ(pandas)の使い方⑤―locを使った抽出
2020.07.16
皆さんハロー
今まで抽出方法を散々紹介してきましたが今回で一旦一区切りにしたいと思います。
この手のコマンドはたくさんあってキリがないから…
さて、前回はilocを使って抽出を行いました。
今回は、行番号で指定するilocに対して文字列で指定するlocがあるのでそっちの紹介をするよ!
今までdfを例に使ってきたけど、インデックスと列名が数値じゃ都合悪いので新しく作ったdf2(↓)を使って抽出作業を行います。
このdf2の作り方を一応載せとくね。
■DataFrame生成
df2=pd.DataFrame(np.random.randint(0, 200, (5, 2)),
index=['A','B','C','D','E'],columns={'Alice','Tom'} )
※乱数生成にnumpyっていう計算用のライブラリを利用してるんだけど、ここで説明すると趣旨がずれるので興味がある人はWEBへ(笑)
まずはA行の抽出
■df.loc[‘行名’](↓①)
今度は行列を指定して抽出
■df.loc[‘行名’,’列名’](↑②)
最後に複数行、複数列を指定して抽出
■df.loc[[‘行名’,’行名’],’列名’](↑③)
以上―!
今回の抽出に関してはとにかく行列の記載順だったり、複数指定の場合は括弧でくくったり「:」で範囲指定したり…がポイントですね!
あとは練習あるのみ。
これまで紹介した以外にもquery()や比較演算子で条件を指定して抽出する方法もあるので、気になる人は調べてみてね。