蛇使いな彼女BLOG
【第13回】 ライブラリ(pandas)の使い方③ー列を指定して抽出
2020.06.18

今回はDataFrame (df)から行・列を指定して見たいデータを取り出すよ。
1.列抽出
先にコマンドを言ってしまうと、df.列名 や df[‘列名’] で抽出可能です。
ただ、前者が使えるのは列名が文字列のときらしく以下一番初めの列を指定していますが、赤文字部分で構文エラーが出ています^^;
■ df.列名↓

気を取り直して今度は列名を[‘0’,‘1’,‘2’,‘3’・・・・] から [‘a’,‘b’,‘c’,‘d’・・・・] とアルファベットに直して再度取り出します。

このとき列名を一括で変更する方法ですが、df.columns で指定してやると簡単☺
実際の列数と[ ]の中身の個数が一致するように記載しましょう。(df[‘列名’]①↓)
今度はdf.aで最初の列の抽出が出来ました。
また、df[‘列名‘]を使うと数字でも文字列でも関係なく抽出できます。(df[‘列名’]②↓)
•df[‘列名’]①↓

•df[‘列名’]②↓

こんな感じで多少の規制はあるものの簡単に抽出できました(^o^)
2.行抽出
dfから範囲を指定して取り出す場合
■ df[行番号:行番号]↓

次に1行だけ抽出したい場合や複数行指定したい場合は行(列)番号を指定するilocを使います。
■ df.iloc[行番号]↓

さて、ここで皆さんに問題です。
問題:
ilocを使ってindexの2行目と3行目を取り出すにどうすればいいでしょうか???
答えは次回載せます(*´ω`*)