python pandas DataFrameの取り扱いの忘備録

DataFrameは便利と言われていますが、自分はいつもやり方を忘れて四苦八苦するので、忘備録。

データフレームの生成

 

pythonでは、リストは、四角い括弧[ ] で括って、カンマ(,)で区切ったもの。

リストの例 [2011,2012,2013]

ディクショナリは、ラベルがついたリストで、弓型の括弧で囲まれたもの

ディクショナリの例 {‘Year’:[2011,2012,2013]}

キーが、データフレームにしたときの列の名前になります。

 

# データフレームの取り扱いを纏めておく

from pandas import DataFrame
import pandas as pd

dict1 = {‘Year’:[2011,2012,2013], ‘A’:[ 1, 3, 2], ‘B’:[5,6,4], ‘C’:[8,7,9]}

df1 = DataFrame(dict1)
print(df,’\n’)
print(‘dfがデータフレーム型であることの確認 type(df) ‘,type(df))

 

実行結果の出力は

   Year  A  B  C
0  2011  1  5  8
1  2012  3  6  7
2  2013  2  4  9 

dfがデータフレーム型であることの確認 type(df)  <class 'pandas.core.frame.DataFrame'>


 

データフレームから列を取得する方法

 

列を取り出すには列の名前で指定できます。

 

#データフレームから列を取りだす方法
print(‘データフレーム df:’,’\n’,df,’\n’)
print(‘Aの1列を取りだす df.A’,’\n’)
print(df.A,’\n’)
print(‘Yearの1列を取りだす df.Year’)
print(df.Year,’\n’)
print(“2つの列を名前で取りだす df[[‘A’,’Year’]]”)#  ‘を内部の文字列として扱いたいときは外側を” ” で
print(df[[‘A’,’Year’]],’\n’)