DataFrameは便利と言われていますが、自分はいつもやり方を忘れて四苦八苦するので、忘備録。
データフレームの生成
pythonでは、リストは、四角い括弧[ ] で括って、カンマ(,)で区切ったもの。
リストの例 [2011,2012,2013]
ディクショナリは、ラベルがついたリストで、弓型の括弧で囲まれたもの
ディクショナリの例 {‘Year’:[2011,2012,2013]}
キーが、データフレームにしたときの列の名前になります。
# データフレームの取り扱いを纏めておく
from pandas import DataFrame
import pandas as pddict1 = {‘Year’:[2011,2012,2013], ‘A’:[ 1, 3, 2], ‘B’:[5,6,4], ‘C’:[8,7,9]}
df1 = DataFrame(dict1)
print(df,’\n’)
print(‘dfがデータフレーム型であることの確認 type(df) ‘,type(df))
実行結果の出力は
Year A B C 0 2011 1 5 8 1 2012 3 6 7 2 2013 2 4 9 dfがデータフレーム型であることの確認 type(df) <class 'pandas.core.frame.DataFrame'>
データフレームから列を取得する方法
列を取り出すには列の名前で指定できます。
#データフレームから列を取りだす方法
print(‘データフレーム df:’,’\n’,df,’\n’)
print(‘Aの1列を取りだす df.A’,’\n’)
print(df.A,’\n’)
print(‘Yearの1列を取りだす df.Year’)
print(df.Year,’\n’)
print(“2つの列を名前で取りだす df[[‘A’,’Year’]]”)# ‘を内部の文字列として扱いたいときは外側を” ” で
print(df[[‘A’,’Year’]],’\n’)