月別アーカイブ: 2021年11月

データフレーム 特定の列が特定の値の行を取得する方法

教員名簿がエクセルであったとして、それをデータフレームとして読み込み、役職が教授の行の氏名の列の情報だけを取得する方法。df.loc[行][列]という形で中に条件を埋め込んで書けます。

xls= pd.ExcelFile(file)
df= pd.read_excel(xls)

#教授だけを表示
print (df.loc[(df['役職名(職種名)'] =='教授')]['氏名'])

 

pd.ExcelFile(file)でエラー ValueError: Max value is 14

pandasのエクセルを読み込むコマンド

pd.ExcelFile(file)

を使って、PDFの表をエクセルに保存したものを読みこもうとしたら、

ValueError: Max value is 14

というエラーになってしまいました。エラーコードを自分が見ても全く理解できないので、あれこれ試行錯誤したのですが、結果的に、エクセルのファイルの中身をコピーアンドペーストで一度、シンプルエディタ(ウインドウズの「メモ帳」)に張り付けて、そこからコピーアンドペースとで新規作成したエクセルファイルに張り付けました。それを保存して、読み込ませたら読めました。おそらく文字に何か、眼に見えないフォーマットがへばりついていたのではないかと想像します。解決方法としては邪道ですが、作業を先に進めることができるのでよしとします。

APIの使い方

APIの使い方ウェブチュートリアル

Python & APIs: A Winning Combo for Reading Public Data by Pedro Pregueiro Feb 22,  2021 Pedro PregueiroさんのAPI解説ウェブ記事。題名に惹かれて中身を読んだら、期待に違わずわかりやすい説明だった。APIが完全に初めてな人向けに非常にスローペースでわかりやすい解説。しかし、最後は面白みのある使用例を示している(新型コロナウイルスの感染状況の分析)。世の中には物事をかみ砕いて説明するのが上手い人がいるもんだと感心。