pythonを使ったデータ分析をしてみたいということで、基本的なところからやっていこうと思います。
まず必要なのが、データをpythonで読み込むことですね。
そのためCSV形式のデータが必要ですが、ネットを探せば簡単に見つかるので好きなデータを使うことができます。
今回は財務省のホームページから、国債の金利データをダウンロードしましたので、これを使って遊んでみましょう。
ダウンロードしたデータを保存する場所ですが、プログラムファイルと同じ場所の方が、慣れないうちはいいかと思います。
python: CSVデータの読み込み
CSVデータの読み込みに使うのが、pandas ライブラリーの「read.CSV関数」。
この関数を使って、ダウンロードしたデータを読み込んでみましょう。
import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'utf-8', header = 0)
print(df)
なんか知らんですが、エラーが出てしまいました。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8d in position 0: invalid start byte
長い文章ですが、要は「’utf-8′ は使えない」っていう意味ですね。
import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'utf-8', header = 0 ) #オレンジの部分がエラーが出ている。
print(df)
なので、いろいろググった結果「’shift-jis’」使えるらしいので、試してみました。
こんな感じ。
import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 )
print(df)
このコードを実行してみた結果は以下の通り。
読み込み成功です。
しかしこれではなんとも見にくいのですね。
なので、もう少し見やすくしてみましょう。
この場合、「print()」 の代わりに 「display()」を使うことで、見やすいテーブルに変換できます。
import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 )
display(df) #print()の代わりにdisplay()を使う。
結果を見てみると、しっかりとテーブルの中に納まって、しかも見やすい。
ということで、読み込み成功です。
次は、データ分析に必要なデータの整理についていろいろ遊んでみたいと思います。
関連記事↓↓↓

Python でデータ分析:DataFrameの整理とデータ型の変換
Python でCSVファイルを読みこんでみましたが、このままでは分析に使えないので、データの整形が必要になります。
csvデータ読み込みの記事はこちら↓↓↓
データの種類によって整形方法が変わりますが、今回のデータの場...

データとは:Python で度数分布表からヒストグラムの作成をやってみた
最近よく聞く「データをもとに...。」「データ分析によると...。」「データサイエンス」などなど、データっていう言葉をよく聞きませんか?
でもデータってなんとなくわかっているようで、深く考えてみるとよくわかっていない言葉ですよね。
...
コメント