pythonでデータ分析:CSVファイルの読み込みと表示

データ分析

pythonを使ったデータ分析をしてみたいということで、基本的なところからやっていこうと思います。

まず必要なのが、データをpythonで読み込むことですね。

そのためCSV形式のデータが必要ですが、ネットを探せば簡単に見つかるので好きなデータを使うことができます。

今回は財務省のホームページから、国債の金利データをダウンロードしましたので、これを使って遊んでみましょう。

ダウンロードしたデータを保存する場所ですが、プログラムファイルと同じ場所の方が、慣れないうちはいいかと思います。

プログラミングを勉強したい!! データ分析に興味がある!!
そんなあなたへのおすすめ記事
無料体験あり、キャッシュバック有りプログラミングスクールおすすめはこちら

 

python: CSVデータの読み込み

CSVデータの読み込みに使うのが、pandas ライブラリーの「read.CSV関数」。

この関数を使って、ダウンロードしたデータを読み込んでみましょう。

import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'utf-8', header = 0)
print(df)

なんか知らんですが、エラーが出てしまいました。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8d in position 0: invalid start byte

長い文章ですが、要は「’utf-8′ は使えない」っていう意味ですね。

import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'utf-8', header = 0 ) #オレンジの部分がエラーが出ている。
print(df)

なので、いろいろググった結果「’shift-jis’」使えるらしいので、試してみました。

こんな感じ。

import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 )
print(df)

このコードを実行してみた結果は以下の通り。


読み込み成功です。

しかしこれではなんとも見にくいのですね。

なので、もう少し見やすくしてみましょう。

この場合、「print()」 の代わりに 「display()」を使うことで、見やすいテーブルに変換できます。

import pandas as pd
df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 )
display(df) #print()の代わりにdisplay()を使う。

結果を見てみると、しっかりとテーブルの中に納まって、しかも見やすい。

ということで、読み込み成功です。

次は、データ分析に必要なデータの整理についていろいろ遊んでみたいと思います。

プログラミングを勉強したい!! データ分析に興味がある!!
そんなあなたへのおすすめ記事
無料体験あり、キャッシュバック有りプログラミングスクールおすすめはこちら

 

関連記事↓↓↓

Python でデータ分析:DataFrameの整理とデータ型の変換
Python でCSVファイルを読みこんでみましたが、このままでは分析に使えないので、データの整形が必要になります。 csvデータ読み込みの記事はこちら↓↓↓ データの種類によって整形方法が変わりますが、今回のデータの場...
データとは:Python で度数分布表からヒストグラムの作成をやってみた
最近よく聞く「データをもとに...。」「データ分析によると...。」「データサイエンス」などなど、データっていう言葉をよく聞きませんか? でもデータってなんとなくわかっているようで、深く考えてみるとよくわかっていない言葉ですよね。 ...

コメント

タイトルとURLをコピーしました