pythonでデータ分析:CSVファイルの読み込みと表示

Python

pythonを使ったデータ分析をしてみたいということで、基本的なところからやっていこうと思います。

まず必要なのが、データをpythonで読み込むことですね。

そのためCSV形式のデータが必要ですが、ネットを探せば簡単に見つかるので好きなデータを使うことができます。

この記事は以下のような人におすすめ。

  • CSVデータの読み込み用法を知りたい
  • 読み込んだ表を見やすくしたい

プログラミング無料体験はこちら↓↓↓



今回は財務省のホームページから、国債の金利データをダウンロードしましたので、これを使って遊んでみましょう。

ダウンロードしたデータを保存する場所ですが、プログラムファイルと同じ場所の方が、慣れないうちはいいかと思います。

プログラミングを勉強したい!! データ分析に興味がある!!
そんなあなたへのおすすめ記事
無料体験あり、キャッシュバック有りプログラミングスクールおすすめはこちら

 

python: CSVデータの読み込み

CSVデータの読み込みに使うのが、pandas ライブラリーの「read.CSV関数」。

この関数を使って、ダウンロードしたデータを読み込んでみましょう。

import pandas as pd 
df = pd.read_csv('jgbcm_all.csv', encoding = 'utf-8', header = 0) 
print(df)

なんか知らんですが、エラーが出てしまいました。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8d in position 0: invalid start byte

長い文章ですが、要は「’utf-8′ は使えない」っていう意味ですね。

なので、いろいろググった結果「’shift-jis’」使えるらしいので、試してみました。

こんな感じ。

import pandas as pd 
df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 ) 
print(df)

このコードを実行してみた結果は以下の通り。


読み込み成功です。

しかしこれではなんとも見にくいのですね。

なので、もう少し見やすくしてみましょう。

この場合、「print()」 の代わりに 「display()」を使うことで、見やすいテーブルに変換できます。

import pandas as pd 
df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 ) 
display(df) #print()の代わりにdisplay()を使う。

結果を見てみると、しっかりとテーブルの中に納まって、しかも見やすい。

ということで、読み込み成功です。

次は、データ分析に必要なデータの整理についていろいろ遊んでみたいと思います。

プログラミング無料体験はこちら↓↓↓



関連記事↓↓↓

Python でデータ分析:DataFrameの整理とデータ型の変換
Python でCSVファイルを読みこんでもこのままでは分析に使えないので、データの整形が必要になります。この記事は以下のような人におすすめ。 pandas で不要なヘダーの削除方法を知りたい numpyを使ってセル内の不要な記号を消し
Python でデータ整理と度数分布表からヒストグラムの作成
データ分析をするうえで重要なのが、データがどのような状態なのかを確認することです。 確認方法として一般的なのが、データの種類の確認、度数分布表とヒストグラムですね。 この記事はこんな人におすすめ。 ...

コメント

タイトルとURLをコピーしました