pythonを使ったデータ分析をしてみたいということで、基本的なところからやっていこうと思います。
まず必要なのが、データをpythonで読み込むことですね。
そのためCSV形式のデータが必要ですが、ネットを探せば簡単に見つかるので好きなデータを使うことができます。

この記事は以下のような人におすすめ。
- CSVデータの読み込み用法を知りたい
- 読み込んだ表を見やすくしたい
プログラミング無料体験はこちら↓↓↓
今回は財務省のホームページから、国債の金利データをダウンロードしましたので、これを使って遊んでみましょう。
ダウンロードしたデータを保存する場所ですが、プログラムファイルと同じ場所の方が、慣れないうちはいいかと思います。
python: CSVデータの読み込み
CSVデータの読み込みに使うのが、pandas ライブラリーの「read.CSV関数」。
この関数を使って、ダウンロードしたデータを読み込んでみましょう。
import pandas as pd df = pd.read_csv('jgbcm_all.csv', encoding = 'utf-8', header = 0) print(df)
なんか知らんですが、エラーが出てしまいました。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8d in position 0: invalid start byte
長い文章ですが、要は「’utf-8′ は使えない」っていう意味ですね。
なので、いろいろググった結果「’shift-jis’」使えるらしいので、試してみました。
こんな感じ。
import pandas as pd df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 ) print(df)
このコードを実行してみた結果は以下の通り。
読み込み成功です。
しかしこれではなんとも見にくいのですね。
なので、もう少し見やすくしてみましょう。
この場合、「print()」 の代わりに 「display()」を使うことで、見やすいテーブルに変換できます。
import pandas as pd df = pd.read_csv('jgbcm_all.csv', encoding = 'shift-jis', header = 0 ) display(df) #print()の代わりにdisplay()を使う。
結果を見てみると、しっかりとテーブルの中に納まって、しかも見やすい。
ということで、読み込み成功です。
次は、データ分析に必要なデータの整理についていろいろ遊んでみたいと思います。

Python でデータ分析:DataFrameの整理とデータ型の変換
Python でCSVファイルを読みこんでもこのままでは分析に使えないので、データの整形が必要になります。この記事は以下のような人におすすめ。 pandas で不要なヘダーの削除方法を知りたい numpyを使ってセル内の不要な記号を消し

Python でデータ整理と度数分布表からヒストグラムの作成
データ分析をするうえで重要なのが、データがどのような状態なのかを確認することです。
確認方法として一般的なのが、データの種類の確認、度数分布表とヒストグラムですね。
この記事はこんな人におすすめ。
...
コメント