Python:DataFrame から不要な行を消す「.drop」

Python

消費者物価指数の、年ごとの変化率をグラフ化してみましょう。

例によって総務省統計局からのデータ引用で、1970年から2020年までの前年度比の変化率をグラフにしてみます。

基本はデータをダウンロードし、CSVファイルを読み込んでデータ整理を行った後にグラフ化するという手順でやっていきましょう。

この記事はこんな人におすすめ。

  • csvファイルの読み込み方を知りたい。
  • .dropの使い方を知りたい。
  • グラフの描画方法を知りたい

プログラミング無料体験はこちら↓↓↓


CSVファイルの読み込み

CSVファイルの読み込みに必要なのがpandasの関数「.read_CSV」。

これを使って、CSVファイルの読み込みをまずやってみましょう。

import pandas as pd
import numpy as np
df_zeny=pd.read_csv('zny2015a.csv', encoding='shift-jis', header=0, index_col=0)

display(df_zeny)

こんな感じでDataFrameの「df_zeny」を作成しました。

さっそくこのdf_zenyを見てみましょう。

グラフ作成の必要な値にたどり着くまでの間に、余計な行が入っていますね。

不要な列または行を消す.dropメソッド

そこでこれらの行を、一気に消してしまいましょう。

行を消すために必要なのが「.drop()」メソッド。

display(df_zeny.drop(index=['Group/Item','類・品目符号(Group/Item code)',
     '含類総連番(Serial number)','ウエイト(Weight)', 
     'ウエイト1万分比(Weight per 10000)'], inplace=True))

こんな感じで直接データ分析に必要ない各行を削除していき、最後に「inplace=True」で元のDataFrameそのものを修正します。

ちなみに「inplace=True」は表が出てくるわけではなく、単純に「none」で返されます。

変更した元データを「display(df_zeny)」で見てみましょう。

不要な行が消せましたので、さっそく本題に入りましょう。

コアコアCPIのグラフを描く

消費者物価指数、つまりインフレ率といっても様々な指標があります。

一般的に、CPI(Consumer Price Index)といわれ、末端価格( 消費者が実際に購入する段階の、商品小売価格(物価))の変動を表す指数です。

このCPIから価格変動の激しい生鮮食品を除いたものを「コアCPI」。

生鮮食品と、エネルギー価格を除いたものを「コアコアCPI」といいます。

そしてもちろんここでグラフ化するのは、コアコアCPIの方ですね。

まずはDataFrameから「生鮮食品及びエネルギーを除く総合」を抜き出してみましょう。

display(df_zeny['生鮮食品及びエネルギーを除く総合'])

こんな感じで無事、抜き出すことができました。

では、ここからインフレ変化率のグラフを作ってみましょう。

下が、コアコアCPIの変化率を見るためのグラフを描くコード。

from matplotlib import pyplot as plt
import pylab
import numpy as np
import matplotlib as mpl
mpl.rcParams['font.family'] = 'MS Gothic'
pylab.figure(figsize=(20, 10))
plt.xticks(np.arange(4, 55))
plt.xticks(rotation=90)
plt.title('コアコアCPI前年比', fontsize=18)
plt.xlabel("年度", fontsize=18)
plt.ylabel("コアコアCPI変化率", fontsize=18)
plt.plot(df_zeny['生鮮食品及びエネルギーを除く総合'], label="コアコアCPI", color="red")
plt.legend(prop={"family":"MS Gothic"})
plt.grid()
plt.show()

でこのコードを実行すると下のようなグラフが完成。

1995年以降は、見事に変化率が0%周辺をさまよっていますね。

コアコアCPI以外にも値があるので、順次可視化していきたいと思っています。

プログラミング無料体験はこちら↓↓↓



 

関連記事↓↓↓

Python:データ分析。「.T」を使った行と列の入れ替え
Pythonを使った簡単なデータ分析の方法を、見ていきましょう。 まずは「pandas」を使って、農林水産省の食料自給率に関するデータのCSVファイルを読み込みします。 この記事はこんな人におすすめ ...
pythonでデータ分析:CSVファイルの読み込みと表示
pythonを使ったデータ分析をしてみたいということで、基本的なところからやっていこうと思います。まず必要なのが、データをpythonで読み込むことですね。そのためCSV形式のデータが必要ですが、ネットを探せば簡単に見つかるので好きなデータ

コメント

タイトルとURLをコピーしました