統計

数学

Python 単回帰分析の実装をやってみた

回帰分析(Regression Analysis)とは、ある変数の値から別の変数の値を推定する方法です。 データによって未来を予測するデータサイエンスで頻繁に用いられる手法になります。 回帰分析には推定に用いる独立変数(説明変数)と、推定さ...
数学

Python で順列と組み合わせを実装してみる

順列は簡単に言うと「並べ方、並べる順番」です。 つまり、n個の異なった要素から決められた数、rの要素を取り出し、取り出した順番に並べた数が順列です。 ちょっと何言っているかわからないですよね。 もっと簡単に言うと、例えば1,2,3,4,5,...
数学

Pythonで離散値の確率分布、二項分布を計算してみる

離散値の確率を計算するのに便利な二項分布を、Pythonを使って実装してみようという趣旨。 離散型の確率分布として使われる二項分布は、例えば勝率が3割のチームが7戦した時に勝つ確率を求めるときなどに役立ちます。 この記事はこんな人におすすめ...
数学

python で正規分布の確率密度関数を描く

Pythonで正規分布の確率密度関数を描いてみます。 データは気象庁の仙台 日平均気温の月平均値(℃)を使って正規分布の確率密度関数を描いてみます。 この記事はこんな人におすすめ。 データの前処理の方法を知りたい。 正規分布の確率密度関数を...
数学

Pythonで連続値の確率分布、正規分布から確率を計算してみる

連続値の確率を、pythonを使って計算してみましょう。 連続値の確率分布として使われる正規分布は、例えば「平均が5gの商品の重さが6g以上になる確率を求めるときなどに使われます。 今回はいくつかの例を使って、正規分布を使った確率の計算を実...
統計

Pyhton を使って確率の計算をやってみる:中心極限定理と正規分布

簡単な確率の計算をPythonを使ってやってみましょう。 確率は何とも概念がつかみにくいものがあるのですが、実際に計算してみることで概念をつかんでみたいと思います。 この記事はこんな人におすすめです。 Pythonで確率の計算をしてみたい。...
データ分析

Python による平均値、中央値、最頻値の求めかたと数式の意味

標本を度数分布表に落とし込み、グラフにすることでその大まかな傾向が見えますが、さらに細かくデータを見てみましょう。 データを視覚的、感覚的に確認するために、一般的に用いられるのが「平均値」「中央値」「最頻値」ですね。 ということで、この三つ...
統計

Python による分散、標準偏差の求めかたと数式の意味

「平均値」「中央値」「最頻値」でデータを視覚的、感覚的に確認し、さらにデータがどのような性質を持っているのかを確認するために用いられるのが、分散と標準偏差です。 この記事では、分散と標準偏差とは何か、どのようなときに使われるのか、さらにpy...
統計

Python を使った度数分布表とヒストグラムの作成

データ分析をするうえで重要なのが、データがどのような状態なのかを確認することです。 そのための方法として一般的なのが、度数分布表とヒストグラムです。 この記事では、Pythonを使って Pythonで度数分布表とヒストグラムを作成する方法 ...