B! ゴロビシャ ネメシスの使い魔

統計学を学ぶ(ベイズ統計)

ベイズ統計の全体像

 

f:id:createday:20230117185708j:image

 

f:id:createday:20230201201058j:image

使用先

f:id:createday:20230117205216p:image

 

 

統計の基礎知識

共分散

f:id:createday:20230201205611j:image

Σ

 

f:id:createday:20230122182706j:image

 

 

f:id:createday:20230122181819j:image

変動係数とは

変動係数とは、格差(データのばらつき)を表す係数です。 格差が拡大すると変動係数が上昇し、格差が縮まると変動係数は下降します。 この数値より大きければ格差が大きいといったものはなく、2つの変動係数 の比較により、格差が大きい・小さいを判断します。

f:id:createday:20230125131415j:image

ローレンツ曲線

ある事象の集中の度合いを示す曲線で、所得や貯蓄の格差などを示す時に有効なグラフです。 ローレンツ曲線は階級ごとに集計された数値を使用します。

 

ローレンツ曲線とは、ある分布を持つ事象について、確率変数が取り得る値を変数とし、確率変数の値が与えられた変数の値を超えない範囲における確率変数と対応する確率の積の和を、その分布に対する確率変数の期待値で割って規格化したものとして与えられる関数の幾何学的な表現のことである。

ジニ係数

ジニ係数は完全平等線((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(橙色部分)を2倍した値です。

f:id:createday:20230127125943j:image

三角形の面積を求め、台形部分の面積を引くことでジニ係数が求まる。

ジニ係数が大きければ大きいほど格差が大きいことを表す。

確率

期待値

f:id:createday:20230127125424j:image

 

期待度数
expected frequency
クロス集計表における期待度数とは、行要素の合計や列要素の合計の比率から逆算して期待される度数のことを指す。期待度数に対し、実験、調査、観察などによって得られたデータに基づく度数を、実測度数、観測度数、観察度数などと言う。

 

独立性とは

確率論における独立とは、2つの事象が何れも起こる確率がそれぞれの確率の積に等しいことをいう。一方の事象が起こったことが分かっても、他方の事象の確率が変化しないことを意味する。 この「独立」の概念は、2個以上の事象、2個以上の確率変数、2個以上の試行に対して定義される。

 

ある事象\(A\)と別の事象\(B\)が独立性を満たすとは2つの事象が互いに関係していないことをいいます。
簡単な例を考えると、一般的にサイコロの出目は独立性を満たすと考えられています。1回目に\(3\)の目が出たとしても2回目にサイコロを振ったときに\(3\)の目が出やすくなったり出にくくなったりすることはありません。

独立性の活用

統計学では、異なる事象が独立かどうかは非常に重要な考え方になります。例えば、CPIなどの経済指標とその国の株価が独立でないと判断できれば経済指標を用いた株価の予測モデルなどを作ることができます。
反対に、異なる事象が独立である場合には計算が簡単になるというメリットがあります。独立でない事象を同時に考えるときにはそれぞれの事象の依存関係を考える必要がありますが、独立な事象では前述のように掛け算を用いて同時に起きる確率などを求めることができます。

 

推定

 

検定

 

回帰分布

単回帰分析が、1つの目的変数を1つの説明変数で予測したのに対し、重回帰分析は1つの目的変数を複数の説明変数で予測しようというものです。 多変量解析の目的のところで述べた、身長から体重を予測するのが単回帰分析で、身長と腹囲と胸囲から体重を予測するのが重回帰分析です。 式で表すと以下のようになります。

f:id:createday:20230130130839j:image

 

 

●2級(PBT、CBT:35問程度/90分)

① データソース
身近な統計

② データの分布
データの分布の記述

③ 1変数データ
中心傾向の指標
散らばりなどの指標
中心と散らばりの活用

④ 2変数以上のデータ
散布図と相関
カテゴリカルデータ

⑤ データの活用
単回帰と予測
時系列データの処理

⑥ 推測のためのデータ収集法
観察研究と実験研究
標本調査と無作為抽出
実験

⑦ 確率モデルの導入
確率
確率変数
確率分布

⑧ 推測
標本分布
推定
仮説検定

⑨ 線形モデル
回帰分析
実験計画の概念の理解

⑩ 活用
統計ソフトウェア の活用

 

ラスパイレス指数

f:id:createday:20230201192421j:image

 

ラスパイレス指数消費者物価指数や企業物価指数、パーシェ指数はGDPデフレータです。  

 

経済が実際にどのくらい成長したかが判断するために、名目GDPを実質GDPに評価しなおす「GDPデフレーター」と呼ばれる指標がある。 数式で表すと「名目GDP÷実質GDPGDPデフレーター」となる。

公式集

統計検定2級チートシート - Qiita

 

ようこそ!名無し文学部へ
楽しんでいってください。