= tibble::tibble(
Data Y = c(9,10,21,18)
# Data
)
# Show data Data
# A tibble: 4 × 1
Y
<dbl>
1 9
2 10
3 21
4 18
mean(Data$Y) # Apply Mean Algorithm
[1] 14.5
データから分析者が指定した計算手順によって算出された値や関数を、Estimatorと呼ぶ。またこの計算手順をアルゴリズムと呼ぶ。
例: 平均アルゴリズム
= tibble::tibble(
Data Y = c(9,10,21,18)
# Data
)
# Show data Data
# A tibble: 4 × 1
Y
<dbl>
1 9
2 10
3 21
4 18
mean(Data$Y) # Apply Mean Algorithm
[1] 14.5
同じAlgorithmを用いたとしても、Estimatorの値は、一般に算出に用いたデータの特徴によって決定される。 データの特徴は確率的に決定されるため、Estimatorの値もまた確率的に決定されると表現できる。
データの事例は、分析者が母集団から確率的に選ばれると想定する。 またEstimandは、母集団の特徴として定義する。 分析者は、母集団およびEstimandを直接観察できないと想定する。
母集団における賃金 \(Y\) の分布 \(=f(Y)\)
Estimand \(=\) 母集団における平均賃金 \(E[Y]=\int Y f(Y)dY\)
データ \(=\) 確率関数 \(f(Y)\) に従って発生した\(N\)個の事例の集合 \([Y_1,..,Y_N]\)
Estimator \(=\) 例えばデータにおける平均賃金 \(\sum_i Y_i/N\)