7.1: Zero way ANOVA (= Student $t$-分布 )


同時正規測定の「スチューデント化した仮説検定」は前に述べた. これの多元化が,分散分析である. したがって,同時正規測定の「スチューデント化した仮説検定」をもう一度ここで復習する. もちろん,多元化し易い形で復習するわけで,この意味で, 「零元配置分散分析」というタイトルをつけた.
さて, \begin{align*} \mbox{ 古典系の基本構造 $[ C_0(\Omega ) \subseteq L^\infty (\Omega, \nu ) \subseteq B(L^2 (\Omega, \nu ))]$ } \end{align*} に集中しよう.
ここで, \begin{align*} \Omega = {\mathbb R} \times {\mathbb R}_+ = \{ (\mu, \sigma ) \;|\; \mu \mbox{は実数,} \sigma \mbox{は正数} \} \end{align*} として, 同時正規測定 ${\mathsf M}_{L^\infty ({\mathbb R} \times {\mathbb R}_+)}$ $({\mathsf O}_G^n = ({\mathbb R}^n, {\mathcal B}_{\mathbb R}^n, {{{G}}^n}) ,$ $S_{[(\mu, \sigma)]})$ ( in $L^\infty({\mathbb R} \times {\mathbb R}_+)$) を考えよう. 繰り返しになるが, $L^\infty({\mathbb R} \times {\mathbb R}_+)$内の 同時正規測定 ${\mathsf M}_{L^\infty ({\mathbb R} \times {\mathbb R}_+)}$ $({\mathsf O}_G^n = ({\mathbb R}^n, {\mathcal B}_{\mathbb R}^n, {{{G}}^n}) ,$ $S_{[(\mu, \sigma)]})$ は以下のように定めた.

\begin{align} & [{{{G}}}^n (\mathop{✕}_{k=1}^n \Xi_k)] ({}\omega{}) = \mathop{✕}_{k=1}^n [{{{G}}}(\Xi_k)](\omega) \nonumber \\ = & \frac{1}{({{\sqrt{2 \pi }\sigma{}}})^n} \underset{{\mathop{✕}_{k=1}^n \Xi_k }}{\int \cdots \int} \exp[{}- \frac{\sum_{k=1}^n ({}{}{x_k} - {}{\mu} {})^2 } {2 \sigma^2} {}] d {}{x_1} d {}{x_2}\cdots dx_n \tag{7.1} \\ & \qquad ({}\forall \Xi_k \in {\cal B}_{{\mathbb R}{}}^{} ({}k=1,2,\ldots, n), \quad \forall {}{\omega}=(\mu, \sigma ) \in \Omega = {\mathbb R}\times {\mathbb R}_+{}). \nonumber \end{align}

状態空間$\Omega = {\mathbb R} \times {\mathbb R}_+$, 測定値空間$X={\mathbb R}^n$. 第二状態空間(=パラメータ空間) $\Theta={\mathbb R}$ としよう. また,推定量 $E:X(={\mathbb R}^n) \to \Theta(={\mathbb R})$ を次のように定める. \begin{align} E(x)=E(x_1, x_2, \ldots , x_n ) = \overline{\mu}(x) = \frac{x_1 + x_2 + \cdots + x_n}{n} \tag{7.2} \end{align} システム量 $\pi:\Omega(={\mathbb R} \times {\mathbb R}_+) \to \Theta(={\mathbb R})$ を次のように定める. \begin{align} \Omega(={\mathbb R} \times {\mathbb R}_+) \ni \omega = (\mu, \sigma ) \mapsto \pi (\mu, \sigma ) = \mu \in \Theta(={\mathbb R}) \tag{7.3} \end{align} スチューデント化の要点は, パラメータ空間$\Theta (={\mathbb R})$の半距離 $d_\Theta^x (\forall x \in X)$で,次のように定めたことであった: \begin{align} d_\Theta^x (\theta^{(1)}, \theta^{(2)}) = \frac{|\theta^{(1)}-\theta^{(2)}|}{\sqrt{n}{\overline{\sigma}(x)}} = \frac{|\theta^{(1)}-\theta^{(2)}|}{\sqrt{\overline{SS}(x)}} \quad \qquad (\forall x \in X={\mathbb R}^n, \forall \theta^{(1)}, \theta^{(2)} \in \Theta={\mathbb R} ) \tag{7.4} \end{align} ここで, \begin{align*} {{\overline{SS}}} (x) = {{\overline{SS}}} (x_1,x_2,\ldots , x_n ) = {\sum_{k=1}^n ( x_k - \overline{\mu} (x))^2} \quad( \forall x=(x_1,x_2,\ldots , x_n ) \in {\mathbb R}^n) \nonumber \end{align*} であった.

前章で述べたように, 我々の問題は,以下の通りであった.

問題7.1 [零元配置分散分析]. 同時正規測定 ${\mathsf M}_{L^\infty ({\mathbb R} \times {\mathbb R}_+)}$ $({\mathsf O}_G^n = ({\mathbb R}^n, {\mathcal B}_{\mathbb R}^n, {{{G}}^n}) ,$ $S_{[(\mu, \sigma)]})$ を考えよう.ここで, \begin{align*} \mu = \mu_0 \end{align*} と仮定しよう.すなわち,帰無仮説を$H_N=\{ \mu_0 \}$ $(\subseteq \Theta= {\mathbb R} ) )$ と仮定する.$0 < \alpha \ll 1$とする. このとき,次を満たす${\widehat R}_{{H_N}}^{\alpha; \Theta}( \subseteq \Theta)$で,「出来るだけ大きいもの(しかも,$\sigma$に依存しないもの)」を見つけよ
$(A_1):$ ${\mathsf M}_{L^\infty ({\mathbb R} \times {\mathbb R}_+)}$ $({\mathsf O}_G^n = ({\mathbb R}^n, {\mathcal B}_{\mathbb R}^n, {{{G}}^n}) ,$ $S_{[(\mu_0, \sigma)]})$の測定値$x(\in{\mathbb R}^n )$が, \begin{align} E(x) \in {\widehat R}_{{H_N}}^{\alpha; \Theta} \tag{7.5} \end{align} を満たす確率は,$\alpha$以下である.

解答. さて, 任意の $ \omega=(\mu_0, \sigma ) ({}\in \Omega= {\mathbb R} \times {\mathbb R}_+ )$に対して, 次のように計算する. \begin{align} & [G^n(\{ x \in X \;:\; d^x_\Theta ( E(x) , \pi( \omega ) ) \ge \eta \} )](\omega ) \nonumber \\ =& [G^n(\{ x \in X \;:\; \frac{ |\overline{\mu}(x)- \mu_0 |}{ {{{\sqrt{\overline{SS}(x)}}}} } \ge \eta \} )](\omega ) \nonumber \\ = & \frac{1}{({{\sqrt{2 \pi }\sigma{}}})^n} \underset{ \eta \sqrt{n-1} \le \frac{ |\overline{\mu}(x)- \mu_0 |}{ {\sqrt{\overline{SS}(x)}} /\sqrt{n-1} } }{\int \cdots \int} \exp[{}- \frac{\sum_{k=1}^n ({}{}{x_k} - {}{\mu_0} {})^2 } {2 \sigma^2} {}] d {}{x_1} d {}{x_2}\cdots dx_n \nonumber \\ = & \frac{1}{({{\sqrt{2 \pi }{}}})^n} \underset{ \eta^2 n({n-1}) \le \frac{ n(\overline{\mu}(x))^2 }{ {\overline{SS}(x)}/({n-1}) } } {\int \cdots \int} \exp[{}- \frac{\sum_{k=1}^n ({}{}{x_k} {} {})^2 } {2 } {}] d {}{x_1} d {}{x_2}\cdots dx_n \tag{7.6} \end{align}

$(A_2):$ ここで,ガウス積分の公式7.8(A)($\S$7.4)によって,次を得る
\begin{align} = & \int^{\infty}_{ \eta^2 n({n-1}) } p_{(1,{{n}}-1) }^F(t) dt = \alpha \;\; (\mbox{ e.g., $\alpha=0.05$}) \tag{7.7} \end{align}

ここに, $p_{(1,{{n}}-1) }^F$ は自由度$(1,n-1)$の$F$-分布の確率密度関数とする. ここで, 自由度$(n_1,n_2)$の$F$-分布の確率密度関数 $p_{(n_1,n_2)}^F(t)$ は,$B(\cdot, \cdot)$はベータ関数を使って,

\begin{align} p_{(n_1,n_2)}^F(t) = \frac{1}{B(n_1/2, n_2/2)} \Big(\frac{n_1}{n_2} \Big)^{n_1/2} \frac{t^{(n_1-2)/2}}{(1+n_1t/n_2)^{(n_1+n_2)/2}} \qquad (t \ge 0) \tag{7.8} \end{align} と定義されることを思い出そう. また,

  • 自由度$(1,n-1)$の$F$-分布 = 自由度$(n-1)$のスチューデントの$t$-分布


も注意しよう.

正数$\alpha$として,$\alpha$-点: $F_{n_1, \alpha}^{n_2}$ $( > 0)$ を次のように定める.

\begin{align} \int^{\infty}_{F_{n_1, \alpha}^{n_2} } p_{(n_1,n_2) }^F (t) dt =\alpha \qquad (0 < \alpha \ll 1. \mbox{ e.g., } \alpha=0.05) \tag{7.9} \end{align} よって,次を解けばよい. \begin{align} {\eta^2 n({{n}}-1) }{ } ={F_{n-1, \alpha}^{1} } \tag{7.10} \end{align} したがって, \begin{align} (\eta^\alpha_{\omega})^2 = \frac{{F_{n-1, \alpha}^{1} }}{n(n-1)} \tag{7.11} \end{align}

として, 結局,棄却域${\widehat R}_{{H_N}}^{\alpha; \Theta}$( (or ${\widehat R}_{H_N}^{\alpha; X}$) として, 次を得る;

\begin{align} {\widehat R}_{{H_N}}^{\alpha; \Theta} & = \bigcap_{\omega =(\mu, \sigma ) \in \Omega (={\mathbb R} \times {\mathbb R}_+) \mbox{ such that } \pi(\omega)= \mu \in {H_N}(=\{\mu_0\})} \{ E(x) (\in \Theta) : \;\; d^x_\Theta ({}E(x), \pi(\omega ) ) \ge \eta^\alpha_{\omega } \} \nonumber \\ & = \{\overline{\mu}(x) \in \Theta(={\mathbb R}) \;:\; \frac{ |\overline{\mu}(x)- \mu_0 |}{ \sqrt{{\overline{SS}(x)}} } \ge \eta_\omega^\alpha \} = \{\overline{\mu}(x) \in \Theta(={\mathbb R}) \;:\; \frac{ |\overline{\mu}(x)- \mu_0 |}{ \overline{\sigma}(x) } \ge \eta_\omega^\alpha \sqrt{n} \} \nonumber \\ & = \Big\{\overline{\mu}(x) \in \Theta(={\mathbb R}) \;:\; \frac{ |\overline{\mu}(x)- \mu_0 |}{ \overline{\sigma}(x) } \ge \sqrt{\frac{F_{n-1, \alpha}^1}{n-1}} \;\; \Big\} \nonumber \\ & = \Big\{\overline{\mu}(x) \in \Theta(={\mathbb R}) \;:\; \mu_0 \le \overline{\mu}(x) - {{\overline{\sigma}(x)}} \sqrt{\frac{F_{n-1, \alpha}^1}{n-1}} \mbox{ or } \overline{\mu}(x) + {{\overline{\sigma}(x)}} \sqrt{\frac{F_{n-1, \alpha}^1}{n-1}} \le \mu_0 \Big\} \tag{7.12} \end{align} そして, \begin{align} {\widehat R}_{H_N}^{\alpha; X} &= E^{-1}({\widehat R}_{{H_N}}^{\alpha; \Theta}) \nonumber \\ & = \Big\{x \in X(={\mathbb R}^n) \;:\; \mu_0 \le \overline{\mu}(x) - {{\overline{\sigma}(x)}} \sqrt{\frac{F_{n-1, \alpha}^1}{n-1}} \mbox{ or } \overline{\mu}(x) + {{\overline{\sigma}(x)}} \sqrt{\frac{F_{n-1, \alpha}^1}{n-1}} \le \mu_0 \Big\} \\ & \tag{7.13} \end{align}
$\square \quad$
$\fbox{注釈7.1}$ (i):上の議論で,多少なりとも数学を使った部分(計算した部分)があるとしたら, (A$_2$)のガウス積分の公式だけであることに注意しよう.

(ii): また、次に注意せよ:
$(\sharp):$ 自由度$(1,n-1)$の$ F$-分布
= 自由度$(n-1)$のスチューデントの$t$-分布
よって、次が成立する: \begin{align*} (7.12)=(6.83) \qquad (7.13)=(6.83) \end{align*}