楕円分布に関する仕事


★ 楕円分布理論に関する研究 ([12][15][19][23])

多変量推測統計学は,多変量正規母集団からデータが採られるという基本仮定の下で
その理論展開がなされている.ところが,多変量解析が社会科学で適用されるとき,
正規性の仮定は満たされていないことが多いと思われる.そこで,正規理論の拡張と
して開発されてきたのが楕円分布に基づく推測理論である.楕円分布の確率密度関数
は
$$
c_p|V|^{-1/2}g((\bfx-\bmu)'V^{-1}(\bfx-\bmu))
$$
と表され,$g(u)=e^{-u/2}$ とすれば多変量正規分布の確率密度関数になる.

楕円分布論は正規分布論の拡張にはなっているが,現在のところ,(i) 周辺分布の尖
度がすべて等しいという制約があり,依然として非現実的である,(ii) 関数 $g(u)$
の選択が難しい,なる欠点がある.ここでの私の研究は,このような欠点を和らげる
ためのいくつかの試みである.

共分散構造モデル $\{\Sigma(\theta)|\theta\in\Theta\}$ における一般化最小2乗
推定量 $\wht\theta$ は次の最小化問題の解として定義される:
$$
\min_{\theta\in\Theta}\frac12\tr[\{(S-\Sigma(\theta))S^{-1}\}^2]
$$
正規性の仮定 (i.e., $S\sim$Wishart 分布) の下で,$\wht\theta$ は次の性質を有
することがわかっている:
\begin{enumerate}
\item $\wht\theta$ は $S$ に基づく漸近正規推定量の中で最小漸近分散をもつ;

\item 最小値を $n$ 倍した量 $\wht F$ は,$\chi^2$ 分布へ収束する, i.e.,
$$
\wht F:=n\cdot \frac12\tr[\{(S-\Sigma(\wht\theta))S^{-1}\}^2]\L\chi^2
$$
$\wht F$ はモデルの適合度検定統計量として利用される.
\end{enumerate}

ある仮定の下で,性質 1. は 楕円母集団に対しても正しく,性質 2. は 
$\wht F/\wht\eta$ とすれば正しい.ここで,$\wht\eta$ は多変量尖度の一致推定量
である.[12] では,楕円分布を含むより広い分布の族に対しても性質 1., 2. を保つ
ような新しい推定方式を提案した.それは,
\begin{eqnarray*}
&&\min_{\theta\in\Theta}\frac12\tr[\{(S-\Sigma(\theta))\wht C^{-1}\}^2] \\
&&C=\frac12(D_\eta\Sigma+\Sigma D_\eta)  \\
&&D_\eta=\diag(\eta_1,\cdots,\eta_p)
\end{eqnarray*}
である.ここで,$\eta_i$ は第 $i$ 変数の尖度を表す.この推定法は,
$\eta_1=\cdots=\eta_p$ のとき楕円分布における推測に対応し,
$\eta_1=\cdots=\eta_p=1$ のとき正規分布の下での推測に対応する.

[19] では,未知の楕円分布
$
    |\tilde V_0|^{-1/2}g\{(x- \tilde \mu_0)'\tilde V_0^{-1}(x-\tilde \mu_0)\}
$
($\tilde V_0$, $\tilde \mu_0$, $g$ はすべて未知) における $(\mu,V)$ に関する
推測理論を展開した.$\bfx_1,\cdots,\bfx_n$ を $g$ からの標本とし,$f$ を適当
な楕円分布の確率密度関数とするとき,擬尤度
\begin{equation}
L(\mu,V)=\prod_k f(\bfx_k|\wht\nu) 
\end{equation}
を定義する.$\nu$ は $(\mu,V)$ 以外の nuisance parameter (興味がない母数) で
ある.例えば,$f$ として多変量T分布を採ると,$\nu$ は自由度である.(2) での
$\wht\nu$ は
$$
\sqrt n(\wht\nu-\nu_0)=O_p(1)\quad \mbox{for some}\;\; \nu_0
$$
であればよい.また,$f$ は $g$ に一致しなくてもよい.この設定の下で,[19] は
(2) に基づく推測で,$f$ が母集団分布であるときの諸公式(漸近分散や漸近カイ2
乗性)は,$f\ne g$ のときでも基本的に正しい(定数倍の調整は必要)ことを証明し
た.つまり,この結果は,モデルの misspecification に対するロバストネスを示し
ている.一方,$\wht\nu$ の分布はこの結果に影響を与えない.つまり,これは 
nuisance parameter の推定量 $\wht\nu$ の選択に対するロバストネスを示す.さら
に,[19] では,複数個の楕円モデルを比較するための規準を提案している.

[23][19] の follow-up study であり,$g$ と $f$ との乖離の程度が推測の 
efficiency (有効性) にどのような影響を与えるかを調べた.

★ 楕円分布族の特徴付け([24])

多変量楕円分布の周辺分布は楕円分布であるが,どのような楕円分布になるのであろ うか.$p$ 次元楕円分布の確率密度関数を $$ f(u|p), u=\sum_{j=1}^{p}x_j^2 $$ と書く.このとき,密度が次の関係を満たすとき,「一致性」があるという. $$ \int f(\sum_{j=1}^{p+1}x_j^2|p+1)dx_{p+1}=f(\sum_{j=1}^{p}x_j^2|p) $$ 論文 [24] で示したことは,楕円分布族が一致性を有するためには,正規分布の尺度 混合に限ることである. 多変量T分布は一致性を有するが,power exponential 分布は一致性を有さないこと が分かった.
[もどる]