シリーズ:統計学の現状と今後
「多変量解析と共分散構造分析」

[読みものページへもどる]

大阪大学人間科学部 狩野裕

最近,共分散構造分析や構造方程式モデリングという言葉が日本でも知られるようになった.別名 LISREL(リズレル)と呼ばれるモデルのことである.一言でモデルの概要を述べるならば,「共分散構造分析=因子分析+多重回帰分析」となる.例えば,因子分析を行い,因子得点を用いて回帰分析をするということが,共分散構造分析では一気に実行できる.「一気に実行する」という方法は,実は多くの長所を持つ.さらに重要な点は,「因子分析+多重回帰分析」という枠組みは相当に広く,事象に関する様々な仮説をモデル化して分析できることである.つまり,モデル規定の柔軟さがその特徴であり,一方,従来の多変量解析に分類される各手法はこのような柔軟性をもたない.

従来の多変量解析との哲学的な違いも大きい.従来の方法は探索的な手法に重点が置かれ,多数の変数間の複雑な関係を解きほぐすこと,または情報損失を最小限にして次元縮小を図ることなどを主目的としていた.帰納的な研究スタイルに向く手法と言えようか.一方,共分散構造分析は基本的に検証的であり,事前の仮説や実質科学的理論を出発点にして実証研究をするための道具である.こちらは演繹的な研究スタイルに向く方法である.分析方法として帰納的なものと演繹的なものは,両者とも開発されているべきであり,優劣をつけるものではない.90年代になって,共分散構造分析の(使える)プログラムがそろい,やっと,応用の研究者に帰納・演繹の両方のツールが提供されることになった.

共分散構造分析のもう一つの特徴は因果分析に使えることである.X と Y の相関係数は対称であるから因果の向きを定めることができない.しかし,X か Y のどちらかに直接効果を持たない第 3 変数 Z が観測できれば因果の方向を同定することができる.このことを応用して,双方向に影響を及ぼす関係 (非逐次モデル) に対しても,それらの影響の大きさを同定することができる.以上のことはいわゆるパス解析として知られていることである.やはり,共分散構造分析の神髄は,(観測変数間の分析だけでなく)潜在変数間の因果分析ができることにある.このことが,構成概念(潜在変数)をよく使う社会科学の分野で重宝がられる理由にもなっている.

共分散構造分析では,観測変数や潜在変数間に因果の仮説を設定することによって観測変数の共分散行列が構造化される.このことから共分散構造分析 (covariance structure analysis)の名がある.因果の仮説は普通,線形な構造方程式で表す.このことから構造方程式モデリング(structural equation modeling; SEM)の名がある.共分散構造をΣ(θ)と書くことにする.ここで,θは回帰係数などの推定すべき構造パラメータである.

共分散構造分析には,同分析方法を適用した応用研究と方法論としての理論研究がある.先に「同分析方法が日本でも知られるようになった」と書いた.この意味は,多くの日本の応用の研究者が共分散構造分析を認知したということである.学会で応用研究のセッションが組まれたり,共分散構造分析の講習会がしばしば開かれ,かなりの参加者がある.

私は,共分散構造分析の理論研究を「Σ(θ)まで」と「Σ(θ)のあと」に分けて考えている.「Σ(θ)まで」とは如何にして共分散構造を構築するかであり,それで何が分かるかを研究する.その成果は例えば,双方向の因果分析であり,多母集団の同時分析であり,潜在変数による成長の記述である.つまり,共分散構造分析の枠組みでの新しいモデル構築である.一方,「Σ(θ)のあと」とは共分散構造の推定・検定問題をさす.

現在では,共分散構造分析の理論構築は一山越えたと言えるのではないか.共分散構造分析の成書は90年代に20冊以上が出版されており,邦書でも 5 冊が出版済みである.共分散構造分析の章を設けた多変量解析の専門書もかなりある.しかしながら,さらなる発展へ向けて,共分散構造分析を対象とする学術雑誌 Structural Equation Modeling が 1994 年に刊行されている.

「Σ(θ)まで」の理論では,今後の発展として因果分析と多母集団分析に期待している.因果分析に関する現状は,対立モデルを棄却したとしても,因果関係が示唆されたという結論にとどまる.探索的なアプローチであるグラフィカルモデリングの理論などと接触しつつ,「データから因果関係にどこまで迫ることができるか」という歴史的な課題に迫っていくことになると予想する.多母集団の分析とは,例えば国籍で構造が同じかどうかを検討するときに用いられる.このデザインは一元配置分散分析に相当する.ただし,特性は共分散構造である.分散分析には多種多様なデザインがあり,共分散構造分析にもそれらのデザインに対応した分析方法が必要になると思われる.最近注目を浴びている多水準データの共分散構造分析は,分割法計画に対応する.

より大きな話題としては,やはり「非正規」「非線形」「シミュレーション」がキーワードになる.「非正規」は「Σ(θ)のあと」の理論で 80 年代以降大きく発展した分野である.そこでは,正規理論に基礎をおいた分析方法が非正規分布のもとでどのような振る舞いをするか,また,その分析方法をどのように修正すればよいのかが議論された.いわゆるロバストネスの研究である.21 世紀へ向けての理論はやや趣を変え,「正規理論でできなかったことが非正規の下で可能になる」ことへの挑戦ではないか.因子回転が不要になる,自己組織化による主成分分析などにその魁が観られる.これは共分散行列のみを分析することからの脱却でもある.共分散構造分析で扱う構造方程式は線形である.非線形への拡張は急務である.非線形因果構造に対するアプローチとして現在,操作変数法を用いた二段階最小2乗法があるが,理論体系は整備されていない.ニューラルネットワークとの相互乗り入れも将来起こりそうである.双方向因果モデルに非線形構造をいれるとカオティックな現象が生ずる可能性があり,意外な方向へ発展しそうな研究対象である.「シミュレーション」の重要性は改めてここで強調することはあるまい.

多変量解析では,いわゆる数理統計学者が取り組んできた数学理論と応用の研究者が実際に適用する手法の間の乖離が指摘されて随分になる.その中にあって,共分散構造分析では統計理論が,実際に使う手法に大いに活かされていると言ってよいと思う.理論と応用とが刺激し合ってうまく発展してきた理由の一つは,統計学者・プログラム開発者・ユーザーの三位一体ではないか.先に述べた LISREL は,ウプサラ大学(スウェーデン)の Joreskog と Sorbom が開発してきた. Joreskog は高名な統計学者であり Sorbom はプログラマーである.その解説書には,多くのユーザーからの質問やコメントよって理論とプログラムが発展させられたとある.日本の統計学者は,このような研究スタイルに学ぶことが多いのではないかと思う.自戒しかりである.

日本の統計学界の将来を見据えるとき,どのようなテーマに取り組むか,ということと同程度に,上記のような研究スタイルをどのようにして整えるかが重要であるように思える.そのような観点でもインターネットの果たす役割が大きくなるであろう.ユーザーと統計学者を結ぶインターフェイスとしてである.例えば,共分散構造分析分野の国際的メイリングリストとして SEMNET ([http://www.gsu.edu/~mkteer/semnet.html])がある.心理学では fpr ([http://www.nuis.ac.jp/~mat/fpr/]) がある.これら以外にもこのようなメイリングリストはたくさんある.統計学者はこれらに積極的に jump in し,異文化と格闘することで創造性を高めていきたい.

久保川達也広報担当理事から「共分散構造分析について歴史・現状・今後」について原稿依頼を受け,この拙文を寄稿させていただいた.この機会を与えてくださった同氏に感謝したい.


[読みものページへもどる]