2012年度 研究室ゼミ

毎週金曜14:40~

研究室ゼミ;以下K:研究室のスタッフや院生が最新の研究成果を発表し,それについて議論を戦わせます.もちろん,ご興味のある方はいつでも歓迎いたします.

データ科学チュートリアル;以下T:講座員,または他から講師を招き,さまざまなトピックを取り上げ数回で講義します.データ科学,確率・統計に関するあらゆる話題を対象とし,理論・応用に関する知識を幅広く共有することを目指します.

研究室ゼミの記録


4月11日
第1回(K): 磯崎 郷平・中矢 徹・森川 耕輔 (M1)
題目: 卒論報告およびその後Part1
概要: 新M1の卒業研究およびその後に関する報告.

4月18日
第2.1回(K): 田中 芳実・田辺 竜ノ介 (M1)
題目: 卒論報告およびその後Part2
概要: 新M1の卒業研究およびその後に関する報告.

第2.2回(K): 上野 真依・坂口 弘樹 (B4), 伊藤 康広 (研究生)
題目: 自己紹介
概要: 新B4および研究生の簡単な自己紹介.

4月25日
第3.1回(T): 鎌谷 研吾 (助教)
題目: ベイズ統計学におけるモンテカルロ法
概要: ベイズ統計学について簡単な紹介をする. / マルコフ連鎖モンテカルロ(MCMC)法のベイズ統計学での役割を述べる. / MCMC法の解析のための幾つかのアプローチを紹介する. / アプローチの善し悪しについて例を通して考える.

第3.2回(T): 春野 雅彦 (教授, NICT)
題目: 脳イメージングの研究と情報・統計科学-これまでとこれから-
概要: 脳波データに対する統計的分析方法の紹介.

5月9日
第4.1回(K): 大矢 修司 (M2)
題目: ドイツ研修の報告とvulcanus in europeのすすめ
概要: 私は2011年4月から2012年3月にかけ,vulcanus in europeというプログラムに参加した.私達の研究室では知名度が高くないため,このプログラムの詳細を周知した.奨学金,どのような学生,研修企業,現地での生活,特に研修内容であるスチール製シャフトの疲労破壊時間の予測に時間を割いた.

第4.2回(T): 鎌田 亜美 (M2)
題目: 自己紹介&研究紹介
概要: 軽い自己紹介の後, 因子分析(主に探索的因子分析)について簡単に説明し, 現在の研究内容と今後の予定を紹介する.

5月23日
第5.1回(K): 山本 倫生 (D2)
題目: 無回答者への追跡調査を含む調査デザインに対する解析方法の検討
概要: 加齢及び健康長寿達成要因の解明を目的としたSONICプロジェクトにおける,2012年度の調査デザインを検討する.当該調査デザインに対応するよう,Hoshino et al.(2006)の傾向スコアによる重み付きM推定量を拡張する.拡張した方法による推定量の一致性及び漸近正規性を,傾向スコアのパラメータが既知の場合と未知の場合に分けて論じる.

第5.2回(K): 土田 友里恵 (M2)
題目: VaRについて
概要: 時系列解析の簡単な紹介と,リスク分析の手法の一つであるVaRについて説明する.

5月30日
第6.1回(K): 門脇 達彦 (研究生)
題目: _
概要: _

第6.2回(K): 片山 翔太 (D2)
題目: Sparse Mean Estimation for High-Dimensional Mean Vector
概要: 母平均ベクトルの尤度関数に基づくSparse推定法を提案し,高次元データにおけるその推定量の漸近的な性質(Sign Recovery, Mean Squaed Error)を明らかにする.また,先行研究で提案されているSoft-Thresholding Estimatorに関しても同様の性質を導出し,提案する推定量との理論的な比較を行う.

6月6日
第7.1回(K): 森 丈治 (D2, 社会人)
題目: Latent class models for medical diagnostic tests in multicenter trials
概要: LCAを用いた推定を行う場合,評価者が2人の場合では最尤推定が自由度不足によりできない.その場合,制約を課して層別を行うことで自由度不足が解消されるが,層別因子が変量効果として考えられる場合は,既存のモデルでは対処できない.変量効果として扱うモデルを提案し,その性能評価及び実データへの適用を示す.

第7.2回(K): 寺田 吉壱 (D2)
題目: 研究紹介~非対称MDSとRKMの強一致性~
概要: 本発表では,非対称MDSとクラスタリングに関する研究について述べる. 非対称MDSに関しては,各対象を一般の楕円体で表現することで, Radius distance modelを拡張したモデルを提案し, その有用性を実際のブランドスイッチデータに適用し確認する. また,クラスタリングに関する研究としては,De Soete and Carroll (1994)によって提案されたReduced k-means clustering の目的関数を最小にする推定値が強一致性をもつことを示す.

6月20日
第8回(K): 磯崎 郷平・中矢 徹・森川 耕輔・田中 芳実・田辺 竜ノ介 (M1)
題目
磯崎:個別ゼミ報告(カーネル法)
田中:項目反応理論~二値反応型と多値反応型
田辺:ベイズ解析とその下準備
中矢:Frailty Model
森川:個別ゼミ報告(セミパラメトリックモデル)

概要
磯崎:カーネル法は,非線形なデータに対し,線形な統計手法を適用することができる非線形変換である.直感的,探索的な非線形変換を行わずに,計算時間を抑えた解析ができることの有意義さと実際の適用例を説明する.
田中:テスト理論の一つである項目反応理論について,項目反応理論の基本となる二値反応型と二値を拡張した多値反応型のモデルについて簡単に紹介する.
田辺:_
中矢:Coxの比例ハザードモデルに個人差を組み込んだfrailty modelを紹介する.
森川:セミパラメトリックモデルの紹介と考えているパラメータ空間において,超有効性を持つ推定量を除く理由について説明した.また,B4の卒論のときから扱っている二値単調欠測なデータについて,時点数によってはパラメータの識別性がないことを報告した.

6月27日
第9.1回(T): 坂口 弘樹・上野 真依 (B4)
題目
坂口:一様分布と十分統計量
上野:情報不等式と一様最小分散不偏推定量
概要
坂口:一様分布からの無作為標本についての統計量をいくつか考え,それが十分統計量であるかを条件付き分布から調べ,またその分布について考察する.さらにNeymanの因子分解定理を紹介し,定理から十分統計量を導く方法を説明する.
上野:一様最小分散不偏推定を求めるために用いる,フィッシャー情報量,クラメール・ラオの不等式についての説明を行う.

第9.2回(T): 熊谷 悦生 (准教授)
題目: Divergence measures and Jensen Difference
概要: φ-divergence及びJensen Differenceの定義と重要な性質の紹介.

7月11日
第10.1回(K): 伊藤 康広 (研究生)
題目: SIerで働くということ
概要: SIerで働くとはどういうことか?業界に身を置いた人が実体験を語る.
- SIerの現状
- 数理科学が業務においてどのように利用されているか
・Rの業務での利用方法
・ソフトウェアテストにおける実験計画法

第10.2回(K): 永田 (下平研・M2)
題目: グラフのブートストラップとコミュニティ抽出
概要: ブートストラップ法は,従来はアレイデータなどの単純な構造を持つデータに対して適用することが多かったが,ネットワークなど複雑な構造を持つデータに対しても,原理上は適用可能である.本発表では,ネットワークに対してブートストラップ法を適用する方法を提案し,ネットワークのコミュニティ抽出問題に対してこの手法がどのように適用されるかを示した.

7月18日
第11回(T): 磯崎 郷平・中矢 徹・田辺 竜ノ介・田中 芳実・森川 耕輔 (M1)
題目
磯崎:基礎ゼミ報告~中心極限定理~
中矢:中心極限定理の一様収束性
田辺:エッジワース展開
田中:デルタ法と分散安定化
森川:基礎ゼミ報告~デルタ法が使えないとき~

概要: 基礎ゼミ (Elements of Large-Sample Theoryの輪読) に関する報告.

10月10日
第12.1回(K): 磯崎 郷平 (M1)
題目: 個別ゼミ報告―変分ベイズ法とその利用―
概要: パラメータ推定の方法の一つに変分ベイズ法がある.この手法は,変分近似を用いて,積分計算の困難さのせいで導出が難しい事後分布に対する近似分布を求める.その導出過程を説明し,有効性を混合正規分布に対する適用例で示す.

第12.2回(K): 田辺 竜ノ介 (M1)
題目: _
概要: _

10月17日
第13.1回(K): 中矢 徹 (M1)
題目: 年齢時代区分データによる超高齢者寿命分布の推測
概要: 年齢時代区分別に観測された超高齢者の生存者統計を極値理論を用いて解析し,寿命分布の限界を議論する.

第13.2回(K): 田中 芳実 (M1)
題目: 個別ゼミ報告―多値型項目反応理論におけるパラメータ推定―
概要: 多値型項目反応モデルの一種である名義反応モデルと評定尺度モデルを紹介し, それぞれのモデルにおけるパラメータの推定手順について述べる.

第13.3回(K): 森川 耕輔 (M1)
題目: 二値反応Diggle and Kenwardモデルの識別性について
概要: 結果変数が二値である場合のDiggle and Kenwardのモデルに対する識別性が無いことを示し,識別性があるために必要な条件を示した.

10月24日
第14.1回(K): 森 丈治 (D2, 社会人)
題目: Two period cross-over design in clinical trials
概要: 製薬企業におけるクロスオーバーデザインの使用とその課題について報告する.2薬剤2期という状況下におけるクロスオーバーデザインを使用する際には,いくつかの仮定が置かれている.その一つに,薬剤と時期の交互作用がないという仮定が挙げられるが,この仮定が満たされない場合の推定値及び検定統計量に対する影響を説明する.その上で,こうした交互作用に対処できるデザインを紹介し,検出力を向上させる検定統計量を提案する.

第14.2回(K): 高木 義治 (D3, 社会人)
題目: _
概要: _

10月31日
第15回(K): 鎌谷 研吾 (助教)
題目: 正則性から少し外れた統計
概要: 非正則なパラメータ族は,「非」正則という言葉の響きに比べ,ありふれている.無視出来る非正則性と,そうでないものを判断できることが重要である.判断に重要と思われる事項を述べる.

11月7日
第16.1回(K): 鎌田 亜美 (M2)
題目: 正則化法に基づく高次元因子分析モデルの推定
概要: 近年, 高次元データに関心がある場合がしばしばあるが,因子分析では, 代表的な推定方法において, 標本共分散行列Sの正則性が必要となるため, 高次元小標本データにおいてSが必ず特異になってしまうことが問題となる. Sの特異性を回避する解析法のひとつに, Sに単位行列の正定数a(リッジパラメータ) 倍を加えることで推定を安定化させるという方法がある(Yuan and Chan, 2008). この方法は潜在的に有効であると推察されるが,その妥当性の検討はシミュレーション研究に留まっている.また,リッジパラメータaの選択についてはアドホックな方法しか提案されていない. そこで本発表では, 理想的な状況を仮定し,S+aIpに基づく推定量のp,N→∞における推定量の性質を調べる(Bai and Lie, 2012). まず,Bai and Lie (2012)の推定法を紹介し,現在研究中であるS+aIpを用いた場合の推定量の一致性, この収束レート, 漸近分散を報告する. これらの結果をもとに,シンプルなモデルに対するaの影響を調べる.

第16.2回(K): 大矢 修司 (M2)
題目: SVMとRVM
概要: よく用いられる機械学習の2つの手法,SVMとRVMの紹介.

第16.3回(K): 土田 友里恵 (M2)
題目: GARCHモデルと極値モデルを用いたValue-at-Risk計測の比較
概要: Value at Risk(VaR)は金融リスクを測るための指標である.VaRを計測する方法はいくつかあるが,ここではGARCHモデルによる方法と極値論による方法を述べる.

11月14日
第17.1回(K): 上野 真依・坂口 弘樹 (B4)
題目
上野:_
坂口:欠測が母集団パラメータに依存する場合の最尤推定

概要
上野:_
坂口:欠測が母集団分布(指数分布)のパラメータに依存する場合において,欠測を考慮した分布を用いた最尤推定と観測されたデータのみで行う通常の最尤推定の比較を各推定量の収束の速さ,漸近分散などの観点から行い,シミュレーションを交えて考察する.

第17.2回(K): 門脇 達彦 (研究生)
題目: _
概要: _

11月28日
第18.1回(K): 片山 翔太 (D2)
題目: Sparse Precision Matrix Estimation in High Dimensional Data
概要: 本報告では,母共分散行列の逆行列をスパースに推定する問題を扱う.最初に,正規尤度,条件付き分布,逆行列の定義にそれぞれ基づく3つのタイプの推定量を紹介する.その後,先行研究の問題点(対称化が必要・スパース過ぎる解を返す可能性がある)を指摘し,それを解決するために,vech-operatorを用いた新しい推定量を提案する.

第18.2回(K): 寺田 吉壱 (D2)
題目: Reduced K-means法 v.s. Factorial K-means法
概要: 本発表では,Reduced k-means (RKM) 法とFactorial k-means (FKM) 法を紹介し,強一致性の十分条件等の性質について述べる.また,クラスタ数が与えられた下での,次元数の選択方法を提案する.さらに,RKM法及びFKM法がどのような場合に有効であるかを数値実験を通して紹介する.

12月5日
第19.1回(T): 磯崎 郷平・田辺 竜ノ介・ (M1)
題目: 基礎ゼミ報告(前半)
概要: 基礎ゼミに関する報告(前半)

第19.2回(K): 熊谷 悦生 (准教授)
題目: A Note on the Efficient Fisher information
概要: 有効なFisher情報量に対して行列関数に関連した統計的な凹性等を紹介した

12月12日
第20.1回(K): 山本 倫生 (D3)
題目: Introduction to functional data analysis
概要: 関数データ及び関数データ解析(FDA)の概要を説明する.具体的には,関数解析の基礎的な事項を説明したのちに,FDAの基本的な解析方法である,関数主成分分析の説明を行う.さらに,近年FDAにおけるトピックとなっている,スパースな関数データに対する解析方法,及び,i.i.d.でない関数データに対する解析方法を紹介する.

第20.2回(T): 中矢 徹・田中 芳実・森川 耕輔 (M1)
題目: 基礎ゼミ報告(後半): 森川,田中,中矢
概要: 基礎ゼミに関する報告(後半)

1月9日
第21回(T): M1×5
題目: 基礎ゼミ報告(リベンジ): 田辺, 田中, 中矢, 森川, 磯崎
概要: 12/5, 12/12に行った基礎ゼミ報告のリベンジ

1月16日
第22.1回(K): 鎌田 亜美 (M2)
題目: 正則化法に基づく高次元因子分析モデルの推定
概要: 高次元因子分析モデルにおける推定量の性質を導出する.標本共分散行列Sが特異に近いとき, 推定が不安定になるという問題がある. この問題の解決策のひとつに,Sに正定数a(>0)倍の単位行列を加えることにより推定を安定化させるという手法がある(Yuan and Chan, 2008). この論文において,この手法が次元数>標本数(p>N)の場合においても有用であることが示唆されているが,その妥当性の検討はシミュレーション研究に留まっている.また,aの選択についてはアドホックな方法しか提案されていない.そこで本発表では, p,N→∞のもとで推定量が持つ性質を調べること,また,aの選択に関する知見を得ることを目標とする.そこで,まず,pを固定したもとでの推定量のバイアスを導出し,次に,p,N→∞のもとでの推定量の一致性,収束レート,漸近的なMSEを導出し,シミュレーションを行う.

第22.2回(K): 大矢 修司 (M2)
題目: _
概要: _

第22.3回(K): 土田 友里恵 (M2)
題目: _
概要: _

1月23日
第23.1回(K): 坂口 弘樹 (B4)
題目: _
概要: _

第23.2回(K): 上野 真依 (B4)
題目: _
概要: _