データ科学チュートリアル(T)/研究室ゼミ(K) (2012年度:H.24.4〜H.25.3)

毎週水曜13:00〜.

研究室ゼミ;以下K:研究室のスタッフや院生が最新の研究成果を発表し,それについて議論を戦わせます.
もちろん,ご興味のある方はいつでも歓迎いたします.

データ科学チュートリアル;以下T:講座員,または他から講師を招き,さまざまなトピックを取り上げ数回で講義します.
データ科学,確率・統計に関するあらゆる話題を対象とし,理論・応用に関する知識を幅広く共有することを目指します.

過去のセミナー記録[H23]

狩野研究室トップページへ


次回以降の予定: 今年度のゼミはすべて終了致しました.


過去の発表

4月11日

第1回(K): 磯崎 郷平・中矢 徹・森川 耕輔 (M1)
題目: 卒論報告およびその後Part1
概要: 新M1の卒業研究およびその後に関する報告.
4月18日

第2.1回(K): 田中 芳実・田辺 竜ノ介 (M1)
題目: 卒論報告およびその後Part2
概要: 新M1の卒業研究およびその後に関する報告.
第2.2回(K): 上野 真依・坂口 弘樹 (B4), 伊藤 康広 (研究生)
題目: 自己紹介
概要: 新B4および研究生の簡単な自己紹介.
4月25日

第3.1回(T): 鎌谷 研吾 (助教)
題目: ベイズ統計学におけるモンテカルロ法 [pdf]
概要: ベイズ統計学について簡単な紹介をする. / マルコフ連鎖モンテカルロ(MCMC)法のベイズ統計学での役割を述べ る. / MCMC法の解析のための幾つかのアプローチを紹介する. / アプローチの善し悪しについて例を通して考える.
第3.2回(T): 春野 雅彦 (教授, NICT)
題目: 脳イメージングの研究と情報・統計科学-これまでとこれから-
概要: 脳波データに対する統計的分析方法の紹介.
5月9日

第4.1回(K): 大矢 修司 (M2)
題目: ドイツ研修の報告とvulcanus in europeのすすめ [pdf]
概要: 私は2011年4月から2012年3月にかけ,、vulcanus in europeというプログラムに参加した. 私達の研究室では知名度が高くないため,このプログラムの詳細を周知した. 奨学金,どのような学生,研修企業,現地での生活, 特に研修内容であるスチール製シャフトの疲労破壊時間の予測に時間を割いた.
第4.2回(T): 鎌田 亜美 (M2)
題目: 自己紹介&研究紹介 [pdf]
概要: 軽い自己紹介の後, 因子分析(主に探索的因子分析)について簡単に説明 し, 現在の研究内容と今後の予定を紹介する.
5月23日

第5.1回(K): 山本 倫生 (D2)
題目: 無回答者への追跡調査を含む調査デザインに対する解析方法の検討 [pdf]
概要: 加齢及び健康長寿達成要因の解明を目的としたSONICプロジェクトにおけ る,2012年度の調査デザインを検討する. 当該調査デザインに対応するよう,Hoshino et al.(2006)の傾向スコアによる重 み付きM推定量を拡張する. 拡張した方法による推定量の一致性及び漸近正規性を,傾向スコアのパラメータ が既知の場合と未知の場合に分けて論じる.
第5.2回(K): 土田 友里恵 (M2)
題目: VaRについて [pdf]
概要: 時系列解析の簡単な紹介と,リスク分析の手法の一つであるVaRについて説明する.
5月30日

第6.1回(K): 門脇 達彦 (研究生)
題目: TBA
概要: TBA
第6.2回(K): 片山 翔太 (D2)
題目: Sparse Mean Estimation for High-Dimensional Mean Vector [pdf]
概要: 母平均ベクトルの尤度関数に基づくSparse推定法を提案し, 高次元データにおけるその推定量の漸近的な性質(Sign Recovery, Mean Squaed Error)を明らかにする. また,先行研究で提案されているSoft-Thresholding Estimatorに関しても同様の性質を導出し, 提案する推定量との理論的な比較を行う.
6月6日

第7.1回(K): 森 丈治 (D2, 社会人)
題目: Latent class models for medical diagnostic tests in multicenter trials [pdf]
概要: LCAを用いた推定を行う場合,評価者が2人の場合では最尤推定が自由度不足により できない.その場合,制約を課して層別を行うことで自由度不足が解消されるが, 層別因子が変量効果として考えられる場合は,既存のモデルでは対処できない. 変量効果として扱うモデルを提案し,その性能評価及び実データへの適用を示す.
第7.2回(K): 寺田 吉壱 (D2)
題目: 研究紹介〜非対称MDSとRKMの強一致性〜 [pdf]
概要: 本発表では,非対称MDSとクラスタリングに関する研究について述べる. 非対称MDSに関しては,各対象を一般の楕円体で表現することで, Radius distance modelを拡張したモデルを提案し, その有用性を実際のブランドスイッチデータに適用し確認する. また,クラスタリングに関する研究としては, De Soete and Carroll (1994)によって提案されたReduced k-means clustering の目的関数を最小にする推定値が強一致性をもつことを示す.
6月20日

第8回(K): 磯崎 郷平・中矢 徹・森川 耕輔・田中 芳実・田辺 竜ノ介 (M1)
題目: 磯崎:個別ゼミ報告(カーネル法) [pdf]
田中:項目反応理論〜二値反応型と多値反応型 [pdf]
田辺:ベイズ解析とその下準備
中矢:Frailty Model [pdf]
森川:個別ゼミ報告(セミパラメトリックモデル) [pdf]
概要: 磯崎:カーネル法は,非線形なデータに対し,線形な統計手法を適用することができる 非線形変換である. 直感的,探索的な非線形変換を行わずに,計算時間を抑えた解析ができることの 有意義さと実際の適用例を説明する.
田中:テスト理論の一つである項目反応理論について,項目反応理論の基本となる二値 反応型と二値を拡張した多値反応型のモデルについて簡単に紹介する.
田辺:TBA
中矢:Coxの比例ハザードモデルに個人差を組み込んだfrailty modelを紹介する.
森川:セミパラメトリックモデルの紹介と考えているパラメータ空間において, 超有効性を持つ推定量を除く理由について説明した. また,B4の卒論のときから扱っている二値単調欠測なデータについて, 時点数によってはパラメータの識別性がないことを報告した.

6月27日

第9.1回(T): 坂口 弘樹・上野 真依 (B4)
題目: 坂口:一様分布と十分統計量 [pdf]
上野:情報不等式と一様最小分散不偏推定量 [pdf]
概要: 坂口:一様分布からの無作為標本についての統計量をいくつか考え,それが  十分統計量であるかを条件付き分布から調べ,またその分布について考察する.  さらにNeymanの因子分解定理を紹介し,定理から十分統計量を導く方法を説明する.
上野:一様最小分散不偏推定を求めるために用いる,フィッシャー情報量,クラメール・ラオの不等式についての説明を行う.
第9.2回(T): 熊谷 悦生 (准教授)
題目: Divergence measures and Jensen Difference [pdf]
概要: φ-divergence及びJensen Differenceの定義と重要な性質の紹介.
7月11日

第10.1回(K): 伊藤 康広 (研究生)
題目: SIerで働くということ
概要: SIerで働くとはどういうことか?業界に身を置いた人が実体験を語る.
 - SIerの現状
 - 数理科学が業務においてどのように利用されているか
   ・Rの業務での利用方法
   ・ソフトウェアテストにおける実験計画法
第10.2回(K): 永田 (下平研・M2)
題目: グラフのブートストラップとコミュニティ抽出 [pdf]
概要: ブートストラップ法は,従来はアレイデータなどの単純な構造を持つデータに対 して適用することが多かったが,ネットワークなど複雑な構造を持つデータに対 しても,原理上は適用可能である.本発表では,ネットワークに対してブートス トラップ法を適用する方法を提案し,ネットワークのコミュニティ抽出問題に対 してこの手法がどのように適用されるかを示した.
7月18日

第11回(T): 磯崎 郷平・中矢 徹・田辺 竜ノ介・田中 芳実・森川 耕輔 (M1)
題目: 磯崎:基礎ゼミ報告〜中心極限定理〜 [pdf]
中矢:中心極限定理の一様収束性 [pdf]
田辺:エッジワース展開 [pdf]
田中:デルタ法と分散安定化 [pdf]
森川:基礎ゼミ報告〜デルタ法が使えないとき〜 [pdf]
概要: 基礎ゼミ (Elements of Large-Sample Theoryの輪読) に関する報告.
10月10日

第12.1回(K): 磯崎 郷平 (M1)
題目: 個別ゼミ報告―変分ベイズ法とその利用― [pdf]
概要: パラメータ推定の方法の一つに変分ベイズ法がある.この手法は,変分近似を用 いて,積分計算の困難さのせいで導出が難しい事後分布に対する近 似分布を求 める.その導出過程を説明し,有効性を混合正規分布に対する適用例で示す.
第12.2回(K): 田辺 竜ノ介 (M1)
題目: TBA
概要: TBA
10月17日

第13.1回(K): 中矢 徹 (M1)
題目: 年齢時代区分データによる超高齢者寿命分布の推測 [pdf]
概要: 年齢時代区分別に観測された超高齢者の生存者統計を極値理論を用いて解析し,寿命分布の限界を議論する.
第13.2回(K): 田中 芳実 (M1)
題目: 個別ゼミ報告―多値型項目反応理論におけるパラメータ推定― [pdf]
概要: 多値型項目反応モデルの一種である名義反応モデルと評定尺度モデルを紹介し, それぞれのモデルにおけるパラメータの推定手順について述べる.
第13.3回(K): 森川 耕輔 (M1)
題目: 二値反応Diggle and Kenwardモデルの識別性について [pdf]
概要: 結果変数が二値である場合のDiggle and Kenwardのモデルに対する識別性 が無いことを示し, 識別性があるために必要な条件を示した.
10月24日

第14.1回(K): 森 丈治 (D2, 社会人)
題目: Two period cross-over design in clinical trials [pdf]
概要: 製薬企業におけるクロスオーバーデザインの使用とその課題について報告する. 2薬剤2期という状況下におけるクロスオーバーデザインを使用する際には,いくつか の仮定が 置かれている.その一つに,薬剤と時期の交互作用がないという仮定が挙げられる が,この仮定 が満たされない場合の推定値及び検定統計量に対する影響を説明する.その上で,こ うした交互作用 に対処できるデザインを紹介し,検出力を向上させる検定統計量を提案する.
第14.2回(K): 高木 義治 (D3, 社会人)
題目: TBA
概要: TBA
10月31日

第15回(K): 鎌谷 研吾 (助教)
題目: 正則性から少し外れた統計 [pdf]
概要: 非正則なパラメータ族は,「非」正則という言葉の響きに比べ, ありふれている.無視出来る非正則性と,そうでないものを 判断できることが重要である.判断に重要と思われる事項を述べる.
11月7日

第16.1回(K): 鎌田 亜美 (M2)
題目: 正則化法に基づく高次元因子分析モデルの推定 [pdf]
概要: 近年, 高次元データに関心がある場合がしばしばあるが,因子分析では, 代表的 な推定方法において, 標本共分散行列S の正則性が必要となるため, 高次元小標 本データにおいてS が必ず特異になってしまうことが問題となる. Sの特異性を回避する解析法のひとつに, S に単位行列の正定数a(リッジパラ メータ) 倍を加えることで推定を安定化させるという方法がある(Yuan and Chan, 2008). この方法は潜在的に有効であると推察されるが,その妥当性の検討はシミュレー ション研究に留まっている.また,リッジパラメータa の選択についてはアド ホックな方法しか提案されていない. そこで本発表では, 理想的な状況を仮定し,S+aIpに基づく推定量のp,N→∞にお ける推定量の性質を調べる(Bai and Lie, 2012). まず,Bai and Lie (2012)の推定法を紹介し,現在研究中であるS+ aIpを用いた場 合の推定量の一致性, この収束レート, 漸近分散を報告する. これらの結果をも とに,シンプルなモデルに対するaの影響を調べる.
第16.2回(K): 大矢 修司 (M2)
題目: SVMとRVM [pdf]
概要: よく用いられる機械学習の2つの手法,SVMとRVMの紹介.
第16.3回(K): 土田 友里恵 (M2)
題目: GARCHモデルと極値モデルを用いたValue-at-Risk計測の比較 [pdf]
概要: Value at Risk(VaR)は金融リスクを測るための指標である.VaRを計測する方法 はいくつかあるが,ここではGARCHモデルによる方法と極値論による方法 を述べる.
11月14日

第17.1回(K): 上野 真依・坂口 弘樹 (B4)
題目: 上野:TBA
坂口:欠測が母集団パラメータに依存する場合の最尤推定 [pdf]
概要: 上野:TBA
坂口:欠測が母集団分布(指数分布)のパラメータに依存する場合において, 欠測を考慮した分布を用いた最尤推定と観測されたデータのみで行う通常の最尤推定の比較を 各推定量の収束の速さ,漸近分散などの観点から行い,シミュレーションを交えて考察する.
第17.2回(K): 門脇 達彦 (研究生)
題目: TBA
概要: TBA
11月28日

第18.1回(K): 片山 翔太 (D2)
題目: Sparse Precision Matrix Estimation in High Dimensional Data [pdf]
概要: 本報告では,母共分散行列の逆行列をスパースに推定する問題を扱う. 最初に,正規尤度,条件付き分布,逆行列の定義にそれぞれ基づく3つのタイプの推定量を紹介する. その後,先行研究の問題点(対称化が必要・スパース過ぎる解を返す可能性がある)を指摘し, それを解決するために,vech-operatorを用いた新しい推定量を提案する.
第18.2回(K): 寺田 吉壱 (D2)
題目: Reduced K-means法 v.s. Factorial K-means法 [pdf]
概要: 本発表では,Reduced k-means (RKM) 法とFactorial k-means (FKM) 法を紹介し, 強一致性の十分条件等の性質について述べる.また,クラスタ数が与えられた下 での, 次元数の選択方法を提案する. さらに,RKM法及びFKM法がどのような場合に有効であるかを数値実験を通して紹 介する.
12月5日

第19.1回(T): 磯崎 郷平・田辺 竜ノ介・ (M1)
題目: 基礎ゼミ報告(前半)
概要: 基礎ゼミに関する報告(前半)
第19.2回(K): 熊谷 悦生 (准教授)
題目: A Note on the Efficient Fisher information [pdf]
概要: 有効なFisher 情報量に対して 行列関数に関連した統計的な凹性等を紹介した
12月12日

第20.1回(K): 山本 倫生 (D3)
題目: Introduction to functional data analysis [pdf]
概要: 関数データ及び関数データ解析(FDA)の概要を説明する.具体的には,関数解 析の基礎的な事項を説明したのちに,FDAの基本的な解析方法であ る,関数主成 分分析の説明を行う.さらに,近年FDAにおけるトピックとなっている,スパー スな関数データに対する解析方法,及び,i.i.d. でない関数データに対する解 析方法を紹介する.
第20.2回(T): 中矢 徹・田中 芳実・森川 耕輔 (M1)
題目: 基礎ゼミ報告(後半): 森川[pdf], 田中[ファイルは1/9], 中矢[pdf]
概要: 基礎ゼミに関する報告(後半)
1月9日

第21回(T): M1×5
題目: 基礎ゼミ報告(リベンジ): 田辺[TBA], 田中[pdf], 中矢[pdf], 森川[[pdf]], 磯崎[TBA]
概要: 12/5, 12/12に行った基礎ゼミ報告のリベンジ
1月16日

第22.1回(K): 鎌田 亜美 (M2)
題目: 正則化法に基づく高次元因子分析モデルの推定 [pdf]
概要: 高次元因子分析モデルにおける推定量の性質を導出する. 標本共分散行列Sが特異に近いとき, 推定が不安定になるという問題がある. こ の問題の解決策のひとつに,Sに正定数a(>0)倍の単位行列を加えることにより推 定を安定化させるという手法がある(Yuan and Chan, 2008). この論文において,この手法が次元数>標本数(p>N)の場合においても有用である ことが示唆されているが,その妥当性の検討は シミュレーション研究に留まっ ている.また,aの選択についてはアドホックな方法しか提案されていない. そこで本発表では, p,N→∞のもとで推定量が持つ性質を調べること,また,aの選 択に関する知見を得ることを目標とする. そこで,まず,pを固定したもとでの推定量のバイアスを導出し,次に,p,N→∞の もとでの推定量の一致性,収束レート,漸近的なMSEを導 出し,シミュレーショ ンを行う.
第22.2回(K): 大矢 修司 (M2)
題目: TBA
概要: TBA
第22.3回(K): 土田 友里恵 (M2)
題目: TBA
概要: TBA
1月23日

第23.1回(K): 坂口 弘樹 (B4)
題目: TBA
概要: TBA
第23.2回(K): 上野 真依 (B4)
題目: TBA
概要: TBA



狩野研究室トップページへ