2015年度 研究室ゼミ

毎週金曜14:40~

研究室のスタッフや院生が最新の研究成果を発表し,それについて議論を戦わせます.もちろん,ご興味のある方はいつでも歓迎いたします.

研究室ゼミの記録


2月5日
第26.1回:折原 隼一郎
題目:個別ゼミ報告~ほんま傾向スコアすごいで~
概要:統計的因果推論について発表する.観察研究における因果推論において,共変量による交絡は避けて通れない物であり,それを解決する手法の一つとして傾向スコアが挙げられる.傾向スコアの概要とその拡張である一般化傾向スコア・傾向関数の概要も説明する.

第26.2回:古川 潤
題目:個別ゼミ報告~ほんまFDRすごいで~
概要:これまでに思っていた統計への熱い思いと, ゼミナールで学習してきた内容の総括, 今興味を持っているODPについての概要を紹介.

第26.3回:川野 有智
題目:Multiple Group Structural Equation Modeling
概要:複数個の集団の特徴を比較する上で,従来の因子分析では因子構造を同じとみなしてよいかどうかを検討するに留まっていた.その後,構造方程式モデリングの発展により,多母集団の同時分析は母集団間で対応する因子負荷量が等しいと考えてよいかを検討することが可能になった.この手法は処置群と対照群の比較,性差や国際比較等の研究に有用である.本発表では,構造方程式モデリングの基礎事項ならびに多母集団の同時分析について紹介する.

1月22-23日
第25回:科研費シンポジウム「欠測データ解析とモデル選択:生体情報データの統計モデル」

1月15日
第24.1回:川口 大輔
題目:--
概要:--

第24.2回:寺田 亘
題目:傾向スコアマッチングを用いての群間インバランスの修正~卒論最終報告~
概要:来たる卒業論文の提出に当たっての近況報告. 以前の中間報告での内容の改善, 補強をおこなった. おもに傾向スコアの推定法, シミュレーション比較を行おうという考えに至った経緯について話す.

第24.3回:松岡 佑知
題目:一致性に基づくSVMの正則化パラメータの選択手法について
概要:SVMは適当な仮定のもとでベイズ誤差に対する一致性を持つ. 今回はその証明の概略とそこで必要となる判別適合的損失と普遍カーネルの理論を紹介する. さらにその証明に対する理論的考察と数値シミュレーションから, サンプル数のみに依存したSVMの正則化パラメータの選択ができないか考察する.

第24.4回:磯 颯
題目:--
概要:--

1月8日
第23.1回:倉田 澄人
題目:修士論文最終報告 ~ダイバージェンスとモデル評価規準~
概要:本研究の中心は、確率分布間の「遠さ」の尺度であるダイバージェンスにある。その応用には様々なものがあるが、今回はその中から、母数推定・適合度検定・モデル評価規準・ベイズ統計について、適宜実例・シミュレーションを交えて紹介する。

第23.2回:林 暢哉
題目:Comparisons among doubly robust estimators in restricted moment models
概要:欠測のあるデータに基づく回帰モデルのパラメータについて、propensityのモデルが正しいときに推定量の分散が小さくなるようなdoubly robustな推定量を提案し、シミュレーションにより既存のdoubly robustな推定量と比較した。サンプルサイズが小さいときの推定精度に課題があるが、サンプルサイズが大きいときは既存手法と同等以上のパフォーマンスが期待できる結果が得られた。

第23.3回:堀家 彰太
題目:状態空間モデルのパラメータ推定における誤差発生機構の数値検証
概要:時系列データに対して有効である状態空間モデルに関して説明し,on-line解析に向いているSequential Monte Carlo法と未知パラメータの推定が行えるParticle Markov Chain Monte Carlo(PMCMC)を紹介し,実際に,PMCMCにおけるパラメータ推定の問題について言及する.

第23.4回:吉水 茉里
題目:カーネル法を用いた独立性尺度の検討 —HSICとKDRの方法論的研究—
概要:カーネル法を用いた依存性の尺度であるHSIC(Hilbert Schmidt Independent Criterion)は非線形な依存性にも対応できることがよく知られている.しかし一方でどういった依存性をもつデータに対して有効なのかはまだ研究されていない.本発表ではその点に注目し,HSICの性質について考察を行う.さらに,条件付き共分散作用素を用いて次元削減を行うKDR(Kernel Dimension Reduction)について,一般化逆作用素を用いることで,正則化なしに最適化する方法を考える.

12月18日
第22.1回:寺田 亘
題目:卒論中間報告~Causal Inference~
概要:これまでにゼミナールで学習してきた内容の総括と, 卒業論文で深く扱いたいと考えているマッチングについてその概要を紹介.

第22.2回:磯 颯
題目:統計的学習理論を用いた,正則化回帰分析の導出
概要:回帰分析などの統計的手法に対し,正則化法が多く用いられている.
正則化法は,頻度論やベイズ的な立場から,それぞれ説明されているが,そこで推定されたモデルが,予測誤差を小さくすることに対する数学的解釈は,いずれの立場からもなされていない.
そこで,今回は,統計的学習理論の枠組みを用いることで,予測誤差上界最小化の形で,正則化回帰分析が自然に導かれることを示す.

第22.3回:松岡 佑知
題目:ラデマッハ複雑度を用いた一様大数の法則による SVM の理論的正当性の説明
概要:サポートベクターマシン(SVM)は機械学習における代表的な手法である. 今回は仮説集合の複雑さを測るための尺度の一つであるラデマッハ複雑度を用いて汎化誤差(予測損失)を評価することで, SVMの性能の良さが理論的に保証されることを説明する.

第22.4回:川口 大輔
題目:Comparing of tail index estimators
概要:極値論において最も大切だと言われている,regularly varyingのパラメータの推定と閾値の設定の仕方について研究しています.
MSEを基準として,パラメータについては,有名ないくつかのパラメータで比較をし,閾値については,その値でどれ程のMSEが得られるかを検討して決定しています.

12月11日
第21.1回:森川 遼真
題目:三大学発表報告~経験尤度の風が吹く~
概要:三大学の内容に補足を追加したものを発表する。「経験尤度」という道具を用いて、いわゆるノンパラメトリック的な解析法で欠測時のデータに対するアプローチを紹介する。

第21.2回:折原 隼一郎
題目:共変量バランシング傾向スコアとバックドア基準
概要:観察研究において傾向スコアは未知であるため,モデリングをしモデルを予測する必要がある.しかしモデルを誤特定した場合に,推定される因果効果にバイアスが発生することが分かっている.今回はモデルの誤特定に対してロバストであるCovariate Balancing Propensity Score (CBPS) について紹介し,それの変数選択法についてシミュレーションで確認をした.

第21.3回:古川 潤
題目:Asymptotic power
概要:基礎ゼミで勉強した検定について, 特に検定の一致性について詳しく説明する. また, 検出力についてEdgeworth展開を用いてとなるように展開をする. 最後に数値計算をして近似の良さ, オーダー評価を確認する.

第21.4回:川野 有智
題目:Correlation analysis for nonparametric statistics
概要:一般に相関係数と呼ばれるPearsonの積率相関係数はデータの正規性と線形性が仮定されている。一方、Spearmanの順位相関係数は順序データの類似性を表すノンパラメトリックな指標であり、前述の仮定を持たない離散値データや非線形データ等において変数間の単調性を測ることができる。
本発表では順位相関係数の基礎理論を解説し、各相関係数と分布の関連性について数値解析を交え紹介する。

12月4日
第20.1回:濵田 悦生先生
題目:出生数の分解公式と大学ランキングの考察
概要:厚生労働省における合計特殊出生率に関する出生数の分解公式における「年齢構成の違い」という項目について考察した。また、Times Higher Education が公表している世界大学ランキングにおけるランキング評価の推移を詳細に考察し、大阪大学のランキング推移を俯瞰した。

11月13日
第19.1回:長瀬 真利雄
題目:識別不能な非逐次モデルから得られる興味深い性質について
概要:非逐次モデルとはモデル内に双方向の因果関係を含むモデルである.
SEM(Structural Equation Modelling) における非逐次モデルは一定の条件をもつ道具的変数を導入することで識別性を持つが,その条件はかなり制限的であり,現実的には当該モデルを適用した分析が困難である場合も多い.しかし,一見,識別不能に見えるような状況であっても,ある仮定を置くことによって,双方向の因果関係情報を偏りなく抽出できる可能性が見えてきた.詳細は発表時に報告する.

第19.2回:門脇 達彦
題目:正倉院文書「食口案」データの分析
概要:研究動機・背景と特定の職種の年末年始における異常値検証について進捗状況を報告します。

11月6日
第18.1回:堀家 彰太
題目:Sequential Monte CalroとParticle Markov chain Monte Carloの優位性の検証
概要:状態空間モデルの事後分布を推定するための手法として, Sequential Monte Calro(SMC)と呼ばれるものがある.更にSMCを未知パラメータの推定や,活用できる範囲の拡大のために二つの動向がある.一つは,SMC自体を改良すること,もう一つはSMCとMCMCを組み合わせることだ.今回はその二つを紹介,検証する.

第18.2回:吉水 茉里
題目:HSICの統計的性質とKDRの漸近的性質について
概要:カーネル法を用いた依存性の尺度であるHSIC(Hilbert Schmidt Independent Criterion)は非線形な依存性にも対応できることが強みである一方で,一般的にどういった依存性をもつデータに対して有効なのかはまだ研究されていない.本発表ではその点に注目する.さらに,条件付き共分散作用素を用いて次元削減を行うKDR(Kernel Dimension Reduction)について,Moore-Penroseの疑似逆行列を用いることで,正則化なしに最適化する方法を考える.

10月30日
第17.1回:倉田 澄人
題目:修士論文中間報告 ~BHHJ-divergenceとモデル選択規準~
概要:KL-divergenceを拡張したBHHJ-divergenceは, 有効性とロバスト性をチューニングパラメータによって調整することが出来るダイバージェンス族である.ここから導出されるモデル選択規準の性能を調べるとともに, 適切なチューニングパラメータを選出する方法についても検討する.

第17.2回:林 暢哉
題目:Efficiency of doubly robust estimators in restricted moment models
概要:欠測のあるデータに基づく回帰モデルのパラメータについて、propensityのモデルが正しいときに推定量の分散が小さくなるようなdoubly robustな推定量を提案し、シミュレーションにより既存のdoubly robustな推定量と比較した。

10月23日
第16回:鎌谷 研吾先生
題目:モンテカルロ法と統計科学
概要:不確実な現象を解析する統計学に対し,モンテカルロ法は逆に不確実性を生み出すものです.一見相容れない両者ですが,この組み合わせが前世紀末に「モンテカルロ革命」とも呼ばれるベイズ統計学の発展をもたらしました.その経緯とモンテカルロ法の最近の話題を解説します.

10月9日
第15.1回:西田 豊先生
題目:Nonnegative Matrix Factorization and K-means
要旨:Ding, He, and Simon (2005)の論文をもとにNMFとK-meansの関係について紹介する.対称行列のNMFはカーネルK-meansと等しく,矩形行列のNMFはbipartile graphに対する行と列の同時クラスタリングと等しいことを確認する.

第15.2回:伊森 晋平
題目:モデル選択の不確かさについて
要旨:モデル選択の目的は「要因特定」と「予測」の二つに大別される。予測を目的としたモデル選択を行う場合、選択後の推定を考慮する必要がある。本発表では、モデル選択の不確かさに着目し、高次元データにおけるモデル選択後の推定方法を紹介・比較する。

10月2日
第14.1回:田辺 竜ノ介
題目:spike and slab事前分布を用いた罰則付き回帰 / 情報量規準を用いた階層ベイズモデル
要旨:従来のベイズ罰則付き推定ではオラクル性を持っていなかった.しかし,事後中央値を用いることでオラクル性を与えることができた.さらに従来の頻度論的手法ではスパース性を与えない罰則でもスパース性を与えることが可能となった.

第14.2回:森川 耕輔
題目:Semiparametric Inference under Nonignorable Nonresponse
要旨:データの"欠測"は疫学,経済学,標本調査といったあらゆる分野で重大な問題となっている.例えば,結果変数の平均が興味の対象であるとする.このような統計量は,一般にある関数を用いて,推定方程式を満たすパラメータのクラスに属する.ここで,は共変量である.が欠測している際,といった単純なパラメータでさえ,通常用いられる標本平均ではバイアスが生じてしまう場合がある.このような問題を扱う際,データが欠測する原因である,欠測メカニズムの特定が重要となる.欠測メカニズムは,で定義される.ここで,が観測される(欠測する)場合,1(0)をとる確率変数である.特に,欠測メカニズムがに依存するとき,無視できない欠測と呼ばれ,従来法では,のモデル及び欠測メカニズム両方のモデルを正しく特定しなければならない.本研究では,条件付き期待値 をカーネル平滑化によりノンパラメトリックに推定することで,のモデルに関する仮定を全く必要としない及びに対する推定量を提案し,それらの漸近分布を導出した.即ち,我々の提案する方法により,欠測メカニズムが結果変数に依存する無視できない欠測であったとしても,の分布に対する仮定を必要とせず,欠測メカニズムに関する仮定のみでを推定することが可能となる.


7月24日
第13.1回:堀家 彰太
題目:個別ゼミ報告 Dynamic Linear Model

第13.2回:吉水 茉里
題目:カーネル次元削減

7月17日
第12.1回:倉田 澄人
題目:個別ゼミナール報告 ~BHHJ-divargenceとモデル選択基準~

第12.2回:林 暢哉
題目:二重頑健推定量(Doubly robust estimator)の改善について

7月10日
第11.1回:折原 隼一郎
題目:研究室ゼミ

第11.2回:川野 有智
題目:不均一分散の回帰分析(M1基礎ゼミ報告)

第11.3回:古川 潤
題目:基礎ゼミ報告

第11.4回:森川 遼真
題目:様々な収束概念間の関係~分布収束の正体~

7月3日
第10.1回:伊森 晋平
題目:モデル選択結果の評価について

第10.2回:狩野 裕先生
題目:Developments in multivariate missing data analysis

6月26日
第9回:長瀬 真利雄
題目:非逐次モデル(双方向因果モデル,因果ループモデル)の識別性に関する研究

6月19日
第8.1回:磯 颯
題目:Least Angle Regression

第8.2回:寺田 亘
題目:The jackknife and bootstrap

第8.3回:松岡 佑知
題目:PAC Learning Frameworkの紹介 ~確率的で正しい学習~

6月12日
第7.1回:西田 豊先生
題目:クラスタワイズノンパラメトリック回帰分析

第7.2回:濵田 悦生先生
題目:エントロピーの非連続性について

6月5日
第6.1回:田辺 竜ノ介
題目:Bayes的罰則付き推定

第6.2回:門脇 達彦
題目:進捗状況報告 正倉院文書「食口案」データの分析

5月22日
第5.1回:堀家 彰太
題目:_

第5.2回:吉水 茉里
題目:独立性の検定

5月8日
第4.1回:倉田 澄人
題目:研究紹介 ~モデル評価基準&ダイバージェンス~

第4.2回:林 暢哉
題目:Semiparametric theory and estimation causal treatment effect

4月24日
第3.1回:森川 耕輔
題目:留学報告,Semiparametric Inference under Nonignorable Nonresponse

4月17日
第2.1回:長瀬 真利雄
題目:自己紹介と研究の概要

第2.2.1回:磯 颯
題目:自己紹介

第2.2.2回:寺田 亘
題目:自己紹介

第2.2.3回:松岡 佑知
題目:自己紹介

4月10日
第1.1回:川口 大輔
題目:Fisher-Tippett theorem

第1.2.1回:折原 隼一郎
題目:自己紹介と研究テーマについて

第1.2.2回:川野 有智
題目:大分と熊本と自己紹介,古典的多次元尺度法の最適性について

第1.2.3回:古川 潤
題目:自己紹介とB4で勉強したこと

第1.2.4回:森川 遼真
題目:自己紹介