2007年度 研究室ゼミ

毎週水曜13:00~

研究室ゼミ:研究室のスタッフや院生が最新の研究成果を発表し,それについて議論を戦わせます.もちろん,ご興味のある方はいつでも歓迎いたします.

データ科学チュートリアル:講座員,または他から講師を招き,さまざまなトピックを取り上げ数回で講義します.データ科学,確率・統計に関するあらゆる話題を対象とし,理論・応用に関する知識を幅広く共有することを目指します.

研究室ゼミの記録


研究室ゼミ

1月23日(2回)
第13回  山本 千有希 (B4)
題目: 項目反応理論における項目特性について
概要: 項目反応理論の2パラメタロジスティックモデルは,困難度母数と識別力母数の2つの指標で項目を特徴づける.これらの指標は,古典的方法で項目分析を行う際に用いられる類似した概念の指標とどのような関係にあるのか,これまでの検証の結果を報告する.

第14回  原田 奈弥 (M2)
題目: 階層構造を持つ縦断的ポアソン・ガンマ混合モデルの研究
概要: 一般化推定方程式の基礎を説明してから,一般化推定方程式を用いる上で推定値の有効性を下げる問題を挙げ,その解決策について提案する.その提案がどれほど推定値の性質を改善しているかを計算機で検証するためのシミュレーションのデザインについて議論する.

12月5日(2回)
第11回  山本 千有希 (B4)
題目: 項目反応理論
概要: 項目反応理論のしくみや基本的なモデルを紹介する.また,現時点で項目反応理論,および,これと対比される古典的テスト理論をどう捉えているかについて述べる.

第10回  原田 奈弥 (M2)
題目: 一般化線形混合モデルの推定における有効性の改良
概要: 一般化線形混合モデルについて簡単に紹介した後,現在の一般化線形混合モデルの推定に関する問題と発表者の考察について述べる.一般化線形混合モデルは尤度関数を陽に求めることができないため,尤度関数の代わりに一般化推定方程式を用いて推定値を得る.一般化推定方程式は少ない仮定から推定値を得ることができるが,一方で仮定を誤ると推定値の有効性が落ちるという問題がある.この問題に関して,先行研究とその改良を紹介する..

11月21日
第9回  林 賢一 (D2)
題目: 高次元データに対するAdaBoost一考
概要: AdaBoostは強力な判別手法である一方で,計算量が多くなるという問題がある.今回は標本サイズよりも寧ろ説明変数の数が多い場合に起こりうるであろう状況を想定し,数値実験を交えて幾つかの考察をおこなう.最終的には高精度かつ効率的なブースティングアルゴリズムの構築を目指したいが,今回は其処まで踏み入れられないであろう.

11月14日
第8回  梅原 武志 (D2)
題目: _
概要: _

10月31日
第7回  紺谷 幸弘 (D2)
題目: NT区間の2nd order accuracyの証明概要
概要: 今夏開催されたいくつかの学会で発表したNT法は,正規化変換に変形を加えることなく連続な区間を得ることができる区間推定法である.これは,Hall (1992)によって示唆された単調化による方法と同様に,2nd order accurateであることが期待される.ここでは,このHall (1992)の方法によって得られる区間とNT区間の被覆確率O(n^{-1})になることを示すことによって,NT区間が2nd order accurateであることを示す.

10月17日
第6回  高井 啓二 (D3)
題目: 制約のあるEMアルゴリズム
概要: パラメタに非線形制約が課されるときのEMアルゴリズムについて述べる.EMアルゴリズムの価値は,M-stepが簡単に実行できることにあるが,制約があった場合にこの価値が失われてしまうという問題があった.本発表では,この問題の解決法のひとつとしてEMPアルゴリズムを提案する.EMPアルゴリズムは,計算が簡単に実行できるだけでなく,制約がある下でも単調増加性を持っている.この単調増加性は,Q関数の一階微分を用いることによって保障されているが,発表では数値微分を用いても十分な精度が得られることを示す.また,理論的背景についても紹介する.

10月10日
第5回  清水 泰隆 (助教)
題目: Asymptotic Inference for Stochastic Differential Equations with Jumps from Discrete Observations
and Some Practical Approaches (学位への道)
概要: 清水がついに博士論文を提出した.そこで,清水の修士時代から現在までの苦難の人生を振り返り,研究生活における様々な心の葛藤や苦悩について赤裸々に告白する.どのような過程を経て博士論文を完成するに至り,その時々何を思っていたか,また,今までの研究生活を振り返っての反省など,ありのままの清水を御覧頂き,悪しき見本として皆さんの反面教師となるつもりである.

7月25日
第4回  原田 奈弥 (M2)
題目:  線形混合モデルとその応用
概要: 回帰分析から始まり,線形モデルを基礎から説明する.線形混合モデルに関しては変量効果と固定効果の違いから,混合モデルを用いることの長所と問題点を述べる.その後,一般化線形混合モデルについて現在扱っている問題を紹介する.

7月18日
第3回:  清水 泰隆 (助教)
題目: Semiparametric estimation of Levy characteristics for semimartingales with jumps
概要: パスに飛躍を持つようなセミマルチンゲールモデルを考え,その飛躍を特徴付けるレヴィ測度の積分型の汎関数パラメータの推定について,レヴィ測度のノンパラメトリックな設定の下で議論する.今回は,ある特別な仮定を置いて議論を進めるが,その仮定が無い場合の問題について,最新の研究も報告する.

6月20日
第2回:  紺谷 幸弘 (D2)
題目:  区間推定における正規化変換の単調化
概要: 母数の推定量を標準化した量に対して,正規化変換を行うと正規分布に対する近似誤差を小さくできる(正規近似の改善).正規分布への近似誤差は,それに基づいて構成される区間の被覆誤差に直結するので,正規化変換を行うことによって被覆誤差の小さい区間推定法が構成できるが,得られる区間が1つの区間であるとは一般には保証されない.正規化変換に単調化を行うことによって,この問題を回避することができるが,正規化変換の単調化は正規近似の改善の程度を薄めてることがこれまでの研究によって示唆されている.今回は,この正規化変換の単調化を行わない区間推定法について紹介する.

5月10日
第1回:  林 賢一 (D1)
題目: ブースティング法の正則化に関する一考察
概要: ブースティング法は,複雑な判別規則を表現できる一方で訓練集合に依存した結果を出力する問題がある.この過学習の問題についてLugosi and Vayatis (2004)の方法を中心にリスク一致性を得るための基本的な考え方を紹介する.また,修士論文で行った罰則付きリスクに対するブースティング法との関連についても議論する.


データ科学チュートリアル

1月16日
第12回 紺谷 幸弘 (D2)
題目 : 情報量規準によるモデル選択とその検定
概要 : モデル選択とは,未知の分布に対し最も良く近似しているモデルを選定する手続きのことである.従来,尤度がモデル評価の基準として用いられてきた.しかしながら,モデルの包含関係の有無によって手続きを変えねばならず,場合によっては複数のモデルを同一の基準で比較することが出来ない.30年ほど前に提案された比較的新しい考え方として情報量規準があるが,情報量規準は全てのモデルに対し同一の手続きによって評価することができ,上記のような問題は起きない.本チュートリアルでは,情報量規準の代表としてAICを取り上げ,その幾何的イメージについて説明する.これは前々回の林氏によるチュートリアルの内容の理解を助けるだろうと思われる.またもう一つの話題として,モデル選択の「検定」を取り上げる.経験分布が変動することを考えれば,最良モデルを「一つだけ選定する」よりも,複数の「最良モデルの候補」を挙げておく方が現実に即しているだろう.モデル選択の検定は,このような「モデルの信頼集合」の構築に利用される.具体的には,Bootstrap確率やMultiscale Bootstrap法について概説する.

1月9日
第11回 清水 泰隆 (助教)
題目 : 株価モデルと収益の予測について
概要 : 株価は数学で予測可能か?先人たちは市場で起こる現象をまるで自然科学を扱うかのように数学的理論で説明しようとし,株価に対するさまざまなモデルを作り上げ,儲ける為の戦略を考えてきた.ここでは,1期間モデルによるポートフォリオ理論から始めて,多期間モデルからブラック=ショールズモデルまでの株価モデルの発展について,簡単な数学的解説とともに述べる.また,それらのモデルを用いた収益の予測・リスク管理法について述べ,これを実データに応用するとどうなるか試してみる.

12月12日
第10回 林 賢一 (D2)
題目 : 情報量規準についての情報
概要 : Akaike(1970)に端を発した情報量規準についての情報を提供する.AICをはじめ,大抵の情報量規準は計算が容易であるので,それらの背景にある思想,哲学を感じ取れるようにしたい.

11月28日
第9回 高井 啓二 (D3)
題目 : 統計におけるベクトルと行列
概要 : 統計学において頻繁に用いられる行列やベクトルについて紹介する.

11月21日
第8回 東條 千裕 (M1)
題目 : 線型混合モデル入門
概要 : 線型混合モデルとは線型回帰モデルに変量効果の項を加えた形のモデルである.この線型混合モデルの基本的な性質・応用例について解説する.また,線型混合モデルでの推定法についても簡単に解説する.

10月31日
第7回 古川 賢志 (M1)
題目 : 危険理論(Risk Theory)について
概要 : 損害保険会社等で使われる危険理論についての基本的な事柄を紹介する.
具体的には,破産問題を主として,破産確率の推定方法等を説明する.

10月17日
第6回 松岡 徹 (M1)
題目 : カテゴリカルデータ解析入門
概要 : 多変量データの中で特に離散変数・質的変数を扱う上で基本ツールとなる分割表の設計方法・推測方法を概説する.また,二値応答データに対するロジスティック回帰モデルの説明も行う.実際のデータを扱うことで,理論の実践方法を伝えることに重点を置きたい.

10月10日
第5回 原田 奈弥 (M2)
題目 : 分散分析になれよう
概要 : 分散分析を,どのような場面でどう使うのか,実用するという視点から説明する.統計解析ソフトRを用いて実際にデータを分析できるようになることを目標としている.

10月3日
第4回 狩野 裕 (教授)
題目 : 統計的因果推論
概要 : 統計的因果推論についての入門的講義

6月6日
第3回 林 賢一 (D1)
題目 : 多値判別におけるブースティング法
概要 : 多値判別は,OCRなどに代表されるように応用する上で重要である.これは二値判別と比べると煩雑な問題であるが,結局は二値問題に落とし込んで議論することになる.本チュートリアルでは,多値判別におけるブースティング法のアプローチをいくつか紹介する.結果として二値判別の重要性を再認識できるようにしたい.

5月23日
第2回 紺谷 幸弘 (D2)
題目 : Bootstrap法入門
概要 : Bootstrap法について概説する.
具体的には,バイアス推定問題を導入として,Bootstrap法の考え方をjacknife法と比較しながら紹介した後,その一般的な形であるBootstrap原理を紹介する.また,発展的な内容としてBayesian bootstrap法についても紹介する

5月9日
第1回 高井 啓二 (D3)
題目 : 非線形最適化
概要 : 非線形関数の最適解を求める方法を紹介する。本チュートリアルでは、非線形方程式を解く基本的方法として、最急降下法、ニュートン法、準ニュートン法、共役勾配法を紹介する