データ科学特論 special lecture

第5回 平成28年1月22日(金)~23日(土) 於: 基礎工J棟 J114(1階セミナー室)

1月22日(金)

16:00-17:00

  • 講演者: 三分一史和氏 (統計数理研究所)
  • 演  題:統計値マップを用いた脳幹呼吸中枢における吸息性ニューロンの検出
    講演概要: ニューロンやアストロサイトの自励的同期現象は脳内の情報伝達において重要な脳機能であり、このメカニズムを探るための注目すべき同期現象の一つとして脳幹における周期的呼吸活動がある。最近では、カルシウムイメージング法を用いた多細胞同時記録など先端的な測定技術が開発され、in vitro状態のニューロンとアストロサイトの活動をイメージングデータとして計測することが可能となった。本講演では種々の統計量を反映したマッピング法により、呼吸に関連したニューロンとアストロサイトの検出方法、ならびに、イメージングデータのプリプロセッシング方法について解説する。

18:30-20:30

  • 情報交換会
1月23日(土)

13:30-14:50

  • 講演者: 若木宏文氏 (広島大学)
  • 演  題:ランダム係数を持つGMANOVAモデルの変数選択規準
    講演概要: GMANOVAモデルは、生物の成長など経時測定データの解析によく用いられるモデルであり、成長曲線モデルとも呼ばれる。偏回帰係数の一部を確率変数として扱うモデルを線形混合効果モデルと呼ぶ。混合効果を導入することにより目的変量の分散共分散行列の構造パラメータには不等式制約が課せられる。情報量規準導出の前提条件である、いわゆる、正則条件は成立しないため、例えば、通常のAIC規準は予測密度の漸近不偏推定量とはならない。本発表では、予測式の切片項をランダム係数とした場合のカルバックーライブラーダイヴァージェンスに基づく予測密度のリスクのバイアスの漸近展開を導出し、バイアスを補正した変数選択規準を提案する。

16:30-17:30

  • 講演者: 渡辺澄夫氏 (東京工業大学)
  • 演  題:潜在変数を持つモデルの評価について
    講演概要: 潜在変数を持つ統計モデルの評価において平均対数尤度を用いる場合に、潜在変数に最尤推定値を代入する方法は適切でないことが知られている。この講演では潜在変数をベイズ推定した場合の平均対数尤度の推定におけるクロスバリデーションと情報量規準の定義を述べ、その基礎的な性質を紹介する。

第4回 平成28年1月20日(水) 於: 基礎工B棟 B104, J棟J602

8:50-10:20

  • 講演者: 鈴木良介氏 ((株)野村総合研究所 ICT・メディア産業コンサルティング部 主任コンサルタント)
  • 演  題:ビッグデータとIoT
    講演概要: データそのものに価値は無く,それをどう活用するかの設計が肝心且つ難しい.データを売り物にするためには,「データ解釈の視点」と「ユーザへの働きかけのつくりこみ」が必要である.本講演では,「データ活用のフレームワーク」としてDIVAを提唱し,多くの実際の事例を通して,ビッグデータの価値化を探る.

10:30-11:00

  • パネルディスカション
    パネラー: 鈴木良介(野村総研),河本薫(大阪ガス),狩野 裕(大阪大学),西田 豊(大阪大学)

第3回 平成27年12月12日(土) 於: 基礎工J棟 J114(1階セミナー室)

14:00-15:30, 15:45-17:15 (2コマ)

  • 講演者: 西井龍映氏 (九州大学マス・フォア・インダストリ研究所(IMI))
  • 演  題:機械学習および統計手法によるデータ解析の実際
    講演概要: ICTの発達により種々の分野でビッグデータが利用可能となっている. 機械学習や統計学はこのデータから新しい知見を得るための手法を提供し, また新しく開発している. 統計的アプローチは, データにふさわしい複数の統計モデルをオーダーメイドで想定し, モデル選択により最適モデルを決定し, 推定した母数でデータの構造を理解する. 一方機械学習のアプローチは, データ適応型の柔らかいモデルを仮定し, 将来の値を予測するモデルにより現象を理解しようとする. ここではパターン認識の種々の手法紹介や各種データの解析事例により, 両者の違いを認識し, それぞれの特徴を生かした活用法について考察する.

  • 情報交換会

第2回 平成27年11月27日(金) 於: 基礎工J棟 J617(数理ディスプレイ室)

14:40-16:10

  • 講演者: 高木義治氏 (サノフィ株式会社)
  • 演  題:NMARの欠測のもとでサロゲートエンドポイントを補助変数として用いて推測した場合のバイアス縮減について
    講演概要: 臨床試験の薬効評価において,被験者の試験中止等により生じる評価項目の欠測 (e.g., 脱落) は,バイアスの代表的な原因として以前から認識されていた (臨床試験のための統計的原則,1997).近年になり,O’Neill and Temple (2012) 等により,欠測をより積極的に考慮することで Intent-to-Treat (ITT) の原則に沿った解析を行う動きが活発化している. 欠測がMCAR又はMARの場合はバイアスのない推測が可能だが,臨床試験で発生する欠測の多くはそれらの仮定を満たさないNMARであると考えられる場合がむしろ多い.そのような場合にバイアスを縮減する比較的簡便なアプローチとして,欠測により失われた情報を補うことを意図して別の変数(補助変数 [auxiliary variable] と呼ばれる)を追加して解析する補助変数法が提案されている (Ibrahim, et al. 2001; O’Neill and Temple 2012).例えば臨床試験では,本来直接評価すべき真のエンドポイントに加えて,効果の間接的な測定値を示す変数であるサロゲートエンドポイント (Prentice 1989) も測定する状況下で,サロゲートエンドポイントを補助変数として用いて推測する場合が考えられる.補助変数法によるバイアス縮減の程度に関する検討はなされているが,いずれもシミュレーションによるものである.本発表では補助変数をモデルに導入した場合のバイアス縮減について理論的に検討した結果を述べる.

16:20-17:50

  • 講演者: 加藤昇吾氏 (統計数理研究所)
  • 演  題:角度データのための統計的手法
    講演概要: 角度データとは,-180°から180°までの角度として表される観測の集合のことをいう.角度データを統計解析する際には,従来の実数値データのための統計手法をそのまま使うことができないという問題がある.このような背景の下,角度データの統計的手法の研究が今までなされてきた.
    本報告では,角度データのための統計的手法について,基本的な知識と講演者の最近の研究成果を概説する.はじめに基本的な知識として,角度データにおいて平均や分散に相当する要約統計量がどのように定義できるかを述べる.また,フォン・ミーゼス分布や円周上のコーシー分布などのよく知られた確率分布についても紹介する.最後に講演者の研究成果として,円周上のコーシー分布の2変量拡張に関する結果を報告する.

18:30-20:30

  • 情報交換会

第1回 平成27年11月20日(金) 於: 基礎工J棟 J617(数理ディスプレイ室)

14:40-16:10

  • 講演者: 松井秀俊氏 (九州大学数理学研究院)
  • 演  題:スパース正則化を用いた関数データの判別および変数・決定境界の選択
    講演概要: 複数の個体に対して経時的に観測,測定されたデータを関数化処理し,関数化データ集合に基づく解析を行う方法は関数データ解析(Functional Data Analysis)とよばれ,幅広い分野でその有用性が報告されている.本報告では,関数データに基づくロジスティック回帰モデルに対してスパース正則化を適用することで,モデル推定と変数選択に加えて,各変数がどの判別に寄与しているかの選択,すなわち決定境界の選択を同時に行う方法について紹介する.ここではsparse group lasso型の制約を適用し,これに基づく推定法と,推定されたモデルを評価するための基準について説明する.そして,数値例を通して本手法の有効性を検証する.

16:20-17:50

  • 講演者: 山本倫生氏 (京都大学大学院医学研究科)
  • 演  題:多変量関数データに対する正準相関分析の定式化とその性質について
    講演概要: ヒルベルト空間上に値をとる確率変数(関数データと呼ぶ)のペアに対して、重み関数と確率変数の内積でスコアを定義し、スコア間の相関係数を最大にする重み関数を推定する方法が関数正準相関分析である。実数値確率変数に対する正準相関分析と同様に、関数正準相関分析は関数データに対する回帰分析や因子分析など多くの関数データ解析モデルを包含する、基本的な多変量解析法である。本発表では、3つ以上の関数データの組を扱えるよう拡張した一般化関数正準相関分析を定式化し、提案方法がwell-definedであるための十分条件およびパラメータの自然な推定量の一致性について検討する。また、提案方法では確率変数の数だけスコアが定義されてしまうが、因子分析における因子得点のように、実際に分析を行なう際には各個体に対して1つのスコアを得ることが必要とされる。そこで、いわゆる等質性分析の観点から、多変量関数データの情報を集約したスコアを求める方法を提案し、一般化関数正準相関分析との同等性を示す。

18:30-20:30

  • 情報交換会

本講義は文部科学省 平成24年度採択 大学間連携共同教育推進事業「データに基づく課題解決型人材育成に資する統計教育質保証」の活動の一環として実施される.
▲Topへ戻る