データ科学特論II

はじめに

理工系,生命系,経済・社会系等,多くの学問分野で実証研究が行われている.修士論文や博士論文においても適切なデータ解析が求められる.データ採取の方法や実験・調査のデザインは個々の学問分野や研究対象に依拠することも多いが,データ解析の方法とそのための基本的な考え方には普遍性がある.

本講義では,実質科学においてデータ解析を研究の道具として実際に使う学生を対象に,具体的な分析の手順・方法とそれらの数理的基礎,そしてそれらを適用する際の注意事項等を講述する.統計学から見たデータの採取方法を理解すること,及び,分析技法の正しい理解の下でデータを適切に解析できることを目的とする.

なお、本講義は、文科省大学間連携共同教育推進事業における取組「データに基づく課題解決型人材育成に資する統計教育質保証」の活動の一環として実施される.

講義基本情報

科目名称データ科学特論 II
単位数2
担当教員狩野 裕,内田雅之,西田 豊(世話教員)
開講学期第1学期(2014年8月25日(月)~8月29日(金) 集中)
会場大阪大学 基礎工学研究科 B棟 3F B300
豊中キャンパス,基礎工B棟 3F B300へのアクセスマップ
受講要件学部1年次レベルの統計学を履修または自習した者
単位認定出席とクラス内活動,レポート課題により総合評価

履修方法

  • 大阪大学の大学院生
    • KOANから履修登録をしてください。
    • 履修登録期間:4月1日~4月21日
      (基礎工学研究科の登録期間.所属部局の登録期間はこれより短いことがあります)
     
  • 同志社大学 大学院文化情報学研究科の大学院生
    • 部局間協定により,特別聴講学生として受け入れます。当該授業科目を履修し考査に合格したときに,所定の単位が与えられ,必要に応じて成績証明書が交付されます。単位互換については,所属大学にお問い合わせください。
    • 受講申請先:同志社大学 文化情報学部 事務室
    • 受講申請期間:
     
  • 大阪府立大学 大学院理学系研究科の大学院生
    • 部局間協定により,特別聴講学生として受け入れます。当該授業科目を履修し考査に合格したときに,所定の単位が与えられ,必要に応じて成績証明書が交付されます。単位互換については,所属大学にお問い合わせください。
    • 受講申請先:大阪府立大学 教育推進課 教務グループ(A3棟)理学教務担当
    • 受講申請期間:~4月17日
     
  • 大学院科目等履修生として受講
    • 当該授業科目を履修し考査に合格したときに,所定の単位が与えられ必要に応じて成績証明書が交付されます。
    • 対象:大学を卒業した者.検定料:9,800円.入学料:28,200円.授業料:28,800円.願書受理期間:平成26年2月10日(月)~2月14(金) 9:00~11:30, 13:30~16:00.募集要項は「こちら (PDF)
    • 問合せ先:大阪大学 基礎工学研究科大学院係 (ki-daigakuin@office.osaka-u.ac.jp)(@は小文字に変換してください)
     
  • その他
    • 本講義は大学間連携共同教育推進事業の公開講義として統計教育に係る教員や他大学大学院生等に公開します。無料で受講できますが,単位認定や修了証等はありません。
    • 公開講義申込書: こちらのwebフォームから申し込んでください 申し込みは終了しました
    • 公開講義申込期間: 4月8日~4月30日
    • 受講可否: 5月31日までに連絡します
     
  • 問合せ先
    • 西田 豊(nishida@sigmath.es.osaka-u.ac.jp)(@は半角文字に変換してください)

講義計画と内容

日程 担当教員講義題目
講義内容
8/25(月)

10:00-12:15
(9:30開場)
狩野 裕 (大阪大学 大学院基礎工学研究科) データ科学特論IIの序

サンプリングと統計的推測の基礎を講述する.続く5つの講義に関する序でもある.いくつかのmotivative examplesを挙げる.
① ある母集団から有権者を無作為に抽出し男女に分ける(事後層別)と有権者名簿で性別を分け,男女の集団のそれぞれから一定数無作為抽出する(層別抽出).事後層別と層別抽出の違いは何か.事後層別した後でt-検定してもよいのか.
② t-検定によって群間比較をするとき,各群の標本サイズは揃えておく方がよいと言われる.それは何故か? 標本サイズが揃っていないとき,大きい方の標本をランダムに削除して両群の標本サイズを揃える価値はあるか.[講義スライド+課題(改訂版)]

受講生の統計学に関する知識を確認するため簡単なクイズを行う (無記名.吉田寿夫教授の講義に関係)

8/25(月)

13:15-18:05
清水裕士 (広島大学 大学院総合科学研究科) 構造方程式モデリングとマルチレベル分析

本講義では,階層的な構造を持ったデータを分析する手法である,マルチレベル構造方程式モデリングについて解説する。まず第1コマでは,構造方程式モデリング(SEM)の基礎について講義し,第2コマでは階層的なデータ構造と,階層的データに対するマルチレベル分析の必要性について論じる。第3コマでは,マルチレベルSEMについてサンプルデータを用いながら解説を行う。

8/26(火)
3限~5限
13:00-17:50
盛山和夫 (関西学院大学 社会学部) 社会調査と計量社会学

人文社会系の学問において、データを収集する中心的な役割を担っているのが社会調査であり、社会調査は学問研究のほかにも世論調査やマーケティングリサーチなどにおいて、現実の政治・経済を担う基盤的な社会インフラとなっている。 本講では、今日における社会調査をとりまく諸問題について検討するとともに、 社会的不平等、社会階層、少子高齢化などを中心とする計量社会学の最近の研究動向および分析手法を紹介し、それらの課題について考察する。

8/27(水)
3限~5限
13:00-17:50
岡田謙介 (専修大学 人間科学部) 社会科学におけるベイズ統計

本講義ではベイズ統計学の考え方と,社会科学分野への応用を扱う.第1コマでは,まず統計学における2つの異なる立場である頻度論とベイズ統計学の差異,続いて主観ベイズと客観ベイズの立場の差異について論じる.第2コマでは,古典的検定に対応する問題をベイズ統計学ではどのように扱うのか,またその利点とは何かを,おもに客観ベイズの立場から論じる.第3コマでは,社会科学分野への応用を念頭に,階層モデルや混合モデルにおけるベイズ推論において,おもに主観ベイズ的な立場から論じる.[スライド改] [プログラム]

8/28(木)
2限~4限
10:30-16:10
吉田寿夫 (関西学院大学 社会学部) 心理測定と心理統計

心理学的研究を行う際に,収集され分析されたデータとそれに基づいて主張する心のメカニズムの間に大きな乖離が生じないようにするために知っておく必要がある,領域固有性の高い知識の形成を目的とした講義を行う。取り上げる予定の具体的内容は,測定の妥当性に関わる問題,データの独立性の問題,相関的研究における変動因の問題,データの集合による相関の変化に関する問題などである。

8/29(金)
2限~4限
10:30-16:10
荘島宏二郎 (大学入試センター 研究開発部) テスト理論(IRT)

本講義では項目反応理論(item response theory, IRT)を扱う。第1コマでは、まずIRTの基本モデルについて紹介し、項目母数と被験者母数の推定方法について講義する。第2コマでは,IRTの多値モデルや多次元モデルなどの応用モデルについて講義する。第3コマでは,computer-based testingや等化など、IRTを用いた応用技術について講義する。

2014/4/04: 8/28と8/29の講義を入れ替えました.
2014/7/26: 初日の講義開始時刻を早めクイズを追加しました.午後の講義を15分遅らせました.

事情により講義内容等を変更する可能性があります。 なお、各講義時間は下記の通りです。

 2限 10:30-12:00
 3限 13:00-14:30
 4限 14:40-16:10
 5限 16:20-17:50