確率制御問題とその応用濱口 雄史

不確実性が存在する下での動的な最適化問題は確率制御問題と呼ばれ、その理論は、確率論や偏微分方程式論などの解析学分野はもちろん、社会科学分野の発展とも密接に関連します。例えば、確率的に変動する金融市場モデルにおいて投資家の富の期待効用(満足度)を最大化するような株式保有量を求める効用最大化問題や、確率的な感染症拡大モデルにおけるワクチンの最適な供給量を求める問題などに応用可能です。典型的な確率制御問題は、

  • 戦略 (株式保有量やワクチン供給量に相当)
  • 状態過程 (投資家の富や感染者数の時間発展挙動に相当)
  • コスト/利得関数 (期待効用や将来の期待感染状況・ワクチン供給費用に相当)
によって定式化され、コスト/利得関数を最小化/最大化するような最適戦略を求めることが目標になります。私は現在、確率制御問題における最適戦略の特徴付けや、それに関連して現れる確率微分(積分)方程式に関する研究を行っています。以下、特に関心を持って取り組んでいる問題について説明します。

時間非整合性を考慮した確率制御問題

時間整合的な確率制御問題、すなわち「初期時点で定められた最適化問題の最適戦略は、時間が経過した後も、その時点での状態を初期値とする部分的な最適化問題の最適戦略となる」という性質を持つ問題は古くから研究されており、動的計画法に基づく非線形偏微分方程式や、最大原理に基づく後退確率微分方程式(Backward Stochastic Differential Equation; BSDE)による解析手法が確立されています。一方で、数理ファイナンスや経済学などに現れる、人間の社会行動を記述するために重要な最適化問題の多くは時間非整合的であり、古典的な動的計画法は適用できないことが知られています。時間非整合的な問題では、初期時点で定まる最適戦略に従って行動してもある将来時点ではその戦略を変更する動機を持ち得るため、古典的な「最適戦略」の概念は動的な観点からは合理的ではないと考えられます。このような問題における合理的な行動指針として、各時点における自分自分を異なる意思決定主体とみなした非協力ゲームを考え、対応するナッシュ均衡を解析するというアプローチが一つの主流です。この方法で定められる解概念は均衡戦略とよばれ、時間整合的な行動指針を与えるものです。人間の社会行動を記述する数学理論の構築のため、時間非整合的な確率制御問題の均衡戦略の数学的な性質を解明することは、最新の確率制御理論における重要なトピックの一つです。

後退確率Volterra積分方程式

状態過程の将来の挙動が、現在の値だけでなく過去の挙動にも依存するという性質を持つような設定の下での確率制御問題を考えます。このような問題における最適戦略を解析するため、後退確率Volterra積分方程式 (Backward Stochastic Volterra Integral Equation; BSVIE) が重要な役割を果たします。BSVIEは、前述の後退確率微分方程式(Backward Stochastic Differential Equation; BSDE)を拡張した方程式です。確率過程の組\((Y,Z)\)がBSVIEの解であるとは、次の確率積分方程式を満たすことを言います: \[ Y(t)=\psi(t)+\int_t^T g(t,s,Y(s),Z(t,s),Z(s,t))\,\mathrm{d}s - \int^T_tZ(t,s)\,\mathrm{d}W(s),\hspace{10px}0\leq t\leq T. \] ただし、\(\int^T_tZ(t,s)\,\mathrm{d}W(s)\)は将来のリスクに関する量を表す確率積分です。BSVIEは、求めたい\(Y(t)\)の値が与えられた量\(\psi(t)\)や将来の値\((Y(s))_{s\in [t,T]}\)に依存して後ろ向きに定まるという構造を持っています。私は現在、BSVIEの可解性や解の数値近似、確率制御問題への応用などに興味を持って研究を行っています。