Skip to main content

交通行動分析

交通行動分析概論

交通行動分析の潮流

土木計画学における交通行動分析(travel behavior analysis)の役割は、第一に四段階推計法(四段階推定法ともいう、four-step estimation method)の諸段階で必要とされる発生・集中交通、分布交通、交通機関分担、配分に関わる各種交通行動の分析とモデリングである。第二に、自動運転やシェアリング、ロードプライシングといったさまざまな交通サービスや交通管制の運用において、交通行動の変化を正確に予測・制御することである。第三に、交通行動のよりよい理解(good understanding travel behavior)そのものが交通行動分析の目的となり得る。

交通行動分析において開発されてきたトリップ発生集中モデル、分布交通モデル、交通機関分担モデル、経路選択モデルといった離散型の非集計選択モデルは、交通需要予測において重要な役割を果たしてきた。こうした初期のモデル群は、1980年代から1990年代にかけて、計算機の性能向上を背景に均衡配分からシミュレーションモデルやアクティビティモデルの開発において多くの研究成果が蓄積されることとなった。

(2) 観測と理論

交通行動分析において、交通行動の理論化(モデル化)と、理論化した現象の観測は相互に影響を受けながら進展してきたといっていい。McFadden9)やBen-Akiva10)によって体系化された離散選択モデルは交通行動分析における理論モデルの代表例であり、サンフランシスコの高速鉄道BARTの需要予測をはじめ、世界各国の交通プロジェクトの需要予測に用いられてきた。一方、PT調査や道路交通センサス、大都市交通センサスといった交通調査は、交通行動観測の代表的方法であり、都市圏単位で交通行動を把握するための調査として定期的に行われ、交通計画や都市計画に欠かせない調査手法として定着するに至っている。

交通行動の観測データは、行動モデルのパラメーターを推定するために用いられる。交通行動分析の多くは観測された行動結果から要因の効果を推定する逆問題であることに特徴がある(これに対して原因から結果を求めるために行動を規範的に扱い、その定式化を重視するネットワーク配分理論や交通流理論は順問題を扱うことが多い)。このため、交通行動分析では、解の存在と一意性、安定性解析が重要となり、観測データと仮定する行動理論の統計的性質に基づいた推定手法の選択が求められる。

ことが可能になりつつある。こうした方法では観測精度が観測場所によって大きく異なるため、観測方程式と行動モデルを組み合わせた一般状態空間モデルやデータ同化による推定・推計手法の開発が行われている。

(1) 交通行動の観測

交通行動の観測は、トリップを単位とする調査方法と、日々の活動の連鎖に着目したダイアリー調査に大別される。

前者の代表はPT調査(パーソントリップ調査(person trip survey))であり、出発地・時刻、到着地・時刻、交通機関や乗換え地点などを調査票形式で尋ねるもので、交通行動分析の基本となる概念はトリップであり、トリップの発地となるゾーンiと着地となるゾーンjの組合せごとにトリップ数Tijを集計したOD表が分析単位となる。一方、アクティビティダイアリー調査(activity diary survey)は、被験者は1日の移動を日誌形式で調査票に記述し回答することになる。トリップを単位とする分析に対して、活動の派生需要として発生する移動の制約条件をより正確に把握することで、前後の活動文脈の影響を分析することが可能になる。

現存しない交通政策の分析にはSPデータが用いられる。SPデータは現実の行動であるrevealed preferenceに対して、仮想的な交通政策シナリオを被験者に提示することで得られる回答データのことであり、政策操縦バイアスや正当化バイアスといったバイアス補正のための手法と、さまざまな心理尺度の導入が図られることで、現実の交通政策評価に用いられるようになっている。

また交通行動の調査は、観測する際の視点の置き方によってオイラー的な方法とラグランジュ的な方法に大別することもできる。オイラー的な方法とは、交通ネットワーク上の複数の定点において、旅行者の状態やIDを記録することで、断面交通量を把握するとともに、通過ID情報を用いて、旅行者の通過経路を推計する方法である。ナンバープレートマッチング調査のような方法から、Wi-Fiの基地局に記録されたMacアドレスから回遊経路を識別する方法まで、さまざまな観測機器を用いた調査が行われている。

一方、ラグランジュ型の観測方法には、移動体通信システムを用いたプローブパーソン調査のように、携帯端末を使った追跡行動調査が用いられる。近年では、衛星画像からCCDカメラまで、広域から局所的な交通挙動のデータが画像処理技術を用いて利用することが可能になりつつある。こうした方法では観測精度が観測場所によって大きく異なるため、観測方程式と行動モデルを組み合わせた一般状態空間モデルやデータ同化による推定・推計手法の開発が行われている。

(2) 交通行動観測の自動化

交通行動分析において、旅行者自ら携帯する位置特定機能付きの移動体通信システムを用いることで、彼もしくは彼女の空間的な位置を自動的に計測することが可能となっている。このような調査はプローブパーソン調査(probe person survey)と呼ばれ、長期にわたる調査とデータ蓄積が可能になりつつある。こうした膨大なデータと交通ネットワークデータを用いてday-to-dayの経路選択やOD交通推計に関わる分析が可能になりつつある。マップマッチング(map matching)はこうしたデータ分析の基本となるデータ処理手法であり、リンクaに対する点kの距離を算出し、総和距離が最短となるようなリンク集合を経路として特定するアルゴリズムである。一方、GPSの位置データだけでは、交通機関や交通目的について知ることは難しい。そこで交通機関や移動目的といった被験者の回答が教師データとして必要になる。教師データと自動的に計測可能なセンサー情報を組み合わせて、機械学習などの方法を用いることで、交通行動の識別が可能になる。移動体通信システムの携帯機器に付帯する加速度センサーや地磁気センサーを使って蓄積され続けるデータを用いることで、データから有用な特徴量と判断基準を抽出し、自動的に交通機関や交通目的を推計することも可能になりつつある(Hato)。加速度センサーの情報を10Hz程度の周期で移動平均で集計し、特徴量とした上で100サンプル程度の教師データを作成すれば、Random TreeやSVMといった方法を用いることで、交通機関や移動目的の自動識別が9割以上の精度で可能となっている(Shafique & Hato)。

(3) 交通行動分析の基礎理論

交通行動を分析しようとする場合、発生・集中、分布、分担、配分といった四段階のステップに分割し、集計量を基に分析する方法と、交通行動を行う旅行者の意思決定そのものに着目して分析する方法に大別される。後者は、トリップベースアプローチとアクティビティベースアプローチに分けられる。意思決定に着目する場合、旅行者の個別の意思決定について価値、不確かさといった事柄を数学的かつ統計的に確定していく問題として記述する必要がある。

交通行動モデルでは、一般的に、効用最大化理論が仮定され、旅行者はさまざまな選択肢の情報を処理しながら効用が最も高くなる選択肢を選択することが仮定される。このとき、旅行者の効用関数を確定項と確率項の和で記述し、確率項にガンベル分布を仮定すると、ロジットモデルを導出することができる。互いの選択肢は無相関であるという仮定を緩和するために、正規分布やG関数を用いることで、選択肢間の相関が任意の形式で記述可能なプロビットモデルやGEVモデルを導出することが可能となる。また、認識処理できる情報量には限りがあることから、限定合理性を仮定したモデルが用いられることも少なくない。劣位の条件を持つ変数の効果を優位な変数の効果で埋め戻さない非補償型モデルや、着目する変数効果の足きり基準の影響を受けるEBAモデルや辞書編纂型モデルなどが限定合理性を取り入れたモデルとして挙げられよう。

つぎに、アクティビティアプローチによって交通行動を捉えようとする場合、現実都市の交通ネットワーク上で行われる交通行動では、交通機関の速度や、始業時刻などに起因する活動時刻制約の記述と、連鎖するトリップとアクティビティの記述が重要になる。前者はプリズム制約(近藤)などを取り込んだスケジューリング問題であり、後者はアクティビティチェイン(activity chain)と呼ばれる連続する移動-活動パターンの記述手法である(Kitamura, et al.)。複雑なアクティビティチェインの選択問題は、Bowman & Ben-Akiva型モデル、Bhat型、Arentze & Timmermans型、Gan & Recker型といったモデルに大別される。Bowman & Ben-Akiva型モデルは、離散型の選択肢で複雑なアクティビティチェインをネスト構造で記述したモデルある。Bhat型は、離散連続モデルによって、制約を有する活動時間の配分を確率的に割り付けるモデルである。Arentze & Timmermans型は、ルールベースのアクティビティシミュレーション用に開発されたエージェントモデルである。Gan & Recker型は、膨大な移動-活動パスの探索そのものを最適化問題として記述したモデルであり、さまざまなアクティビティモデルの開発が進められている。

4.1 交通行動分析

(4) 交通行動分析における今後の課題

交通行動分析の課題として、a)動学化、b)相互化、c)最適化が挙げられよう。行動分析は、1980年代のアクティビティ分析の時代から、1990年代には動学化の時代に入ったといわれ、パネル調査による政策効果の動学的予測について多くの研究が蓄積されてきた。状態依存効果などの確認がなされるとともに、パネル調査時の消耗バイアスの補正方法が確立された。相互化については福田らによる社会的相互作用による複数均衡の可能性が示唆されており、構造推定の適用による相互動学化やゲーム理論などとの整合的な分析フレームワークの確立が求められている。一方、最適化については、旅行者個人の交通行動と交通事業者の意思決定問題を組み合わせたrevenue managementの研究なども近年重要度を増しており、自動運転車両の共同利用サービスでは、利用者のスケジューリング意思決定を経路探索問題と車両資源配分と同時に解くような問題の解法が必要とされているといっていい。計算機の性能向上とZDDのようなDB検索理論の進展により、組合せ最適化問題に関する研究進展と相まって、膨大な行動データのリアルタイム収集・蓄積技術の進展が、交通行動分析の理論を大きく更新しようとしている。(羽藤英二)

4.1.2 行動モデリングの基礎理論

交通行動の予測や理解に用いられてきた行動モデルは多岐にわたるが、ここでは、交通需要予測や便益評価において研究・実務の両面で最も頻繁に用いられてきた確率効用最大化モデル(random utility maximization model, RUMモデル)に焦点を絞って説明する。

(1) 合理的選択と効用最大化

人間の行動を客観的・定量的に表現しようとする試みは、ミクロ経済学の消費者行動分析において最も精力的に行われてきた。消費者行動分析では、人間の意思決定における合理性(rationality)を前提としている。これは、意思決定主体はいくつかの目標を持ち、それらの目標に照らし合わせて行動代替案を総合評価でき、代替案を選好の順に並べることができる、というものである。これを公理体系的に書けば以下のようになる。

  1. 再帰性
    • 任意の代替案Xに対してX(≥)X
    • (X(≥)Yは「XはYより選好されるかまたは無差別である」を表す)
  2. 完全性
    • 任意の代替案X, Yに対してX(≥)YまたはY(≥)X
  3. 推移性
    • 任意の代替案X, Y, Zに対してX(≥)YかつY(≥)ZならばX(≥)Z
  4. 連続性
    • 任意の代替案Yに対してX: X(≥)YとX: X(≤)Yは閉集合

上記1~3が成り立てば、すべての代替案を選好の順に並べることができ、さらに4が成り立てば無差別曲線を定義することができるため、選好を効用関数(utility function)で表現することができる。なお、効用関数は、代替案Xに対してU(X)なる関数がスカラー数を与え、XがYより選好される(X(>)Y)場合はU(X)>U(Y)U(X) > U(Y)、XとYが選好無差別である(X(=)Y)場合はU(X)=U(Y)U(X) = U(Y)となる写像である。

効用関数を持つ合理的個人は、効用値が大きい代替案を選好するため、複数の代替案の中から最大の効用をもたらす代替案を選択するという効用最大化(utility maximization)の行動原理が演繹される。

(2) 制約条件下での最適化行動

交通行動を含むなんらかの活動を行うためには、少なからず時間等の有限な資源が必要となる。ゆえに、合理的個人の効用最大化行動は、制約条件下での最適化行動として以下のように表すことができる。

MaxUn=f(x1n,x2n,,xJn)Subject toj=1Jgk(x1n,x2n,,xJn,t1k,t2k,,tJk)=Ekn(k=1,2,,K)\begin{align} \mathrm{Max} \quad & U_n = f(x_{1n}, x_{2n}, \ldots, x_{Jn}) \tag{4.1} \\ \mathrm{Subject\ to} \quad & \sum_{j=1}^J g_k(x_{1n}, x_{2n}, \ldots, x_{Jn}, t_{1k}, t_{2k}, \ldots, t_{Jk}) = E_{kn} \quad (k = 1, 2, \ldots, K) \tag{4.2} \end{align}

ここでUnU_nは個人nnJJ個の行動代替案に時間等の資源を配分することで得られる効用を表す直接効用関数(direct utility function)であり、当該個人は時間や所得等のKK個の資源制約の下でこの値が最も大きくなるような各行動代替案の消費量xjnx_{jn}の組合せを選択するものと考える。なおEknE_{kn}は個人nnkk番目の資源の総量であり、tjkt_{jk}kk番目の資源に関する代替案jjの単位消費量(価格等)である。

式(4.1)と式(4.2)で表される最適化問題を、ラグランジュの未定乗数法を用いてxjnx_{jn}について解くと、最大の効用を与えるxjnx_{jn}の消費量として

xjn=Xjn(t11,,tJ1,,t1K,,tJK,E1n,,EKn)(4.3)x_{jn}^* = X_{jn}(t_{11}, \ldots, t_{J1}, \ldots, t_{1K}, \ldots, t_{JK}, E_{1n}, \ldots, E_{Kn}) \tag{4.3}

が求められる。式(4.3)は、それぞれの資源に関する各代替案の重みtjkt_{jk}と各資源の総量EknE_{kn}が与えられたときの各行動代替案の最適な消費量を示す関数であり、需要関数と呼ばれる。また、この最適な需要量を式(4.1)の効用関数に代入して得られる最大効用値

Un=f(x1n,,xJn)=V(t11,,tJ1,,t1K,,tJK,E1n,,EKn)\begin{align} U_n^* &= f(x_{1n}^*, \ldots, x_{Jn}^*) \\ &= V(t_{11}, \ldots, t_{J1}, \ldots, t_{1K}, \ldots, t_{JK}, E_{1n}, \ldots, E_{Kn}) \tag{4.4} \end{align}

は、tjkt_{jk}EknE_{kn}の関数VVによって間接的に定まるため、これを間接効用関数(indirect utility function)と呼ぶ。なお、式(4.3)の需要関数は、直接効用関数の最大化から求めたが、ロワの恒等式(Roy's identity)によって間接効用関数から需要関数を導出できることもできる。

(3) 標準的RUMモデルのフレームワーク

交通行動の選択は交通手段や目的地、経路のように、選択対象となる代替案が離散変数であることが多い。そこで、ここでは互いに排反かつ網羅的な離散的代替案の中から最大の効用を与える一つの代替案を選ぶという行動を記述する離散選択モデル(discrete choice model)を説明する。

標準的な離散選択モデルは、前述の効用関数のうち、最適化行動の結果として得られる間接効用関数に基づいてモデル化がなされる。ここで、意思決定者は自身の効用が最大となる代替案を選択するが、これを分析者から見た場合、意思決定主体が持つ効用の全体像が不確定にしかわからない。そこで、効用を分析者にとって観測可能な部分と観測できない部分に加法分解し、観測できない部分を確率項で表したものが確率効用最大化(RUM)モデルである。この考えに即して、RUMに基づく離散選択モデルのフレームワークを数理的に表現すれば、以下のようになる。

Uin=Vin(Xin;βn)+εin(Dn),iCnyn(i)={1,if Uin>Ujn,j(ji)0,otherwise\begin{align} U_{in} &= V_{in}(X_{in}; \beta_n) + \varepsilon_{in}(D_n), \quad \forall i \in C_n \tag{4.5} \\ y_n(i) &= \begin{cases} 1, & \text{if } U_{in} > U_{jn}, \quad \forall j (j \neq i) \\ 0, & \text{otherwise} \end{cases} \tag{4.6} \end{align}

ここで、

  • UinU_{in}: 個人nnの代替案iiに関する総効用
  • VinV_{in}: 個人nnの代替案iiに関する効用の確定項
  • XinX_{in}: 代替案iiおよび個人nnの特性ベクトル
  • βn\beta_n: 個人nnの嗜好を表す効用パラメーター
  • εin\varepsilon_{in}: 個人nnの代替案iiに関する効用の確率項
  • DnD_n: 効用の確率項の分布型を規定する平均や分散などの母数パラメーター
  • CnC_n: 個人nnの選択肢集合
  • yn()y_n(\cdot): 個人nnの選択結果を表すダミー変数

である。なお効用の確率項には、以下のような要因が含まれると考えられる。

  1. 効用最大化以外の意思決定による影響
  2. 意思決定者の情報の不完全性に起因する要因
  3. 分析者が観測できない意思決定者や代替案の属性などの要因
  4. 分析者が観測できない意思決定主体間の個人差
  5. 属性の観測誤差
  6. instrumental variablesの影響: 効用に影響を与える特定の要因が計量できないような時(交通手段の快適性)、別の計量可能な要因(座席数)を代理変数として用いることによる近似誤差 さて、式(4.5)のように、分析者から見た場合、意思決定者の効用には未知の部分(確率項)があるため、選択される行動は確率的に見えることになる。したがって、個人nnが代替案iiを選ぶという行動は、確率モデルとして以下のように表すことができる。
Pn(i)=pr[Uin>Ujn,j(ji)](4.7)P_n(i) = pr[U_{in} > U_{jn}, \forall j(j \neq i)] \tag{4.7}

式(4.5)〜(4.7)で表されるモデルが確率効用最大化に基づく離散選択モデルであり、式(4.5)に含まれる要素(関数や変数など)に関して、なんらかの仮定を置くことにより、特定のモデルが導出される。以降では、そのうち、長年にわたりさまざまな理論展開がなされてきた確率項の特定化に絞って代表的なモデルを紹介する。なお、紙面の都合上、より詳細なレビューについては文献[21]〜[23]を参照されたい。

[4] 確率項の特定化

(1) 多項プロビットモデル

前述のように、効用の確率項にはさまざまな要因が含まれる。したがって、確率項の分布形としては、中心極限定理(central limit theorem)により多変量正規分布(multivariate normal distribution)を仮定することが理にかなっていると考えられる。そこで、確率項として、期待値が0ベクトル、代替案間の確率項の相関構造を表す分散共分散行列がΣ\Sigmaなる多変量正規分布を仮定すると、個人nnが代替案iiを選ぶ確率は次式で与えられる。

Pn(i)=VinV1nVinVjnϕ(εn0,Σ)dεjndε1nP_n(i) = \int_{-\infty}^{V_{in}-V_{1n}} \cdots \int_{-\infty}^{V_{in}-V_{jn}} \phi(\varepsilon_n|\mathbf{0},\mathbf{\Sigma}) d\varepsilon_{jn} \cdots d\varepsilon_{1n} ϕ(εn0,Σ)=1(2π)J/2Σ1/2exp(12εnTΣ1εn)\phi(\varepsilon_n|\mathbf{0},\mathbf{\Sigma}) = \frac{1}{(2\pi)^{J/2} |\mathbf{\Sigma}|^{1/2}} \exp \left(-\frac{1}{2} \varepsilon_n^T \mathbf{\Sigma}^{-1} \varepsilon_n \right) Σ=(σ12σ12σ1jσ12σ22σ2jσ1jσ2jσj2)(4.8)\mathbf{\Sigma} = \begin{pmatrix} \sigma_1^2 & \sigma_{12} & \cdots & \sigma_{1j} \\ \sigma_{12} & \sigma_2^2 & \cdots & \sigma_{2j} \\ \vdots & \vdots & \ddots & \vdots \\ \sigma_{1j} & \sigma_{2j} & \cdots & \sigma_j^2 \end{pmatrix} \tag{4.8}

これが多項プロビットモデル(multinomial probit model, MNPモデル)[24]であり、分散共分散パラメーターσ\sigmaにより、代替案間の確率項の相関や異分散性を考慮できるため、一般性の高いモデルであるといえる。その反面、選択確率式に多重積分が含まれるため、モデルに含まれる未知パラメーターの推定にかかる計算負荷が大きいという欠点がある。なお、未知パラメーターの具体的な推定方法については次項にて説明する。

も、プロビットモデルのように選択確率に積分形が残らず、解析的に計算できるモデルの代表例として多項ロジットモデル(multinomial logit model, MNLモデル)が挙げられる。多項ロジットモデルは、それぞれの代替案の確率効用項に、互いに独立で同一の分散を持つガンベル分布(Gumbel distribution)を仮定したものであり、その確率密度関数は次式で与えられる。

f(εn)=μexp{μ(εnη)}exp[exp{μ(εnη)}](4.9)f(\varepsilon_n) = \mu \exp \{-\mu (\varepsilon_n - \eta)\} \exp [-\exp \{-\mu (\varepsilon_n - \eta)\}] \tag{4.9}

ここに、μ\muは分布のばらつきを表すスケールパラメーター、η\etaは分布の位置を表すロケーションパラメーターである。すべての確率項についてη=0\eta = 0と置き、式(4.7)と式(4.9)を用いて整理すると、多項ロジットモデルの選択確率は次式のようになる。

Pn(i)=exp(μVin)jCnexp(μVjn)(4.10)P_n(i) = \frac{\exp (\mu V_{in})}{\sum_{j \in C_n} \exp (\mu V_{jn})} \tag{4.10}

多項ロジットモデルは、選択確率が解析的に計算できたり、利用者便益の評価における消費者余剰の計算を容易に行うことができる[25]など、その操作性の高さからこれまで実務においても頻繁に用いられてきた。しかしながら、式(4.10)からもわかるように、任意の二つの代替案の選択確率の比が、選択肢集合に含まれるその他の代替案の影響を受けないというIIA (independence from irrelevant alternatives)特性を有するため、選択確率の交差弾性値がすべての代替案で同じ値になるという問題を抱えている。つまり、実際には確率項間に相関があるにもかかわらず、多項ロジットモデルを適用した場合には、相関の高い代替案の選択確率が過大評価されるなど、非現実的な予測値をもたらす危険性がある。なお、IIA特性には長所もあり、それらについてのより詳細な説明や、実証分析においてIIAの仮定の妥当性を検証する方法等については、文献[20]を参照されたい。

(3) GEVモデル

多項ロジットモデルのように選択確率に積分形を含まない閉形式(closed-form)モデルの一般型として、誤差項に一般化極値分布(generalized extreme value distribution, GEV)を仮定したGEVモデル[26]が提案されている。ここで、一般化極値分布の累積分布関数は、次式で与えられる。

F(ε1n,,εJn)=exp[G{exp(ε1n),,exp(εJn)}](4.11)F(\varepsilon_{1n}, \ldots, \varepsilon_{Jn}) = \exp [-G\{\exp (-\varepsilon_{1n}), \ldots, \exp (-\varepsilon_{Jn})\}] \tag{4.11}

ただしこの関数GGは以下の条件を満たさなくてはならない。

  1. ε1n,,εJn0\varepsilon_{1n}, \ldots, \varepsilon_{Jn} \geq 0について非負。つまり

    G(ε1n,,εJn)0G(\varepsilon_{1n}, \ldots, \varepsilon_{Jn}) \geq 0
  2. 正の定数μ\muについてμ\mu次同次関数。つまり

    G(αε1n,,αεJn)=αμG(ε1n,,εJn)G(\alpha \varepsilon_{1n}, \ldots, \alpha \varepsilon_{Jn}) = \alpha^{\mu} G(\varepsilon_{1n}, \ldots, \varepsilon_{Jn})
  3. すべてのiiについてεin\varepsilon_{in} \rightarrow \inftyの極限は++\infty。つまり

    limεinG(ε1n,,εJn)=,i=1,,J\lim_{\varepsilon_{in} \rightarrow \infty} G(\varepsilon_{1n}, \ldots, \varepsilon_{Jn}) = \infty, \quad i = 1, \ldots, J
  4. εin\varepsilon_{in}の任意のkk個の組合せについて、関数GGの偏微分はkkが奇数のときは非負、kkが偶数のときは非正。つまり

    kGε1nεkn{0,if k=2m10,if k=2m,m=1,2,\frac{\partial^k G}{\partial \varepsilon_{1n} \cdots \partial \varepsilon_{kn}} \begin{cases} \geq 0, & \text{if } k = 2m-1 \\ \leq 0, & \text{if } k = 2m \end{cases}, \quad m = 1, 2, \ldots

以下に、指定された文章をマークダウン形式で整形し、数式をLaTeXに変換したものを示します。内容は省略せず、構成も変更していません。

式(4.7)と式(4.11)を用いて整理すると、GEVモデルの選択確率は次式のようになる。

Pn(i)=exp(Vin)Gi[exp(V1n),,exp(VJn)]μG[exp(V1n),,exp(VJn)](4.12)P_n(i) = \frac{\exp(V_{in})G_i[\exp(V_{1n}),\ldots,\exp(V_{Jn})]}{\mu G[\exp(V_{1n}),\ldots,\exp(V_{Jn})]} \tag{4.12}

ここに、GiG_iは関数GGexp(εin)\exp(-\varepsilon_{in})について偏微分した関数である。関数GGとして

G(εi1,εin)=(iCnεin1/μ)μ(4.13)G(\varepsilon_{i1}, \varepsilon_{in}) = \left(\sum_{i \in C_n} \varepsilon_{in}^{1/\mu}\right)^\mu \tag{4.13}

と置けば、選択確率は、式(4.10)で表される多項ロジットモデルが導出できる。また、関数GGに確率項間の相関構造を表すパラメーターを導入することにより、閉形式を保持したままさまざまな非IAモデルを導出することができるという点で一般性の高いモデルである。加えて、従来は関数GGが所定の条件を満たしているか複雑な証明が必要であったが、近年では、確率項間の相関関係をネットワーク構造で表現しモデル化することで比較的容易に新しいGEVモデルを導出する方法[2]が提案されている。

(4) MXLモデル: GEVモデルのような閉形式のモデルではないが、「効用最大化に基づくあらゆる離散選択モデルが近似可能である」というミックストロジットモデル(mixed multinomial logit model, MXLモデル)[3]を紹介する。

MXLモデルでは、式(4.5)における確率項を独立で同一な分散を持つガンベル分布ν\nuと、任意の相関が考慮できるプロビット型の確率項η\etaに加法分解し、効用関数を次式のように特定化する。

Uin=Vin(Xin;sn)+ηi(θn)+νin(μ),iCn(4.14)U_{in} = V_{in}(X_{in};s_n) + \eta_i(\theta_n) + \nu_{in}(\mu), \quad i\in C_n \tag{4.14}

これにより確率項間の相関構造を表す分散共分散行列COV(e)\mathrm{COV}(\mathbf{e})は次式のようになる。

COV(e)=[σ12σ12σ1Jσ12σ22σ2Jσ1Jσ2JσJ2]+[π2/6μ2000π2/6μ2000π2/6μ2](4.15)\mathrm{COV}(\mathbf{e}) = \begin{bmatrix} \sigma_1^2 & \sigma_{12} & \cdots & \sigma_{1J} \\ \sigma_{12} & \sigma_2^2 & \cdots & \sigma_{2J} \\ \vdots & \vdots & \ddots & \vdots \\ \sigma_{1J} & \sigma_{2J} & \cdots & \sigma_J^2 \end{bmatrix} + \begin{bmatrix} \pi^2/6\mu^2 & 0 & \cdots & 0 \\ 0 & \pi^2/6\mu^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \pi^2/6\mu^2 \end{bmatrix} \tag{4.15}

右辺第1項は、式(4.8)のプロビット型の確率項の相関構造を、また第2項はロジット型のそれを表している。さて、ここでプロビット型の確率項を仮定したη\etaが所与であるとすると、η\etaがうえられた下での代替案iiの条件付き選択確率は次式のようにロジット式で表すことができる。

以下に、指定された文章をマークダウン形式で整形し、数式をLaTeXに変換したものを示します。内容は省略せず、構成も変更していません。

Pn(iη)=exp{μ(Vin+ηi(θn))}jCnexp{μ(Vjn+ηj(θn))}(4.16)P_n(i \mid \eta) = \frac{\exp\{\mu(V_{in} + \eta_i(\theta_n))\}}{\sum_{j \in C_n}\exp\{\mu(V_{jn} + \eta_j(\theta_n))\}} \tag{4.16}

η\etaは実際には確率変数であるため、式(4.16)をη\etaの分布に従って評価すると、代替案iiの選択確率は次式のようになる。

Pn(i)=Pn(iη)f(η)dη=exp{μ(Vin+ηin(θn))}jCnexp{μ(Vjn+ηjn(θn))}f(η)dη(4.17)P_n(i) = \int P_n(i \mid \eta)f(\eta)d\eta \\ = \int \frac{\exp\{\mu(V_{in} + \eta_{in}(\theta_n))\}}{\sum_{j \in C_n}\exp\{\mu(V_{jn} + \eta_{jn}(\theta_n))\}}f(\eta)d\eta \tag{4.17}

ここに、f(η)f(\eta)η\etaの確率密度関数を表している。なお、実証分析においては、式(4.15)の第1項のようにすべての分散共分散パラメーターを同時に推定するわけではなく、相関が生ずると思われる代替案間にのみ共通の確率項を導入したり、異分散性が想定される場合には、異なる分散を持つ独立的な確率項を導入した上で、その分布パラメーターの推定ならびに統計的検定を通じて、発見探索的に分散共分散構造の推定を行うのが一般的である。MXLモデルにおける確率項の代表的な特定化については文献[29]を参照されたい。また、式(4.17)には積分形が残るため、多項プロビットモデルと同様、選択確率を解析的に求めることはできない。通常はη\etaの分布に従う乱数をシミュレーションによって繰り返し発生させ、その平均値を選択確率の推計値とみなしてモデル推定がなされる。その詳細については、次項にて説明する。

以下に、指定された文章をマークダウン形式で整形し、数式をLaTeXに変換したものを示します。内容は省略せず、構成も変更していません。

[5] 離散-連続モデル

これまでは、交通手段や目的地の選択など、選択対象となる代替案が離散変数である場合を説明したが、自動車の購入に当たっての車種選択と購入した自動車の利用度(例として年間走行距離など)の選択や、1日の活動種別とその活動時間の選択のように、離散選択と連続選択の組合せとして行われる選択行動も多い。このとき、購入車種と利用度の選択の例では、車種の選択は想定する自動車の利用度の関数と考えられると同時に、自動車利用は選択された車種の関数と考えられる。したがって、車種と自動車利用度はおのおののモデルの従属変数であり、モデル系内で同時に決定されるべき内生変数である。このように、離散的な選択行動と連続量に関する選択行動とが部分的に共通な要因によって関連づけられている状況を記述するための行動モデルが離散-連続モデル(discrete-continuous model)である。離散-連続モデルは、近年精力的に開発が行われ、さまざまなモデルが提案されているが、ここでは、複数の離散選択肢を同時に選択することを許容しているという点で一般性の高いMDCEVモデル(multiple discrete-continuous extreme value model)[30]を紹介する。なお、離散-連続モデルの包括的なレビューについては、文献[31]を参照されたい。

MDCEVモデルの説明に当たり、ここでは、離散選択として活動種別を、連続量の選択として活動時間を取り上げる。MDCEVモデルは、本項の[2]で述べた直接効用関数の最大化を考えることでモデル化がなされる。いま、活動種別jjの活動時間をtjt_jとすると、利用可能な時間TTJJ種類の活動に配分することで得られる効用は次式で表すことができる。

U=j=1Jexp(βXj+εj)1αj(tj+η)αj(4.18)U = \sum_{j=1}^J \exp(\beta X_j + \varepsilon_j) \frac{1}{\alpha_j}(t_j + \eta)^{\alpha_j} \tag{4.18}

ここで、exp(βXj+εj)\exp(\beta X_j + \varepsilon_j)は活動種別jjの活動時間の重みを表す基準効用であり、分析者にとって観測不能な要因等が含まれるため、確率項εj\varepsilon_jを導入している。また、η\etaは一部の活動種別への配分時間が0となる、すなわち、端点解をとる場合を考慮するためのパラメーターであり、αj\alpha_jは限界効用の逓減度合いを表すパラメーターである。意思決定主体は、利用可能なすべての時間をなんらかの活動に配分するため、j=1Jtj=T\sum_{j=1}^J t_j = Tなる制約条件の下で式(4.18)が最大となるよう、活動種別jjの活動時間を選択する。この問題をラグランジュの未定乗数法を用いて解くと、活動種別jjの最適配分時間tjt_j^*に対するキューン・タッカー条件は以下のように表現される。

[exp(βXj+εj)]αj(tj+η)αj1=λ,iftj>0,j=1,,J[exp(βXj+εj)]αj(tj+η)αj1<λ,iftj=0,j=1,,J(4.19)\begin{aligned} [\exp(\beta X_j + \varepsilon_j)]\alpha_j(t_j^* + \eta)^{\alpha_j-1} = \lambda, \quad \mathrm{if} \quad t_j^* > 0, \quad j = 1,\ldots,J \\ [\exp(\beta X_j + \varepsilon_j)]\alpha_j(t_j^* + \eta)^{\alpha_j-1} < \lambda, \quad \mathrm{if} \quad t_j^* = 0, \quad j = 1,\ldots,J \end{aligned} \tag{4.19}

ここで、λ\lambdaはラグランジュの未定乗数である。さて、利用可能時間についての等式制約から、未知変数はJ1J-1個の活動種別の活動時間である。そこで、一つめの活動種別には必ず活動時間を配分するものとした上で、一つめの活動以外の活動時間にのみ着目すると、式(4.19)は以下のように書き直すことができる。

Vj+εj=V1+ε1,iftj>0,j=2,,JVj+εj<V1+ε1,iftj=0,j=2,,JVj=βXj+ln(αj)+(αj1)ln(tj+η),j=1,,J(4.20)\begin{aligned} V_j + \varepsilon_j = V_1 + \varepsilon_1, \quad \mathrm{if} \quad t_j^* > 0, \quad j = 2,\ldots,J \\ V_j + \varepsilon_j < V_1 + \varepsilon_1, \quad \mathrm{if} \quad t_j^* = 0, \quad j = 2,\ldots,J \\ V_j = \beta X_j + \ln(\alpha_j) + (\alpha_j-1)\ln(t_j^* + \eta), \quad j = 1,\ldots,J \end{aligned} \tag{4.20}

式(4.20)の確率項εj\varepsilon_jとして、独立で同一な分散を持つガンベル分布を仮定すると、JJ個の活動種別のうち、1〜MM番目の活動種別にはtjt_j^*なる正の活動時間が配分され、残りの活動種別には活動時間が配分されない、すなわち活動が実行されないような最適時間配分パターンが生起する確率は、最終的に次式で表すことができる。

P(t1,t2,,tM,0,0,,0)=(i=1Mci)(j=1M1cj)(M1)1(M1)!cj=1αjtj+η,j=1,,M(4.21)P(t_1^*,t_2^*,\ldots,t_M^*,0,0,\ldots,0) \\ = \left(\prod_{i=1}^M c_i\right)\left(\sum_{j=1}^M \frac{1}{c_j}\right)^{-(M-1)}\frac{1}{(M-1)!} \\ c_j = \frac{1-\alpha_j}{t_j^*+\eta}, \quad j = 1,\ldots,M \tag{4.21}

ここで、M=1M=1のとき、つまり、一つの活動種別にのみ時間が配分されるとき、式(4.21)は式(4.10)の多項ロジットモデルに帰着する。それゆえ、MDCEVモデルは、既往の離散選択モデルとの整合性を保ちつつ、複数の離散選択肢が同時に選択される状況も記述することができる高い汎用性を有したモデルである。同時に、ここでは確率項εj\varepsilon_jとして、独立で同一な分散を持つガンベル分布を仮定した場合を説明したが、MXLモデルのように柔軟な分散共分散構造を持つ確率項η\etaに加法分解することも容易であり、非常に強力な分析ツールとなるポテンシャルを有しているといえよう。