
最新《交通规划年会交通分析模型》346-交通方式划分离散选择模型比较研究.pdf
10页1 交通方式划分离散选择模型比较研究* 陈先龙 【摘要】【摘要】 离散选择模型是交通需求预测中交通方式划分的主要工具之一, 因不同形式的离散选择模型有其优势和局限性, 选择何种具体形式一直是离散选择模型应用的现实问题 对出行交通方式划分预测中五种常用的离散选择模型进行了分类研究, 重点分析了各自的理论基础与应用特征并将五类模型应用于一个真实的城际出行交通方式划分预测, 比较了各模型的计算结果结果表明,NL 模型能够较好解决存在于替选方案的相似性问题;MMNL 预测误差最小,可靠性最高,较 NL、HEV、MNP 模型更能解决交通方式选择行为中存在的相似性、异质性的问题, 是一种对交通方式选择行为预测的有效方法 研究对交通方式分担率预测问题具有重要的指导意义, 表明通过简单选择某个离散选择模型开展研究得出的结论并不一定可靠,应根据模型特点谨慎选择、谨慎应用 【关键词】【关键词】离散选择模型;方式划分;Logit 模型;异质性极值模型;多项概率模型 1. 引言引言 了解出行者交通方式选择行为是拟定良好客运交通政策的先决条件之一 离散选择模型是研究出行者交通方式选择行为的重要工具,其已被广泛地应用于运输领域的理论与实践。
运输市场中出行者会选择最适合自己的交通方式,同样的,交通工具也会“选择”最有能力的出行者 因此出行者选择交通方式的过程中除了会受到交通工具的属性的影响外也会受到消费者本身的经济能力、偏好等等内在因素(个人属性)影响由于交通方式选择行为描述、 预测精度会受到各种不同因素的影响, 因而选择一个恰当且解释能力强的离散选择模型是十分关键的问题 国内外虽然有很多学者对离散选择模型进行了不同层次的研究[1-14],但面对离散选择理论体系众多模型, 如何从中选择合适的模型以有效解决交通方式选择行为预测问题仍然是困难的有鉴于此,本研究针对交通方式选择行为建模预测问题,对五种典型的离散选择模型进行比较,研讨选择最佳离散选择模型的依据,并提出选择策略 2. MNL 模型及其应用局限模型及其应用局限 离散选择理论起源于心理学与经济学, 20 世纪 80 年代以来它已成为选择行为模型研究的主流理论目前的研究多以效用函数为基础常见的效用函数的数学表达式如下: njnjnjUV'nnjnjZnnjnnjnjxy (1) 其中,njU为方案j带给决策者n的效用;njV为可衡量效用;nj为误差项(不可衡量效用) ,'n为决策者n参数向量,njZ为观察到的变量;njx 为决策者n所具有的个体特性 *基金项目:2011 年广州市科技计划项目《基于低碳的城际和城市一体化轨道交通的客流预测研究》 (编号:0556) 2 向量,njy为替选方案j所具有的特性向量。
nN,N为决策者个体总量,jJ,J为可以选择的方案数量 个体选择模型建模过程中假设消费者为理性的选择者,则个人n选择方案i的概率为, (,)ninininjnjPP VVji ,, i jJ (,)njnininjPVVji (2) 式 (2) 中假定误差项nj满足独立一致同分布假设 (Independent and Identically Distributed, IID)并服从如下第I型极值分布: ()()()expnjnjnjnjnjfee (3) 其中,nj为位置参数(Location Parameter) ;为离散参数(Dispersion Parameter) 此分布的方差为22/6令=l 、nj=0则得 MNL 的选择概率模型: 1ninjVniJVjePe (4) 关于可衡量效用,一般多指定为参数的线性关系,亦即,niV nninixy,因此,个人n选择方案i的概率可表示如下: 1n ninin njnjxyniJxyjePe (5) 将(5)式经过简单推导,可以得到下式(6) 。
该数学式即为多项 Logit 模型的不相关替选方案独立(Independence from Irrelevant Alternatives, IIA)特性 exp(),exp()ninnininjnnjnjPxyijPxy,, i jJ (6) (6)式的意义为,在全部方案集合中,决策者对于任意二个替选方案选择概率比值,仅与该二替选方案效用有关,与其它替选方案之效用无关 另一方面, 如果假设个人n面对第i个方案作决策时不受到其自身特性nix的影响, 则上述多项 Logit 模型(5)可以改写成下式: 1ninjyniJyjePe (7) 3 式(7)即条件 Logit 模型,此模型的特点在于其所有的决策只取决于选择方案所具有的特性(jy),而与决策者特性(nX)无关估计时等于假设每一组选择对于个人效用的影响都是相同的,所以不论有多少组选择方案,需估计的参数值只有一组若研究中方案较多,则适合利用条件 Logit 模型来建模,同时也方便其它模型与之比较 MNL (Multinominal Logit Model)模型在实际应用中需满足不相关替选方案独立(Independence from Irrelevant Alternatives, I.I.A) 特性。
IIA 特性意味着方案之间彼此独立没有关联,且二替选方案选择概率的比值,仅与该二替选方案效用有关,与其它替选方案效用无关I.I.A 特性来自于误差项的 I.I.D 假设(误差项概率分布满足独立、相同的第I型极值分布) 若存在着异质性与相似性问题则 I.I.D 条件不能保证,进而导致错误统计推断 除了 IIA 特性限制外, MNL 模型应用上另外两个较大缺陷是, 不能处理随机偏好差异;不能运用面板资料来从事未被观察到的有序列相关因素的研究MNL 模型优点有二:型式封闭;参数估计便利 部分学者认为就模型理论而言,此特性是完全合理的如 McFadden(1975)[15]就认为 IIA 的限制虽然使得某些应用 MNL 的研究失去价值,但是 IIA 所造成的偏误是来自研究对象而非理论本身他认为在同质群体(Homogeneous Populations)中,IIA 特性是成立的Ben-Akiva(1985)[2]进一步指出,IIA 虽然不适用于整个群体,但是 IIA 特性的确存在于同质群体,因此 IIA 特性的可信程度取决于模型考虑的群体异质性是否显著若群体异质性不显著,则 MNL 模型是最佳建模选择。
但也有部分学者认为 IIA 假设不适当且不适用于一般情况基于以上分歧,众多学者在寻找其它更好的模型 3. 离散选择模型改进与发展离散选择模型改进与发展 异质性和相似性问题与模型误差项假设有直接关系 影响误差项的因素有二个方面, 观察样本与替选方案因此可以从样本、替选方案两个角度来考察异质性与相似性问题从样本的观点来看异质性,其代表着决策者的方式选择行为中对特定的交通方式有不同的看法,即个体间的品味有差异,或称为“个体异质性” 个体异质性主要来自偏好异质(Preference Heterogeneity)与回应异质(Response Heterogeneity),前者包含个体社会经济特性对于运输方式选择的可观察及不可观察的影响效果,后者则是个体对于运输方式服务水平的评价差异,同样存在可观察及不可观察的影响 而所谓相似性, 系指样本间调查获取过程中可能会因为空间或时间上的自相关 (例如重复访问同一受访者或者抽样对象间的样本因区位相邻之因素可能造成数据间自相关等) 而造成其存在相似性的问题(Bhat,1998)[16] 这两类难以完全避免的特性容易造成参数估计偏误甚至高估特定因素影响 至于从替选方案的观点来考察异质性与相似性特性,则只需考核替选方案间是否满足IIA 之特性即可。
若方案间不独立或不同质,则选择方案之间会有相似与异质的问题产生,亦即所谓的“方案相似性”与“方案异质性” 4 近三十年来,为克服异质性与相似性问题,从不同角度出发,众多学者逐步发展出NL(Nested Logit Model) 、 HEV(Heteroscedastic Extreme Value model) 、 MMNL(Mixed Multinominal Logit Model)、MNP(Multinominal Probit Model)模型 3.1 NL 模型模型 NL(Nested Logit Model)模型引入巢层的概念,将具有相似性的替选方案放在同一巢层中其假设同巢层内的替选方案的误差项为独立且相同的第I型极值分布,而属于不同巢层内的替选方案误差项则不相同这里以两层巢式架构为例,假设模型中共M个巢,第m巢层中有mJ个方案且方案i为m巢层中方案之一,则方案i被决策者选中的概率为ijP为: ijjmjPPP i m (8) 其中,jmP为m巢层被决策者选中的边际概率,1expexpmmjmMkkkIPI;jP i m为m巢层中方案i被选中的条件概率,expexpimjmVP i mI;mI为包容值,它代表m巢层的综合效用,lnexpmmjmj JIV;m包容值参数,用以说明巢内方案的相似程度,估计的包容值参数必须满足01m,亦即满足效用最大化原则。
当1m则 NL 模型化简为MNL 模型;m越趋近于 0 则方案间的相关性越高 NL 模型将具有相关性的替选方案置于同一独立之巢层中, 并利用包容值(Inclusive Value)代表这些方案的共同效用, 再与其它独立之替选方案构建模型, 以达到各方案间相互独立的效果 故此 NL 模型优点在于适合于解决部分替选方案存在相似性的情况 其不足也很明显,一是须指定固定的巢层结构; 二是无法处理所有随机误差项之间同时存在相关性的情况; 三是需假定决策程序满足连续性条件;四是须限定每个替选方案只能出现在一个巢中 3.2 HEV 模型模型 HEV 模型由 Bhat(2001)[17]提出该模型允许替选方案nj满足独立不一致第I型极值分布,即各替选方案拥有各自的方差,可能相同也可能不同,而不同方案间的协方差则为零个人n选择方案i的概率为 ,dwijiij C j ijwVVwPww (9) 其中, 与 为第I型极值分布的累积分布函数与概率密度函数C为选择集合,5 22var6ii,niiw,i为替选方案的异质性参数,其反应出不确定性因素的程度, 也就是不确定性因素的权重, 不同的替选方案对整体效用会有不同程度的影响。
i越大则可观测效用对选择概率的单位变动量将趋缓 HEV 模型通过各替选方案误差项的方差表达式中引入尺度因子而允许替选方案误差项的方差不同(各自的方差可相同也可能不同) ,且不同方案间的协方差为零HEV 模型仅能处理方案间存在异质性的问题, 若方案间同时存在相似性问题, 则使用该模型将会造成大偏差 3.3 MNP 模型模型 Daganzo(1979)[18]提出若式(2)假设随机误差项服从正态分布,则可推导得到 MNP 模型MNP 模型允许随机误差项间彼此可以不完全独立且不相同,能充分表现出决策者的实际选择行为,为最一般化模型MNP 模型数学表达式为: (,) ()dninjnininjPIVVji nnεε (10) 其中, I为指标函数, I=1 则决策者选择了其中效用最大者,否则为 0;()nε为多元正态分布,11221exp2()2Jnnnεεε,12,,,nnnnJ ε,期望Enε0,为协方差矩阵 模型(10)带有复杂的积分项,当选择集合超过四个方案时,参数求解较困难。
MNP 模型则不会受到上述 MNL 模型的三种限制,其可以处理异方差问题、可设定任何型式的误差结构、亦可运用面板数据处理时间序列相关的误差项MNP 模式唯一的限制是必须假设效用函数所有的误差项均为正态分布 大部分的情况下, 假设随机项为正态分布是适当的,但某些情况下,假设为正态分布并不适合,且会导致违反常理的预测结果,最著名的例子就是价格变量的系数, 应采用密度分布只出现在大于 0 的一侧的分布, 如对数正态分布(lognormal)较为合理, 但此种分布无法纳入 MNP 模型中, 除了此项限制之外, MNP 模型参数求解较复杂 3.4 MMNL 模型模型 MMNL 模型假定决策者的偏好应该不同,因此假设边际效用服从某种分布,使得须对MNL 模型的参数积分得到 MMNL 的概率决策者n选择方案i的概率表示如下: ( ) ( )d( ) ()dnininiPLgLg (11) 其中,( )niL是在特定参数向量下的多项 Logit 选择概率: 6 1exp( )( )exp( )niniJnjjVLV (12) 而( )g=()g 是概率密度函数,是深层参数向量(deep parameter) ,包括均值、方差或协方差等;( )niV是可衡量效用。
如果将效用指定为线性组合,亦即( )'niniVZ,则 MMNL 的选择概率可表示如下: 1exp( ')( )dexp( ')niniJnjjZPgZ (13) MMNL 模型的选择概率取决于分布形态,常见的分布形态是均匀分布,三角分布,正态分布, 对数正态分布 在实证研究中 g究竟为何种分布, 须由研究者探索之后认定现有多数研究,如 Hensher 和 Greene(2002)[19]等均设定 g服从正态分布或对数正态分布 MMNL 模型的效用函数中除了可观测部份的非随机项以及误差项外,还包括不可观测部份的随机项而透过此随机项可考虑方案间的相关性、异质性以及个体偏好异质性MMNL 可同时处理异质性与相似性问题, 因此理论上 MMNL 模型假设最接近真实情况, 其对于偏好行为解释效果最佳 若 MMNL 模型中效用设定为线性组合,则 MNL 为 MMNL 模型的特例MMNL 模型的优点在于: 允许个体之间存在偏好差异性; 可用来刻划同一消费者之不同出行间的相关性;可逼近任何其它随机效用模型(RUM)的估计结果MMNL 模型的缺点是计算过程繁杂,需要高速计算机估计参数;参数的分布未知需要特别制定,可能产生问题。
有必要说明的是,MNL、NL、HEV、MMNL、MNP 模型参数估计方法不完全相同MNL、NL、HEV 模型参数一般采用极大似然法(Maximum Likelihood Estimation, MLE)辨识得到MMNL、MNP 模型未知参数估计则必须采用极大模拟似然法(Maximum Simulated Likelihood Method) 以误差项假设独立 (independent)与一致(identical)的二维观点解析离散选择模型,可将本文介绍的五种模型作如下分类: 表 1 离散选择模型的分类 误差项假设 独立 不独立(相似性) 一致 MNL NL 不一致(异质性) HEV MMNL,MNP 由上述分析可知, 每种模型均有优缺点, 若将其很好组合应用则实践可能得到满意结果 7 4. 算例算例 这里使用著名悉尼与墨尔本之间的通勤出行者问卷调查数据[20]来对五种离散选择模型进行研究原数据源于对 210 个通勤出行者从悉尼到墨尔本面对小汽车、火车、长途公共汽车、飞机四种交通方式的选择行为调查,主要变量如下: TTME —— 站点等待时间,小汽车为0(min) INVT —— 车内时间(min) GC —— 广义成本,等于车辆成本+车内时间×时间价值 HINC —— 家庭收入 待估计的效用函数表达式为: njnjGnjTnjHnjnjUGCTTMEHINC air (14) 上式中nj为反映每种替选方案特征的常数,njair为替选方案哑元变量。
nj独立且服从第I型极值分布 首先以小汽车出行方式为参照方案,建立 MNL 模型,采用极大似然法估计参数可得全集合、受限制的集合情况下的参数值见下表受限制集合是指剔除 Air 方式集合 表 2 MNL 模型校估结果 全集合 受限制集合 备注 Estimated parameters Coefficient Coefficient Air 5.207 — — 剔除项 Train 3.869 4.464 Bus 3.163 3.105 GC -0.015 -0.0639 Ttme -0.096 -0.0699 air*Hinc 0.013 — — 剔除项 Log likelihood at=0 -291.1218 Log likelihood at convergence -199.1284 表 2 数据是采用 Car 作为标准参照组计算得到的由计算结果可知,因豪斯曼检验值HM=33.3363 大于20.059.488,说明模型 IIA 假设未通过检验,即意味着存在异质性与相似性的问题需要建立其它模型研究选择行为 计算表明,Train, Bus 或 Car 均可作为标准参照组,但 Air 不能作为标准参照组,因会导致参数不可辨识。
这里采用如下(图 1)的树状 NL 模型作为例子估计参数 8 图 1 NL 模型结构图 检验 NL 模型估计结果可得到 10.94520.055.99,即拒绝 IIA 假设从计算结果可知NL 模型较之 MNL 模型能提高选择行为的解释能力 方案之间可能存在异质性, 这里尝试将一尺度因子(scale parameter)加入各替选方案的误差项中,使得各替选方案的误差项不再均等,而存有方案异质性的问题在 HEV 模型中,需要至少固定一方案的尺度因子才可以估计其它参数的尺度因子, 为了便于模型比较, 此处假设小汽车为基础方案, 且其尺度参数值为 1 其它参数的尺度因子估计值为:Air =0.2485,Train=0.2595,Bus=0.6065Bhat 在实证研究中发现,HEV 模式的解释能力比 NL 模型及MNL 模型好本例计算结果表明(见表 3)HEV 模型对选择行为的解释能力强于 MNL 模型但劣于 NL 模型 MNP 模型参数估计中固定小汽车参数值为 0,得出的一组结果见表 3MNP 模型对选择行为的解释能力并未增强,可能与假设有关,即某些效用函数的误差项并不是正态分布。
表 3 NL 模型、HEV 模型与 MNP 模型校估结果 Estimated parameters NL 模型 HEV 模型 MNP 模型 Coefficient Coefficient Coefficient Air 6.062 7.833 1.358 Train 4.096 6.866 4.298 Bus 5.065 7.172 3.609 GC -0.032 -0.052 -0.035 Ttme -0.112 -0.197 -0.077 air*Hinc 0.015 0.040 0.059 Log likelihood at convergence -193.6561 -195.6605 -196.9244 以前述全集合状态下的 MNL 模型为基本型建立 MMNL 模型采用极大似然模拟估计方法得到参数如下(见表 4,分为独立随机参数与相关随机参数两种情况) 9 表 4 MMNL 模型校估结果 Estimated parameters Independent Random Paramaters Correlated Random Parameters Coefficient t-stat Coefficient t-stat Air 9.41 5.83 10.8 3.8 Train 9.55 5.75 10.7 3.6 Bus 8.59 5.69 9.7 3.7 GC -0.03 -3.35 -4.02 1.9 Ttme -0.21 -5.96 -13.4 3.9 air*Hinc 0.059 2.50 5.5 2.0 Chol(GC,GC) 3.00 1.3 Chol(Ttme,Ttme) 0.13 3.85 3.86 0.4 Chol(GC, Ttme) 7.70 2.0 Log likelihood at convergence -178.810 -176.816 注:Chol 指方差-协方差矩阵的 Cholesky 分解估计得到的参数值。
总体而言,在本文所有模型中 MMNL 模型解释能力最好 5. 结语结语 本文对常见离散选择模型进行了比较研究, 重点介绍它们各自的理论基础并比较了它们的差异通过算例研究得出以下结论: (1)在参数分布已知情况下,MMNL 模型是最佳选择,该模型对样本数据的解释能力最强所以,该模型应用中需谨慎设定参数分布 (2)MNP 模型存在原生缺陷——必须设定效用函数所有的误差项为正态分布,导致实践中 MNP 模型解释能力不强对常用模型的案例检验中,MNP 的解释能力较差 (3)NL 模型预测精度依赖于所确定的决策者行为架构,若决策程序无法确知,建立选择结构十分困难,而决策结构建立若有重大错误,对于模型结果影响甚大此外,决策者的决策程序为连续性假设有时与事实不符 (4)案例分析表明:HEV 模型对选择行为的解释能力强于 MNL 模型但劣于 NL 模型与 Bhat 的实证研究结论存在差异——HEV 模式的解释能力比 NL 模型及 MNL 模型好 【参考文献】【参考文献】 [1] Train K. Discrete choice methods with simulation[M]. 2nd ed. ed. Cambridge: Cambridge University Press, 2009: 388. [2] Ben-Akiva M E, Lerman S R. Discrete choice analysis : theory and application to travel demand[M]. Cambridge, Mass.: MIT Press, 1985: 390. [3] Lerman S R. Discrete choice analysistheory and application to travel demand[M]. Cambridge, Mass.: MIT Press, 1985: 390. [4] Hensher D A, Swait J D, Louviere J J. Stated choice methods : analysis and applications[M]. Cambridge, UK: Cambridge University Press, 2000: 402. [5] Greene W H, Hensher D A. A latent class model for discrete choice analysis: contrasts with mixed logit[J]. Transportation Research Part B: Methodological. 2003, 37(8): 681-698. [6] Antoniou C, Matsoukis E, Roussi P. A Methodology for the Estimation of Value-of-Time Using State-of-the-Art Econometric Models[J]. Journal of Public Transportation. 2007, Vol. 10, No. 3. 10 [7] Bhat C R, Sidharthan R. A new approach to specify and estimate non-normally mixed multinomial probit models[J]. Transportation Research Part B: Methodological. 2012, 46(7): 817-833. [8] Fosgerau M, Bierlaire M. A practical test for the choice of mixing distribution in discrete choice models[J]. Transportation Research Part B: Methodological. 2007, 41(7): 784-794. [9] Bhat C R, Castelar S. A unified mixed logit framework for modeling revealed and stated preferences: formulation and application to congestion pricing analysis in the San Francisco Bay area[J]. Transportation Research Part B: Methodological. 2002, 36(7): 593-616. [10] Munger D, Ecuyer P L, Bastin F, et al. Estimation of the mixed logit likelihood function by randomized quasi-Monte Carlo[J]. Transportation Research Part B: Methodological. 2012, 46(2): 305-320. [11] Hess S, Bierlaire M, Polak J. Estimation of value of travel-time savings using Mixed Logit models[J]. Transportation Research Part A: Policy and Practice. 2005, 39(3): 221-236. [12] Walker J, Ben-Akiva M. Generalized random utility model[J]. Mathematical Social Sciences. 2002, 43(3): 303-343. [13] 吳至中. 檢視選擇為宅行質異與住中的性相似性[D]. 台南: 國學立成功大, 2005. [14] 鲜于建川. 通勤者活动—出行选择行为研究[D]. 上海: 上海交通大学, 2009. [15] Mcfadden D, Domencich T A. Urban travel demand :a behavioral analysis : a Charles River Associates research study[M]. Amsterdam: North-Holland Pub. Co., 1975: 215. [16] Bhat C R. Accommodating flexible substitution patterns in multi-dimensional choice modeling: formulation and application to travel mode and departure time choice[J]. Transportation Research Part B: Methodological. 1998, 32(7): 455-466. [17] Bhat C R. Quasi-random maximum simulated likelihood estimation of the mixed multinomial logit model[J]. Transportation Research Part B: Methodological. 2001, 35(7): 677-693. [18] Daganzo C F. Multinomial Probit: The Theory and Its Application to Demand Forecasting[M]. New York: Academic Press, 1979: 216. [19] Hensher D A, Greene W H. The Mixed Logit Model: The State of Practice [R]. Sydney, 2002. [20] Greene W H. NLOGIT Version 5 Reference Guide[M]. New YORK: 2012: 650. 【作者简介】 【作者简介】 陈先龙, 男, 硕士, 广州市交通规划研究所, 高级工程师。
电子信箱: harleych@ 。
