罪犯追踪译文.doc
19页摘要 刘伟 12 月 12 日 在本文中,我们提出了一个计算机模型来预测基于以往犯罪的地点和时间下的下一个可能犯罪地点和(罪犯 )住所为了衡量汽车行驶时的距离,我们首先创建一个“道路度量”为了预测未来犯罪的地点,结合我们的道路度量我们应用核密度估计这一无参数统计技巧,其中道路度量使我们可以估计一个与时间相关的概率分布函数为了预测连环犯罪的罪犯居住点,我们使用改进的 Rossmo 模型,使之适合于道路度量这种方法提出了一种关于犯罪分子可能的居住地点的概率分布通过权衡以往犯罪的方便程度,(罪犯) 离居住点越远就有越多的机会作案,被抓的几率就越少我们把我们的模型应用到多次大规模连环杀人案,即彼得萨克利夫的“约克郡开膛手” 案,和 “亚特兰大儿童谋杀”案的凶手韦恩威廉姆斯在这两案件中,我们的模型在预测犯罪地点中取得了成功,并且证明可能在刑事调查中有用 1 简介 在本文中,我们构建了一个研究犯罪模式的计算机模型。
我们的模型将高速公路系统作为犯罪分子进行犯罪活动的一个重要的决定因素特别的,我们建立了一个道路度量来计算司机从地图上的一点到另一点开车要花费多少时间我们把这个道路度量纳入几个不同的模型下来预测下一次犯罪将会是在哪里发生和罪犯住在哪里我们的模型给执法部门一种在哪里搜索才能最大可能地逮捕罪犯的方法以及在哪里开展罪犯居住点的调查 1.1 我们方法的轮廓 我们论文的开头部分给出了我们计算机模型的理论框架和以及模型计算机实现的轮廓后面部分将我们的模型应用到著名的刑事案件中并检验模型的精确度对每个案件的调查我们大致做如下处理:建立道路度量来计算基于在两地间开车所花费的时间的距离这个度量主要基于当地的高速公路系统 估计推断下一次作案的可能地点的概率密度函数 基于修正的当前模型和道路度量,用最佳匹配圆来估计罪犯的住所。
1.2 假设 由于犯罪活动的巨大变动以及几乎所有连环杀人案的凶手通常患有心理疾病,所以采用相对简单的计算机模型去预测连环杀人案一般都面临几个障碍以下是应用我们模型的对犯罪行为所采取的假设: 犯罪是单独作案的我们假设模型中的案件都是由单独个体作案的,我们的模型不对有组织的犯罪,团伙犯罪和暴动进行分析 犯罪分子都是驾车逃离我们模型在分析高速公路模式时有意义,这里,我们通过计算驾车行驶所花费的时间来判断距离 作案地点在被罪犯被发现地点的附近在凶杀案中这意味着尸体的发现地点就是作案地点这不是不合理的假设,因为多数连环案件的凶手在作案后会把受害人尸体丢到作案地点附近在连环案件中,比如连环强奸案,爆窃或纵火案,作案地点与警方发现地点是无区别的 犯罪发生在一个狭小的区域,比如一个市或县。
这里忽略案件发生在州或国家之间的情况在那些案件中,我们的模型必须被应用于每一个犯罪群体 2 测绘犯罪和路度量我们用数学软件 Sage 来生成一幅案发地点附近的地图地图中的主要特征有主要的高速公路线路和案发现场 我们把高速公路系统看作一个图,把高速路的每个出口入口看作图中的顶点,把出口入口间的公路部分看作图的边给相邻两顶点间的边赋一个权值,该权值为两顶点间的欧氏距离 2.1 道路度量 对每一个图M,计算一个道路度量d:M * M —〉R + 在一个地区内,道路度量根据两地开车所花费的时间来计算两点间的距离这个方法是建立在司机总是走两点间最短路径和尽量利用高速路而不是走侧街道的假设基础之上的道路度量建立假设: 在侧街道上花费的时间是与曼哈顿度量成正比的,因为侧街道总是被规划成网格形状。
花费在高速路上的时间是与欧氏距离成正比的 已知地图上的点a,b,我们的 道路度量计算如下: 1. 对于我们高速路系统的每个顶点V,(对应于高速路的入口或是出口),我们计算曼哈顿距离M(V, a),M(V,b) 2. 对于每一对顶点V 1,V 2,我们应用Dijkstra算法来寻找图中V 1到V 2的最短路径(考虑边缘部分的长度),我们把这个距离记做E( V1,V 2) 3. 然后我们的道路度量定义为: d(a,b)=min{ {M(a,V1))+ E(V 1,V2)+ M(V2,b))},M(a,b) } 1,2minV或者换句话说,把它定义为走高速路的最短时间与不走高速路的所花费时间的最小值。
在实际计算路度量时,我们将图分为m×n个网格并计算,然后记录从一个网格空间到其他网格空间的距离 3 估计推断概率密度函数 3.1 核密度估计 给出犯罪的地点跟位置,我们对未来犯罪的概率密度分布做出初步估计在欧氏距离下,给出一组由随机变量产生的样本点{x1,x 2,…x n} ,则概率密度函数为 1()()NAiixKx其中, 1()()12()TiixAxAiKxe其中A为协方差矩阵,相当于在每个点周围添加小正态分布来产生一个概率密度估计函数。
我们发现由于协方差矩阵是正定的,二次型x tAx在R n上的范数定义为: TxA这反过来又产生了一个度量通过将高斯函数K(如上所示)替换为修正后的高斯函数G,提供了道路度量的一个应用 2(,)1(,)(iidxGxitEpMtht其中d 为上面定义的道路度量,h 为协方差的一个间接控制因子,Mi 为归一化常数,定义为: 2(,)()ii dxtEpht我们把h看成是时间的函数,由于近期的犯罪多比早期犯罪更容易用来估计未来的犯罪的这个假设是合理的,因此通过将h定义为增函数,让修改后的高斯函数在时间域上发散由经验确定h(t)=2.5arctan( 2t+0.5)其中t 以周为单位,是一个不错的选择我们对概率密度函数的估计也因此变为 1(,)(,)NiixtGxt在实际计算 时,如同我们计算道路度量时,我们在分好的m (,)xt*n个网格的每一个网格中用预先计算出来的道路度量计算 。
3.2 推断未来的概率密度函数 我们以上的讨论给出了一个寻找犯罪地点的合理的方法,但是期望犯罪分子总是根据单个概率密度函数来实施犯罪就不见得合理因此我们决定建立基于上面讨论的概率分布函数的趋势的加权最小二乘逼近这个方法对概率密度函数做了线形近似并预测数据集以外的概率密度函数我们的方法如下:用x 1,x 2,…x n表示犯罪地点,分别发生在t 1tn时的概率密度函数 在我们的方程 (方程1)中,我们对在t时间之前发生的犯罪(,)x的(概率密度)求和 所以我们的线形近似与核函数的初始峰值没有偏差我们希望我们的密度函数尽可能的发散使用公式(1)的概率密度估计,我们得到概率密度函数, ,… 2(,)xt3(,)xt(,)nxt尽可能小 (,)MxttM在t n和t*之间。
我们现在做加权最小二乘逼近来估计 在m * n 的网格上, (,)xt我们逐点考虑 并进行加权最小二乘我们修改众所周知的标准(,)xt最小二乘问题 的正规方程,来得到修改后的正规方程 AttXyAttXWy其中W是权重矩阵我们选择的概率密度函数的权值与时间呈线性关系(所以后来犯罪的权值远大于先前犯罪的权值) 4 最佳匹配圆和Rossmo模型 4.1 中心图学估计连环作案罪犯居住地的一个常用的方法是将每一个案发地点看作一个质点,通过空间平均来找到这些质点的中心。





