基于犯罪大数据的社会治安精准防控.docx
20页基于犯罪大数据的社会治安精准防控 [摘要]数据之中蕴藏着社会发展与犯罪治理的规律,犯罪治理如何适应大数据浪潮成为在立体化治安防控中开展循数管理的关键对此,我国应重视“犯罪大数据”问题,从把握大数据与小数据、理论与数据、相关与因果、工具理性与价值理性的关系出发解读犯罪大数据,据此研判数据驱动下的治安防控精细化发展趋势,提出犯罪的精准防控范畴,为大数据时代犯罪治理模式的升级开辟进化之路作为日常性治理战略的战术延伸,精准防控是为解决犯罪治理的“短板问题”而提出的,在“人力+科技”“传统+现代”治理技术的有机融合下,具有系统性、多层次、全方位、前瞻性、整合式的应用表现[关键词]犯罪大数据;循数管理;社会治安防控;精准防控;犯罪治理模式[作者简介]单勇,同济大学法学院副教授本文系2014年度国家社科基金青年项目“基于犯罪热点制图的城市防卫空间研究”(项目编号:14CFX016)的阶段性成果,并受同济大学中央高校基本科研业务费资助一、问题:犯罪治理如何适应大数据浪潮“数据表示的是过去,关注、表达的却是未来数据之中蕴藏着社会发展的规律{1}随着《促进大数据发展的行动纲要》的发布,大数据上升为国家核心战略,“数据治国”成为推进国家治理能力现代化的重要着力点。
在治安防控领域,如何以数据文化推进犯罪治理,如何解读“以信息化为引领”方略,怎样借力“互联网+”的增量效应和“大数据”的乘数效应提升立体化社会治安防控的科学性,成为亟待深入探究的问题大数据浪潮孕育了尊重事实、推崇理性、强调精确的数据文化,数据文化推动了社会治理模式的转变,也催生了社会科学研究范式的转换,社会科学与计算科学、网络科学相结合,向着“计算社会科学”和“网络社会科学”转变大数据分析挑战着传统的科学研究方法论图灵奖得主詹姆斯格雷认为大数据时代将形成数据密集型科学研究的“第四范式”{2} 在社会治理研究如沐大数据春风的同时,社会科学界出现了“大数据有限论”“数字利维坦”等颇值得关注的反思观点关于“大数据有限论”,有学者强调,“之所以出现‘大数据崇拜,不是数据拥有者有什么高明之处,而是人类监测手段出现了爆炸式增长”{3};“大数据不能质疑,更不能取代各种非量化的人文社会研究”{4}有学者认为,“无论如何精巧的大数据分析工具的使用,都不能代替生产工具的人的理性思考‘武器的批判并不能取代‘批判的武器”{5}有学者指出,大数据重相关关系而轻因果关系,“在大数据库中,由于数据量庞大,通常很容易得出统计意义上显著的回归系数,但这并不意味着两个变量之间存在因果关系”{6}。
大數据检测到的网络联系是一种弱联系,不足以预测高风险的社会行为{7}关于“数字利维坦”,有学者指出,“信息技术不仅孕育着走向数字民主的巨大机会,而且潜伏着滑向‘数字利维坦的现实风险”{8}数字利维坦”的风险在于,国家依靠信息技术的全面装备,将公民置于彻底而富有成效的监控体系之下,而公民却难以有效地运用信息技术来维护其公民权利,即无法通过数字民主来制衡国家的监控体系{9}大数据浪潮与“大数据有限论”“数字利维坦”形成了观念上的冲突与对立,争议的焦点是在社会治理中如何正确理解及科学运用大数据面对观念对冲、思潮起伏,犯罪治理如何适应大数据浪潮且不至于陷入盲目滥用、误读误解、动辄泛化的数据陷阱,成为在“创新立体化社会治安防控体系”中开展循数管理的关键对此,我国应正视和重视“犯罪大数据”问题,针对上述争议观点,从把握大数据与小数据、理论与数据、相关与因果、工具理性与价值理性的关系出发解读犯罪大数据,据此研判数据驱动下的治安防控发展趋势,并思考犯罪治理模式的进化之路二、基点:正解犯罪大数据IBM(国际商业机器公司)和IDC(国际数据公司)将大数据的特点归纳为“4V”,即海量性(Volume)、多样性(Variety)、快速性(Velocity)、真实性(Veracity,IBM的界定)或价值性(Value,IDC的界定)。
在此基础上,有学者提出,数据有测量、计算、记录三种来源,大数据可理解为传统的小数据(源自测量)加上现代的大记录所产生的数据大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创造新价值,从而为社会带来‘大知识‘大科技‘大利润和‘大智能等发展机遇{10} 因此,大数据之大,不仅在于大容量,更在于大价值作为大数据在治安防控领域的分支,“犯罪大数据是指能全面反映犯罪相关人、事、物的数量特征、时空分布特征,以及变化过程的海量、多源、异构数据犯罪大数据具有多源异构、高维度、长时序的特征”{11}犯罪大数据同样具有“4V”特性,在思维、方法、类型、价值上与大数据一脉相承,但它是以犯罪及其防控为核心的数据,是犯罪及其防控信息的载体经过数据整理与加工后,犯罪大数据能够呈现出具有规律性的犯罪防控知识犯罪大数据的大价值主要体现于犯罪防控的创新实践中在国外,美国圣克鲁斯警局较早运用大数据分析历史案件,发现推测犯罪趋势和犯罪模式;美国马里兰州运用软件预测罪犯假释或缓刑期间的再犯可能性,这种预测成为了法庭假释审查的参考;南卡罗来纳州警察运用IBM的数据分析工具探察犯罪模式,发现犯罪热点,优化警力部署;洛杉矶警局与科研机构合作,基于过去80年的130万个犯罪记录开发出预测犯罪高发地点的软件;在国内,信息警务异军突起,犯罪大数据分析逐渐成为治安防控的重要支撑。
山东省公安机关“警务云平台”建设取得重大进展,截至2016年已收集460类369亿条数据,存储总量达到10P,每日处理数据达千亿条;2013年北京市公安局怀柔分局与天津工业大学合作,研发出“犯罪数据分析和趋势预测系统”,取得了良好的防控效果相对于犯罪大数据的丰富实践,我国犯罪大数据的理论研究甚为滞后,这在客观上制约了犯罪大数据在治安防控中的应用为此,在全面体察上述实践的基础上,本文尝试从以下五个方面解读犯罪大数据:endprint1.犯罪大数据不能简单等同于公安大数据公安机关与海量的线索、情报、信息打交道,并拥有人、车、案件、证据、户籍管理、警力部署、警用地理信息等犯罪数据库,因此有学者直接提出“公安大数据”{12}范畴虽然公安机关是打击和预防犯罪的重要力量,但犯罪治理的主体不应限于公安机关从全局层面、系统角度来理解,法院掌握的已判决刑事案件数据、检察机关掌握的提起公诉刑事案件数据、国家安全机关掌握的国家安全数据、司法部门掌握的罪犯矫治数据、政法委掌握的维稳及综合治理数据、纪委掌握的反贪及廉政建设数据、政府其他机构掌握的城市公共安全数据、社会其他团体及公民个人(现代社会每个人都是互联网数据记录与传输的终端)掌握的与治安防控有关的数据均与公安大数据一样,属于犯罪大数据的范围。
可见,“犯罪大数据”比“公安大数据”涵盖范围更广、视野更加开阔、内容更为丰富,“犯罪大数据”应成为研究大数据浪潮对犯罪防控影响的基石范畴2.犯罪大数据包括犯罪小数据从类型上看,犯罪小数据亦是犯罪大数据的有机组成部分,源自测量的小数据与现代大记录形成的数据共同组成了犯罪大数据大数据从类型上可分为结构化数据、半结构化数据和非结构化数据{13}结构化数据是防控机关内部系统中的信息,如Excel表格中案件情况的统计数据从容量及数据来源上看,结构化数据属于典型的犯罪小数据半结构化数据包括Word文档中的文字、网页中的新闻、电邮等;非结构化数据是基于物联网、等移动智能终端、车联网等的传感器所形成的视频、图片、地理位置、活动轨迹、网络日志等数据从数据可用性上看,大数据的价值主要体现在传统的小数据或结构化数据上当前人类的数据约75%是非结构化数据和半结构化数据,这也是大记录的表现形式非结构化数据和半结构化数据要想体现出数据治理的价值,当前主要的处理方法还是把它们转化为严整结构的小数据{14}以往传统的区域犯罪风险评估、基于犯罪地图的热点探测、实验性防控项目跟踪等量化研究很多都属于小数据分析大数据无法取代以抽样调查和实验研究为代表的传统的‘小数据研究,抽样调查的样本在特定情况下比某些‘大数据更具有代表性。
从长远来看,大数据不仅不会取代小数据,而且必须依靠小数据才能得到发展{15}因此,犯罪大数据并不排斥传统的小数据分析,犯罪小数据与大数据是一种共生相依的关系3.“理论+数据”结合下的数据相对论犯罪大数据分析以对犯罪规律的精准把握为目标,但这种分析并不是单纯的客观性分析,仍离不开主观假设、理论思辨、经验和偏好、既有知识积累、价值评判的影响有了犯罪大数据也不意味着就能为决策者、研究者提供一个绝对真实的“镜像世界”大数据分析的推崇者以往每每列举洛杉矶警局运用大数据预测犯罪的例子,但2015年洛杉矶犯罪率却出现了13年以来各类犯罪的犯罪率齐升高的现象这是否意味着犯罪大数据分析失灵或大数据泡沫破裂呢?实际上,数据越多,分歧也可能越多,因为每一个不同的观点,都能找到相应的数据来支持要将千变万化的人类行为提炼归纳进一套相关性分析模型和数学公式里面,几乎是不可能的这就是大数据不可能宣告理论终结的原因所在{16} 数据是不能单靠自己“说话”的,还有赖于研究者的数据清理、分析、解释工作不对原始数据进行调整就等于故意公布错误的信息{17}因此,犯罪大数据分析必须扎根在犯罪学基础理论之上,并接受理论的指导,任何分析都是一半数据、一半理论;理论驱动与数据驱动之间是一种“海上明月共生潮”的珠联璧合关系。
根据数据相对论的理解,数据永远在追赶事实数据仅记录事实的一个侧面数据再大都不是事实,但它逼近事实事实确实只有一个,但又千万个棱面,任何一组数据,可能都只仅仅描绘了一个“面”{18}研究者用数据描述事物不同棱面的过程就是解释数据可见,犯罪大数据分析是否科学有效不仅取决于犯罪数据的质量,更取决于研究者如何将犯罪学理论与犯罪数据有机结合,以既有理论、知识设计算法和程序,以量化分析探究犯罪规律、检验和修正犯罪学理论,从而改进犯罪治理模式此外,有效的犯罪大数据分析能够提升犯罪防控决策和实施活动的科学性,但并不意味着能直接带来犯罪率的降低毕竟,影响特定区域犯罪率的因素很多,即使犯罪大数据分析应用甚多,有时也无法对冲人口、城市化、经济、社会结构等深层次原因的影响4.从相关到因果的犯罪规律探究在大数据时代,“相关比因果更重要”的观点甚为流行,基于相关关系的预测分析成为大数据的基本应用犯罪原因一直是传统犯罪学的核心议题随着大数据分析的流行,相关关系能够取代因果关系、犯罪预测会架空犯罪原因研究吗?一般来说,大数据思维强调归纳,注重分析事物之间的相关关系;传统犯罪学研究强调演绎思维,以解释因果关系为目标大数据分析可以阐述关联和概率,但归纳法具有无法确定因果关系的天然缺陷。
科学的最终目的显然不只是陈述概率或可能性,而是解释因果关系和给出答案{19}在概率分析中,有时两个风马牛不相及的因素之间会存在显著的回归系数,这并不意味着变量之间有真实的因果关系概率分析的上述局限也无法否定相关分析在犯罪原因研究中的独特价值尽管相关并非完全等同因果,但“相关性观察是绝大多数犯罪原因研究的前期研究”{20}犯罪原因的等级取决于同结果发生之间的联系概率概率越大,原因等级便越高研究者运用基于概率论的数理统计方法可从众多因素中筛选出与犯罪存在较大概率的相关因素、排除无关因素,并精准把握特定变量影响犯罪发生的數量关系{21} 在分析过程中,归纳和演绎思维往往难以分割,“‘数据驱动科学必须把归纳和演绎结合起来通过归纳性的大数据分析洞察情况,然后依据数据分析的结果提出假设,最后再用演绎法与数据分析相结合去验证假设”{22}可见,相关关系不但没有取代因果关系,而且从相关性角度探究犯罪的因果关系构成了量化犯罪原因的可行进路endprint从相关到因果的研究进路不仅能够预。





