摘 要
犯罪空间分析是空间内犯罪问题的重要研究内容之一,国外学者基于不同渠道的犯罪相关数据,运用新理论、新技术、新算法,围绕犯罪空间的研究形成了一批极富影响力的学术理论。但我国在这一领域的研究较为薄弱,研究成果缺乏实用性,难以在犯罪打防实战中发挥作用。同时,由于犯罪数据获取困难,更多的研究停留在质性研究层面,定量角度的实证研究极其缺乏,导致我国对于犯罪空间研究的相关理论、技术发展严重掣肘。为数不多的基于数据分析技术的研究也是聚焦微观层面,过多关注某个因素对于犯罪的影响或某个区域犯罪空间的分布规律,缺乏宏观到微观,多因素、多角度的系统性研究成果和科学的分析模式。基于上述问题,本书通过对较为翔实的犯罪空间环境数据和犯罪数据开展具体分析,一方面对国外相关理论、视角及方法在我国的可用性、有效性进行验证;另一方面,本书以我国北京市侵财类案件为例,结合空间内经济发展、交通分布、人口布局、社会资源配置、空间结构等多个方面数据样本开展实证研究,探索出一套系统化的、适用于我国犯罪空间分析的模式CSAE模式,同时在该分析模式的逻辑指导下研究对应的算法技术,不仅为犯罪空间分析提供宏观指导和分析路径,也为犯罪空间分析提供具体方法。本书主要工作和创新如下:
第一,研究提出了基于空间环境数据的犯罪空间分析模式——CSAE模式。该模式在以往研究、相关领域专家经验、公安一线实战基础上提出,弥补了这一领域缺乏系统化研究范式的空白。
第二,提出了一种基于Bagging集成的特征选择方法——SEFV_Bagging算法。该算法基于“好而不同”原则选取表现较好的子学习器,利用子学习器进行空间环境因子的集成选择。通过该方法可以较为高效地从众多环境因子中筛选出引发空间内犯罪的关键因子,实现特征选择。
第三,针对犯罪空间分异格局的研究提出一种聚类集成算法——CEGRA算法。该算法是基于灰色链接矩阵构建的聚类集成算法,无论是在标准数据集上还是在本书所用数据集上,性能都表现优良,且鲁棒性好,泛化能力强,可以有效实现犯罪空间格局的划分。
通过大量实证数据的验证,本书所提的CSAE分析模式能够高效地实现基于空间环境数据的犯罪分析和预测。所提的SEFV_Bagging算法和CEGRA算法实现了环境因子的筛选和空间分异格局的划分,为犯罪空间分析研究提供了一套行之有效的分析模式和与之匹配的算法技术。
犯罪空间分析;空间环境因子;空间分异;聚类集成;特征选择;空间自相关
6.总结与展望
6.1 本书总结
本书在以往犯罪环境学相关研究和公安一线实战经验的基础之上,以环境数据为研究视角开展犯罪空间分析,对系统化的犯罪空间分析模式和该模式下配套分析算法展开研究,主要的工作和创新点如下:
构建系统化的基于环境数据的犯罪空间分析模式的框架——CSAE模式。该分析模式第一步是针对影响犯罪空间内发案的环境因子进行筛选,提出开展犯罪空间分析要从地理、经济、交通、人口、社会资源五大方面环境因子进行分析,并在此基础上针对每类环境因子给出了具体可参考的指标项;第二步是基于筛选出的空间环境因子对犯罪空间分异格局进行探究,得到不同的犯罪空间类型;第三步是分别针对每种类型的犯罪空间开展环境对犯罪作用机理探索。该分析模式框架的提出弥补了该领域内系统化研究框架的空白,为犯罪空间分析提供了一套系统化的新思路。
在研究框架提出之上,本书又提出一种基于Bagging集成的选择性特征筛选集成算法(SEFV_Bagging),通过该种方法可以较为高效地得出引发犯罪的空间环境数据。即实现分析模式第一步——环境因子筛选。实验结果显示SEFV_Bagging算法具有较好的泛化能力和稳定性,对于环境因子的筛选表现出良好的性能。
针对犯罪空间分异格局的研究提出一种聚类集成算法——CEGRA聚类集成法,实现对犯罪空间进行划分。它是基于灰色链接矩阵聚类集成方法,具有聚类效果优良、准确性高的优点,且应用该方法进行聚类集成的鲁棒性较好,稳定性表现突出,同时有效避免了类标签的匹配问题,大大降低了算法复杂度。
本书在所提的CSAE框架下,分别从宏观尺度和微观尺度开展实证研究,尤其是微观尺度的实证研究弥补了该分析尺度的研究空白。
最后在犯罪空间分异格局下开展不同类型犯罪空间的发案预测分析,为以往的主观办案经验提供科学依据,并为实战工作提供精确指导。
6.2 未来展望
本书提出了犯罪空间分析的模式框架,并针对这一框架的具体应用提供了相应的算法技术。由于数据和相关领域知识的欠缺,本书的研究内容有待进一步深化,还存在以下不足之处:
一是犯罪空间分析模式的框架还需要更多的理论层次的探索。该框架的构建主要依托于以往的片段化研究和一线实战主观经验,缺乏相关的理论探索,使得这一框架还存在不完善之处,未来将针对这一框架进行细化和完善。
二是影响犯罪空间内发案的环境因子指标项还需进一步扩展。由于专业领域知识的限制,对于影响发案的因子指标还有很多,未来需要更多的研究和探索,获得更加系统化的因子指标。
三是本书从不同尺度开展实证研究,验证了所提框架的科学性和可用性,下一步可以尝试从更加微观的尺度进行研究。
四是本书对犯罪空间环境因子的提取和犯罪空间分异格局进行了探讨,而对于犯罪空间内的发案预测和分析还不足够深入,也缺乏背后机理的探究。下一步可以尝试依托知识图谱和专家系统技术,更加深入地探究发案背后的机理。
五是针对犯罪空间内的发案,本书只提供了一套分析框架和算法,没有给出相应的防控对策。未来可以尝试利用最优规划模型,针对犯罪空间的防控提出空间规划设计建议和警力资源部署方案。
1.绪论 / 001
1.1 犯罪空间研究背景及意义 001
1.1.1 犯罪空间研究背景 001
1.1.2 犯罪空间研究意义 003
1.2 国内外犯罪空间研究现状 004
1.2.1 国外犯罪地理学研究现状 004
1.2.2 国内犯罪地理学研究现状 008
1.2.3 犯罪空间分析研究现状 011
1.3 犯罪空间主要研究内容及创新点 014
1.3.1 犯罪空间主要研究内容 014
1.3.2 创新点 016
2.相关知识及关键技术 / 018
2.1 基于环境学的犯罪空间 018
2.1.1 环境犯罪学 018
2.1.2 犯罪空间分析 020
2.2 犯罪空间数据处理的关键技术 023
2.2.1 特征工程 023
2.2.2 聚类技术 024
2.2.3 回归分析预测技术 027
2.2.4 集成学习技术 028
2.2.5 空间数据可视化技术 032
2.2.6 空间相关分析技术 033
3.基于环境数据的犯罪空间分析模式 / 036
3.1 基于环境数据的犯罪空间分析模式 036
3.1.1 空间环境分异对犯罪空间的影响 036
3.1.2 基于环境数据的犯罪空间分析模式——CSAE模式
038
3.2 犯罪空间环境影响因子的指标选择及实证研究 039
3.2.1 针对犯罪空间环境影响因子的探讨 039
3.2.2 经济因子对犯罪空间的影响 042
3.2.3交通因子对犯罪空间的影响 045
3.2.4 人口因子对犯罪空间的影响 048
3.2.5 社会资源因子对犯罪空间的影响 050
3.3 基于环境因子的犯罪空间分异及实证研究 058
3.3.1 环境因子对犯罪空间分异的影响 058
3.3.2 基于环境数据的犯罪空间分异格局 059
3.3.3 犯罪空间分异的空间分析 063
3.3.4 本章小结 066
4.基于SEFV_Bagging算法的环境因子筛选实证研究 / 067
4.1 特征选择技术及集成学习技术 068
4.1.1 特征选择技术 068
4.1.2 集成特征选择算法 069
4.2 基于SEFV_Bagging算法的犯罪空间环境因子选择 070
4.2.1 犯罪空间环境因子数据准备 070
4.2.2 SEFV_Bagging算法描述 072
4.2.3 实验结果分析 083
4.3 本章小结 094
5.基于CEGRA聚类算法的犯罪空间分异实证研究 / 096
5.1 聚类集成算法 097
5.2 灰色关联分析 099
5.2.1 灰色关联分析理 099
5.2.2 灰色关联度 099
5.3 基于灰色绝对关联度的聚类集成算法 100
5.3.1 CEGRA算法框架 101
5.3.2 灰色链接矩阵的构建 102
5.3.3 一致性函数 104
5.3.4 CEGRA算法实验分析 107
5.3.5 基于CEGRA算法的犯罪空间分异实证研究 118
6.总结与展望 / 149
6.1 本书总结 149
6.2 未来展望 150
参考文献 / 152