基于改进K-Means聚类算法的互联网涉烟违法犯罪区域划分研究

基于改进K-Means聚类算法的互联网涉烟违法犯罪区域划分研究吕飞---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除------本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---[摘要]近年来,利用物流和快递从事卷烟非法交易的违法犯罪活动日益猖獗,随着烟草行业打假打私力度不断增大,各级烟草专卖管理部门在物流寄递渠道均查获了大量的涉烟案件数据。由于目前行业内外鲜有对该类案件进行大数据分析研究,因此,本文以理论结合实际,首先介绍了数据挖掘技术中聚类算法相关理论,重点对经典K-Means算法及其相关改进算法进行了研究,然后以W市烟草专卖局的真实涉烟案件数据进行实验仿真,通过分析历史各类案发地址等信息,帮助烟草专卖执法人员在涉烟案件经营侦办、卷烟消费市场监管等方面开展精准打击、重点治理。[关键词]烟草专卖;市场监管;数据挖掘;聚类分析;K-Means算法doi:10.3969/j.issn.1673-0194.2019.22.077[]TP391.3[]A[]1673-0194(2019)22-0-050引言近年来,不法分子利用物流寄递渠道,将非法卷烟销往全国各地,严重干扰了正常卷烟市场秩序,使国家税收流失,消费者利益受到侵害。为进一步加强对物流寄递领域涉烟违法行为的监管,自2016年起,烟草行业逐渐加大了对利用互联网制售假冒卷烟犯罪活动的打击力度,积累了大量的物流寄递渠道涉烟案件数据。但是,由于缺少大数据的整理整合以及内在价值的挖掘分析能力,在目前的烟草专卖市场监管和案件侦办工作中,“数据丰富、情报匮乏、手段单一”的现象仍然存在。如何有效利用这些历史案件数据,全面、客观、系统地挖掘互联网涉烟案件线索,深入拓展卷烟市场监管的新领域,以实现新时期烟草专卖管理的高质量发展,是目前迫切需要研究的课题。数据挖掘作为当前一种新颖高效的数据分析手段,如今被广泛应用在各行各业,例如数据库营销、客户关系管理、顾客行为预测及市场趋势预测等,在公安部门情报侦察、案件侦办领域也发挥着举足轻重的作用。因此,利用数据挖掘方法对物流寄递渠道的海量涉烟案件数据进行深入研究,充分挖掘犯罪数据中的犯罪规律、行为特---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---征等情报价值,给烟草专卖市场监管提供帮助,是让沉淀的历史案件数据发挥最大价值的有效途径。对于如何运用大数据分析方法对烟草专卖管理领域的案件数据进行价值挖掘,行业内外鲜有相关研究,而采用类似方法的研究课题大多集中在卷烟营销领域。本文基于数据挖掘中的聚类分析K-Means算法,围绕互联网涉烟案件中的大量案发地址数据,开展智能化自动分类和辅助预警,以帮助一线烟草专卖执法人员迅速了解和掌握管辖市场的违法犯罪活动高发区域和活动中心,准确开展市场信息分析,全面推动卷烟市场监管由“人工经验”向“数字决策”转变。1聚类算法概述1.1聚类算法聚类算法是一种非监督机器学习算法,实质是按照特定的标准把一组数据对象划分成若干类子集或簇的过程,使同一个子集或簇的数据对象相似度尽可能大,不同子集或簇的数据对象差异性也尽可能大。即聚类后具有相似属性的数据对象尽可能聚到一起,不同的数据对象尽量分离。聚类算法有很多种,分为划分法、层次法、基于密度的方法、基于网格的方法、基于模型的方法等。每一类中都有目前广泛应用的算法,例如,划分方法中的K-Means聚类算法、层次方法中的凝聚型层次聚类算法、基于密度方法中的DBSCAN聚类算法等。1.2经典K-Means算法经典K-Means算法由于简单易实现且效率高,是聚类算法中最流行、使用最广泛的算法。该算法主要采用距离作为相似性的评价指标,认为子集或簇是由距离靠近的对象组成,最终目标是获得紧凑且独立的子集或簇。即以k为参数,把n个对象分成k个子集或簇,使子集或簇内具有较高的相似度,而子集或簇间的相似度较低。经典K-Means算法主要分为4个步骤。步骤1:从样本数据集中随机抽取k个值作为初始簇的质心。步骤2:将每个剩余的样本数据划分到距离最近质心所在的簇。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---步骤3:重新计算每个簇内样本...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?