[发明专利]一种基于层次聚类的可疑纳税人检测方法无效
申请号: | 201410328004.2 | 申请日: | 2014-07-10 |
公开(公告)号: | CN104102706A | 公开(公告)日: | 2014-10-15 |
发明(设计)人: | 郑庆华;李博;杜友田 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 陆万寿 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 可疑 纳税人 检测 方法 | ||
技术领域
本发明属于计算机科学与技术中的数据挖掘子领域,涉及一种可疑纳税人的检测方法,具体涉及一种基于层次聚类的可疑纳税人检测方法。
背景技术
在真实环境的税务系统中,不同地区的税务系统之间的信息不对称,信息封闭没有统一,难以真实统计各个地区的税务数据,大量税务数据缺乏分析利用,大量偷逃骗税行为难以发现,导致税收流失率和流失税金居高不小。对税收数据进行分析,通过纳税人之间的利益关联抽取利益关联社团并最终发现和打击偷漏税行为就显得十分重要,并且成为税务分析系统的重点和难点,但现有的技术都不能有效的判断出利益关联社团中的是否存在可疑纳税人,因此迫使发现及打击偷税漏税的行为变得相当的严峻。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于层次聚类的可疑纳税人检测方法,该方法可以有效的发现利益关联社团中是否存在可疑纳税人。
为达到上述目的,本发明所述的基于层次聚类的可疑纳税人检测方法包括以下步骤:
1)获取纳税人利益网络,并从纳税人利益网络中提取出各节点对应的纳税人以及任意两个纳税人之间的利益关联程度,再采用层次聚类算法对纳税人以及任意两个纳税人之间的利益关联程度进行层次聚类,形成二叉树,然后根据纳税人和任意两个纳税人之间的利益关联程度对所述二叉树进行分割,得若干簇,其中,每次层次聚类得到的簇均记作利益关联社团;
2)从步骤1)中得到的利益关联社团中选取正常纳税人利益社团和异常纳税人利益社团,然后提取正常纳税人利益社团的特征信息及异常纳税人利益社团的特征信息,然后构建正常纳税人利益社团的特征库及异常纳税人利益社团的特征库;
3)预处理的利益关联社团包括若干纳税人利益社团,分别获取各预处理的纳税人利益社团的特征信息,然后将各预处理的纳税人利益社团的特征信息分别与正常纳税人利益社团的特征库及异常纳税人利益社团的特征库进行相似度计算,分别计算出各预处理的纳税人利益社团属于正常纳税人利益社团的概率及属于异常纳税人利益社团的概率,当预处理的纳税人利益社团属于异常纳税人利益社团的概率大于或等于异常预设阈值时或者当该预处理的纳税人利益社团属于正常纳税人利益社团的概率小于正常预设阈值时,则该预处理的纳税人利益社团中存在可疑纳税人;
4)通过步骤3)得到的各正常纳税人利益社团的特征信息及各异常纳税人利益社团的特征信息构建新的正常纳税人利益社团的特征库及异常纳税人利益社团的特征库,然后再根据新的正常纳税人利益社团的特征库及异常纳税人利益社团的特征库判断下一个预处理的利益关联社团中的各纳税人利益社团是否存在可疑纳税人。
所述特征信息包括度分布、集聚系数和平均最短路径。
本发明具有以下有益效果:
本发明所述的基于层次聚类的可疑纳税人检测方法在检测预处理的利益关联社团中是否存在可疑纳税人的过程中,先通过获取纳税人利益网络,然后采用层次聚类算法按照纳税人以及任意两个纳税人的利益关联程度进行分层聚类,然后根据分层聚类的结果得到利益关联社团,再从所有的利益关联社团中选取正常纳税人利益社团及异常纳税人利益社团,在构建正常纳税人利益社团的特征库及异常纳税人利益社团的特征库,在对预处理纳税人利益社团进行处理时,只需提取出预处理的纳税人利益社团的特征信息,然后采用相似度计算的方法分别计算出该预处理的纳税人利益社团属于正常纳税人利益社团的概率及属于异常纳税人利益社团的概率,然后再分别与正常预设阈值及异常预设阈值进行对比,从而判断出该预处理的纳税人利益社团中是否存在可疑纳税人,操作方便,简单,可信度高。
附图说明
图1为本发明中第一次检测可疑纳税人的流程图;
图2本发明中更新正常纳税人利益社团的特征库和异常纳税人利益社团的特征库的流程图。
具体实施方式
下面结合附图对本发明做进一步详细描述:
参考图1及图2,本发明所述的参考图基于层次聚类的可疑纳税人检测方法包括以下步骤:
1)获取纳税人利益网络,并从纳税人利益网络中提取出各节点对应的纳税人以及任意两个纳税人之间的利益关联程度,再采用层次聚类算法对纳税人以及任意两个纳税人之间的利益关联程度进行层次聚类,形成二叉树,然后根据纳税人和任意两个纳税人之间的利益关联程度对所述二叉树进行分割,得若干簇,其中,每次层次聚类得到的簇均记作利益关联社团;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410328004.2/2.html,转载请声明来源钻瓜专利网。