[发明专利]自动确定机构的所属行业类别的方法、存储设备及终端有效
申请号: | 201710391930.8 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107169523B | 公开(公告)日: | 2020-07-21 |
发明(设计)人: | 谷国良;李亮;徐建华 | 申请(专利权)人: | 鹏元征信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518040 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种自动确定机构的所属行业类别的方法、存储设备及终端,方法包括:获取机构的描述内容,对机构的描述内容进行分词处理,并构建词库;从词库中提取特征词,并将特征词在机构的描述内容中的位置特征作为用于确定机构所属行业类别的附加特征;分别计算特征词的熵值以及逆向文档频率IDF值,对特征词进行两次筛选;根据预设的分类器组计算出经两次筛选后所剩下的特征词属于各行业类别的条件概率,同时结合附加特征综合分析,确定机构的所属行业类别,完成分类处理并输出结果。本发明提高了判别机构所属行业类别的准确度,提升了机构的行业类别分类效率,有效降低了机构被划分到错误行业类别的风险。 | ||
搜索关键词: | 自动 确定 机构 所属 行业类别 方法 存储 设备 终端 | ||
【主权项】:
一种自动确定机构的所属行业类别的方法,其特征在于,所述方法包括:步骤A、获取机构的描述内容,对所述机构的描述内容进行分词处理,并构建词库;步骤B、从所述词库中提取特征词,并将所述特征词在机构的描述内容中的位置特征作为用于确定机构所属行业类别的附加特征;步骤C、分别计算所述特征词的熵值以及逆向文档频率IDF值,对所述特征词进行两次筛选;步骤D、根据预设的分类器组计算出经两次筛选后所剩下的特征词属于各行业类别的条件概率,同时结合所述附加特征综合分析,确定所述机构的所属行业类别,完成分类处理并输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏元征信有限公司,未经鹏元征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710391930.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种具有除湿功能的小学生储物箱
- 下一篇:一种智能除臭衣柜