[发明专利]基于卡方统计和TF-CRF改进的TF-IDF计算装置有效
申请号: | 202010783892.2 | 申请日: | 2020-08-06 |
公开(公告)号: | CN111881668B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 岳希;王如忆;唐聃;何磊;刘敦龙 | 申请(专利权)人: | 成都信息工程大学 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/242;G06F40/284 |
代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 苏丹 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于卡方统计和TF‑CRF改进的TF‑IDF计算模型包括:数据载入模块、TF‑IDF计算模块、卡方统计模块、CRF计算模块、权重计算模块、权重排序模块、权重筛选模块和特征词保存模块,其特征在于模型工作步骤如下:步骤1.建立用于保存筛选后特征词的.txt文本文件;步骤2.数据模块的载入;步骤3.进行TF‑IDF计算模块的运算;步骤4.进行卡方统计模块的运算;步骤5.进行CRF计算模块的运算;步骤6.进行权重计算模块的运算;步骤7.权重排序模块的运算;步骤8.进行权重筛选模块的运算;步骤9.进行词保存模块的运算;步骤10.将步骤2‑9运算筛选得到的筛选后特征词保存在步骤1建立的文档中。 | ||
搜索关键词: | 基于 统计 tf crf 改进 idf 计算 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010783892.2/,转载请声明来源钻瓜专利网。