[发明专利]一种词权重类别的获得方法及装置有效
申请号: | 201611033877.6 | 申请日: | 2016-11-15 |
公开(公告)号: | CN106557465B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 李莉;司华建;李宝善;赵乾 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/216 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种词权重类别的获得方法及装置,方法包括:获得目标词;提取所述目标词的词特征,所述词特征包括词向量及互信息;利用预设的词集分类器根据所述词向量及互信息,对所述目标词进行分类,得到所述目标词的初始权重类别;其中,所述词集分类器是对历史语料集合通过语料词特征提取进行构建得到。本申请通过预先基于历史语料集合的语料词特征构建词集分类器,进而在对目标词进行分类时,首先提取目标词的词向量及互信息等词特征,进而再利用词集分类器根据这些词特征对目标词进行分类,进而得到目标词的初始权重类别,无需人工对目标词的权重类别的手动标注,节省大量的人力消耗,从而提高效率。 | ||
搜索关键词: | 一种 权重 类别 获得 方法 装置 | ||
【主权项】:
一种词权重类别的获得方法,其特征在于,包括:获得目标词;提取所述目标词的词特征,所述词特征包括词向量及互信息;利用预设的词集分类器根据所述词向量及互信息,对所述目标词进行分类,得到所述目标词的初始权重类别;其中,所述词集分类器是对历史语料集合通过语料词特征提取进行构建得到。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611033877.6/,转载请声明来源钻瓜专利网。