[发明专利]确定语料与实体的相关性的方法和装置及分类器训练方法有效
申请号: | 201210212662.6 | 申请日: | 2012-06-21 |
公开(公告)号: | CN103514194A | 公开(公告)日: | 2014-01-15 |
发明(设计)人: | 张姝;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李春晖;李德山 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种确定语料与实体的相关性的方法和装置及分类器训练方法。所述确定相关性的方法包括:利用通用分类器基于从作为未标注语料的第二组语料提取的通用特征对第二组语料进行分类,以确定第二组语料中的每个语料与第一给定实体的相关性,从而得到作为对第二组语料的标注结果的机器标注语料;基于所述通用特征和从机器标注语料中选取的与第一给定实体相关的补充特征,结合实体名称相关的启发式规则,利用机器标注语料,训练针对第一给定实体的自适应分类器;以及基于从第一组语料提取的通用特征和所述补充特征,结合实体名称相关的启发式规则,利用训练好的自适应分类器,确定第一组语料中的每个语料与第一给定实体的相关性。 | ||
搜索关键词: | 确定 语料 实体 相关性 方法 装置 分类 训练 | ||
【主权项】:
一种用于确定第一组语料中的每个语料与第一给定实体的相关性的方法,包括:利用通用分类器基于从作为未标注语料的第二组语料提取的通用特征对所述第二组语料进行分类,以确定所述第二组语料中的每个语料与所述第一给定实体的相关性,从而得到作为对所述第二组语料的标注结果的机器标注语料;基于所述通用特征和从所述机器标注语料中选取的与所述第一给定实体相关的补充特征,结合实体名称相关的启发式规则,利用所述机器标注语料,训练针对所述第一给定实体的自适应分类器;以及基于从第一组语料提取的通用特征和所述补充特征,结合实体名称相关的启发式规则,利用训练好的所述自适应分类器,确定第一组语料中的每个语料与第一给定实体的相关性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210212662.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种圆锯片切割机
- 下一篇:一种灯罩裁边机的切边机构