[发明专利]一种中文事件事实性识别方法和系统有效
申请号: | 201611170133.9 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106844448B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 何天雄;李培峰;朱晓旭;朱巧明;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06F16/36 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 李阳 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种中文事件事实性识别方法和系统,利用事件事实性信息和它们之间的联系,采用机器学习和推理相结合的方法来识别中文事件的事实性。本发明的方法和系统,与现有的方法和系统相比,总体的识别性能有所提升,同时,在处理类别的不均衡问题上有更好的效果,尤其在事件数目较少的类别的事实性识别上有明显的性能提升。 | ||
搜索关键词: | 一种 中文 事件 事实性 识别 方法 系统 | ||
【主权项】:
一种中文事件事实性识别方法,其特征在于:用于识别中文事件的事实性,包括步骤:S10、从预先标注了各类事实性信息的标注语料库中抽取中文事件的事实性相关信息及其真实事实性构造基本的标注语料集合;从预先标注了各类事实性信息的测试语料库中抽取中文事件的事实性相关信息构造基本的测试语料集合;S20、在标注语料集合上,针对每个中文事件的事实性相关信息,使用规则的方法,进行特征的处理、转化和融合,得到一系列事实性相关特征,再加入事件的真实事实性,构造出标注语料特征集合;在测试语料集合上,针对每个中文事件的事实性相关信息,使用相同规则的方法,进行特征的处理、转化和融合,得到一系列事实性相关特征,构造出测试语料特征集合;S30、根据标注语料特征集合中各个事件的特征,训练一个最大熵事件事实性识别模型,再利用最大熵事件事实性识别模型识别测试语料特征集合中事件的事实性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611170133.9/,转载请声明来源钻瓜专利网。