[发明专利]一种基于规则与深度学习的知识抽取方法在审
申请号: | 201810505732.4 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108959375A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 孟涛;李佳静 | 申请(专利权)人: | 南京网感至察信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 南京源古知识产权代理事务所(普通合伙) 32300 | 代理人: | 郑宜梅 |
地址: | 210001 江苏省南京市秦淮区光华*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于规则与深度学习的知识抽取方法,包括以下步骤:一专家定义概念并对概念之间的关系进行定义并生成规则。二将生成的规则进行知识抽取,抽取出匹配概念和概念之间关系的文本。三将步骤二中抽取出的文本,利用深度学习方法进行训练;从而得到更多的概念和概念之间的关系。四将步骤三中得到的更多的概念和概念之间的关系,进行知识抽取,并将该抽取的结果进行标注;并对知识抽取时的精确率、召回率和F1值进行评判;所述精确率、召回率和F1值作为评价标准。五重复步骤三和步骤四,直至所述评价标准达到预设的标准。本方法能解决机器学习的冷启动问题,也能够得到未知的概念和概念间的关系,能够提高知识抽取的召回率。 | ||
搜索关键词: | 知识抽取 评价标准 取出 文本 机器学习 生成规则 专家定义 冷启动 预设 学习 标注 匹配 抽取 评判 重复 | ||
【主权项】:
1.一种基于规则与深度学习的知识抽取方法,其特征在于:包括以下步骤:步骤一:专家定义所属定义域中的概念和概念间的关系进行定义;并使用包含上下文计算符和布尔关系计算符的生成文法描述概念和概念之间的关系的规则;步骤二:基于步骤一中生成的规则进行知识抽取,抽取出匹配概念和概念之间关系的文本;步骤三:基于步骤二中抽取出的匹配概念和概念之间关系的文本,对深度学习方法进行训练;从而得到更多的概念和概念之间的关系;步骤四:基于步骤三中得到的更多的概念和概念之间的关系,进行知识抽取,并对该抽取的结果进行标注;并对知识抽取时的精确率、召回率和F1值进行评判;所述精确率、召回率和F1值作为评价标准;步骤五:重复步骤三和步骤四,直至所述评价标准达到预设的标准。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京网感至察信息科技有限公司,未经南京网感至察信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810505732.4/,转载请声明来源钻瓜专利网。
- 上一篇:数据存储方法、装置及电子设备
- 下一篇:一种数据处理方法及装置