[发明专利]一种融合规则与深度学习的汽车新闻事件抽取方法有效
申请号: | 201810638065.7 | 申请日: | 2018-06-20 |
公开(公告)号: | CN110633409B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 黄海量;韩松乔 | 申请(专利权)人: | 上海财经大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06F40/284;G06F40/289;G06N3/045;G06N3/0442;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种融合规则与深度学习的汽车新闻事件抽取方法,包括:文本预处理步骤,获取网络新闻文本数据,包括新闻语料和百科数据,对所述网络新闻文本数据进行文本预处理,基于预处理后的新闻语料和百科数据形成训练集,对词向量和字向量进行训练;基于规则的基模型构建步骤,提取汽车行业新闻事件所需抽取的关键属性,建立适用于汽车领域的本体知识库,构建基于规则的基模型;深度学习神经网络训练步骤,搭建并训练用于判断事件类别的BiLSTM+CRF网络;事件抽取步骤,基于所述BiLSTM+CRF网络对未标注新闻语料进行识别,获取对应的事件类别。与现有技术相比,本发明具有高效、精度高、适用于汽车行业领域等优点。 | ||
搜索关键词: | 一种 融合 规则 深度 学习 汽车新闻 事件 抽取 方法 | ||
【主权项】:
1.一种融合规则与深度学习的汽车新闻事件抽取方法,其特征在于,包括:/n文本预处理步骤,获取网络新闻文本数据,包括新闻语料和百科数据,对所述网络新闻文本数据进行文本预处理,基于预处理后的新闻语料和百科数据形成训练集,对词向量和字向量进行训练;/n基于规则的基模型构建步骤,提取汽车行业新闻事件所需抽取的关键属性,建立适用于汽车领域的本体知识库,构建基于规则的基模型;/n深度学习神经网络训练步骤,搭建并训练用于判断事件类别的BiLSTM+CRF网络;/n事件抽取步骤,基于所述BiLSTM+CRF网络对未标注新闻语料进行识别,获取对应的事件类别。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海财经大学,未经上海财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810638065.7/,转载请声明来源钻瓜专利网。