[发明专利]一种案件语义要素的自动抽取方法在审
申请号: | 201711332273.6 | 申请日: | 2017-12-13 |
公开(公告)号: | CN107894981A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 金勇;邱爽;李力;陈云浩;朱阳光 | 申请(专利权)人: | 武汉烽火普天信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 上海精晟知识产权代理有限公司31253 | 代理人: | 冯子玲 |
地址: | 430000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种案件语义要素的自动抽取方法,(1)序列标注模块根据预先训练好的中文序列标注模型对简要案情文本进行词性标注,识别出里面的名词,动词和动名词;(2)词义相似模块利用词义相似算法丰富种子词库;(3)调优模块多次人工校准,对要素提取结果进行进一步的调优;(4)分类词库模块要素按类别形成类别词库。该案件语义要素的自动抽取方法,实现了从繁杂无规律的简要案情中,自动抽取案件语义要素,大大提升了案件语义要素提取的效率,降低了人力抽取成本,同时也可以将此系统用于公安行业的其他非结构化文本信息的语义理解分析,为案件的关联分析提供有效方法,提高办案效率。 | ||
搜索关键词: | 一种 案件 语义 要素 自动 抽取 方法 | ||
【主权项】:
一种案件语义要素的自动抽取方法,其特征在于,包括如下步骤:S1、首先根据要素可能出现的词性,利用预先训练好的序列标注模对简要案情的进行词性标注,识别出里面的名词,动词和动名词;S2、作案工具和涉案物品从名词中抽取,人工进行分类标注少数简要案情中的作案工具和涉案物品;作案手段从动词和动名词中抽取,并且还需要识别作案手段动词和名词的结合,最终形成种子词库;S3、根据人工标注的种子词库,利用词义相似算法找到更多相类似的词,以便丰富词库;由于词性标注是基于已有的简要案情进行的,为了之后新增案件语义要素抽取可以获得较高的准确率,利用相似算法获取相似词是十分必要的;S4、利用校对的词库结合已训练好的序列标注模型对所有案件的简要案情进行相关要素的抽取,对抽取的要素进行进一步调优;S5、要素按类别形成类别词库,结合序列标注算法和正则化处理方法,对新输入的简要案情文本进行自动抽取,将抽取的语义要素对应案件编号入库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火普天信息技术有限公司,未经武汉烽火普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711332273.6/,转载请声明来源钻瓜专利网。