[发明专利]一种基于中文分词的线索提取方法及系统在审
申请号: | 201811074803.6 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109214005A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 李志兴 | 申请(专利权)人: | 南威软件股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于自然语言处理技术领域,公开了一种基于中文分词的线索提取方法及系统,系统包括语义分词模块、线索提取模块和文本标注模块,对中文分词进行线索提取首先采用导入Asnj开源工具包调用NlpAnalysis.parse()方法将线索文本根据语义分词,并分析词性,然后将分词所得词序列结合词性提取线索价值信息,最后在文本内容中标出提取到的线索信息;同时公开一种提取方法。本发明能够根据切分出来的词性进行组合提取,大大提高了提取的灵活性和准确性,提高了工作效率,节省了时间和人力。 | ||
搜索关键词: | 线索 中文分词 词性 语义 分词 自然语言处理技术 工具包调用 分词模块 工作效率 价值信息 提取模块 文本标注 文本内容 线索信息 词序列 文本 分析 | ||
【主权项】:
1.一种基于中文分词的线索提取方法,其特征在于,所述基于中文分词的线索提取方法包括:将工程项目导入Asnj开源工具包并调用NlpAnalysis.parse()方法,并返回分词相关属性序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南威软件股份有限公司,未经南威软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811074803.6/,转载请声明来源钻瓜专利网。