[发明专利]一种个股公告自然语言查询处理的方法、系统及设备有效
申请号: | 201811615557.0 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109710742B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 赵岑;陈世敏;冯采;张小平;罗广超 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个股 公告 自然语言 查询 处理 方法 系统 设备 | ||
1.一种个股公告自然语言查询处理的方法,其特征在于,包括:
接收输入的自然语言查询语句;
对所述自然语言查询语句进行分词处理得到关键词组;
根据所述关键词组确定所述自然语言查询语句的类型,并根据所述自然语言查询语句的类型确定所述自然语言查询语句的各个组成部分;
将各所述组成部分按照预设规则转换为预设数据交换格式的文件;
获取所述预设数据交换格式的文件中的查询条件信息,并根据所述查询条件信息对个股公告信息进行查询;
其中,对所述自然语言查询语句进行分词处理得到关键词组,包括:
对所述自然语言查询语句进行初始匹配,得到初始组成部分;
根据所述初始组成部分对预设类型进行筛选,确定所述自然语言查询语句的类型的初始范围;
调用句法分析工具对所述自然语言查询语句进行分词处理得到关键词组;
所述根据所述关键词组确定所述自然语言查询语句的类型,并确定所述自然语言查询语句的各个组成部分对应包括:
根据所述关键词组在所述初始范围内确定所述自然语言查询语句的类型;
根据所述自然语言查询语句的类型确定所述自然语言查询语句除所述初始组成部分之外的其它组成部分。
2.根据权利要求1所述的方法,其特征在于,所述自然语言查询语句的组成部分包括事件时间、事件类型、标的物。
3.根据权利要求2所述的方法,其特征在于,当所述自然语言查询语句的组成部分还包括事件属性时,确定所述自然语言查询语句的各个组成部分,包括:
获取数据库中记录的各事件属性组,并在所述自然语言查询语句中对各所述事件属性组进行匹配并评分;
确定评分最高的事件属性组为所述事件属性。
4.根据权利要求3所述的方法,其特征在于,当所述自然语言查询语句的组成部分还包括事件过滤条件时,在确定评分最高的事件属性组为所述事件属性之后,还包括:
对所述自然语言查询语句进行句法分析得到第一分析结果;
根据所述第一分析结果确定所述事件属性的修饰词或所述事件属性的谓语及宾语为所述事件过滤条件。
5.根据权利要求2所述的方法,其特征在于,确定所述自然语言查询语句的各个组成部分,包括:
获取数据库中记录的各预设标的物,并在所述自然语言查询语句中对各所述预设标的物进行匹配并评分;
确定评分最高的预设标的物为所述标的物。
6.根据权利要求5所述的方法,其特征在于,当所述自然语言查询语句的组成部分还包括标的价格过滤条件及标的价格时间时,在确定评分最高的预设标的物为所述标的物之后,还包括:
对所述自然语言查询语句进行句法分析得到第二分析结果;
根据所述第二分析结果确定所述标的物的修饰词或所述标的物的谓语及宾语为所述标的价格过滤条件;
根据所述第二分析结果确定所述标的物的时间限制为所述标的价格时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811615557.0/1.html,转载请声明来源钻瓜专利网。