[发明专利]一种个股公告自然语言查询处理的方法、系统及设备有效
申请号: | 201811615557.0 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109710742B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 赵岑;陈世敏;冯采;张小平;罗广超 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个股 公告 自然语言 查询 处理 方法 系统 设备 | ||
本申请公开了一种个股公告自然语言查询处理的方法,包括:接收输入的个股公告信息的自然语言查询语句;对该自然语言查询语句进行分词处理得到关键词组;根据该关键词组确定该自然语言查询语句的类型,并根据该自然语言查询语句的类型确定该自然语言查询语句的各个组成部分;将各组成部分按照预设规则转换为预设数据交换格式的文件。本申请使得数据库能够直接读取该预设数据交换格式的文件中的信息,并根据该信息确定查询条件信息,进而根据该查询条件信息对个股公告信息进行查询,提高了用户在对个股公告数据信息进行查询时的效率。本申请同时还提供了一种个股公告自然语言查询处理的系统、设备及计算机可读存储介质,具有上述有益效果。
技术领域
本申请涉及信息转换领域,特别涉及一种个股公告自然语言查询处理的方法、系统、设备及计算机可读存储介质。
背景技术
个股公告是上市公司最权威、最及时的信息展示窗口,其内容很可能会对投资者判断公司基本面,产生重要影响。个股公告中往往包括各类精确、客观的数据信息,重要时间段及时间节点信息,很多事项的进展、运作、实施的前提条件等。
对于投资者来说,快速准确的获取到个股公告中的信息显得尤为重要,现有技术中用户通常通过输入关键字及查询条件查询数据库中的个股公告信息,系统根据接收到的关键字在数据库中进行匹配,将包括该关键字且满足该查询条件的所有数据信息进行输出。而随着互联网技术的发展,互联网上的信息量呈爆炸式增长,个股公告的数量太过庞大,这使得用户想查询到某一个或某一类个股公告信息时,需要输入多个关键字及查询条件,使得个股公告信息的查询过程较为复杂,且需要用户具有一定的数据库操作能力,查询效率较低。
因此,如何提高个股公告信息的查询效率是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种个股公告自然语言查询处理的方法、系统、设备及计算机可读存储介质,用于提高个股公告信息的查询效率。
为解决上述技术问题,本申请提供一种个股公告自然语言查询处理的方法,该方法包括:
接收输入的自然语言查询语句;
对所述自然语言查询语句进行分词处理得到关键词组;
根据所述关键词组确定所述自然语言查询语句的类型,并根据所述自然语言查询语句的类型确定所述自然语言查询语句的各个组成部分;
将各所述组成部分按照预设规则转换为预设数据交换格式的文件;
获取所述预设数据交换格式的文件中的查询条件信息,并根据所述查询条件信息对个股公告信息进行查询。
可选的,对所述自然语言查询语句进行分词处理得到关键词组,包括:
对所述自然语言查询语句进行初始匹配,得到初始组成部分;
根据所述初始组成部分对预设类型进行筛选,确定所述自然语言查询语句的类型的初始范围;
调用句法分析工具对所述自然语言查询语句进行分词处理得到关键词组;
所述根据所述关键词组确定所述自然语言查询语句的类型,并确定所述自然语言查询语句的各个组成部分对应包括:
根据所述关键词组在所述初始范围内确定所述自然语言查询语句的类型;
根据所述自然语言查询语句的类型确定所述自然语言查询语句除所述初始组成部分之外的其它组成部分。
可选的,所述自然语言查询语句的组成部分包括事件时间、事件类型、标的物。
可选的,当所述自然语言查询语句的组成部分还包括事件属性时,确定所述自然语言查询语句的各个组成部分,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811615557.0/2.html,转载请声明来源钻瓜专利网。