[发明专利]一种通过自然语言实现结构化数据搜索的方法有效
申请号: | 201711015609.6 | 申请日: | 2017-10-26 |
公开(公告)号: | CN107748784B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 邢加和 | 申请(专利权)人: | 江苏赛睿信息科技股份有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;陈国军 |
地址: | 211100 江苏省南京市雨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 自然语言 实现 结构 数据 搜索 方法 | ||
本发明公开了一种通过自然语言实现结构化数据搜索的方法,通过自然语言输入模块、语言解析模块、数据处理模块、输出模块实现,包括:自然语言输入模块接收用户输入的自然语言,所述自然语言为文字或语音;语言解析模块用于对所述自然语言进行解析,并将语言解析结果发送给数据处理模块;数据处理模块根据接收到的语言解析结果对待检索数据进行操作,并将操作结果发送至输出模块;输出模块将接收到的输出结果进行输出。本发明提供的一种通过自然语言实现结构化数据搜索的方法,能够通过自然语言实现对结构化数据的搜索,降低了数据检索的技术门槛,提高了数据检索的效率。
技术领域
本发明涉及信息检索领域,特别涉及一种通过自然语言实现结构化数据搜索的方法。
背景技术
目前,在结构化数据的搜索当中,仍然以编写SQL查询语句为主,对数据库的查询等操作需要操作人员具有对应软件方面的知识,熟悉数据库软件的操作,造成了数据库查询这种有较大需求的工作难以普及到个人,因此需要一种能够让不经过训练就可以对数据库进行查询的方法,用以降低数据库的使用门槛,提高数据库的使用范围。
发明内容
为解决以上问题,本发明提供一种通过自然语言实现结构化数据搜索的方法。
本发明提供的一种通过自然语言实现结构化数据搜索的方法,通过自然语言输入模块、语言解析模块、数据处理模块、输出模块实现,包括:
自然语言输入模块接收用户输入的自然语言,所述自然语言为文字或语音;
语言解析模块用于对所述自然语言进行解析,并将语言解析结果发送给数据处理模块;
数据处理模块根据接收到的语言解析结果对待检索数据进行操作,并将操作结果发送至输出模块,所述操作包括查询操作;
输出模块将接收到的输出结果进行输出。
优选的,所述查询操作,对待检索的结构化数据执行查询操作(结构化数据包括:文本文件、数据库表等),所述查询操作实施为先根据输入的自然语言中过滤条件筛选出相应的行,再根据输入的自然语言中需要的内容查询出相应的列。
优选的,
所述自然语言输入模块,包括显示设备显示的输入框,用于输入自然语言;
所述输出模块,包括显示设备显示的输出界面,用于以数字、图表、图形或数字、图表、图形的组合的方式显示输出结果;所述输出界面与所述输入框在显示设备显示的同一界面显示。
优选的,所述语言解析结果,包括关键字和每个关键字所对应的解析准确性权值。
优选的,所述语言解析模块用于对所述自然语言进行解析,包括:
语言解析模块对所述自然语言进行分词,得到分词结果;
语言解析模块对所述分词结果进行词性标注,得到标注结果;
语言解析模块对所述标注结果进行命名实体识别,得到实体识别结果;
语言解析模块依据预设的规则对所述命名实体识别结果赋予权值,得到带有权值的实体识别结果;
语言解析模块根据预设的规则选择带有权值的实体识别结果,将其设置为关键字,将其权值设置为和关键字对应的解析准确性权值。
优选的,所述语言解析模块,还用于:
对解析得到的关键字进行扩展,得到扩展后的关键字,所述扩展为根据预设的规则通过关键字获取潜在关键字,所述潜在关键字为根据预设规则获取的、与关键字的读音或形状相近的关键字;
根据预设的规则对扩展后的关键字赋予解析准确性权值,所述权值小于1。
优选的,所述潜在关键字,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏赛睿信息科技股份有限公司,未经江苏赛睿信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711015609.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于句向量的多标签公司描述文本分类方法
- 下一篇:衣橱管理方法及移动终端