[发明专利]语音查询方法、装置和电子设备有效
申请号: | 201811440115.7 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109542929B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 宋英杰;窦全胜;姜平;唐焕玲;张斌;门洪云 | 申请(专利权)人: | 山东工商学院 |
主分类号: | G06F16/2452 | 分类号: | G06F16/2452;G06F16/2455 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐彦圣 |
地址: | 264000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 查询 方法 装置 电子设备 | ||
1.一种语音查询方法,其特征在于,所述方法应用于服务器,所述方法包括:
获取用户语音,将所述语音转换成中文文本;
对所述中文文本进行处理,得到文本向量;
将所述文本向量输入至预设的转换模型中,得到输出结果;所述转换模型通过注意力模型训练得到;
将所述输出结果输入至预设的SQL语句模板中,根据预设的语义依存关系得到形式化SQL语句;
获取域信息;
根据所述域信息和所述形式化SQL语句,得到可执行SQL语句;
所述将所述输出结果输入至预设的SQL语句模板中,根据预设的语义依存关系得到形式化SQL语句的步骤,包括:
将SQL语句的自动生成问题转化为语义理解槽填充问题,利用所述输出结果,根据所述预设的语义依存关系对所述SQL语句模板进行填充,得到所述形式化SQL语句;所述SQL语句模板包括:SELECT($COL)*,($AGG$COL)*;WHERE$COL$OP$VALUE;($LINK$COL$OP$VALUE)*;
其中,所述*表示0个或多个,所述$AGG表示SQL语句中的函数;所述$COL表示数据库中的列名;所述$VALUE表示查询值;所述$LINK表示连接词;所述$OP表示比较运算符;$符号标记的部分需要根据所述转换模型的输出结果进行填充的部分;
所述根据所述域信息和所述形式化SQL语句,得到可执行SQL语句的步骤,包括:
使用标准化的SQL元素替换$COL、$OP、$AGG;找到SELECT语句中具体的列名和WHERE语句中隐藏的$COL,进行补充;找到$COL在数据库中对应的表,若分散在多个表中,找到各个表之间的关联;
根据所述域信息中各个表的表字段、字段说明、字段类型、字段常用表达、字段取值范围的信息,实现$COL、$OP、$AGG向标准化SQL元素的转化,得到所述可执行SQL语句。
2.根据权利要求1所述的方法,其特征在于,所述对所述中文文本进行处理,得到文本向量的步骤,包括:
对所述中文文本进行预处理,得到多个词汇;所述预处理包括去停词、去标点、分词;
对每个所述词汇进行词性标注,得到每个所述词汇的词性;
根据预设的规则对每个所述词汇进行编码,得到所述文本向量。
3.根据权利要求2所述的方法,其特征在于,所述根据预设的规则对每个所述词汇进行编码的步骤,包括:
对每个所述词汇执行以下处理步骤:
获取所述词汇的词性;
获取所述词汇的相邻词汇的词性;
根据所述词汇的词性和所述词汇的相邻词汇的词性,对所述词汇进行编码;
将所述中文文本的多个词汇的编码结果进行集合,得到所述文本向量。
4.根据权利要求1所述的方法,其特征在于,所述转换模型通过注意力模型训练得到的步骤,包括:
获取中文文本样本;
对所述中文文本样本进行处理,得到文本向量样本;
将所述文本向量样本输入至预先搭建的所述注意力模型中进行训练,得到所述转换模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:采用交叉验证法对所述转换模型进行调整。
6.根据权利要求1所述的方法,其特征在于,所述域信息包括数据库表结构、表字段、字段说明、字段类型、字段取值范围和字段常用表达中的多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东工商学院,未经山东工商学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811440115.7/1.html,转载请声明来源钻瓜专利网。