[发明专利]通过语音查询单词的系统及其方法无效
申请号: | 200910219114.4 | 申请日: | 2009-11-24 |
公开(公告)号: | CN101706797A | 公开(公告)日: | 2010-05-12 |
发明(设计)人: | 陈淮琰;刘丽 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L11/06;G10L15/02 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 商宇科 |
地址: | 710075 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 语音 查询 单词 系统 及其 方法 | ||
技术领域
本发明涉及一种通过语音查询单词的系统及其方法,尤其是一种根据接收的语音信号提供单词释义的单词查询系统及其方法。
背景技术
对外语学习者而言,携带型电子词典或在线电子词典几乎是不可或缺的学习工具;携带型电子词典与在线电子词典相较之下是各有千秋,前者拥有携带方便、可随时查询的优势,而后者则具有数据量庞大与经济实惠的优点。
但无论是使用携带型电子词典或是在线电子词典,若使用者欲查询一个只听闻其发音,却不知道其拼字的单词,就只能从发音去推敲这个单词的拼字,再输入电子词典进行查询;在使用者猜测错误情况下,电子词典将回复使用者查无此字,甚至是显示出非使用者想要的另一个单词。例如使用者原要查询一个发短音的单词[pIt∫],却因为误会而输入长音的拼法peach,此时电子词典将出现非使用者所要的单词与解释;这样的状况不仅导致查询的不便,更因为使用者采取此种试误查询方式,而导致需花费较长的时间来获取所需的单词解释,此将增加网络与查询系统的负担。此外,因携带型电子词典的键盘较小,误键率较高,将使上述的试误过程更加不便。
综上所述,可知先前技术于查询仅知其发音而不知其拼字的单词时,一直存在无法有效提供单词解释的问题,因此有必要提出改进的技术手段,来解决此问题。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出一种通过语音查询单词的系统及其方法。
本发明的技术解决方案是本发明为一种通过语音查询单词的系统,其特殊之处在于:该系统包含:音节数据库,储存有多个音节文件与对应音节文件的字母组合;音档数据库,储存有多个音文件与对应音文件的音文件关键词;字词数据库,储存有对应音文件关键词的字词数据;接收模块,用来接收语音信号;语音辨识模块,用来对语音信号进行端点检测,根据端点检测的样本,提取语音信号的特征,并根据语音信号的特征,将语音信号切分为音节;查找模块,用来在音节数据库查找出符合音节的音节文件,提取对应音节文件的字母组合,并依序拼合字母组合,产生单词;确认模块,用来确认音档数据库有符合单词的音文件关键词,并在字词数据库进一步查找对应音文件关键词的字词数据;显示模块,用来显示字词数据,所述接收模块接入语音辨识模块,所述音节数据库和语音辨识模块分别与查找模块连接,所述查找模块、音档数据库、字词数据库和显示模块分别与确认模块连接。
上述语音辨识模块用来根据浊音特色进行语音辨识。
上述语音辨识模块在切分语音信号为音节后,包含用来对音节进行修整。
上述系统还包含输出模块,用来输出对应音文件关键词的音文件。
上述系统可延伸应用至主从式架构。
本发明还提供一种通过语音查询单词的方法,其特殊之处在于:该方法包含下列步骤:
1)建立包含有多个音节文件与对应音节文件的字母组合的音节数据库、多个音文件与对应音文件的音文件关键词的音档数据库,以及包含有对应音文件关键词的字词数据的字词数据库;
2)接收语音信号;
3)对语音信号进行端点检测;
4)根据端点检测的样本,提取语音信号的特征;
5)根据语音信号的特征,将语音信号切分为音节;
6)在音节数据库查找出符合音节的音节文件,提取对应音节文件的字母组合;
7)依序拼合字母组合,产生单词;
8)确认音档数据库包含有符合单词的音文件关键词;
9)在字词数据库查找对应音文件关键词的字词数据;
10)显示字词数据。
上述步骤4)中端点检测的样本用来作为判断浊音的依据。
上述步骤5)中将语音信号切分为音节后,修整音节。
上述步骤10)之后还包含步骤11)输出对应音文件关键词的音文件。
上述方法可延伸应用至主从式架构。
本发明提供的通过语音查询单词的系统及其方法,具有对接收的语音信号进行语音辨识,以及对语音辨识产生的音节进行分析比对的技术手段;通过此技术手段可解决先前在查询仅知其发音而不知其拼字的单词时,一直存在的无法有效提供单词解释的问题,达成通过语音查询单词并有效提供单词释义的技术功效。
附图说明
图1为本发明系统方块示意图;
图2为本发明方法步骤流程图;
图3为本发明字词数据库其数据示意图;
图4为接收语音信号示意图;
图5.1为确认有对应字词数据的音文件接口示意图;
图5.2为确认无对应字词数据的音文件接口示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910219114.4/2.html,转载请声明来源钻瓜专利网。