[发明专利]中文电脑的汉语语音输入系统及其方法无效
| 申请号: | 94102358.3 | 申请日: | 1994-03-03 |
| 公开(公告)号: | CN1063554C | 公开(公告)日: | 2001-03-21 |
| 发明(设计)人: | 李琳山 | 申请(专利权)人: | 李琳山 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 程天正,王忠忠 |
| 地址: | 中国*** | 国省代码: | 台湾;71 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 中文 电脑 汉语 语音 输入 系统 及其 方法 | ||
1.一种汉语语音输入方法,用以将任意文句的汉语语音直接转换成相对应的中文文字,所述方法包括声音处理过程以及语言解码过程两大部分,其特征在于,所述声音处理过程包括步骤:
(1)利用“段落统计模型”将每一音节的声音切成复数个段落;
(2)在训练程序中求出每一段落中声音特征参数的统计分布并建成模型;
(3)辨认时也将未知语音切成复数个段落,以计算出未知语音针对每一音节及声调的机率;和
(4)由该机率决定辨认结果;所述语言解码过程针对所述声音处理过程送来的一连串音节进行的处理包括步骤:
以“马可夫中文语言模型”中大量训练用文字档案所计算出之词与词前后相连出现在文句中的次数及机率,以及每一个词出现的频率以找出所对应的文字。
2.根据权利要求1所述的方法,其特征在于,所述“马可夫中文语言模型”是以“词”为基础、但以“字”来计算机率的“马可夫中文语言模型”。
3.根据权利要求1所述的方法,其特征在于,所述以“词”为基础、以“字”来计算机率的“马可夫中文语言模型”是将输入的音节串所对应的同音字一一分割为若干个词,但根据两两相连的词之间相连的词头字及词尾字相连出现的机率,并比较每一个词出现的频率及前后文关系判断该音节的字。
4.根据权利要求1所述的方法,其特征在于,所述“段落统计模型”的训练方式包含下列步骤:
(1)若某一单音节α的总长度为T个音框,则将该单音节分为N段,每一段含有T/N个音框;
(2)使用者重覆念该单音节数次,长度虽不尽相同,但同样等分成N段;
(3)将所有上述单音节的第一段音框的特征向量合在一起,训练成第一段的状态;
(4)将所有上述单音节的第二段音框的特征向量混合在一起,训练成第二段的状态,依此类推,训练出N个状态;
(5)上述每个状态以M个高斯机率混合来描述,以上述音框的特征向量训练各个高斯机率的参数;和
(6)上述M个状态即构成该音节α的“段落统计模型”。
5.根据权利要求4所述的方法,其特征在于,其中该“段落统计模型”训练法尚包含“分段共用”训练法,该方法系将输入之单音节分为N段,该N段的前面几段描述声母部分,后面几段描述韵母部分,因此可利用此两部份分别训练其他有相同声母或韵母的单音节的相关声母与韵母各段的状态。
6.根据权利要求4所述的方法,其特征在于,所述“段落统计模型”的辨认方法包含下列步骤:
(1)使所有的408个基本单音节都训练成“段落统计模型”;
(2)将输入的未知音β分成N段;
(3)该N段中的每一段的每一个音框的特征向量分别代入某个音节的“段落统计模型”的该段状态的M个高斯机率混合中,以计算机率;
(4)将各段的机率相乘,即得到该未知音β相对于上述音节的“段落统计模型”的机第;和
(5)依上述方法计算该未知音β相对于所有408个基本单音节的“段落统计模型”的机率,比较后机率最高的“段落统计模型”所对应的基本单音节,即是辨识结果。
7.根据权利要求1所述的方法,其特征在于,所述“中文语言模型”尚可用于部份更正声音处理部分的错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李琳山,未经李琳山许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94102358.3/1.html,转载请声明来源钻瓜专利网。





