[发明专利]一种模拟发声方法及模拟发声系统有效

申请号：	201711079101.2	申请日：	2017-11-06
公开（公告）号：	CN108109610B	公开（公告）日：	2021-06-18
发明（设计）人：	孟猛	申请（专利权）人：	芋头科技（杭州）有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L13/033;G10L13/04;G10L25/75;G10L25/93
代理公司：	北京中原华和知识产权代理有限责任公司 11019	代理人：	寿宁
地址：	310000 浙江省杭州市余杭区***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种模拟发声方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种模拟发声方法及模拟发声系统，属于语音合成技术领域；方法包括获取一待发声文本；将待发声文本中的文字分别转化成对应的基本音子，以形成包括依序排列的多个基本音子的音子序列；于音子序列中区分出隶属于中文音标的基本音子以及隶属于英文音标的基本音子；根据对应关系将音子序列中隶属于中文音标的基本音子转换成对应的隶属于英文音标的基本音子，以形成一仅包括隶属于英文音标的基本音子的待发声序列；将待发声序列送入语音合成引擎中，以合成对应于待发声文本的一段语音并输出。上述技术方案的有益效果是：采用一个语音合成引擎实现中英文混合语音的模拟发声，降低模拟发声处理的复杂度，保证模拟发声的准确性。

技术领域

本发明涉及语音合成技术领域，尤其涉及一种模拟发声方法及模拟发声系统。

背景技术

随着计算机技术的飞速发展以及语音识别技术的日渐成熟，语音合成技术也得到了巨大的发展和进步。语音合成技术能够广泛应用到人们的日常生活中，出现了很多例如有声小说、有声新闻、天气播报以及字典朗读等的语音合成并模拟发声的应用，给人们的日常生活带来了很多便利和娱乐乐趣。

现有的语音合成技术在可懂度和区分度上都能够满足日常应用的需求，但是目前的语音合成技术通常只针对一种语音进行，例如仅针对中文或者仅针对英文。少部分同时支持中英文双语的语音合成引擎通常的做法是：对两个音色相近的中文/英文说话人，或者同一个中英文发音都很流利的说话人进行语音采样，并分别建立中文/英文语音合成模型，在语音合成的时候针对中文/英文分别套用两套语音合成模型分别进行语音合成，最后再将中文/英文的合成结果进行组合并得到最终的语音合成结果。

但是现有技术中，对于面向英美用户的英文语音合成引擎(Text To Speech，TTS)，一般很难找到音色合适又能流利说中文的英语母语的说话人，也较难找到音色与英文母语的说话人音色近似的中文说话人。因此，专用的英文语音合成引擎对于模拟中文发音的语音合成通常无能为力。

发明内容

根据现有技术中存在的上述问题，现提供一种模拟发声方法及模拟发声系统的技术方案，旨在采用一个语音合成引擎就能较好地实现中英文混合语音的模拟发声处理，降低了模拟发声处理的复杂度，并且保证模拟发声的准确性。

上述技术方案具体包括：

一种模拟发声方法，其中，设置一基于英文音标的语音合成引擎，并预先建立英文音标与中文音标之间的对应关系，还包括：

步骤S1，获取一待发声文本；

步骤S2，将所述待发声文本中的文字分别转化成对应的基本音子，以形成包括依序排列的多个所述基本音子的音子序列；

步骤S3，于所述音子序列中区分出隶属于中文音标的所述基本音子以及隶属于英文音标的所述基本音子；

步骤S4，根据所述对应关系将所述音子序列中隶属于中文音标的所述基本音子转换成对应的隶属于英文音标的所述基本音子，以形成一仅包括隶属于英文音标的所述基本音子的待发声序列；

步骤S5，将所述待发声序列送入所述语音合成引擎中，以合成对应于所述待发声文本的一段语音并输出。

优选的，该模拟发声方法，其中，所述步骤S4中具体包括：

步骤S41，判断隶属于中文音标的所述基本音子的类别：