[发明专利]生成用于人工语音的话音的方法、装置和制造品在审
申请号: | 201810166331.0 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108694936A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | O.波戈雷利克 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/26;G10L17/22 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 臧永杰;闫小龙 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工语音 标识符 多个装置 制造品 话音 文本 存储标识符 可听信号 输出表示 输出设备 装置生成 生成器 | ||
本发明公开了生成用于人工语音的话音的方法、装置和制造品。一种示例装置包括存储标识符的组件,所述标识符唯一地从多个装置中标识所述装置;人工语音生成器,用以生成表示文本的第一人工语音信号,第一人工语音信号基于所述标识符而生成,第一人工语音信号以可听得见的方式不同于针对所述文本由所述多个装置中的相应装置生成的人工语音信号;输出设备,用以输出表示第一人工语音信号的可听信号。
技术领域
本公开一般涉及人工语音(artificial speech),并且更具体地涉及生成用于人工语音的话音(voices)的方法、装置和制造品。
背景技术
市场越来越多地正被智能和高度交互式设备所充满。这些系统中的许多是使用人工语音与最终用户通信的基于话音的交互式设备。示例基于话音的交互式设备包括但不限于,机器人、玩具、计算机、智能手机、平板电脑、智慧型个人助理、器具(appliances)、电视、物联网(Internet of Things, IoT)设备等。
附图说明
图1图示具有多个基于话音的交互式设备的示例系统。
图2是根据本公开的教导的具有多个基于话音的交互式设备的示例系统的框图,所述基于话音的交互式设备使用唯一的不同话音生成人工语音。
图3是根据本公开的教导的示例人工语音生成器的框图,所述示例人工语音生成器可以被用于实现图2的示例基于话音的交互式设备。
图4是可以被用于实现图3的示例人工语音生成器的示例混合器的示意图。
图5是根据本公开的教导的示例话音个性化器(voice personalizer)的框图,所述示例话音个性化器可以被用于实现图3的示例人工语音生成器。
图6是图示图3和5的示例话音个性化器的示例操作的图表。
图7是表示可以被实现为机器可读指令的示例过程的流程图,所述机器可读指令可以被执行以实现图2和3的示例人工语音生成器。
图8是表示可以被实现为机器可读指令的示例过程的流程图,所述机器可读指令可以被执行以实现图3和5的示例话音个性化器。
图9图示示例处理器系统,所述示例处理器系统被构造成执行图7和8的示例指令以实现图2和/或3的示例人工语音生成器。
具体实施方式
现在将详细地参考本公开的非限制性示例,本公开的示例在附图中被图示。以下通过参考附图来描述示例,其中同样的附图标记指的是同样的元素。当示出同样的附图标记时,对应的(一个或多个)描述不被重复,并且感兴趣的读者被指引向用于(一个或多个)同样的元素的描述的(一个或多个)之前讨论的图。
许多现有基于话音的交互式设备实现用户可以从中选择的有限数目(例如,一个、六个、十个等)的话音(例如,Siri®、Cortana®、女性、男性、机器等)。由于有限数目的话音,当用户具有许多现有基于话音的交互式设备时,可能难以或不可能以可听得见的方式(audibly)分辨他们正在与哪个基于话音的交互式设备交互。此外,虽然来自话音的有限集的现有基于话音的交互式设备能够帮助以可听得见的方式辨别设备,但话音的配置可能对于某些最终用户而言太复杂。此外,现有基于话音的交互式设备定制(customization)对于得以执行可能是昂贵的,并且可能要求持续的维护(例如,重置成工厂默认值将授权(mandate)之后的恢复,等)。又另外,虽然现有系统存在以向组动态地添加和配置基于话音的交互式设备,但这样的系统不用不同的话音配置所述基于话音的交互式设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810166331.0/2.html,转载请声明来源钻瓜专利网。