[发明专利]语音对话系统、终端装置和数据中心装置有效

专利信息
申请号: 201310095196.2 申请日: 2013-03-22
公开(公告)号: CN103366729A 公开(公告)日: 2013-10-23
发明(设计)人: 高桥润 申请(专利权)人: 富士通株式会社
主分类号: G10L13/00 分类号: G10L13/00;G10L15/26
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 康建峰;杨华
地址: 日本神*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种语音对话系统,包括数据中心装置和终端装置。数据中心装置获取对在对来自终端装置的语音数据所作的语音识别处理中获得的请求信息的回答信息,创建包括回答信息的脚本,创建关于回答信息的第一合成语音数据,将第一合成语音数据发送至终端装置,并当在创建第一合成语音数据中创建第一合成语音数据时将脚本发送至终端装置。终端装置创建与接收到的脚本中的回答信息有关的第二合成语音数据,接收第一合成语音数据,基于对第一合成语音数据的接收是否完成的判断结果来选择第一合成语音数据和第二合成语音数据中的一个,并再生语音。
搜索关键词: 语音 对话 系统 终端 装置 数据中心
【主权项】:
一种语音对话系统,包括:数据中心装置,所述数据中心装置接收从终端装置发来的说话声的语音数据,对所述语音数据施加语音识别处理,以获取由所述语音数据所表达的请求信息,从信息源获取对所述请求信息的回答信息,创建包括所述回答信息的脚本,创建第一合成语音数据,所述第一合成语音数据表达发出所述回答信息的声音的合成语音,将在所述创建所述第一合成语音数据中创建的所述第一合成语音数据发送至所述终端装置,并且当在所述创建所述第一合成语音数据中创建所述第一合成语音数据时将所述脚本发送至所述终端装置;以及所述终端装置,所述终端装置获取所述说话声的输入,以将所述说话声转换成表达所述说话声的语音数据,将所述说话声的语音数据发送至所述数据中心装置,接收从所述数据中心装置发来的所述脚本,创建第二合成语音数据,所述第二合成语音数据表达发出包括在接收到的所述脚本中的所述回答信息的声音的合成语音,接收从所述数据中心装置发来的所述第一合成语音数据,判断所述第一合成语音数据的接收是否完成,以基于所述判断的结果来选择所述第一合成语音数据和所述第二合成语音数据中的一个,并且输出由在所述判断中选择的合成语音数据所表达的合成语音,其中,所述数据中心装置和所述终端装置经过通信网络而连接。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310095196.2/,转载请声明来源钻瓜专利网。

同类专利
  • 音频源的直接选择-201580010911.5
  • N·B·帕蒂尔;R·D·克里米恩;D·W·勇 - 博士有限公司
  • 2015-02-26 - 2019-10-01 - G10L13/00
  • 在从用户输入接收到指示时,输出来自音频源的经排序的列表的、耳机当前连接至其的音频源的名称。每当在预定义的时间量内接收到连续指示时,输出列表中的下一无线音频源的名称。如果列表中的下一无线音频源是列表中的最后的无线音频源,并且来自用户输入的连续指示在所逝去的时间超过预定义值之前被接收到,则输出耳机当前连接至其的音频源的名称作为列表中的下一所选择的无线音频源。当大于预定义值的时间量逝去而没有来自用户输入的连续指示时,连接其名称被输出的最后的无线音频源。
  • 有声电子书的音频合成方法、电子设备及计算机存储介质-201810688295.4
  • 陈欣润;戴树颖;殷祥;杨丹;文思远 - 掌阅科技股份有限公司
  • 2018-06-28 - 2019-06-07 - G10L13/00
  • 本发明公开了一种有声电子书的音频合成方法、电子设备及计算机存储介质,该方法包括:确定有声电子书的电子书文本中包含的多个对象,以及与有声电子书相对应的多个原始音频;分别针对每个对象确定该对象所对应的原始音频,根据该对象在电子书文本中的位置以及电子书文本与该对象所对应的原始音频之间的对应关系,从该对象所对应的原始音频中提取该对象所对应的至少一个音频段;根据提取出的各个对象所对应的至少一个音频段合成与有声电子书相对应的合成音频。根据该方法,能够使用户在收听电子书的过程中可以根据自己的偏好选择不同的人来阅读同一本书,从而提升了用户体验。
  • 利用言语合成对话语进行响应的方法及装置-201480031099.X
  • 松原弘明;浦纯也;川原毅彦;久凑裕司;吉村克二 - 雅马哈株式会社
  • 2014-06-02 - 2019-04-12 - G10L13/00
  • 本发明设置有:语音输入单元(102),其经由语音信号接收话语(询问);响应产生单元(110),其创建针对所述话语的响应(回答)的语音序列;音高分析单元(106),其对所述话语的第一区间(例如,句尾)的音高进行分析;以及语音产生单元(语音合成单元(112)等),其经由语音产生由所述语音序列表示的响应。所述语音产生单元以如下方式控制整个响应的音高:使所述响应的第二区间(例如,句尾)的音高相对于所述话语的第一区间的音高实现规定的音高(例如,向下五度)。由此实现对能够给用户自然感觉的响应语音的合成。
  • 语音合成方法及系统-201210138028.2
  • 王玉平;翟鲁峰;戴林;高羽 - 上海果壳电子有限公司
  • 2012-05-04 - 2019-01-01 - G10L13/00
  • 本发明涉及一种语音合成方法及系统,所述方法包括:预设语音合成任务,外接语音合成应用调用并提交语音合成任务;对各种语音合成任务进行调配并生成经过排序的待处理语音合成任务列表;从待处理语音合成任务列表中选出排在最前的待处理语音合成任务进行当前语音合成和播报;重复上述步骤直至无语音合成任务提交且待处理语音合成任务列表为空,本发明能够将不同的外接语音合成应用中的各种语音合成需求交由一个独立的语音合成应用处理,即将语音合成归一化,外接语音合成应用如果需要用到语音合成的功能,可以通过远程调用的方式来调用语音合成应用的语音合成功能,减少资源冗余和浪费,也在一定程度上简化了外接语音合成应用的开发复杂度。
  • 大语料音库裁剪方法及系统-201510326068.3
  • 陈彬彬;高毅;于振华;王影 - 科大讯飞股份有限公司
  • 2015-06-12 - 2018-09-21 - G10L13/00
  • 本发明公开了一种大语料音库裁剪方法及系统,该方法包括:采集包含多领域的文本数据作为辅助裁剪文本;利用所述辅助裁剪文本基于决策树模型对大语料音库中的语音单元进行预选,得到预选音库;根据所述预选音库对应的决策树模型叶子节点包含的语音单元之间的相似度计算所述语音单元的裁剪得分;根据所述语音单元的裁剪得分对预选音库中的语音单元进行裁剪,得到裁剪后的大语料音库。本发明可在降低音库占用空间的同时,保证音库语音单元的覆盖度。
  • 非常短的基音周期检测和编码-201280055726.4
  • 高扬;齐峰岩 - 华为技术有限公司
  • 2012-12-21 - 2017-06-06 - G10L13/00
  • 为用于语音或音频信号的非常短的基音周期检测和编码提供了系统和方法实施例。该系统和方法包括使用时域和频域基音周期检测技术的组合在语音或音频信号中检测是否存在比常规最小基音周期限制更短的非常短的基音周期。基音周期检测技术包括使用时域中的基音相关系数和检测频域中的语音或音频信号中的低频能量的缺少。使用开始于预定义最小的非常短的基音限制(小于常规最小基音限制)的基音周期范围对检测到的非常短的基音周期进行编码。
  • 信息处理设备、信息处理方法和程序-201580027141.5
  • 桐原丽子 - 索尼公司
  • 2015-04-21 - 2017-02-22 - G10L13/00
  • [问题]提供了一种允许用户直观地识别对应于语音输出的附加信息的信息处理设备、信息处理方法和程序。[解决方案]信息处理设备设置有控制附加信息的输出的控制器,该附加信息与给定功能相关,并且不同于与给定功能相关且在包括与给定功能相关的所述语句的一系列语句中找到的语句的语音输出,附加信息的输出的所述控制是基于与定时相关的定时信息而执行的,在该定时处,进行与给定功能相关的语句的语音输出。
  • 朗读文本信息的方法及装置-201610809542.2
  • 刘洁;张军;魏先哲 - 北京小米移动软件有限公司
  • 2016-09-07 - 2017-02-08 - G10L13/00
  • 本公开是关于朗读文本信息的方法及装置。该方法包括获取待朗读输出的文本信息的文学类型;确定与所述文学类型对应的声音模型信息;当需朗读输出所述文本信息时,根据所述声音模型信息,朗读输出所述文本信息。该技术方案中,可确定与文本信息的文学类型对应的声音模型信息,并可根据声音模型信息,朗读输出文本信息,这样,不同类型的文本信息,可自适应匹配不同的声音模型进行对应的朗读输出,进一步增强了文本阅读的功能,也提高了用户体验,从而提高了朗读文本的使用率。
  • 语音库生成设备及其方法、语音合成系统及其方法-201210091240.8
  • 江源;凌震华;胡国平;胡郁;刘庆峰 - 科大讯飞股份有限公司
  • 2012-03-31 - 2016-11-09 - G10L13/00
  • 本发明提供一种语音库生成设备及其方法,所述语音库生成设备包括:语音提取装置,用于从收集的数据中提取预定发音人的语音数据;语音识别装置,用于将所述预定发音人的语音数据识别为文本;文本标注装置,用于对所述文本进行标注。以及本发明提供一种语音合成系统及其方法。由于本发明通过自动收集数据并自动处理,生成语音库,节约了大量的人力成本。此外,缩短语音合成系统的构建周期以及方便对其进行更新,并实现个性化定制。
  • 声音处理装置-201480014605.4
  • 成山隆一;石川克己;松本秀一 - 雅马哈株式会社
  • 2014-03-12 - 2015-11-11 - G10L13/00
  • 存储装置(12)针对不同的多个歌唱表现,对表示歌唱表现的歌唱表现数据(DS)和与该歌唱表现相关的属性数据(DA)进行存储。区间指定部(34)与来自使用者的指示相应地,对选择声音信号(X)的各对象区间进行指定。表现选择部(36)参照各属性数据(DA),从而针对每个对象区间,选择与来自使用者的指示(检索条件)相应的歌唱表现数据(DS)。表现赋予部(38)将表现选择部(36)针对选择声音信号(X)的各对象区间而选择的歌唱表现数据(DS)所表示的歌唱表现赋予至该对象区间。
  • 带语音合成信息的文本数据提供装置及文本数据提供方法-201280044941.4
  • 五十嵐信夫;亀島佳史;田中公司 - 日立公共系统有限公司
  • 2012-09-24 - 2014-05-28 - G10L13/00
  • 本发明提供一种能够执行就用户要求的任意文章任意朗读的操作、通过符合用户意图的操作、用户能够方便地实现语音朗读的文章文本。读取基于来自用户终端的指示信号从存储多个文本数据的数据库选择的文本数据,判别构成文本数据的各文章文本,通过发音符号列生成程序,对每个文章文本生成发音符号列,在各文章文本中添加生成的每个文章的发音符号列。将在各文章文本中添加了每个文章的发音符号列的文本数据和语音变换合成程序从发送单元发送到用户终端。
  • 音频交互的消息交换-201280016476.3
  • L.艾哈拉;S.兰德里;L.斯蒂费尔曼;M.钱塔昆塔;A.萨利文;K.李 - 微软公司
  • 2012-04-02 - 2013-12-11 - G10L13/00
  • 经由语音识别、文本转语音(TTS)和检测算法的组合提供了尤其是在便携式装置中的完全免持的消息交换。在确定了音频交互模式是否适当后,可以向用户大声地朗读输入消息,并且使所述用户经由音频输入用答复消息对发送者作出响应。用户还可以被提供有按照不同通信方式(例如,呼叫)作出响应的选项,或者执行其它动作。还可以使用户使用自然语言来发起消息交换。
  • 语音对话系统、终端装置和数据中心装置-201310095196.2
  • 高桥润 - 富士通株式会社
  • 2013-03-22 - 2013-10-23 - G10L13/00
  • 一种语音对话系统,包括数据中心装置和终端装置。数据中心装置获取对在对来自终端装置的语音数据所作的语音识别处理中获得的请求信息的回答信息,创建包括回答信息的脚本,创建关于回答信息的第一合成语音数据,将第一合成语音数据发送至终端装置,并当在创建第一合成语音数据中创建第一合成语音数据时将脚本发送至终端装置。终端装置创建与接收到的脚本中的回答信息有关的第二合成语音数据,接收第一合成语音数据,基于对第一合成语音数据的接收是否完成的判断结果来选择第一合成语音数据和第二合成语音数据中的一个,并再生语音。
  • 语音聊天室的伴奏方法及装置-201310107977.9
  • 高辉荣;靳国文 - 贵阳朗玛信息技术股份有限公司
  • 2013-03-29 - 2013-07-10 - G10L13/00
  • 本发明公开一种语音聊天室的伴奏方法及装置,以提供语音聊天室质量良好的伴奏模式供用户使用。本发明公开的该伴奏方法应用于嵌入语音聊天室WEB网页的客户端插件中,所述客户端插件包括通过windows系统的hook机制被加载到伴奏播放器的进程空间中的钩子,其伴奏方法包括:在所述伴奏播放器向声卡缓存输送伴奏声音之前,通过钩子拦截伴奏声音,并将拦截的伴奏声音备份;将备份的伴奏声音与麦克风的录音进行混音;将混音数据发送给所述语音聊天室的语音服务器。
  • 信号处理装置和方法、程序、记录介质和信号处理系统-201210555393.3
  • 剑持千智;松本恭辅;高桥秀介 - 索尼公司
  • 2012-12-19 - 2013-06-26 - G10L13/00
  • 本技术涉及信号处理装置、信号处理方法、程序、记录介质以及信号处理系统。一种信号处理装置包括:特征量计算单元,计算通过第一通信路径获取的第一音频信号以及通过第二通信路径获取的、对应于第一音频信号的第二音频信号的各个特征量;音频同步处理单元,基于通过特征量计算单元计算的特征量,产生第一音频信号和第二音频信号的同步信息;以及音频合成单元,基于通过音频同步处理单元产生的同步信息,将第一音频信号与第二音频信号合成。
  • 一种基于IP网络的语音合成播放装置-201220650991.4
  • 何志勇;何星浩 - 四川理工学院
  • 2012-11-30 - 2013-06-05 - G10L13/00
  • 本实用新型提供一种基于IP网络的语音合成播放装置,该播放装置包括IP网络接口模块、语音合成模块、音频处理与功率放大集成模块和电源模块,所述的IP网络接口模块通过语音合成模块与音频处理与功率放大集成模块连接,所述的电源模块分别与IP网络接口模块、语音合成模块、音频处理与功率放大集成模块连接。利用现有的IP网络传输指令和文本数据,解决了布线施工困难,长距离传输音频信号导致的信号衰减,及在IP网络中传输音频数据量大的问题,并且在系统管理、维护、升级及稳定性方面有较大的优势。
  • 用于文本到语音转换的方法和系统-201180043239.1
  • L·J·黄;T·熊 - 索尼公司
  • 2011-06-22 - 2013-05-08 - G10L13/00
  • 一种文本到语音转换的系统和方法。在便携式装置上执行文本到语音转换的方法包括:识别用于转换到语音格式的文本的一部分,其中所述识别包括基于与用户关联的信息执行预测。在便携式装置连接到电源时,对所述文本的一部分执行文本到语音转换以产生转换的语音。把转换的语音存储在便携式装置的存储装置中。执行阅读器应用,其中接收对所述文本的一部分的叙述的用户请求。在所述执行期间,响应于用户请求从存储装置访问转换的语音,并且把转换的语音呈现给用户。
  • 基于互联网的多人异步合唱混音合成方法及合成系统-201210550248.6
  • 秦毅 - 上海音乐学院
  • 2012-12-17 - 2013-04-03 - G10L13/00
  • 本发明涉及一种基于互联网的多人异步合唱混音合成方法及合成系统,所述的合成方法包括:1)一手持移动终端向系统后台服务器发送某首歌曲的合唱公告信息;2)系统后台服务器将合唱公告信息发送给与其相连的手持移动终端,建立合唱数据库;3)手持移动终端通过库号访问合唱数据库;4)系统后台服务器在收到录音音频时,实时对其进行音质处理,生成合唱混音;5)将一个或多个合唱混音存入合唱数据库中,并将合唱数据库的当前状态分别发送至手持移动终端和Web服务器进行更新;所述的合成系统包括系统后台服务器、Web服务器和多个手持移动终端。与现有技术相比,本发明具有合唱作品音质效果好、噪音少、充分发挥网络互动性等优点。
  • 一种移动通讯终端实现语音合成的方法-201110160708.X
  • 周晓东;刘镇 - 镇江佳得信息技术有限公司
  • 2011-06-15 - 2012-12-19 - G10L13/00
  • 本发明提出了一种移动通讯终端实现语音合成的方法,移动通讯终端内的基带处理器中含有语音合成模块和pcm音频播放模块,移动通讯终端获得文本文件后,语音合成模块对文本文件的第一块文本数据进行语音合成,再送pcm音频播放模块进行播放。语音合成模块连续分块的对文本数据分块进行语音合成,合成后排队送pcm音频播放模块进行播放,从而实时实现移动通讯终端对文本的语音播放。
  • 一种基于串行存储器构建的语音合成芯片-201220151494.X
  • 何宇新;何娅玲 - 北京宇音天下科技有限公司
  • 2012-04-11 - 2012-10-24 - G10L13/00
  • 本实用新型涉及一种基于串行存储器构建的语音合成芯片,所述语音合成芯片包括语音信号处理子芯片和用于保存语音模型和字典数据的串行存储子芯片,其中,所述语音信号处理子芯片和串行存储子芯片通过多芯片堆叠方式封装在一起,获得QFP/LQFP的封装形式;所述语音合成芯片的引线数不超过64个,面积不大于10mm×10mm。本实用新型的语音合成芯片具有引线数量少、容易集成的特点,生产制作工艺更灵活,可按照行业应用特点或客户的个性化需求,进行更加灵活、个性化的定制,具有更加实用化的特点。
  • 和声合成器及声音信号的和声方法-201210068847.4
  • 陈耀柱;董明会;岑玲;李肇华 - 新加坡科技研究局
  • 2012-03-15 - 2012-09-19 - G10L13/00
  • 本发明说明了用于对声音信号进行和声的方法和声合成器。所述和声方法包括:接收输入声音信号;识别所述声音信号的音高轨迹;将和声音程矢量校准到所述输入声音信号的音高轨迹,以形成经校准的和声音高轨迹;并且根据所述经校准的和声音高轨迹来合成和声。本发明的和声方法和和声合成器适合不具备良好节奏感的歌手并且还不会牺牲和谐音的质量。
  • 一种目标语音的隐私保护方法及其系统-201210006800.5
  • 蒋斌;杨军 - 中国科学院声学研究所
  • 2012-01-11 - 2012-07-04 - G10L13/00
  • 本发明涉及一种目标语音的隐私保护方法及其系统,该方法基于目标语音信号产生干扰语音信号,并结合已有干扰存储库内干扰信号合成复合干扰声音,所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。该系统基于目标语音信号产生干扰语音信号,结合已有干扰存储库内干扰信号合成复合干扰声音,所述的目标声音和复合干扰声音由位于房间中不同位置的扬声器系统播放。干扰声音是一种复合干扰信号,包括和目标语音信号相关部分,相关部分由处理目标语音信号产生,具有干扰效率高、烦恼度低的优点;其次,干扰声音和目标声音由位于不同空间位置的扬声器系统进行播放,既达到干扰录音设备拾取声音信号,同时基本不影响会议正常进行。
  • 用于网络游戏的语音合成系统及其实现方法-201010555487.1
  • 宋永波 - 盛乐信息技术(上海)有限公司
  • 2010-11-23 - 2012-05-30 - G10L13/00
  • 本发明公开了一种用于网络游戏的语音合成系统,该系统包括个性声音参数设置模块和语音合成模块;该个性声音参数设置模块用于提供用户设置声音参数的接口,供用户设置个性化声音参数,生成声音预览和参数调整,并且保存用户最终选定的声音参数;该语音合成模块用于记录同一场景所有角色的位置信息,说话角色将说话内容以及其个性声音参数广播给一定范围内的其他角色,其他角色将说话内容合成为语音,再根据说话角色预设的个性化声音参数做变声处理,并在本地播放。此外,本发明还公开了该系统的实现方法。本发明用语音去充实游戏中的声音,提高了游戏的表现力,从本质上改善了游戏体验的效果。
  • 自动生成重读音节语音的方法和系统-201110270759.8
  • 王欢良;邹平 - 苏州思必驰信息科技有限公司
  • 2011-09-14 - 2012-05-02 - G10L13/00
  • 一种自动生成重读音节语音的系统,包括:音素定位模块,用于确定接收到的语音信号中每个音素的位置,得到每个词、音节和音素的时间边界;声学特征提取模块,用于从语音信号中提取和重读相关的特征以及频谱特征;声学特征参数修正模块,用于把输入语音特征参数调整为对应的表示给定音节重读的特征参数,并对调整后的特征参数进行平滑处理;语音重构模块,用于采用修正后的语音声学特征参数通过源-滤波器模型重新合成语音;特征变换参数库,用于存放每个音素的声学特征从非重读到重读的统计的变换矩阵参数。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top