[其他]数字语音音调变换的方法及装置无效

专利信息
申请号: 87100209 申请日: 1987-01-10
公开(公告)号: CN87100209A 公开(公告)日: 1987-10-21
发明(设计)人: 潘建平;胡南钟;杜根源;曹彬石;黄昭鸣 申请(专利权)人: 上海工业大学
主分类号: G10L5/04 分类号: G10L5/04
代理公司: 上海工业大学专利事务所 代理人: 陶鑫良,贾泽才
地址: 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数字 语音 音调 变换 方法 装置
【权利要求书】:

1、一种语音音调变换的方法,其特征是:在一帧波形内求出最相似的波形段;时域波形扩展时,在相似段波形两端附近求出波形的最匹配点,变换时将两匹配点所对应的波形段删除;时域波形压缩时,当相似段内波形是准周期的,求出段内一个周期间隔的波形匹配点,变换时将这-波形周期重复插入,当相似段内波形是非周期的,变换时将段内的波形插入一或二次。

2、如权项1所述的方法,其特征是:在时域波形扩展和压缩时,分别令最相似段的长度为所需删除的波形长度和二分之一语音帧长度;由以上长度求出每帧波形中短时平均能量和短时平均过零率的最小方差值及对应位置,对两最小方差值分别加权,根据两加权后的最小方差值和对应位置确定语音帧中的波形最相似段位置。

3、如权项1和2所述的方法,其特征是:在时域波形扩展时,在最相似段左端附近确定一定点,该点的位置为最相似段左端点位置加上前一帧波形的删除长度偏差,在相似段右端作点移动,同时求移动点所对应的波形与定点对应的波形的短时相关值,并比较得最大相关值及对应的移动点位置,这移动点和定点为波形的两匹配点,变换时将两匹配点对应的波形段删除,并令相关比较后的删除长度减去(所需的删除长度加上前一帧删除长度偏差)为本帧的删除长度偏差。

4、如权项1和2所述的方法,其特征是:在时域波形压缩时,在最相似段中所估计的波形最大周期长度内进行短时相关值比较,求出最大相关值及两个对应点的位置,再用在最相似段内的短时平均能量的均值对最大相关值归一化。

5、如权项1、2和4所述的方法,其特征是:在时域波形压缩时,当归一化的最大相关值大于等于一门限时,把两对应点作为波形的匹配点,变换时把这两点对应的一个周期波形重复插入直至插入的波形长度总和接近于所需的插入长度加上前一帧波形的插入长度偏差,并令(所需插入的波形长度加上前一帧波形的插入长度偏差)减去重复插入的波形长度总和为本帧的插入长度偏差。

6、如权项1、2和4所述的方法,其特征是:在时域波形压缩时,当归一化的最大相关值小于这一门限时,若所需的插入长度加上前一帧插入长度偏差小于等于语音帧长度的一半,变换时把在最相似段内的长度等于所需插入长度加上前一帧插入长度偏差的波形一次插入;若所需插入长度加上前一帧插入长度偏差大于语音帧长度的一半,把在最相似段内的长度等于所需插入长度与前一帧插入长度偏差之和一半的波形作两次插入;并令本帧的插入长度偏差为零。

7、实施权项1语音音调变换方法的装置,其主要结构的特征是:用二至三个存贮器组交替地写入和读出数字语音数据。

8、如权项7所述的装置,其主要结构的特征是:前一存贮器组写入数据的末段与后一存贮器组写入数据的始段重叠;后一存贮器组重叠部分数据存贮的中点地址加上前一帧波形的删除或插入长度偏差为该组读出帧数据的首址。

9、如权项7所述的装置,其主要结构的特征是:存贮器组内写入的数据帧长度取决于音调变换系数,男、女声语音及被变换波形是原波形还是已被录音机回放系统扩展或压缩的波形,帧长度范围定为20~60毫秒。

10、如权项7所述的装置,其结构的特征是:在进行波形相似比较的语音被采样前用一模拟低通滤波器滤除其高频分量,并将该语音的采样速率定为写入帧语音采样速率的十分之一。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海工业大学,未经上海工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/87100209/1.html,转载请声明来源钻瓜专利网。

同类专利
  • 携带式留言定时播放机-97242844.5
  • 张展 - 张展
  • 1997-12-08 - 1999-05-19 -
  • 本实用新型公开了一种携带式留言定时播放机,其特征为受话器与话筒偏置电路连接,语言录放电路分别与话筒偏置电路、时间常数电路、音量调节功放电路、走时器相连接,走时器还与电源相连,音量调节功放电路还与扬声器相连接。本机使用方便、噪声小、语音逼真清晰,响度可调节语言录入存储掉电可保存数拾年,反复录放可达10万次以上,耗电量小,还具有性能稳定可靠,外形美观、体积小,便于携带的特点。
  • 语音合成中的语音规整方法-97116047.3
  • 张景嵩;沙海红;徐彬艳 - 英业达股份有限公司
  • 1997-08-15 - 1999-02-24 -
  • 本发明的方法是针对句子的文字内容,分析其对应的句型、词性、片语群及特殊词等,并自该规则库中检索出对应的每个音节的音节参数,进而求得一音节参数阵列,而该句子经由语音合成装置合成的WAV数据,则通过分音节模块,于其中插入音节标记,再依据上述音节参数阵列与WAV数据间的对应关系,针对所标出的每个音节进行语调类型、能量、时间长度及静音等处理,最后,再将处理后的语音数据重新整合成新的WAV数据,产生更接近自然语言的发音。
  • 波形语音合成-96193162.0
  • 安德鲁·劳里 - 英国电讯有限公司
  • 1996-04-03 - 1998-05-06 -
  • 通过在一个语音波形段的末尾和在另一个语音波形段的开头产生外推波形以产生一个具有同步音高标记的重叠区来连接语音波形段,然后求出穿过该重叠区的加权和以提供一个平滑过渡。
  • 语音合成器-96192406.3
  • 安德鲁·劳里;安德鲁·布林;彼得·杰克逊 - 英国电讯有限公司
  • 1996-03-07 - 1998-04-01 -
  • 记录的语音波形(例如,对应于语音)的各部分被进行组合,以合成单词。为了提供一种较平滑的传输,一个波形部分的每个发声部分具有调整到一预定参考电平的幅度。所使用的比例因子在每个部分之间和在发声和不发声部分之间的整个过渡区域是逐渐变化的。
  • 声音识别方法,信息形成方法,声音识别装置和记录介质-96112292.7
  • 南野活树 - 索尼公司
  • 1996-07-19 - 1997-06-11 -
  • 一种声音识别方法,其中给出多个声音识别目标字,并通过使用事先对于一个未知的输入声音信号计算的参数。向声音识别目标字加分,由此,提取和识别一个相应的声音识别目标字,其特征在于,通过使用声音识别目标字之间的相关值,将声音识别目标字构造成分层结构,并通过使用构造成分层结构的声音识别目标字的字典,对未知的输入声音信号进行分数计算。
  • 语音合成-95192141.X
  • 安德鲁·洛厄里 - 英国电讯有限公司
  • 1995-03-17 - 1997-02-26 -
  • 通过将语音信号分成一个频谱分量及一个激励分量而改变合成的语音信号的音高。在发声语音的情况中,将激励分量乘以与至少近似地对应于发声激励瞬间的音高定时标记信息同步的一系列重叠的窗口函数,以将其分成开窗口的语音段,在作用了可控制的时间位移之后重新将它们加在一起。然后重新组合频谱及激励分量。乘法以每一音高时段至少用两个窗口,各有小于一个音高时段的持续时间。作为替代,各窗口具有小于两倍定时标记之间的音高时段的持续时间并相对于定时标记不对称。
  • 一种留言器-94232024.7
  • 屈惠民 - 屈惠民
  • 1994-12-20 - 1996-09-18 -
  • 一种留言器,由语言输入电路、语言合成芯片,放大电路、开关电路、电源电路、扬声器、外壳等组成。与现有技术相比、本实用新型具有线路结构简单、体积小、生产成本低、携带使用方便的特点,可方便地应用于家庭或办公室等场所。
  • 用于连续汉语语音合成的半音节方法-95101534.6
  • 郑元成 - 郑元成
  • 1995-03-06 - 1996-07-10 -
  • 一种用于连续汉语语音合成的半音节方法,它把汉语音节分割为只包含一个音节的声母和该音节前一部分韵母的前半音节;由当前音节韵母的后一部分与下一个音节的前一部分组成的后半音节。汉语语音音节由构成该音节的前半音节和后半音节拼接而成。连续汉语语句由构成该语句中音节的前半音节和后半音节拼接而成。由汉语前半音节、后半闭音节和后半开音节组成一个包括任意汉语发音情况的汉语语音发音规则库。本发明能够合成出流畅的连续汉语语句。
  • 基音同步波形叠加汉语文语转换系统-94107920.1
  • 吕士楠;初敏;关定华 - 中国科学院声学研究所
  • 1994-08-01 - 1996-03-13 -
  • 一种由汉语全部基本音节波形采样值及其基音同步标记构成的语音库,由词调模式、重音模式和句调模式构成的韵律规则库和利用基音同步波形叠加技术,对从语音库中取出的音节波形按韵律规则进行音长、音高和音强调节,然后拼接成清晰、自然的连续语言的基音同步波形叠加汉语文语转换系统如图1所示。该系统具有设备简单;数学运算少,能实时处理;输出语音清晰、流畅,接近自然语言的特点。它适用于机场、码头和车站的自动播音,各种信息自动咨询等。
  • 语音合成器-94103582.4
  • 李至诚 - 合泰半导体股份有限公司
  • 1994-04-12 - 1995-10-25 -
  • 本发明涉及一种可程序化的语音合成器,包括有一振荡器及时序产生电路、一选择码电路、一表格码电路、一语音码电路、一数字/模拟转换电路、一控制电路及一写入电路等,以可程序化只读存储器来完成语音数据的存取工作,且结合表格式触发方式发送语音信号,因此具有较高的实用性。
  • 用于珠算出题的声音发生装置-90107703.8
  • 青木喜彦;林克彦;庄野尚道;若桑昭男 - 可乐丽股份有限公司
  • 1990-09-12 - 1994-04-20 -
  • 一种珠算问题出题用的声音发生装置,包括储存具有出题开始用音节、出题终了用音节、数值音节及单位音节的声音数据之数据存储媒体;驱动该数据存储媒体而读出声音数据之存储媒体驱动装置;将读出的声音数据储存之存储装置;控制存储媒体驱动装置而从数据存储媒体随意选择读出声音数据并将之储存于存储装置中之控制装置;及将从存储装置中读出的声音数据变换成声音而予以输出之声音输出电路。
  • 吉祥语电子礼品-93217731.X
  • 张麟祥 - 张麟祥
  • 1993-07-06 - 1994-04-06 -
  • 一种吉祥语礼品装置,由壳体、线路板、扬声器、电池、开关构成。线路板上有语言集成电路。壳体由上盖和下盖构成,上、下盖均用塑料或金属冲压而成,上盖上有凸状的吉祥文字和图案。本实用新型在打开开关后,可发出祝福性的吉祥语言。
  • 承压套筒式拉力试验机-93202116.6
  • 崔德山 - 余自强
  • 1993-01-14 - 1994-02-02 -
  • 本实用新型提供的是一种拉力试验机。它包括加力机构、固定机构和底座。加力机构和固定机构分别安装于底座的两端。加力机构与固定机构之间设置承压套筒,其加力机构包括液压装置、油缸和联于油缸活塞杆上的联接件。固定机构包括支架、安装于支架上的滚筒和滚筒上的手柄、套柱。本实用新型提供的承压套筒式拉力试验机,可以提高试验精度,安全可靠,操作方便。本实用新型由于有承压套筒5,故不需要地基,可移动试验。
  • 多用途语音处理器开发及应用板-91223955.7
  • 陈凡;罗四维 - 北方交通大学
  • 1991-08-31 - 1992-03-18 -
  • 一种用于IBM-PC系列微机的多用途语音处理器开发及应用板,它由语音处理器、音频电路、接口电路、语音选择器、语音存储器组成。这种结构可对合成语句的固定段和变化段分别处理,合理存放。并对语音录入、选择播放、分析、编辑、合成提供支持。它有结构简单、成本低、用途多等特点。它既可用于有声系统的开发,又可直接用于语音录入/播放、存储转发及合成的应用场合,如有声检测报告、语音提醒和有声CAI等方面。
  • 语音合成广告器-90224132.X
  • 刘宏彬;颜必长;胡宇;颜永红;史维崎 - 刘宏彬;颜必长;胡宇;颜永红;史维崎
  • 1990-11-27 - 1991-07-10 -
  • 本实用新型是一种语音广告器,它由麦克风1、电源开关2、扩音/录放转换键3、定时开关4、采样频道选择5、录音键6、放音键7、停止键8、定时时间调节钮9、叠层电池10、插座11、耳机插孔/稳压电源插座12、扬声器13、功放电路板14、稳压电源15、音量调节钮16和导线17组成。本广告器使用者可以根据不同场合,随时合成、存储并自动播放语音广告或其它用语,具体积小、功耗小,便于携带等优点。
  • 数字语音音调变换的方法及装置-87100209
  • 潘建平;胡南钟;杜根源;曹彬石;黄昭鸣 - 上海工业大学
  • 1987-01-10 - 1987-10-21 -
  • 本发明是语音音调变换技术。用已有方法变换得的语音会产生音素过渡等失真,这些失真在高倍数时域压缩变换时显得更为严重。本方法先将语音数据帧写入存贮器,在帧内求出语音波形的最相似段和段两端附近的波形匹配点,根据这两点以一定的速率和方式将数据读出存贮器;它克服了已有方法所产生的音素过渡等失真,并得到了良好的听觉效果。本方法及装置能使变调语音的音调得以恢复和提供特殊的语音音调效果。
  • 选择和再生语言字符的方法-86101871
  • 西奥多·E·拉森 - 英特克系统公司
  • 1986-03-24 - 1986-09-24 -
  • 一个从语言的语音表示中选择和再生语言字符的方法,本方法特别适用于有大量图形字符的语言。该方法包括显示表示没有语调的语言的所有语音的语音符号的步骤。该方法选择所要的语音以构成一字符,还显示具有所选语音的所有语调的语言字符以及选择具有确定的语音和音调组合以及所需要的具体意义的特定字符。
  • 极低数码率汉语识别声码器-85100576
  • 陈永彬 - 南京工学院
  • 1985-04-01 - 1986-08-06 -
  • 汉语识别声码器,属于汉语数字通信设备,目的是为了降低数码率,以使通信增益得到提高。本发明采用了自动分段技术、二级识别技术、建立语音库技术和多讲话者技术。硬件实现是由预处理设备、程序控制器、运算器、程序存储器、数据存储器、系数与表格存储器、语音库、及输入输出设备等组成。本发明可用于汉语数字通信中的信源终端,也可推广用于翻译机、声控打字机及人机对话装置。
  • 计算机汉语语音的合成方法-85100092
  • 茅于杭;刘伟 - 清华大学
  • 1985-04-01 - 1986-07-16 -
  • 计算机汉语语音的合成方法,可以使普通的中文计算机获得语音输出的功能,把要告诉人们的信息不仅可以由屏幕用中文的形式显示出来,或用打印机打印出来,也可以用说话的语音表示出来。它的基本内容是采用汉语拼音的方法来实现无限词汇的语音输出。机器里存有全部汉语语音的声母、韵母(包括四声的区分)语音数据,机器根据拼音规则实现拼接,合成语音。该发明可以在IBM—PC型微型机及其它兼容机上迅速实现。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top