|
钻瓜专利网为您找到相关结果 99个,建议您 升级VIP下载更多相关专利
- [发明专利]一种低资源下利用迁移学习进行情感语音合成的方法-CN202010681019.2有效
-
王龙标;徐杰;党建武;贡诚
-
天津大学
-
2020-07-15
-
2023-10-17
-
G10L13/02
- 本发明公开了一种低资源下利用迁移学习进行情感语音合成的方法,包括以下步骤:步骤一,情感向量预训练:利用EMOV‑DB数据集对于一个语音情感识别模型进行训练,这一语音情感识别模型是由风格化端到端语音合成的基本方法GST+Tacotron2模型中风格向量提取部分进一步处理得到的;步骤二,语音合成模型预训练:对于基本的Tacotron2模型,利用LJSpeech‑1.1的数据集进行预训练;步骤三,进行迁移学习训练:对于基本的Tacotron2模型在编码器的结果上连接上步骤一中得到的中间结果,并进行迁移学习训练。本发明采用预训练和迁移学习的方法,能够充分利用单个说话人少量的情感数据,在一个统一的情感语音合成模型的基础上,合成出质量达到一定水平的、情感倾向明显的合成语音。
- 一种资源利用迁移学习进行情感语音合成方法
- [发明专利]一种融合显式和隐式个性化信息的对话生成方法-CN202111051850.0有效
-
王瑞芳;贺瑞芳;王龙标;党建武
-
天津大学
-
2021-09-08
-
2023-10-13
-
G06F16/332
- 本发明公开了一种融合显式和隐式个性化信息的对话生成方法,包括如下步骤:1)构建显式个性化信息提取器,利用transformer中的编码器作为上下文编码器对上下文进行编码,再利用个性化‑上下文注意力机制对给定的个性化信息进行编码得到与上下文相关的个性化信息;2)构建隐式个性化信息生成器,利用vMF分布进行抽象和采样得到隐式个性化信息;3)构建个性化信息生成器,利用隐式个性化信息进行生成,用给定的个性化信息对其进行监督,保证隐式个性化信息与上下文和显式个性化信息是相关的;4)构建回复生成器,将上述提到的显式个性化信息,隐式个性化信息以及上下文作为解码器的输入,最终得到对应的回复。提高回复中个性化的一致性,提升回复的多样性。
- 一种融合个性化信息对话生成方法
- [发明专利]基于高层信息监督的自蒸馏模型压缩算法-CN202210729125.2在审
-
徐强;王龙标;于强;党建武
-
天津大学
-
2022-06-24
-
2022-10-21
-
G06N20/00
- 本发明公开一种高层信息监督的自蒸馏模型压缩算法,主要包括构建基于ctc/conformer混合模型的teacher和student模型;预训练第一个阶段是预训练阶段,第二个阶段是NFSD将student模型的所有层两两一组进行分组,每个组内的较深层的网络输出作为另一层网络输出的指导信息,计算两层网络的均方误差损失,并求和所有组的均方误差损失,在student反向传播过程中,优化该均方误差损失和student模型本身的交叉熵损失。AFSD对于student模型的每一层,计算该层的输出与其之后的所有层的输出的相似度,并用此相似度对该层之后的所有层的输出进行加权求和,加权求和的结果作为该层的指导信息,在student反向传播过程中,优化该均方误差损失和student模型本身的交叉熵损失,直到student模型收敛。
- 基于高层信息监督蒸馏模型压缩算法
|