[发明专利]歌词生成模型训练方法、歌词生成方法、装置及存储介质在审
| 申请号: | 202110286728.5 | 申请日: | 2021-03-17 |
| 公开(公告)号: | CN115114474A | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 韩文静;王晓瑞 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F40/211 |
| 代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 歌词 生成 模型 训练 方法 装置 存储 介质 | ||
本公开提供一种关于一种歌词生成模型训练方法、歌词生成方法、装置及存储介质,涉及人工智能领域。包括:获取第一歌词文本,第一歌词文本至少包括一首或多首歌曲的歌词、歌曲中每一句歌词的字数信息;将第一歌词文本转换为训练字符;根据训练字符,对预设网络模型进行训练,得到歌词生成模型;歌词生成模型用于根据输入的待生成歌词的约束条件,生成与约束条件对应的待生成歌词,约束条件至少包括:输入文本以及待生成歌词中每句歌词的字数,待生成歌词包括输入文本,歌词生成模型具备识别训练字符的能力。基于此,歌词生成模型训练装置可以通过在训练歌词文本中增加字数信息,提高歌词生成模型生成符合字数要求的歌词的能力。
技术领域
本公开涉及人工智能领域,尤其涉及一种歌词生成模型训练方法、歌词生成方法、装置及存储介质。
背景技术
歌词创作是音乐创作的重要组成部分,当前歌词的创作主要途径为人工创作。人工创作的过程依赖创作人员的知识积累和创作能力,创作歌词花费时间较长。
相关技术中,提出了采用人工智能(Artificial Intelligence,AI)技术生成歌词文本的方法。采用AI技术中的网络模型生成歌词为当前的常用方法。当前训练网络模型时,通常是将获取到的歌词文本输入到网络模型中进行训练,并根据训练好的网络模型生成歌词。
但是,由于歌词通常有严格的格式要求(例如,句数,字数等要求),当前训练神经网络模型时未考虑歌词的格式要求,导致训练好的神经网络模型不能严格的根据待生成歌词的格式生成歌词。
发明内容
本公开提供一种歌词生成模型训练方法、歌词生成方法、装置及存储介质,以至少解决相关技术中神经网络模型不能严格根据待生成歌词的格式生成歌词的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种歌词生成模型训练方法,包括:
获取第一歌词文本,所述第一歌词文本至少包括一首或多首歌曲的歌词、所述歌曲中每一句歌词的字数信息;
将所述第一歌词文本转换为训练字符;
根据所述训练字符,对预设网络模型进行训练,得到歌词生成模型;所述歌词生成模型用于根据输入的待生成歌词的约束条件,生成与所述约束条件对应的所述待生成歌词,所述约束条件至少包括:输入文本以及所述待生成歌词中每句歌词的字数,所述待生成歌词包括所述输入文本,所述歌词生成模型能够识别训练字符。
可选的,所述获取第一歌词文本,包括:
获取第二歌词文本,所述第二歌词文本包括所述一首或多首歌曲的歌词;
在第二歌词文本中添加特征信息,得到处理后的文本;特征信息至少包括所述歌曲中每一句歌词的字数信息,所述字数信息用于标识字的数量;
根据处理后的文本,确定所述第一歌词文本。
可选的,所述特征信息还包括以下任一项:所述歌曲中每一首歌曲的句数信息、所述每一首歌曲的开始信息、所述每一首歌曲的结束信息。
可选的,所述根据处理后的文本,确定所述第一歌词文本,包括:
将所述处理后的文本中的每一句歌词的文字倒序排列,以得到倒序排列后的文本;
确定所述倒序排列后的文本为所述第一文本。
可选的,所述根据所述训练字符,对预设网络模型进行训练,得到歌词生成模型,包括:
根据所述预设网络模型的处理长度,从所述训练字符中获取输入序列和输出序列,所述输入序列和所述输出序列的长度小于或等于所述处理长度,所述输出序列包括所述训练字符中输入序列中每一字符的下一个字符;
根据所述输入序列和所述输出序列,对所述预设网络模型进行训练,得到所述歌词生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110286728.5/2.html,转载请声明来源钻瓜专利网。





