[发明专利]视频生成方法、视频生成装置、电子设备、存储介质有效
申请号: | 202210439688.8 | 申请日: | 2022-04-25 |
公开(公告)号: | CN114786059B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 梁亚妮 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/439;G10L15/26;G06F40/284;G06F40/30;G06V20/40;G06V20/62;G06V40/16 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 廖慧贤 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 电子设备 存储 介质 | ||
本申请提供一种视频生成方法、视频生成装置、电子设备、存储介质,属于人工智能技术领域。包括:获取原始视频,将原始视频分离为音频和图像帧;对音频进行语音处理,得到第一关键词和语调属性;根据第一分类模型对图像帧进行分类,得到人物图像帧和图文图像帧;对人物图像帧进行人物表情识别,得到人物表情属性;对图文图像帧进行光学字符识别,得到第二关键词;根据第一关键词、语调属性、人物表情属性、第二关键词得到关键时间点;将关键时间点、第一关键词和第二关键词输入知识图谱,根据知识图谱输出的剪辑策略对原始视频进行剪辑处理,生成目标视频。本申请通过知识图谱输出的剪辑策略对原始视频进行剪辑,能够自动输出剪辑后的视频。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种视频生成方法、视频生成装置、电子设备、存储介质。
背景技术
目前,视频拍摄完成后,需要人工对视频进行剪辑来完成后期制作,但是视频剪辑对人工制作有一定的技术和时间要求,效率低且容易因人为操作而出错。
发明内容
本申请实施例的主要目的在于提出一种视频生成方法、视频生成装置、电子设备、存储介质,能够自动输出剪辑后的视频,降低了视频制作对于技术和时间的要求,提高视频剪辑的效率。
为实现上述目的,本申请实施例的第一方面提出了一种视频生成方法,所述方法包括:
获取原始视频,将所述原始视频分离为音频和图像帧;
对所述音频进行语音处理,得到第一关键词和语调属性;
根据预设的第一分类模型对所述图像帧进行分类,得到人物图像帧和图文图像帧;
对所述人物图像帧进行人物表情识别,得到人物表情属性;
对所述图文图像帧进行光学字符识别,得到第二关键词;
获取所述第一关键词的时间属性、所述语调属性的时间属性、所述人物表情属性的时间属性、所述第二关键词的时间属性,根据所述第一关键词对应的时间属性、所述语调属性对应的时间属性、所述人物表情属性对应的时间属性、所述第二关键词对应的时间属性得到关键时间点;
将所述关键时间点、所述第一关键词和所述第二关键词输入预先建立的知识图谱,根据所述知识图谱输出剪辑策略;
根据所述剪辑策略对所述原始视频进行剪辑处理,生成目标视频。
在一些实施例,所述对所述音频进行语音处理,得到第一关键词和语调属性,包括:
将所述音频转换为第一文本,对所述第一文本进行语义识别,得到所述第一文本中的第一关键词;
对所述音频进行语调分析,得到声纹特征,根据预设的第二分类模型对所述声纹特征进行分类,得到语调属性。
在一些实施例,所述将所述音频转换为第一文本,对所述第一文本进行语义识别,得到所述第一文本中的第一关键词,包括:
根据预设的语音识别模型对所述音频进行语音识别,将所述音频转换为对应的所述第一文本;
对所述第一文本进行分词处理,得到第一单词序列;
对所述第一单词序列中每个单词进行词性标注,得到所述第一单词序列中每个所述单词的单词词性;
根据所述单词词性对所述第一单词序列进行词性还原,得到第二单词序列;
对所述第二单词序列进行语义识别,得到所述第一文本中的第一关键词。
在一些实施例,所述对所述人物图像帧进行人物表情识别,得到人物表情属性,包括:
对所述人物图像帧进行人脸对齐处理,在所述人物图像帧中定位人脸特征点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210439688.8/2.html,转载请声明来源钻瓜专利网。