[发明专利]文本风格处理方法、装置、电子设备及存储介质有效
申请号: | 201810943330.2 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109189985B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 申世伟 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/35;G06F16/43;G06N3/08 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 风格 处理 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种文本风格处理方法、装置、电子设备及存储介质,包括下述步骤:获取目标媒体中的文本信息,识别文本信息中文字所表达的情绪信息,根据情绪信息对目标媒体进行图像处理,以使目标媒体中的文本信息通过文字形态表征情绪信息,通过将不同的文本信息处理成不同风格化的图像,并展示在视频字幕或者音乐歌词等目标媒体中,丰富了文字信息在目标媒体的展示效果,从而提高了文字信息的可观赏性。
技术领域
本申请公开涉及文本图像处理领域,尤其是一种文本风格处理方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的不断发展,音频、视频、文字作为不同的表现形式传播的。在影视、音乐视频或者直播中,视频已经开始主导人们生活的各方各面,人们往往希望通过后期编辑视频,使得编辑后的视频更能引起用户的注意,使用户产生更大的观看视频兴趣。
一般对视频的处理很多时候只是对视频画面的处理,忽略了视频字幕或者音乐歌词等文字信息也是表达视频内容最为直观的载体之一,然而现有的文字展示风格单一、缺乏趣味性,导致视频字幕或者音乐歌词平淡无奇。
发明内容
为克服相关技术中存在的问题,本申请提供一种文本风格处理方法、装置、电子设备及存储介质。
根据本申请实施例的第一方面,提供一种文本风格处理方法,包括下述步骤:
获取目标媒体中的文本信息;
识别所述文本信息中文字所表达的情绪信息;
根据所述情绪信息对所述目标媒体进行图像处理,以使所述目标媒体中的文本信息通过文字形态表征所述情绪信息。
可选地,所述情绪信息为文本信息的情绪分类结果,所述识别所述文本信息中文字所表达的情绪信息的步骤包括:
将所述文本信息输入到预设的文本分类模型中,其中,所述文本分类模型为训练至收敛的用于文本分类的神经网络模型;
获取所述文本分类模型输出的所述文本信息的情绪分类的置信度;
当所述置信度大于预设第一阈值时,确认所述置信度所表征的情绪分类结果为所述情绪信息。
可选地,所述根据所述情绪信息对所述目标媒体进行图像处理,以使所述目标媒体中的文本信息通过文字形态表征所述情绪信息的步骤包括:
在预设的风格图片数据库中获取与所述情绪信息具有对应关系的风格图片;
将所述文本信息像素化生成内容图片;
将所述内容图片与所述风格图片输入到预设的图像融合模型中,其中,所述图像融合模型为训练至收敛的用于图像融合的神经网络模型;
获取所述图像融合模型根据所述内容图片与所述风格图片生成的融合图片,其中,所述融合图片包括所述文本信息的文字图像,且所述文字图像的文字形态表征所述情绪信息。
可选地,所述获取所述图像融合模型根据所述内容图片与所述风格图片生成的融合图片的步骤之后,还包括下述步骤:
通过格拉姆矩阵计算所述融合图片与所述内容图片之间的内容损失;
通过格拉姆矩阵计算所述融合图片与所述风格图片之间的风格损失;
通过所述内容损失与所述风格损失计算所述融合图片的总损失值;
将所述总损失值与所述图像融合模型的梯度损失函数的梯度阈值进行比对,当所述总损失值大于所述梯度阈值时,通过所述图像融合模型的反向传播算法校正所述图像融合模型中的权值,至所述图像融合模型输出的融合图片的总损失值小于或等于所述梯度损失函数的最小梯度阈值时为止。
可选地,所述总损失值的特征描述为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810943330.2/2.html,转载请声明来源钻瓜专利网。