[发明专利]视频召回方法在审
申请号: | 202111262439.8 | 申请日: | 2021-10-28 |
公开(公告)号: | CN113901269A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 彭浩 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F40/166;G06F40/194;G06F40/232 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 陈春光 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 召回 方法 | ||
1.视频召回方法,其特征在于,包括以下步骤:
步骤1、将影视数据库中的所有片名文本进行读法预处理后,提取拼音特征,所述拼音特征包括全值特征和分字特征,所述全值特征为片名文本对应的不带声调的全值拼音,所述分字特征包括片名文本对应的带声调的全值拼音、不带声调排序后的全值拼音以及不带声调的相邻字拼音列表;
步骤2、根据提取的拼音特征分别创建拼音全值召回数据库和分字拼音召回数据库,所述拼音全值召回数据库的key为片名文本的全值特征,value为全值特征相同的片名文本列表,所述分字拼音召回数据库的key为片名文本的不带声调的相邻字拼音列表的元素,value为有该元素的片名特征列表,所述片名特征包括:片名文本及其对应的带声调的全值拼音和不带声调排序后的全值拼音;
步骤3、当接收到用户输入的语音文本后,根据预设识别算法从语音文本中提取可能为片名文本的待纠正文本,并对待纠正文本进行与步骤1相同的读法预处理和拼音特征提取,得到待纠正文本所有读法对应的拼音特征;
步骤4、根据待纠正文本各读法对应的拼音特征并分别基于拼音全值召回数据库和分字拼音召回数据库进行全值特征召回和分字特征召回,得到全值特征召回结果和分字特征召回结果;
步骤5、若全值特征召回结果中有片名,则将该片名作为视频召回结果,否则,确定分字特征召回结果中各片名的相似度,并根据所述相似度确定视频召回结果。
2.如权利要求1所述的视频召回方法,其特征在于,所述确定分字特征召回结果中各片名的相似度之前还包括:
获取分字特征召回结果中各片名文本对应的不带声调的相邻字拼音列表与用户输入的语音文本对应的不带声调的相邻字拼音列表之间的共有子串数量,若所述共有子串数量小于第一预设阈值,则抛弃对应的片名,所述第一预设阈值根据待纠正文本的长度确定。
3.如权利要求1所述的视频召回方法,其特征在于,所述确定分字特征召回结果中各片名的相似度之前还包括:
获取分字特征召回结果中各片名文本与待纠正文本的文本长度差,若所述文本长度差大于第二预设阈值,则抛弃对应的片名。
4.如权利要求1所述的视频召回方法,其特征在于,所述确定分字特征召回结果中各片名的相似度之前还包括:
获取用户输入的语音文本对应的带声调的全值拼音,根据所述语音文本对应的带声调的全值拼音和分字特征召回结果中的带声调的全值拼音计算分字特征召回结果中各片名文本对应的第一拼音编辑距离评分,若所述第一拼音编辑距离评分小于第三预设阈值,则抛弃对应的片名,所述第一拼音编辑距离评分的计算公式如下:
lpn=lev(npn,tpn);
式中,lpn为第一拼音编辑距离评分,lev()为编辑距离算法,npn为分字特征召回结果中的带声调的全值拼音,tpn为语音文本对应的带声调的全值拼音。
5.如权利要求4所述的视频召回方法,其特征在于,确定分字特征召回结果中各片名的相似度的方法还包括:
计算分字特征召回结果中各片名文本对应的排序后的第二拼音编辑距离评分;
获取用户输入的语音文本对应的不带声调的相邻字拼音列表长度、分字特征召回结果中各片名文本对应的共有子串数量以及分字特征召回结果中共有子串数量的最大值;
根据第一拼音编辑距离评分、第二拼音编辑距离评分、语音文本对应的不带声调的相邻字拼音列表长度、分字特征召回结果中各片名文本对应的共有子串数量以及分字特征召回结果中共有子串数量的最大值计算分字特征召回结果中各片名文本对应的共有子串系数;
根据第一拼音编辑距离评分、第二拼音编辑距离评分和共有子串系数计算分字特征召回结果中各片名的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111262439.8/1.html,转载请声明来源钻瓜专利网。