[发明专利]一种交互式热词更新的语音识别方法与系统在审
申请号: | 202010016662.3 | 申请日: | 2020-01-08 |
公开(公告)号: | CN113178194A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 闫博群;马家旭;汪俊;李索恒;张志齐 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/10;G10L15/06 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 王函 |
地址: | 200126 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交互式 更新 语音 识别 方法 系统 | ||
本发明公开了一种交互式热词更新的语音识别方法与系统,方法包括:对接收的音频进行识别、转写后输出识别文本结果并判断是否准确,若准确,则输出该识别文本结果,若不准确,则增加热词;将识别文本结果与热词结合进行识别、转写后输出结合文本结果并进行上述判断,准确,则输出结合文本结果;不准确,则增加热词,重复上一个步骤,直至准确,输出结合文本结果;系统包括:语音识别单元,接收音频并进行识别、转写后生成识别文本结果;文本判断单元,判断识别文本结果是否准确;判断处理单元,准确则输出识别本文结果,不准确则需增加热词;热词增加单元,增加热词;语音识别单元将识别文本结果与热词结合进行识别、转写后输出结合文本结果。
技术领域
本发明涉及语音识别方法与系统领域,具体涉及一种交互式热词更新的语音识别方法与系统。
背景技术
随着信息技术的发展,互联网的普及,实现人机之间人性化、智能化的有效交互,构建高效自然的人机交流环境,已经成为当前信息技术应用和发展的迫切需求;
近年来,随着语音识别技术的飞速发展,语音输入、语音识别、语音判断等各种在线语音识别受到了越来越多的关注,预先基于海量数据训练的系统能满足常用语输入撰写的需要,特别当语音输入内容符合原语言模型概率分布时识别准确率往往较高,然而在实际应用中,移动互联网和社交网络快速发展不断产生着新的热点话题及相应的热点词汇,在现有技术中采用对所有的用户场景提供一致的识别结果,但是难以满足用户的个性化需求,不同用户也存在不同个性化词汇的识别需求,但是由于一些热点词汇或个性化词汇由于时效性和特异性在进行识别、转写、判断时因出现频率较低,导致系统不能准确识别、转写、判断;
并且现有的语音识别方法中,对识别得到的文本结果进行热词更新时需要重新经过语音识别模块、解码器后重新识别音频,从而得到加入热词后的文本结果,但这一过程耗时较长,无法做到实时刷新的文本;
针对现有的情况,希望能够有一种满足用户个性化需求的同时增加识别效率的交互式热词更新的语音识别方法与系统。
发明内容
本发明要解决的技术问题是提供一种交互式热词更新的语音识别方法,采用识别语音单元对音频进行识别、转写、解码并生成识别文本结果进行判断,若判断不准确,可增加热词后结合热词再次进行识别、转写、解码后生成结合文本结果,以达到最高的准确率的同时满足不同用户的个性化需求,实现交互的功能;
新增的编码器对音频进行识别、转写生成识别文本结果;
新增的解码器对识别文本结果进行缓存的同时将识别文本结果进行解码后与热词结合再进行识别、转写后生成结合识别结果进行判断,减少了对音频的再次识别与转写的步骤,提高了准确率的同时增加整个过程的效率,节约了音频与热词更新时所需要的时间的开销,快速进行处理;
新增的解码器还能够将热词分数表与识别文本结果、热词结合后再进行识别、转写后生成结合识别结果进行判断,热词分数表用于对热词进行加分,相同的热词每增加一次便进行一次的加分,分数越高的热词在进行识别时的识别度越高、被转写的机率越多,有效提高识别、转写的准确率;
通过热词列表能够记录被增加以及用户自设定的热词,实现用户个性化热词库的创建,满足每个用户的个性化的需求,实现交互式热词更新的效果,用以解决现有技术导致的缺陷。
本发明还提供一种交互式热词更新的语音识别系统。
为解决上述技术问题本发明提供以下的技术方案:
一种交互式热词更新的语音识别方法,其中,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010016662.3/2.html,转载请声明来源钻瓜专利网。