[发明专利]语音识别系统在审
申请号: | 201880095674.0 | 申请日: | 2018-08-07 |
公开(公告)号: | CN112437956A | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 金载烘;李泰镐;郑翰吉 | 申请(专利权)人: | LG电子株式会社 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 夏凯;张伟峰 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 | ||
提供了一种语音识别系统。根据本公开的实施例的语音识别系统包括:语音识别代理,用于从用户接收语音数据并且将语音数据发送到人工智能服务器;和人工智能服务器,用于将语音数据输入到语音识别模型,将用于语音数据的识别结果发送给语音识别代理,并且学习语音数据,其中,当语音数据的语音识别率低于预设基准时,语音识别代理向用户请求用于学习用户的语音的附加数据。
技术领域
本公开涉及一种语音识别系统,其能够通过允许用户直接参与语音识别模型的学习来获得语音数据或文本并且使用所获得的数据来学习用户的语音数据。
背景技术
人工智能是计算机科学和信息技术的分支,用于研究计算机如何完成人类智能可以完成的思考、学习和自我发展,并允许计算机模仿人类的智能行为。
而且,人工智能并非通过其本身存在,而是与计算机科学的其他领域直接或间接相关。特别是在现代,人们非常积极地尝试将人工智能元件引入信息技术的各个领域,并使用它们来解决该领域中的问题。
同时,在相关技术中,已经积极地研究了上下文感知技术,该上下文感知技术使用人工智能来识别用户的状况并以期望的形式提供用户的期望信息。
随着上述上下文感知技术的发展,对于能够执行适合用户情况的功能的系统的需求正在增加。
同时,通过结合用户的语音识别和上下文识别技术,通过语音识别向用户提供各种操作和功能的语音识别系统正在增加。
语音识别指代通过分析语音信号并将分析的语音信号与构图的数据库组合,将语音信号转换为字符串或识别语言含义内容。
在语音识别技术中,语音识别模型分析输入的语音数据,提取特征,并测量与先前收集的语音模型数据库的相似性,以将最相似的一个转换为文本或命令。
语音识别技术是一种模式识别过程。因为每个人的语音、发音和语调不同,所以传统的语音识别技术会从尽可能多的人中收集语音数据,从中提取共同特征,并生成参考模式。
然而,因为这种参考模式通过在实验室环境中创建的训练数据来配置学习模型,所以并未针对实际用户的语音或音调进行优化。
因此,需要额外的自适应学习,使得语音识别模型对直接使用语音识别设备的用户被个性化。
本公开提出一种可以增加自适应学习的准确性和效率的方法。
发明内容
技术问题
本公开提供一种语音识别系统,其能够通过允许用户直接参与语音识别模型的学习来获得语音数据或文本以及使用所获得的数据来学习用户的语音数据。
技术方案
根据本公开的实施例,一种语音识别系统,包括:语音识别代理,该语音识别代理被配置成:从用户接收语音数据,并且将所述语音数据发送给人工智能服务器;以及人工智能服务器,所述人工智能服务器被配置成:将所述语音数据输入到语音识别模型,将基于所述语音数据的识别结果发送到所述语音识别代理,以及学习所述语音数据,其中,当所述语音数据的语音识别率低于预设基准时,所述语音识别代理进一步被配置成向所述用户请求用于学习用户的语音数据的附加数据。
在这种情况下,所述语音识别代理可以被配置成:向所述用户提供特定句子,并且当接收到与所述特定句子相对应的第二语音数据时,将所述第二语音数据发送给所述人工智能服务器。所述人工智能服务器可以被配置成学习与所述特定句子相对应的所述第二语音数据。
在这种情况下,所述人工智能服务器可以被配置成:基于所述语音数据的特征,将多个句子当中的与所述语音数据的特征相对应的特定句子发送到所述语音识别代理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于LG电子株式会社,未经LG电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880095674.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:充电提示方法及相关产品
- 下一篇:显示装置