[发明专利]一种唇部状态检测方法及装置在审
申请号: | 201711209022.9 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107992813A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 辛晓哲;冯阳;杨文文;李斌 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王玲,王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 唇部 状态 检测 方法 装置 | ||
技术领域
本发明实施例涉及计算机技术领域,具体涉及一种唇部状态检测方法及装置。
背景技术
随着人工智能技术的发展,语音交互成为一种应用广泛的技术。然而,由于语音交互易受环境影响,容易出现噪声干扰,导致语音识别结果不准确。为了改善语音识别不准确的问题,出现了唇语识别技术。唇语识别技术是一种对面部图像进行识别、以获取对应的语言识别结果的技术。目前的唇语识别技术为了减少噪声数据的影响,通常会在接收到语音信号时,开始采集视频图像;在语音信号结束时,停止采集视频图像。这种方式从一定程度上避免了噪声数据的影响。但当语音交互所处的环境较为嘈杂时,环境噪音会被当作语音信号采集,这时尽管用户没有开口说话,仍然会采集视频数据。因此,现有技术的方案无法有效消除静音帧等噪声数据,影响唇语识别结果。
发明内容
本发明实施例提供了一种唇部状态检测方法及装置,旨在解决现有技术提供的唇语识别方法存在的噪声数据干扰、识别效率低的技术问题。
为此,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供了一种唇部状态检测方法,包括:对目标图像进行唇部区域检测,获取所述目标图像包括的唇部区域图像;确定所述唇部区域图像的多个关键特征点;根据所述多个关键特征点对应的特征值确定所述唇部区域的状态;所述唇部区域的状态包括开口状态或者闭口状态。由于可以识别出唇部区域的状态,例如闭口状态,而闭口状态对应的画面是静音帧。在进行唇语识别时,可以仅对非静音帧处理,有效消除静音帧等噪声数据,提高唇语识别的效率和准确性。
第二方面,本发明实施例提供了一种唇部状态检测装置,包括:检测单元,用于对目标图像进行唇部区域检测,获取所述目标图像包括的唇部区域图像;特征点确定单元,用于确定所述唇部区域图像的多个关键特征点;状态确定单元,用于根据所述多个关键特征点对应的特征值确定所述唇部区域的状态;所述唇部区域的状态包括开口状态或者闭口状态。
第三方面,本发明实施例提供了一种用于唇部状态检测的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:对目标图像进行唇部区域检测,获取所述目标图像包括的唇部区域图像;确定所述唇部区域图像的多个关键特征点;根据所述多个关键特征点对应的特征值确定所述唇部区域的状态;所述唇部区域的状态包括开口状态或者闭口状态。
第四方面,本发明实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面所示的唇部状态检测方法。
本发明实施例提供的唇部状态检测方法及装置,可以在目标图像检测出唇部区域图像,并确定唇部区域图像包括的多个关键特征点,根据所述多个关键特征点的特征值确定唇部区域处于开口状态或者闭口状态。本发明实施例提供的方法可以有效检测唇部区域状态,识别准确性高,并能有效去除静音帧等噪声数据对唇语识别结果的影响,减少干扰,提高数据处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的唇部状态检测方法流程图;
图2为本发明另一实施例提供的唇部状态检测方法流程图;
图3为本发明一实施例提供的唇部状态检测装置示意图;
图4是根据一示例性实施例示出的一种用于唇部状态检测装置的框图;
图5是根据一示例性实施例示出的服务器的框图。
具体实施方式
申请人在实现本发明时发现,在执行唇部状态检测时,可以通过接收的语音数据的变化或者红外传感器等额外的外部传感器来进行检测,但这些方式需要借助额外的设备或者传感器,无法通过单纯的图像视觉信息进行唇部状态检测。
本发明实施例提供了一种唇部状态检测方法及装置,可以有效检测唇部区域状态,识别准确性高,成本低,并能有效去除静音帧等噪声数据对唇语识别结果的影响,减少干扰,提高数据处理效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711209022.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种唇语识别方法及装置
- 下一篇:对象寻找方法及装置