[发明专利]基于区块链的视频直播智能交互和大数据管理方法及系统在审
申请号: | 202310371132.4 | 申请日: | 2023-04-07 |
公开(公告)号: | CN116366927A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 杨芳 | 申请(专利权)人: | 北京海上升科技有限公司 |
主分类号: | H04N21/4788 | 分类号: | H04N21/4788;H04N21/4415;H04N21/2187;H04N21/439;H04L9/00;G10L21/0208 |
代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 刘方林 |
地址: | 102602 北京市大兴区榆顺路12号*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 区块 视频 直播 智能 交互 数据管理 方法 系统 | ||
本发明公开了一种基于区块链的视频直播智能交互和大数据管理方法及系统,涉及语音分析技术领域。该方法包括:采集该观众的人脸图像,并对该观众的身份进行初步识别;当需要进行交互时,采集该观众的语音信号;对该语音信号进行去噪;对去噪语音信号进行声纹识别;若声纹识别结果与人脸识别结果一致,则确定该观众的身份信息,并对去噪语音信号进行识别,以得到纠错后语音信号识别结果;若纠错后语音信号识别结果中包含预置的非正常词汇,则对该观众的发言进行屏蔽;反之,则将去噪语音信号发送给直播人员;将核心信息上链。本发明结合多种算法模型,实现高效精准的语音识别,提高智能交互效果;并结合区块链技术将核心信息上链,保证数据安全。
技术领域
本发明涉及语音分析技术领域,具体而言,涉及一种基于区块链的视频直播智能交互和大数据管理方法及系统。
背景技术
视频直播具有快速、灵活、自由等特点,近年来受到民众的广泛认可,在商品销售、教育培训等多个方面发挥出越来越重要的作用。然而在直播过程中,观众往往无法方便地和直播人员进行交互,显著地降低了直播过程中的互动效果。即使部分交互式技术已经应用于直播过程中,但仍然无法显著地提升交互效果;同时,对于交互过程中产生的大量数据,也不能实现有效管理。
随着信息技术的高速发展,能够为直播视频的智能交互提供直接支持;同时随着区块链技术的不断更新换代,也能够为交互过程中的语音大数据管理提供直接的支持。因此,深度结合信息技术和区块链技术,提出一种基于区块链的视频直播智能交互和大数据管理方法及系统有非常重要的价值和意义。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于区块链的视频直播智能交互和大数据管理方法及系统,结合基于多样性网络模块智能拼接的普适性去噪模型、基于多样性核函数互验的SVM声纹识别模型、基于发音相近词汇编码式纠错的语音识别模型,实现高效精准的语音识别,提高智能交互效果;并结合区块链技术将核心信息上链,保证数据安全。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于区块链的视频直播智能交互和大数据管理方法,包括以下步骤:
当观众在观看视频直播的过程中,基于音视频采集设备采集该观众的人脸图像,并利用人脸识别技术对该观众的身份进行初步识别,以得到人脸识别结果;
当需要进行交互时,基于音视频采集设备采集该观众的语音信号,并记录该观众发言时间;
利用基于多样性网络模块智能拼接的普适性去噪模型,对该语音信号进行去噪,以得到去噪语音信号;
利用基于多样性核函数互验的SVM声纹识别模型,对去噪语音信号进行声纹识别,以得到声纹识别结果;
若声纹识别结果与人脸识别结果一致,则确定该观众的身份信息,并利用基于发音相近词汇编码式纠错的语音识别模型,对去噪语音信号进行识别,以得到纠错后语音信号识别结果;
若纠错后语音信号识别结果中包含预置的非正常词汇,则对该观众的发言进行屏蔽;反之,则将对应的去噪语音信号发送给对应的直播人员,实现直播交互;
将观众的身份信息、发言时间和纠错后语音信号识别结果上传至区块链,实现上链存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海上升科技有限公司,未经北京海上升科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310371132.4/2.html,转载请声明来源钻瓜专利网。