[发明专利]基于语音识别的移动设备与Web客户端智能联动的系统、方法、装置、处理器及存储介质在审

专利信息
申请号: 202111221775.8 申请日: 2021-10-20
公开(公告)号: CN113851134A 公开(公告)日: 2021-12-28
发明(设计)人: 俞枫;黄韦;梁帅;陶惠勇;张铭明;杨红伟 申请(专利权)人: 国泰君安证券股份有限公司
主分类号: G10L15/30 分类号: G10L15/30;G10L15/18;G10L15/26;H04L29/08;H04M1/7243;H04W4/20;G06F40/284;G06F40/30;G06N20/00
代理公司: 上海智信专利代理有限公司 31002 代理人: 王洁;郑暄
地址: 200041 上海市静安*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于语音识别实现移动设备与Web客户端智能联动处理的系统,包括移动设备,用于接收用户的语音指令,将语音转化为文字;NLP及语义识别服务器分析分词和语义;指令服务器在移动设备和Web客户端间传输指令;Web客户端对指令对象为Web客户端的指令进行处理。本发明还涉及相应的利用该系统实现基于语音识别的移动设备与Web客户端智能联动处理的方法、装置、处理器及其计算机可读存储介质。采用了本发明的基于语音识别实现移动设备与Web客户端智能联动处理的系统、方法、装置、处理器及其计算机可读存储介质,通过语音指令实现移动应用与Web网页的联动,通过半人工干预的机器学习算法不断扩充可识别指令库,提高正常用户的使用效率,为不方便操作电脑的人群提供操作方法。
搜索关键词: 基于 语音 识别 移动 设备 web 客户端 智能 联动 系统 方法 装置 处理器 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国泰君安证券股份有限公司,未经国泰君安证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202111221775.8/,转载请声明来源钻瓜专利网。

同类专利
  • 一种构建协作语音交互引擎簇的方法及装置-202110404771.7
  • 牛坤;张伟萌;戴帅湘 - 国网福建省电力有限公司厦门供电公司;厦门利德集团有限公司;福建省亿鑫海信息科技有限公司
  • 2021-04-15 - 2023-10-27 - G10L15/30
  • 本发明公开了构建协作语音交互引擎簇的方法及装置,所述方法包括:第一智能终端在首次成功接入所述本地无线网络后生成第一语音处理能力列表;第一智能终端向语音助手云服务器发送语音交互引擎簇搜索请求,并从语音助手云服务器接收语音交互引擎簇搜索响应,其中携带至少一个第一语音交互引擎簇的属性信息;所述第一智能终端根据所述语音交互引擎簇搜索响应构建生成第一协作语音交互引擎簇属性信息。通过本发明的方法,使得用户的不同设备分别安装了不同的语音交互引擎从而无法在一个设备上形成语音交互引擎簇时,也能够享受协作语音交互引擎簇所带来的良好体验,提升了硬件设备受限的智能终端的语音助手的智能化程度。
  • 能够内外网、多业务接入的智能语音交互设备及交互方法-202310946912.7
  • 柴晓康;梁红岩;陈佳童;韩鹏;刘嘉伟;隋唐;李骏扬 - 石家庄同研信息技术有限公司
  • 2023-07-31 - 2023-10-20 - G10L15/30
  • 本发明涉及一种能够内外网、多业务同时接入的智能语音交互设备及交互方法。智能语音交互设备包括外网主机单元、内网主机单元以及用于连接外网主机单元与内网主机单元的单向传输通道;所述外网主机单元包括外网系统模块、外网控制模块、外网通信模块、音频处理模块和麦克风;所述内网主机单元包括内网系统模块、内网控制模块、内网通信模块、语音合成模块以及扬声器。本发明构建的智能语音交互模式既可接入外网语音识别系统与多个内网业务服务器系统,又可通过简单配置即可实现相应业务,还可基于语音进行查询与播报。由此使得本发明形成一种既具有内外网络信息隔离功能又可做到外网语音识别、多内网业务处理,能够以语音交互方式完成相关业务。
  • 语音识别方法、装置、电子设备和存储介质-202011226698.0
  • 杨松;纪盛;孟宪海;徐木水 - 北京百度网讯科技有限公司
  • 2020-11-05 - 2023-10-20 - G10L15/30
  • 本申请公开了一种语音识别方法、装置、电子设备和存储介质,涉及语音技术和深度学习技术等人工智能技术领域。具体实现方案为:通过预设的第一进程识别目标语音数据中是否包含唤醒词;若包含唤醒词,则通过第一进程生成与目标语音数据对应的语音标识信息;控制第一进程通过预设的通信链路,向预设的第二进程发送包含语音标识信息的唤醒提醒消息;通过第二进程获取目标语音数据,对目标语音数据压缩生成压缩语音数据;通过第二进程向服务器发送压缩语音数据。由此,将语音唤醒算法与语音压缩处理业务解耦,便于各自独立升级和维护,且由于语音唤醒算法与语音压缩处理业务运行在独立的进程中,避免了单进程负载过高的问题,保证了语音处理的服务质量。
  • 语音识别方法、装置、服务器及存储介质-202310869970.4
  • 李良斌 - 北京声智科技有限公司
  • 2023-07-14 - 2023-10-03 - G10L15/30
  • 本申请实施例公开了一种语音识别方法、装置、服务器及存储介质,属于计算机技术领域。方法包括:在语音对话的过程中,将接收到的语音数据流中的音频帧存储在数据流队列中;在对数据流队列中的音频帧进行实时检测的过程中,响应于检测到数据流队列中的第一音频帧,对数据流队列中第一音频帧之前的音频帧进行过滤,第一音频帧为数据流队列中第一个包含声音的音频帧;按照过滤后的数据流队列中的音频帧的顺序,对过滤后的数据流队列中的音频帧进行语音识别,得到语音识别结果。本申请实施例提供的方案,能够在接收完成语音数据流中的音频帧时,即可完成对音频帧的语音识别,实现语音流同步识别,进而保证语音识别效率。
  • 一种设备唤醒方法及终端设备-202010191577.0
  • 陈天峰;冯大航;靳源;常乐 - 北京声智科技有限公司
  • 2020-03-18 - 2023-09-22 - G10L15/30
  • 本发明提供一种设备唤醒方法及终端设备,终端设备与至少一个扬声器连接,至少一个扬声器分别安装在至少一个语音设备上,并且分别覆盖每个语音设备的麦克风的进声通道,该方法包括:接收用户输入的第一唤醒语音;在第一唤醒语音与终端设备的第一唤醒词匹配的情况下,唤醒终端设备,并合成与目标语音设备的第二唤醒词匹配的第二唤醒语音,通过安装在目标语音设备上的扬声器播放第二唤醒语音,以通过第二唤醒语音唤醒目标语音设备,其中,目标语音设备为至少一个语音设备中的至少一个。本发明实施例能够通过唤醒终端设备的方式来间接达到唤醒目标语音设备的目的,不仅给用户使用带来便捷,且减轻用户需记忆不同设备的唤醒词的负担。
  • 一种语音验证的方法及网络设备-201910000958.3
  • 尼凌飞;施南翔 - 中国移动通信有限公司研究院;中国移动通信集团有限公司
  • 2019-01-02 - 2023-09-19 - G10L15/30
  • 本发明提供了一种语音验证的方法及网络设备,涉及通信技术领域,所述方法包括:获取终端将语音信息发送至语音识别服务器后,由所述语音识别服务器对所述语音信息进行特征识别后获得的语音识别文件;其中,所述语音识别文件包括根据所述语音信息识别的文本信息和语音属性标签;根据所述语音识别文件,进行语音验证。本发明实施例能够缩短语音密码设置和验证的时间,且,增强了语音密码验证的准确性和安全性。
  • 从单个设备访问多个虚拟个人助理(VPA)-202310923331.1
  • N·B·佩蒂尔;A·托德曼;B·A·克莱默 - 伯斯有限公司
  • 2017-08-31 - 2023-09-15 - G10L15/30
  • 本文中描述的技术可以以一种计算机实现的方法来体现,该计算机实现的方法包括:在第一设备上呈现第一用户界面,第一用户界面包括多个虚拟个人助理(VPA)服务提供者的用户可选择菜单;以及接收标识特定VPA服务提供者的用户选择。该方法还包括:接收表示输入语音数据的第一信号;以及处理第一信号以生成包括输入语音数据的至少一部分的第一电子文件,第一电子文件根据特定VPA服务提供者的规范被生成。该方法还包括:将第一电子文件传输到与特定VPA服务提供者相关联的一个或多个远程计算设备;接收包括对输入语音数据的响应的至少第二电子文件;以及使得声学换能器基于第二电子文件来生成声学输出。
  • 从单个设备访问多个虚拟个人助理(VPA)-202310923686.0
  • N·B·佩蒂尔;A·托德曼;B·A·克莱默 - 伯斯有限公司
  • 2017-08-31 - 2023-09-15 - G10L15/30
  • 本文中描述的技术可以以一种计算机实现的方法来体现,该计算机实现的方法包括:在第一设备上呈现第一用户界面,第一用户界面包括多个虚拟个人助理(VPA)服务提供者的用户可选择菜单;以及接收标识特定VPA服务提供者的用户选择。该方法还包括:接收表示输入语音数据的第一信号;以及处理第一信号以生成包括输入语音数据的至少一部分的第一电子文件,第一电子文件根据特定VPA服务提供者的规范被生成。该方法还包括:将第一电子文件传输到与特定VPA服务提供者相关联的一个或多个远程计算设备;接收包括对输入语音数据的响应的至少第二电子文件;以及使得声学换能器基于第二电子文件来生成声学输出。
  • 一种基于多核模块化构架的声学处理设备-201810300988.1
  • 聂玮奇;贺武君;罗晓峰 - 西安合谱声学科技有限公司
  • 2018-04-04 - 2023-09-05 - G10L15/30
  • 本发明公开了一种基于多核模块化构架的声学处理设备,包括至少两个处理核心,处理核心包括至少一个算法核心模块和至少一个控制核心模块,还包括音视频输入模块、接口模块、语音拾取模块、语音预处理模块、参考信号输入模块、控制与算法模块、语音输出模块、网络模块和电源管理模块,将声学处理过程分成了不同的模块,不同功模块相互独立且受不同处理核心的管理及控制,管理核心之间通过核间通信以及共享内存的方式协同合作,将不同模块交给不同的核心进行管理与控制,通过合理的模块控制与系统资源分配,充分利用处理器的运算资源,提高声处理系统的运算能力以及有效利用率、减少处理时延长以及提高系统资源调度能力。
  • 基于车机端和终端语音控制方法、电子设备和存储介质-202310655770.9
  • 陈立荣 - 博泰车联网(南京)有限公司
  • 2023-06-02 - 2023-08-22 - G10L15/30
  • 本申请实施方式涉及基于车机端和终端语音控制方法、电子设备和存储介质,涉及车辆技术领域。该方法包括:响应于接收到用户的语音指令且监测到车辆内未设置与语音指令对应的语音解析数据包,监测车辆的网络状态;响应于监测出网络状态处于不可用状态,将语音指令发送至与车辆预先建立无线通信连接的终端;响应于基于建立的通信连接从终端接收到与语音指令对应的控制指令,控制车辆执行控制指令。该方法包括:响应于从与终端预先建立无线通信连接的车辆接收到语音指令,从云端服务器获取与语音指令相关的信息;基于建立的通信连接和信息向车辆发送控制指令;其中,云端服务器设置有与语音指令对应的语音解析数据包。
  • 适用于煤矿采煤机的声信号采集装置-202223551655.7
  • 李再峰;高思伟;宋国利;王峰;曹宁宁 - 北京天玛智控科技股份有限公司;北京煤科天玛自动化科技有限公司
  • 2022-12-29 - 2023-07-28 - G10L15/30
  • 本申请提出了一种适用于煤矿采煤机的声信号采集装置,涉及数据处理技术领域。该装置包括:麦克风阵列、音频编解码器、控制器、网络接口,其中,音频编解码器分别与麦克风阵列和控制器连接,网络接口与控制器连接;麦克风阵列用于采集采煤机工作时的模拟声信号;音频编解码器,用于将模拟声信号转换为数字音频信号;控制器,用于将数字音频信号进行声纹特征提取,获取目标声信号,并通过网络接口将目标声信号发送给外部服务器。本申请可以在煤矿开采过程中,提高采煤机声信号的清晰度,避免噪声干扰,实时根据采煤机声信号进行煤岩识别监测,提高煤岩识别的效率和准确率,避免浪费人力资源。
  • 用于处理移动终端设备的自动的在线-语音识别器的识别结果的方法以及交换设备-201810901684.0
  • C·福格特 - 奥迪股份公司
  • 2018-08-09 - 2023-07-07 - G10L15/30
  • 本发明涉及一种通过交换设备(20)处理用于移动终端设备(10)的自动的在线‑语音识别器(11)的识别结果(17)的方法,其中从在线‑语音识别器(11)针对由使用者说出的语句(14)接收作为文本(18)的识别结果。本发明提出,从移动终端设备(10)接收许可的语句的语音模型(24),其中通过语音模型(24)为每个许可的语句分配与语句(14)的含义相关的意思表述,通过交换设备(20)的决策逻辑(26)将识别结果(17)的文本(18)与通过语音模型(24)定义的许可的语句相比较,对于根据预先确定的相符性标准(27)判断相符的许可的语句确定该许可的语句的意思表述(28)并将该意思表述(28)提供给移动终端设备(10)。
  • 一种ASR资源方的路由控制方法及装置-202310665052.X
  • 曹甲俊;孟祥如;程鹏辉 - 百融至信(北京)科技有限公司
  • 2023-06-07 - 2023-07-04 - G10L15/30
  • 本发明公开了一种ASR资源方的路由控制方法及装置,涉及语音识别技术领域,主要目的在于实现自动选择适配的资源方进行语音识别。本发明主要的技术方案为:获取待识别语音信息;基于所述待识别语音信息,利用预设路由方案获取所有的待连接资源方的路由配置,所述预设路由方案包括至少2个已绑定的所述待连接资源方的路由配置;基于所有的所述待连接资源方的路由配置,利用预设规则获取符合连接条件的所述待连接资源方的路由配置,且与对应的所述待连接资源方建立长连接;基于建立的所述长连接,向已连接的资源方发送所述待识别语音信息,且从已连接的资源方接收所述待识别语音信息对应的语音识别结果。本发明用于语音识别选择资源方。
  • 语音交互方法、网络分析端及客户端-201911381615.2
  • 章晨;丁伟;梁正 - 科大讯飞股份有限公司
  • 2019-12-27 - 2023-06-02 - G10L15/30
  • 本发明实施例提供一种语音交互方法、网络分析端及客户端,其中方法包括:接收客户端发送的当前网络相关信息;当前网络相关信息包括设备位置信息、设备姿态信息和设备网络状态信息中的至少一种;基于当前网络相关信息,确定当前网络分析结果;将当前网络分析结果返回至客户端,以供客户端将当前网络分析结果对应音频格式的语音数据发送至语音交互服务端,进行语音交互。本发明实施例提供的方法、网络分析端及客户端,通过当前网络相关信息确定当前网络分析结果,进而基于当前网络分析结果对应的音频格式进行语音数据传输,使得语音数据的音频格式能够灵活适应各种网络状态,提高各种网络状态下语音交互的实时性和准确性。
  • 语音播报的语音识别装置-202222957467.8
  • 刘祖宝 - 宜昌康泰网络科技有限公司
  • 2022-11-07 - 2023-06-02 - G10L15/30
  • 本实用新型提供一种语音播报的语音识别装置,包括语音识别装置、无线网络设备和语音播报装置,语音识别装置与无线网络设备无线无线连接,无线网络设备与控制平台电连接,控制平台通过语音控制器与语音播报装置或/和家电设备连接,语音识别装置内部设有语音识别系统,语音输送到语音控制器内部,语音控制器控制语音播报装置或/和家电设备运作。能够随身携带,可以随时将语音指令输送到控制平台,控制平台能够及时的做出指令,能更快的做出反应,且语音识别装置结构小巧,根据局域网来连接各种设备,使用方便,控制指令能够更清楚上传。
  • 一种语音处理方法、装置、电子设备及存储介质-202211624162.3
  • 章福瑜;李坚涛 - 阿波罗智联(北京)科技有限公司;阿波罗智行科技(广州)有限公司
  • 2022-12-16 - 2023-04-25 - G10L15/30
  • 本公开提供了一种语音处理方法、装置、电子设备及存储介质,涉及计算机技术领域,具体涉及语音技术、人工智能、自动驾驶、云计算等技术领域。具体实现方案为:客户端将待识别语音数据的当前语音片段发送给服务端;服务端接收当前语音片段并识别,对识别结果进行语义预测,将得到的预测语义及基于预测语义生成的当前响应信息发送给客户端;客户端接收并缓存预测语义和当前响应信息;在接收到完整待识别语音数据时,将对完整待识别语音数据进行识别得到的目标离线语音识别结果与接收到的所有预测语义进行匹配;若匹配,将与目标离线语音识别结果匹配的预测语义对应的当前响应信息确定为完整待识别语音数据的目标响应信息,提高了语音处理的速度。
  • 边缘智能语音识别方法及相关设备-202211542006.2
  • 邝先信 - 深圳市欧瑞博科技股份有限公司
  • 2022-12-02 - 2023-04-25 - G10L15/30
  • 本申请提出一种边缘智能语音识别方法及相关设备,其中,相关设备包括边缘智能语音识别装置、电子设备及存储介质,边缘智能语音识别方法包括:离线服务器接收待识别语音数据;所述离线服务器对所述待识别语音数据进行识别并获得离线识别结果;所述离线服务器计算所述离线识别结果的置信度;所述离线服务器对比所述置信度与预设第一阈值,若所述置信度高于所述预设第一阈值,则将所述离线识别结果作为语音识别结果,若所述置信度小于等于所述预设第一阈值,则将所述待识别语音数据和所述置信度发送至在线服务器。该方法通过评估离线识别结果的准确度以判断是否需要启用在线服务器处理语音数据,从而能够确保语音识别效率和准确度之间的平衡。
  • 一种分布式语音交互方法、系统及分布式中心-202211725512.5
  • 曹圣红;马峰 - 科大讯飞股份有限公司
  • 2022-12-30 - 2023-04-25 - G10L15/30
  • 本申请实施例公开了一种分布式语音交互方法、系统及分布式中心。其中,该方法包括:接收唤醒设备上传的唤醒词段音频特征和唤醒词时间范围;其中,唤醒设备为多个智能语音设备中被唤醒词唤醒的智能语音设备,唤醒词段音频特征包括第一达到时间差tdoa特征和第一音频质量特征;根据第一tdoa特征和唤醒词时间范围选择唤醒词到达时间最早的唤醒设备作为响应设备;根据第一音频质量特征选择唤醒词音频质量最好的唤醒设备作为识别阶段的拾音设备。可见,本申请实施例中能保证总是距离用户最近的语音智能设备来对用户进行响应,使得响应能够更好地被用户感知;还能保证采集得到的识别语句音频质量较好,从而可以获得更准确的识别效果。
  • 一种智能交互数据处理方法、客户端、服务端及设备-202211640347.3
  • 邓建凯;朱成亚;郭奕超;甘津瑞 - 思必驰科技股份有限公司
  • 2022-12-20 - 2023-04-14 - G10L15/30
  • 本发明提供一种智能交互数据处理方法、客户端、服务端及设备,所述方法包括:接收用户发送的交互信息;将所述交互信息通过预先建立的长链接发送至服务端,以使得所述服务端根据所述交互信息获得交互结果和所述交互结果对应的交互应答语音,所述服务端将所述交互结果和所述交互应答语音通过所述长链接返回;接收所述服务端返回的所述交互结果;若判断获知所述交互结果中包括音频标识,则从与所述服务端之间创建的所述长链接中下载所述交互应答语音。本发明节省了创建https链接的时间,提升了智能交互的响应速度。
  • 一种基于位置信息调整云端语义等待时间的方法及装置-202211562124.X
  • 李龙飞;刘杰;陈彩可;张炜玮;林孟超 - 中国第一汽车股份有限公司
  • 2022-12-07 - 2023-04-14 - G10L15/30
  • 本发明公开了一种基于位置信息调整云端语义等待时间的方法及装置。所述基于位置信息调整云端语义等待时间的方法包括:获取车辆内用户提供的音频流信息;获取车辆的当前地理位置信息;获取预设响应对照表,其包括至少一个预设线路段信息以及响应时间,一个预设线路段信息对应一个响应时间;获取当前地理位置信息所位于的预设线路段信息所对应的响应时间作为等待云端根据音频流信息反馈云端语义信息的等待时间。本申请根据当前的车辆的地理位置来动态调整等待时间,从而能够给与使用者最为人性化的等待时间,在明显没有信号的地区,则减少等待时间或者直接不用云端进行处理,从而防止即耽搁了时间还不会得到结果。
  • 一种语音信息处理方法及终端-202111057019.6
  • 周力为;田发景 - 上海擎感智能科技有限公司
  • 2021-09-09 - 2023-03-14 - G10L15/30
  • 本发明提供了一种语音信息处理方法及终端。上述的语音信息处理方法包括:获取用户的语音数据,所述语音数据表征所述用户希望扩展的功能;输出所述语音数据至云端服务器,以基于云端服务器确定所述语音数据对应的功能;接收所述云端服务器返回的所述语音数据对应的功能;在本地数据库中存储所述语音数据以及所述语音数据对应的功能,以在后续语音交互中,基于所述本地数据库确定语音数据对应的功能。根据本发明所提供的语音信息处理方法及终端,通过在线语音功能方便地拓展了离线语音控制功能,从而有利于人机交互的实现。
  • 语音识别方法及相关产品-202211487069.2
  • 祝明;王曦 - 深圳市人马互动科技有限公司
  • 2022-11-25 - 2023-03-03 - G10L15/30
  • 本申请提供了一种语音识别方法及相关产品,方法包括:服务器调用人机互动引擎通过终端设备与用户进行互动,获取互动过程中用户输入的目标语音信息,并对目标语音信息进行文字识别,得到第一文本,对第一文本进行场景识别和场景关联词提取,确定第一文本对应的目标服务场景以及目标场景关联词,将目标场景关联词与目标服务场景对应的目标场景热词集合中的场景热词进行拼音对比,得到目标场景关联词与场景热词的差异值得分,用目标场景热词集合中差异值得分最高的目标场景热词替换第一文本中的目标场景关联词,得到第二文本,根据第二文本用户意图,再根据该用户意图执行对应的服务操作。可见,能够提高语音识别的准确度,提升用户体验。
  • 一种基于语音识别的大容量离线外呼电话号码鉴别系统-202211210739.6
  • 陈剑 - 四川君诚互动科技有限公司
  • 2022-09-30 - 2023-01-13 - G10L15/30
  • 本发明公开了一种基于语音识别的大容量离线外呼电话号码鉴别系统,包括:外呼模块、上位服务器以及数据库、语音处理模块,所述外呼模块与所述语音处理模块连接,所述数据库以及语音处理模块均与所述上位服务器,其中:所述上位服务器连接有外呼号码处理模块,所述外呼号码处理模块用于从数据库中批量导入外呼号码,并读取固定数量的号码,并将固定数量的号码发送至语音处理模块;所述语音处理模块包括:中央控制单元,所述中央控制单元用于接收外呼号码,并根据外呼号码控制外呼模块发起外呼,本发明实现离线识别,不占用公司外网带宽,识别到结果的时间为毫秒级,基本无延时,能同时进行上千路语音流的识别,不产生额外费用。
  • 语音信息处理方法、系统及用于语音信息处理的装置-202110554313.1
  • 孙璐璐;赵宁 - 青岛海尔空调器有限总公司;青岛海尔空调电子有限公司;海尔智家股份有限公司
  • 2021-05-20 - 2023-01-13 - G10L15/30
  • 本申请涉及智能家电技术领域,公开一种语音信息处理方法。该方法包括服务端获得语音指令信息库,信息库中保存有当前第一客户端已注册的多个家电设备的标识信息,以及多个家电设备各自关联的语音指令包;语音指令包具有多个语音信息,以及多个语音信息各自对应的控制指令;将信息库中多个语音指令包中各自独有的语音信息的集合作为独有语音集合;当获得第一客户端发送的目标音频时,确定目标音频中的目标指令描述段及其对应的目标语音信息;如果目标语音信息属于独有语音集合,则从信息库中确定目标控制指令;将目标控制指令发送给目标语音信息对应的目标家电设备关联的第二客户端。本申请还公开一种语音信息处理系统及用于语音信息处理的装置。
  • 信息处理方法、系统和装置-202111355056.5
  • 侯本忠 - 青岛海尔智能家电科技有限公司
  • 2021-11-16 - 2022-12-27 - G10L15/30
  • 本申请涉及语音识别技术领域,公开一种信息处理方法,包括:第一设备节点获得语音信息,并对语音信息进行识别;在识别失败的情况下,将语音信息发送至同一网段下的第二设备节点,以便第二设备节点对语音信息进行识别;在第二设备节点识别成功的情况下,获得第二设备节点发送的识别结果。这样,可以借助第二设备节点的本地语音信息库,实现语音识别。由于同一网段下的设备节点可以直接进行通信,其通信距离较短,因此可以有效降低语音识别的响应时间,提高用户的使用体验。本申请还公开一种信息处理系统和信息处理装置。
  • 语音处理装置和系统以及云端服务器和车辆-202011600283.5
  • 丁磊;王超;蒋瑞;李梦龙 - 华人运通(上海)云计算科技有限公司
  • 2020-12-29 - 2022-12-23 - G10L15/30
  • 本申请提出一种语音处理装置和系统以及云端服务器和车辆,云端的语音处理装置包括:语音网关,用于接收车机端的目标音频;多个语音处理能力模块,语音处理能力模块用于对目标音频进行语音处理,以生成待选云端语音处理结果;云端仲裁模块,用于根据预设的云端仲裁策略,从多个待选云端语音处理结果中确定出对目标音频的目标云端语音处理结果;语音网关还用于将目标云端语音处理结果返回给车机端。本申请实施例的技术方案可以为用户提供准确和优化的人机交互服务。
  • 设备唤醒方法、装置、存储介质及电子装置-202110130483.7
  • 汪秀元;徐海涛;苏腾荣 - 青岛海尔科技有限公司;海尔智家股份有限公司
  • 2021-01-29 - 2022-12-06 - G10L15/30
  • 本发明公开了一种设备唤醒方法、装置、存储介质及电子装置,上述方法包括:获取多个设备在接收到目标对象的唤醒语音后上传的唤醒参数值,唤醒参数值包含以下至少之一:设备根据唤醒语音确定的分布式特征值、设备根据唤醒语音确定的朝向值,其中,分布式特征值用于指示唤醒语音在目标对象与设备之间经空间距离传播后的衰减值,朝向值用于指示设备的设备正向与发出唤醒语音的目标对象之间符合预设范围的夹角;在已获取到多个设备中每一设备对应的至少一组唤醒参数值的情况下,分别对每一设备对应的所有唤醒参数值进行加权计算,以确定每一设备对应的唤醒值;从多个唤醒值中确定符合预设条件的目标唤醒值,对目标唤醒值对应的目标设备进行唤醒。
  • 指挥调度系统的语音识别方法、装置、设备及介质-202211035571.X
  • 蒋俊兰 - 北京飞讯数码科技有限公司
  • 2022-08-26 - 2022-11-29 - G10L15/30
  • 本发明公开了一种指挥调度系统的语音识别方法、装置、设备及介质。该方法包括:通过语音识别服务器获取指挥调度客户端发送的语音指令报文,并基于预设通信协议对语音指令报文进行解析,获取语音指令报文对应的语音指令数据;进而通过预部署的语音识别软件开发工具包对语音指令数据进行语音识别,并将语音识别结果发送到指挥调度客户端。本实施例的技术方案,通过在语音识别服务器中部署语音识别软件开发工具包,以对指挥调度客户端的语音指令数据进行语音识别,可以实现对不同操作系统的指挥调度客户端的语音识别,可以提升指挥调度客户端的语音识别的系统兼容性。
  • 基于端云一体识别语音信号的方法、系统和计算机设备-202210730170.X
  • 王洲;曹作安;王强强;付涛;商迎新 - 北京云思智学科技有限公司
  • 2022-06-24 - 2022-11-08 - G10L15/30
  • 本发明提供一种基于端云一体识别语音信号的方法,应用于云端,该方法包括:接收终端发送的识别语音信号的请求,该请求中包含待识别语音信号和所述终端的标识,根据终端的标识,确定终端的处理语音信号的等级,当终端的处理语音信号的等级大于等于预设阈值时,向终端返回本地处理待识别语音信号的指令,当终端的处理语音信号的等级小于预设阈值时,该云端对待识别语音信号进行识别,得到待语音信号中各音素的评测分数,并实时向终端展示待语音信号中各音素的评测分数,以此方式可以根据终端的处理能力,确定识别待识别语音信号的设备,这样可以减少云端识别语音信号的压力,有效地避免因识别任务较多导致无法实时返回识别结果的技术缺陷。
  • 古诗语音信号识别方法、装置和计算机设备-202210731119.0
  • 王洲;曹作安;商迎新;马智;王强强 - 北京云思智学科技有限公司
  • 2022-06-24 - 2022-11-08 - G10L15/30
  • 本发明属于古诗语音信号识别领域,提供一种古诗语音信号识别方法,包括:按照预设分割窗长,将待评测诗句的语音信号划分为多个语音块,对多个语音块分别进行识别,得到各个所述语音块中多个音素的后验概率,基于各个语音块中多个音素的后验概率,构建各个语音块对应的至少一条概率转移路径,基于待评测古诗的解码图中的诗句路径,分别对各个所述语音块对应的至少一条概率转移路径进行对齐处理,得到各个语音块对应的目标概率转移路径,以此方式进行对齐可以支持用户顺序读、跳读、以及复读,提高用户体验。本方案还可以实时向用户端展示各个语音块中各音素的评测分数和/或待评测诗句的语音信号的评测分数。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top