“出门问问（武汉）信息科技有限公司”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果15个，建议您升级VIP下载更多相关专利

[发明专利]一种对语音信息的训练方法及装置-CN202011577644.9有效
发明人：张旭;殷昊;陈云琳;江明奇;杨喜鹏 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-28 - 公布日： 2023-08-01 - 主分类号： G06V10/44 文献下载
摘要：本发明公开了一种对语音信息的训练方法及装置，本发明实施例首先获取语音信息数据；并针对所述语音信息数据中的任一语音信息：对所述语音信息进行处理，得到梅尔频谱图序列；对所述梅尔频谱图序列进行语义特征提取，得到语义特征信息；对所述语义特征信息进行时序特征提取，得到时序特征信息；之后对多个所述时序特征信息进行模型训练，得到面部关键点模型。由此，通过对语音信息进行语义特征提取的学习，以及时序特征提取的学习，从而提升面部关键点模型的性能，使得面部关键点模型能够准确合成面部关键点序列，进而提高说话人视频的合成效果，从而解决现有技术中模型输出说话人画面出现的抖动问题。
一种语音信息训练方法装置

[发明专利]声纹注册方法、装置、电子设备及存储介质-CN202211055446.5在审
发明人：魏光辉;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2022-08-31 - 公布日： 2023-03-21 - 主分类号： G10L15/04 文献下载
摘要：本公开提供了一种声纹注册方法、装置、电子设备及存储介质。本公开实施例的声纹注册方法可以包括：将第一说话人的语音样本切分为长度相同的多条语音段；将每条语音段切分为长度相同且彼此重叠的多个语音帧；获取每条语音段中每个语音帧的声纹识别特征，并根据语音段中所有语音帧的声纹识别特征获取语音段的声纹嵌入码；确定语音样本中每条语音段的声纹嵌入码与其他语音段的声纹嵌入码的相似度；根据每条语音段的声纹嵌入码的所有相似度和预设的相似度阈值确定有效的声纹嵌入码；根据语音样本对应的所有有效的声纹嵌入码获得第一说话人的注册声纹嵌入码。本公开可以实现无效音频部分的自检查和有效提取，使得注册声纹嵌入码能够更加准确地表示说话人的语音特征。
声纹注册方法装置电子设备存储介质

[发明专利]语音识别方法、装置、电子设备及存储介质-CN202211057400.7在审
发明人：魏光辉;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2022-08-31 - 公布日： 2022-11-29 - 主分类号： G10L15/04 文献下载
摘要：本公开提供了一种语音识别方法、装置、电子设备及存储介质。本公开的一种语音识别方法包括：将待识别语音切分为长度相同的多条语音段；以及，通过如下方式获取每条所述语音段的说话人：将语音段切分为长度相同且彼此重叠的多个语音帧；获取所述语音段中每个所述语音帧的声纹识别特征；根据所述语音段中所有语音帧的声纹识别特征获取所述语音段的声纹嵌入码；根据所述语音段的声纹嵌入码和预注册声纹嵌入码，确定所述语音段的说话人。本公开实施例不仅可以有效去除无效音频段落对整个音频说话人识别的影响，从而准确识别出语音的说话人，同时还可鉴别语音质量，识别出人声指令较佳的语音和人声质量欠佳的语音。
语音识别方法装置电子设备存储介质

[发明专利]语音合成方法、装置、电子设备及计算机可读存储介质-CN202211029056.0在审
发明人：殷昊;梁婷;陈云琳;叶顺平 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2022-08-25 - 公布日： 2022-11-22 - 主分类号： G10L13/02 文献下载
摘要：本申请提供了一种语音合成方法、装置、电子设备及计算机可读存储介质；所述方法包括：获取第一发音人针对第一文本的多种音频信息和第一发音人的标识，以及获取第二发音人针对第二文本的一种音频信息和第二发音人的标识；基于所述第一发音人的音频信息和所述第一发音人的标识、所述第二发音人的音频信息和所述第二发音人的标识，训练第一语音模型，学习重音特征以及声音特征；基于所述第二发音人的标识、待输出音频对应的文本和训练好的所述第一语音模型，确定目标输出音频。本申请提供的语音合成方法不仅高效实现了带有重音的语音合成，而且实现了重音的可控性，提升了语音合成的自然度及表现力。
语音合成方法装置电子设备计算机可读存储介质

[发明专利]一种视频流的字幕的确定方法、装置及可读存储介质-CN202011576783.X有效
发明人：张彬彬;陈晓宇;曾晨晨;杨超 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-28 - 公布日： 2022-08-19 - 主分类号： H04N21/488 文献下载
摘要：本发明公开了一种视频流的字幕的确定方法、装置及可读存储介质，该方法包括：获取视频流中的多个候选字幕图像及每个候选字幕图像对应的语音段；对每个候选字幕图像进行文本识别，得到每个候选字幕图像对应的第一文本；对每个候选字幕图像对应的语音段进行语音识别，得到每个候选字幕图像对应的第二文本；计算每个候选字幕图像对应的第一文本与第二文本之间的相似度；根据最大相似度值对应的候选字幕图像的第一文本确定视频流的字幕。通过实施本发明，可以确定每个候选字幕图像对应的第一文本与第二文本是否对应，根据对应最好的第一文本就可以确定为视频流的字幕，从而可以确定一个有效、准确的字幕。
一种视频字幕确定方法装置可读存储介质

[发明专利]文本间的语义相似性比较方法、设备及计算机存储介质-CN201910749686.7有效
发明人：祝文博;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2019-08-14 - 公布日： 2022-08-05 - 主分类号： G06F16/33 文献下载
摘要：本发明公开了一种文本间的语义相似性比较方法、设备及计算机存储介质，包括：确定第一文本和第二文本；分别对所述第一文本和第二文本进行分词处理，得到对应的第一分词处理结果和第二分词处理结果；将所述第一分词处理结果和第二分词处理结果进行向量转换，得到对应的第一词向量和第二词向量；分别将所述第一词向量和第二词向量映射到高维空间，得到对应的第一映射向量和第二映射向量；对所述第一映射向量和第二映射向量进行相似性比较，得到用于表征第一文本与第二文本之间语义相似性的比较结果。
文本语义相似性比较方法设备计算机存储介质

[发明专利]对话处理方法、设备及计算机存储介质-CN201910752180.1有效
发明人：祝文博;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2019-08-15 - 公布日： 2022-08-05 - 主分类号： G06F16/332 文献下载
摘要：本发明公开了一种对话处理方法、设备及计算机存储介质，包括：获得查询文本；对所述查询文本进行主题分析，得到主题词；分别对所述查询文本和主题词进行向量转换，获得对应的查询文本向量和主题词向量；融合所述查询文本向量和主题词向量，获得融合向量；将所述融合向量进行转换，得到对应所述查询文本的应答文本，应用本发明实施例对话处理方法，能够减少对话生成中产生的通用性回复。
对话处理方法设备计算机存储介质

[发明专利]一种对话容错方法、中控设备、系统以及可读存储介质-CN201910749547.4有效
发明人：张瀚;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2019-08-14 - 公布日： 2022-07-26 - 主分类号： G06F11/14 文献下载
摘要：本发明公开了一种对话容错方法、中控设备、系统以及可读存储介质，应用于中控设备，中控设备设置于用户或用户终端与对话系统之间，包括：接收来自用户或用户终端的用户请求；将用户请求转发至对话系统，以指示对话系统响应于用户请求；若在预设时间段内未接收到用于表征第一响应结果的回复信息，则将所接收的用户请求再转发至备份系统，以指示备份系统响应于用户请求；接收用于表征第二响应结果的回复信息，并将用于表征第二响应结果的回复信息转发至用户或用户终端。由此，当中控设备与对话系统之间的通信出现故障时，备份系统依然能够响应用户请求并将回复信息反馈给用户或者用户终端，使整个对话系统能正常使用。
一种对话容错方法设备系统以及可读存储介质

[发明专利]一种语音识别路径规划方法、系统及平台-CN202011627783.8在审
发明人：汪剑;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-31 - 公布日： 2021-05-18 - 主分类号： G01C21/36 文献下载
摘要：本发明公开了一种语音识别路径规划方法、系统及平台，属于语音信息处理，该方法包括：获取原始语音信息，调用预先训练得到的特征提取模型，提取音频序列特征；基于预测候选集，识别音频序列特征，并得到对应的序列信息表示；调用预先训练得到的语音识别模型，根据序列信息表示，结合当前对应的状态信息，选取当前位置出发收益期望值最高的路径作为路径规划中的下一条路径；调用深度强化网络智能体，完成序列路径决策，得到并输出解析路径信息。通过实施本发明披露的技术方案能够将语音序列信息的高层表示构建和语音识别的路径构建进行统一训练优化，避免了两者之间差异性造成的影响。
一种语音识别路径规划方法系统平台

[发明专利]一种获取语音识别模型训练数据的方法及装置-CN202011576869.2在审
发明人：张彬彬;杨超;陈晓宇;曾晨晨 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-28 - 公布日： 2021-05-14 - 主分类号： G10L15/22 文献下载
摘要：本发明公开了一种获取语音识别模型训练数据的方法及装置，该方法包括：获取视频流中的第t帧图像；当第t帧图像包括第一字幕区域，获取视频流中的第t+1帧图像，并从第t+1帧图像中确定与第一字幕区域的位置坐标相同的区域作为第二字幕区域；当第二字幕区域与第一字幕区域的相似度大于或等于预设阈值，以步长为1，依次获取视频流中的第t+2、第t+3…第t+n帧图像，直到第t+n帧图像对应的第n+1字幕区域与第t+n‑1帧图像对应的第n字幕区域的相似度小于预设阈值，并计算第t帧图像至第t+n‑1帧图像之间的时间段；提取视频流中时间段的语音，得到语音数据；对第一字幕区域至第n字幕区域中的任意一个字幕区域进行文本识别，得到与语音数据对应的标注文本数据。
一种获取语音识别模型训练数据方法装置

[发明专利]语音识别方法及装置-CN202011519104.5在审
发明人：张彬彬;吴迪;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-21 - 公布日： 2021-05-14 - 主分类号： G10L15/22 文献下载
摘要：公开了一种语音识别方法及装置。该方法应用于电子设备，所述电子设备包括流式语音识别模型，所述流式语音识别模型包括：CTC模型和Transformer模型，该方法包括：接收语音信息；对所述语音信息进行编码，生成编码序列；当所述编码序列中除最后一个元素外的任一元素生成时，利用CTC模型对所述元素进行识别，生成中间识别结果；输出所述中间识别结果；利用Transformer模型对所述编码序列进行识别，生成最终识别结果；输出所述最终识别结果。
语音识别方法装置

[发明专利]垃圾指令识别方法及装置-CN202011521158.5在审
发明人：胡晓慧;孟振南;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-21 - 公布日： 2021-05-14 - 主分类号： G10L15/02 文献下载
摘要：公开了一种垃圾指令识别方法及装置。该方法应包括获取音频信息；将所述音频信息转换为文字信息；提取所述音频信息的音频特征生成音频特征集合；利用预训练的文本模型获取所述文本信息的特征向量；将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。
垃圾指令识别方法装置

[发明专利]一种基于语言模型进行运算的训练方法及装置-CN202011621097.X在审
发明人：张旭;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-31 - 公布日： 2021-05-07 - 主分类号： G06F40/126 文献下载
摘要：本发明公开了一种基于语言模型进行算术运算的训练方法及装置，该方法包括在算式文本中每个字符前添加空格字符，生成准算式文本；对所述准算式文本进行分词处理，得到与所述准算式文本对应的列表，所述列表中包括多个词；将与所述准算式文本对应的列表作为训练样本，得到训练样本数据；利用语言模型对所述训练样本数据进行运算训练，生成算术模型。由此，通过添加空格字符和分词处理的方式对算式文本进行预处理，从而使得算式文本中每一个字符作为单独的词输入语言模型，语言模型能够对算式文本的每个字符和每个字符的数位信息进行学习，进而实现了在对语言模型采用少量训练样本训练后便可以有效提高训练后算术模型计算的准确率。
一种基于语言模型进行运算训练方法装置

[发明专利]模型训练方法及装置-CN202011362179.7在审
发明人：齐乔松;孟振南;雷欣;李志飞 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-11-27 - 公布日： 2021-04-02 - 主分类号： G06F9/48 文献下载
摘要：公开了一种模型训练方法及装置。该方法应包括利用共享层中包括的训练数据对多个任务模型的通用参数进行训练，将训练后的任务模型分别输出到对应的任务层中；根据所述训练数据对应的任务标识，将所述多个任务模型中的目标任务模型对应的目标训练数据提取到所述目标任务模型对应的任务层中；利用所述目标任务模型对应的任务层中包括的目标训练数据对所述目标任务模型的特定参数进行训练，输出训练后得到的目标任务模型。
模型训练方法装置

[发明专利]一种穿戴设备及其显示模组-CN202011537580.X在审
发明人：李永坡;王葆麟;李清亮;宋彪 -专利权人： 出门问问（武汉）信息科技有限公司
申请日： 2020-12-23 - 公布日： 2021-03-19 - 主分类号： G04B39/00 文献下载
摘要：本发明公开了一种穿戴设备及其显示模组，显示模组包括玻璃层；触摸层，贴合在玻璃层的一侧；LCD显示层，贴合在触摸层的远离玻璃层的一侧，且LCD显示层与玻璃层之间共同形成有环形容纳部；装饰圈，设置于LCD显示层与玻璃层之间，并部分容纳于环形容纳部内，且装饰圈能够与穿戴设备的主体部连接，以将显示模组安装在穿戴设备上。该显示模组自带装饰圈，在与穿戴设备进行装配时，可直接将装饰圈粘贴在穿戴设备的主体部上，从而避免了将显示模组分开成两部分再进行装配的过程，进而提高了显示模组装配的便利性。此外，该显示模组无需考虑装饰圈与显示模组的装配问题，具有更大的设计空间，以适应不同用户的使用需求。
一种穿戴设备及其显示模组

1
共 15 条