“马泽君”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果176个，建议您升级VIP下载更多相关专利

[发明专利]语音对象分离方法、装置、终端设备及云服务器-CN202310588293.9在审
发明人：李光正;张志飞;徐杨飞;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-05-23 - 公布日： 2023-08-08 - 主分类号： G10L21/0308 文献下载
摘要：本公开实施例涉及一种语音对象分离方法、装置、终端设备及云服务器，该方法包括：获取原始语音数据；对原始语音数据进行信号检测，获取至少两个语音片段；分别提取至少两个语音片段中每一个语音片段对应的相干散射能量比；基于每一个语音片段对应的相干散射能量比，将至少两个语音片段进行二分类处理，获取与目标对象对应的语音片段，以及除目标对象之外的其他语音对象对应的语音片段。通过该方式分离属于目标对象的语音片段时，无需使用语音识别算法和意图识别算法，自然也就会大大降低语音对象分离方法的复杂度，提高识别精度。
语音对象分离方法装置终端设备服务器

[发明专利]一种文本处理方法、装置、设备及介质、程序产品-CN202110506873.X有效
发明人：林雨;吴培昊;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2021-05-10 - 公布日： 2023-08-08 - 主分类号： G06F40/253 文献下载
摘要：本公开提供了一种文本处理方法，该方法包括获取待处理文本中原语句对应的多个候选修改句，然后根据原语句以及多个候选修改句，通过评估模型获得多个候选修改句的第一评分，该评估模型为双向预训练模型通过文本纠错语料迁移学习得到，接着根据第一评分从多个候选修改句中确定原语句的目标修改句。该方法中评估模型具有双向预训练模型带来的高效以及高性能的特点，进而得到的第一评分的准确度更高，根据准确度较高的第一评分确定目标修改句，能够提高语法纠错的准确率，满足业务需求。
一种文本处理方法装置设备介质程序产品

[发明专利]一种说话人转换点检测方法、装置、设备及存储介质-CN202110745056.X有效
发明人：董林昊;范志赟;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2021-06-30 - 公布日： 2023-08-08 - 主分类号： G10L25/87 文献下载
摘要：本申请公开了一种说话人转换点检测方法、装置、设备及存储介质，该方法包括：首先获取待检测的目标语音数据；并从其中提取表征其声学信息的声学特征，然后对该声学特征进行编码处理，得到目标语音数据的语音帧级别的说话人表征向量，接着，基于CIF对目标语音数据的语音帧级别的说话人表征向量进行整合发放，得到目标语音数据中以说话人转换点为边界的说话人表征序列，进而可以根据该说话人表征序列，确定说话人转换点对应的时间戳。可见，由于本申请是模拟人脑对信息处理的方式，利用CIF对目标语音数据中逐帧累积的说话人表征向量进行充分整合发放，从而能够有效提高交互类型的目标语音数据中说话人转换点检测结果的准确性。
一种说话转换检测方法装置设备存储介质

[发明专利]一种手势动作的识别方法、装置、电子设备及存储介质-CN202310532245.8在审
发明人：张鹏;贡昱洲;徐杨飞;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-05-11 - 公布日： 2023-08-04 - 主分类号： G06F18/2415 文献下载
摘要：本公开公开了一种手势动作的识别方法、装置、电子设备及存储介质。包括：采集至少一个目标对象在预设时间内产生的肌电信号序列；检测所述肌电信号序列，得到所述肌电信号序列对应的目标信号特征；对所述目标信号特征进行计算得到目标概率矩阵，其中，所述目标概率矩阵用于表示所述预设时间内每一时刻对应多个手势动作的概率分布；基于所述目标概率矩阵确定每一时刻对应的目标手势动作，并基于目标手势动作生成所述目标对象在预设时间内的手势动作序列。本公开实现了实时检测多个对象的手势动作，且能够针对每一个对象进行连续多个手势动作的识别，提高了手势识别的精度。
一种手势动作识别方法装置电子设备存储介质

[发明专利]音频的字幕对齐方法、装置、介质和电子设备-CN202310531888.0在审
发明人：孙修松;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-05-11 - 公布日： 2023-08-01 - 主分类号： H04N21/43 文献下载
摘要：本公开涉及音频识别技术领域，具体地，涉及一种音频的字幕对齐方法、装置、介质和电子设备。该方法包括：获取目标音频和目标音频的目标字幕文本；若目标音频的时长大于第一预设时长，则根据切片时长，对目标音频进行切片处理，得到多个第一目标音频；确定每一第一目标音频的第一音频特征信息；若目标音频的时长小于或等于第二预设时长，则对全部第一音频特征信息进行拼接，得到目标音频的目标音频特征信息，其中，第二预设时长大于第一预设时长；根据目标字幕文本和目标音频特征信息，生成目标音频对应的字幕信息。如此，能够避免占据过多的机器资源，通过一次对齐实现目标字幕文本和目标音频特征信息的匹配，提高对齐结果的准确性。
音频字幕对齐方法装置介质电子设备

[发明专利]文本口语化转换模型构建方法、装置及电子设备-CN202310421130.1在审
发明人：周娜;谭言信;彭冲;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-04-18 - 公布日： 2023-08-01 - 主分类号： G06F40/289 文献下载
摘要：本公开实施例涉及一种文本口语化转换模型构建方法、装置及电子设备，该方法包括：获取第一文本样本，第一文本样本中包括口语化词汇；将第一文本样本输入到预训练的口语化识别模型中，识别第一文本样本中的口语化词汇；对第一文本样本中的口语化词汇进行去除后，获取第二文本样本；将第一文本样本和第二文本样本构成伪平行语料后，输入到预构建的文本口语化转换模型中，对文本口语化转换模型进行训练，获取最终的文本口语化转换模型。通过该方式可以获取大量的伪平行语料，避免人工标注的成本，也能够克服现有技术中平行语料的数量太少对模型训练的限制问题。再者，还能够从侧面提升文本口语化转换模型的转换程度和生成口语化文本的生成质量。
文本口语化转换模型构建方法装置电子设备

[发明专利]发音评价方法、装置、可读介质及电子设备-CN202310460583.5在审
发明人：李亮亮;李伟;高绍钧;田霄海;付凯奇;马泽君 -专利权人：北京有竹居网络技术有限公司;脸萌有限公司
申请日： 2023-04-25 - 公布日： 2023-07-28 - 主分类号： G10L25/51 文献下载
摘要：本公开涉及一种发音评价方法、装置、可读介质及电子设备，所述方法包括：获取待评价的目标语音和所述目标语音对应的目标文本；根据目标语音和目标文本，确定目标语音对应的多个目标音素特征；将多个目标音素特征和至少一个目标评价任务输入预先生成的发音评价模型，以获取发音评价模型输出的每个目标评价任务对应的评价值；其中，发音评价模型通过多个样本集对目标神经网络模型进行训练得到的，样本集包括样本文本的每个样本音素的样本音素信息、每个样本音素在样本语音中的样本音素特征、多个样本评价任务以及每个样本评价任务对应的样本评价值，样本音素信息包括样本音素标识和样本位置信息。
发音评价方法装置可读介质电子设备

[发明专利]语音翻译方法及装置、电子设备、存储介质-CN202310522097.1在审
发明人：章峻珲;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-05-10 - 公布日： 2023-07-28 - 主分类号： G10L15/00 文献下载
摘要：本公开能够提供语音翻译方法及装置、电子设备、存储介质，其中，语音翻译方法包括：接收第一语音，第一语音为待进行翻译的源语言语音；从第一语音中提取出第一声学特征信息，第一声学特征信息用于表示源语言语音的语义；将第一声学特征信息转换为目标语言的频谱信息，对频谱信息进行编码，以生成第二语音；第二语音为对源语言语音进行翻译之后得到的目标语言语音。本公开提供的语音翻译方案能够适用于更多的应用场景，实现了对语音翻译功能的优化，明显提升了用户体验。
语音翻译方法装置电子设备存储介质

[发明专利]一种语音数据的处理方法、装置、电子设备及存储介质-CN202310573990.7在审
发明人：付凯奇;田霄海;李伟;马泽君 -专利权人：北京有竹居网络技术有限公司;脸萌有限公司
申请日： 2023-05-19 - 公布日： 2023-07-28 - 主分类号： G10L25/60 文献下载
摘要：本公开提供了一种语音数据的处理方法、装置、电子设备及存储介质。包括：获取待识别的目标语音数据；检测目标语音数据得到目标特征序列以及目标时间序列，目标特征序列包括目标语音数据中各个音频帧对应音素的音素描述信息，目标时间序列包括目标语音数据中各个音素对应的时间信息；基于目标特征序列中的音素描述信息以及目标时间序列中的时间信息进行线性计算，得到目标语音数据对应的目标流利度。本公开通过提取语音数据的目标特征序列以及目标时间序列，通过目标特征序列中的音素描述信息以及目标时间序列中的时间信息能够准确的表达出细粒度的声学特征，为语音数据的流利度检测提供了可靠的依据，提高了流利度检测结果的可靠性。
一种语音数据处理方法装置电子设备存储介质

[发明专利]视频字幕生成方法、装置、介质及电子设备-CN202310457969.0在审
发明人：孙修松;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-04-25 - 公布日： 2023-07-21 - 主分类号： H04N21/435 文献下载
摘要：本公开涉及一种视频字幕生成方法、装置、介质及电子设备，方法包括：获取目标音频；确定所述目标音频中的事件在所述目标音频中持续的事件时间范围，所述事件包括在所述目标音频中的语音片段中发生的事件和在所述目标音频中的非语音片段中发生的事件；根据所述事件在所述目标音频中持续的事件时间范围，将所述事件对应的事件标签作为字幕添加到视频对应该事件时间范围的视频帧中，所述视频为与所述目标音频对应的视频，提升了视频字幕展示的效果。
视频字幕生成方法装置介质电子设备

[发明专利]对象识别方法、装置、可读介质及电子设备-CN202310436583.1在审
发明人：郭义;何义乾;李晓阳;禹梓林;秦浩桐;张阳;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-04-21 - 公布日： 2023-07-21 - 主分类号： G06F18/2135 文献下载
摘要：本公开涉及一种对象识别方法、装置、可读介质和电子设备，可以获取待识别的目标对象；将所述目标对象输入目标识别模型后，得到识别结果；所述目标识别模型为根据投影矩阵、第一特征图以及第二特征图对目标知识接受模型进行模型训练后得到的识别模型；所述第一特征图为预先训练得到的目标知识输出模型的至少一个第一预设中间层输出的特征图，所述第二特征图为预先训练得到的所述目标知识接受模型的至少一个第二预设中间层输出的特征图；所述投影矩阵用于对所述第一特征图和所述第二特征图进行知识蒸馏。
对象识别方法装置可读介质电子设备

[发明专利]用于媒体内容推荐的方法、装置、设备和存储介质-CN202310020500.0在审
发明人：王聪;高嘉敏;黄培松;田霄海;马泽君 -专利权人：北京有竹居网络技术有限公司;脸萌有限公司
申请日： 2023-01-06 - 公布日： 2023-07-18 - 主分类号： G06F16/435 文献下载
摘要：根据本公开的实施例，提供了一种用于媒体内容推荐的方法和装置。该方法包括从候选媒体内容中提取文本信息；基于所提取的所述文本信息来生成与所述候选媒体内容相关联的音频信息；以及响应于所述音频信息相对于所述候选媒体内容的密度超过阈值密度，基于所述候选媒体内容向用户进行推荐。以此方式，能够实现为特定群体用户推荐更加合适的媒体内容，从而提升客户体验。
用于媒体内容推荐方法装置设备存储介质

[发明专利]语音识别方法、装置和电子设备-CN202110470943.0有效
发明人：黄明坤;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2021-04-28 - 公布日： 2023-07-18 - 主分类号： G10L15/26 文献下载
摘要：本公开实施例公开了语音识别方法、装置和电子设备。该方法的一具体实施方式包括：获取待识别的语音块作为当前语音块，其中，当前语音块中的将来帧的数目小于第一目标数目；增加当前语音块的将来帧，得到调整后的语音块，其中，增加的将来帧中的语音内容为空，调整后的语音块中将来帧的数目为第一目标数目；对调整后的语音块进行语音识别，得到语音识别结果作为目标语音识别结果，其中，目标语音识别结果包括当前帧的语音识别结果和第一目标帧的语音识别结果，第一目标帧为位于当前帧之前的第二目标数目个语音帧；基于目标语音识别结果，对已识别出的语音识别结果进行更新。该实施方式可以在减小语音识别延迟的同时提高语音识别准确率。
语音识别方法装置电子设备

[发明专利]噪音数据提取方法、装置、介质及电子设备-CN202310152649.4在审
发明人：文仕学;陈金坤;黄露;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-02-16 - 公布日： 2023-07-14 - 主分类号： G10L15/06 文献下载
摘要：本公开涉及一种噪音数据提取方法、装置、介质及电子设备。方法包括：提取原始音频中的非语音片段；根据非语音片段的语音识别结果和目标任务的任务需求，从非语音片段中剔除误召回的语音帧；若剔除后所得的非语音片段为噪音，则将其确定为用于所述目标任务的噪音数据。这样可从任意音频数据中自动提取噪音数据，方便快捷且成本低，而无需专门采集噪音数据，也无需额外的人力成本或采购成本。另外，根据非语音片段的语音识别结果和目标任务的任务需求，从非语音片段中剔除误召回的语音帧，可避免噪音数据中参杂人声数据，提升噪音数据精度。此外，还可根据不同的任务需求，采用不同的语音帧剔除策略，从而使得筛选出的噪音数据更加符合任务需求。
噪音数据提取方法装置介质电子设备

[发明专利]意图识别方法、装置、可读介质及电子设备-CN202111402778.1有效
发明人：李晓阳;禹梓林;张向阳;田晓刚;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2021-11-19 - 公布日： 2023-07-07 - 主分类号： G06F16/33 文献下载
摘要：本公开涉及一种意图识别方法、装置、可读介质及电子设备，该方法通过预设意图识别量化模型对目标文本中每个字符对应的查询向量与键向量的点积进行量化操作，以得到第一比特位的定点型目标向量，根据该定点型目标向量通过目标映射关系确定每个字符对应的第二比特位的浮点型注意力权重，根据该浮点型注意力权重确定该目标文本对应的目标意图，该第一比特位小于该第二比特位，能够通过将确定每个字符对应的第二比特位的浮点型注意力权重过程中复杂的计算过程调整为从该目标映射关系中查找对应关系，以确定该浮点型注意力权重的过程，从而能够有效减少模型运算量，提升模型识别效率。
意图识别方法装置可读介质电子设备