专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果176个,建议您升级VIP下载更多相关专利
  • [发明专利]一种说话人转换点检测方法、装置、设备及存储介质-CN202110745056.X有效
  • 董林昊;范志赟;马泽君 - 北京有竹居网络技术有限公司
  • 2021-06-30 - 2023-08-08 - G10L25/87
  • 本申请公开了一种说话人转换点检测方法、装置、设备及存储介质,该方法包括:首先获取待检测的目标语音数据;并从其中提取表征其声学信息的声学特征,然后对该声学特征进行编码处理,得到目标语音数据的语音帧级别的说话人表征向量,接着,基于CIF对目标语音数据的语音帧级别的说话人表征向量进行整合发放,得到目标语音数据中以说话人转换点为边界的说话人表征序列,进而可以根据该说话人表征序列,确定说话人转换点对应的时间戳。可见,由于本申请是模拟人脑对信息处理的方式,利用CIF对目标语音数据中逐帧累积的说话人表征向量进行充分整合发放,从而能够有效提高交互类型的目标语音数据中说话人转换点检测结果的准确性。
  • 一种说话转换检测方法装置设备存储介质
  • [发明专利]音频的字幕对齐方法、装置、介质和电子设备-CN202310531888.0在审
  • 孙修松;马泽君 - 北京有竹居网络技术有限公司
  • 2023-05-11 - 2023-08-01 - H04N21/43
  • 本公开涉及音频识别技术领域,具体地,涉及一种音频的字幕对齐方法、装置、介质和电子设备。该方法包括:获取目标音频和目标音频的目标字幕文本;若目标音频的时长大于第一预设时长,则根据切片时长,对目标音频进行切片处理,得到多个第一目标音频;确定每一第一目标音频的第一音频特征信息;若目标音频的时长小于或等于第二预设时长,则对全部第一音频特征信息进行拼接,得到目标音频的目标音频特征信息,其中,第二预设时长大于第一预设时长;根据目标字幕文本和目标音频特征信息,生成目标音频对应的字幕信息。如此,能够避免占据过多的机器资源,通过一次对齐实现目标字幕文本和目标音频特征信息的匹配,提高对齐结果的准确性。
  • 音频字幕对齐方法装置介质电子设备
  • [发明专利]文本口语化转换模型构建方法、装置及电子设备-CN202310421130.1在审
  • 周娜;谭言信;彭冲;马泽君 - 北京有竹居网络技术有限公司
  • 2023-04-18 - 2023-08-01 - G06F40/289
  • 本公开实施例涉及一种文本口语化转换模型构建方法、装置及电子设备,该方法包括:获取第一文本样本,第一文本样本中包括口语化词汇;将第一文本样本输入到预训练的口语化识别模型中,识别第一文本样本中的口语化词汇;对第一文本样本中的口语化词汇进行去除后,获取第二文本样本;将第一文本样本和第二文本样本构成伪平行语料后,输入到预构建的文本口语化转换模型中,对文本口语化转换模型进行训练,获取最终的文本口语化转换模型。通过该方式可以获取大量的伪平行语料,避免人工标注的成本,也能够克服现有技术中平行语料的数量太少对模型训练的限制问题。再者,还能够从侧面提升文本口语化转换模型的转换程度和生成口语化文本的生成质量。
  • 文本口语化转换模型构建方法装置电子设备
  • [发明专利]语音识别方法、装置和电子设备-CN202110470943.0有效
  • 黄明坤;马泽君 - 北京有竹居网络技术有限公司
  • 2021-04-28 - 2023-07-18 - G10L15/26
  • 本公开实施例公开了语音识别方法、装置和电子设备。该方法的一具体实施方式包括:获取待识别的语音块作为当前语音块,其中,当前语音块中的将来帧的数目小于第一目标数目;增加当前语音块的将来帧,得到调整后的语音块,其中,增加的将来帧中的语音内容为空,调整后的语音块中将来帧的数目为第一目标数目;对调整后的语音块进行语音识别,得到语音识别结果作为目标语音识别结果,其中,目标语音识别结果包括当前帧的语音识别结果和第一目标帧的语音识别结果,第一目标帧为位于当前帧之前的第二目标数目个语音帧;基于目标语音识别结果,对已识别出的语音识别结果进行更新。该实施方式可以在减小语音识别延迟的同时提高语音识别准确率。
  • 语音识别方法装置电子设备
  • [发明专利]噪音数据提取方法、装置、介质及电子设备-CN202310152649.4在审
  • 文仕学;陈金坤;黄露;马泽君 - 北京有竹居网络技术有限公司
  • 2023-02-16 - 2023-07-14 - G10L15/06
  • 本公开涉及一种噪音数据提取方法、装置、介质及电子设备。方法包括:提取原始音频中的非语音片段;根据非语音片段的语音识别结果和目标任务的任务需求,从非语音片段中剔除误召回的语音帧;若剔除后所得的非语音片段为噪音,则将其确定为用于所述目标任务的噪音数据。这样可从任意音频数据中自动提取噪音数据,方便快捷且成本低,而无需专门采集噪音数据,也无需额外的人力成本或采购成本。另外,根据非语音片段的语音识别结果和目标任务的任务需求,从非语音片段中剔除误召回的语音帧,可避免噪音数据中参杂人声数据,提升噪音数据精度。此外,还可根据不同的任务需求,采用不同的语音帧剔除策略,从而使得筛选出的噪音数据更加符合任务需求。
  • 噪音数据提取方法装置介质电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top