专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果288个,建议您升级VIP下载更多相关专利
  • [发明专利]歌曲标注检测方法、装置和系统及存储介质-CN202011122814.4在审
  • 崔君君;李秀林 - 标贝(北京)科技有限公司
  • 2020-10-20 - 2021-01-15 - G06F16/68
  • 本发明提供一种歌曲标注检测方法、装置和系统及存储介质。方法包括:获取拼音字典、针对同一待标注歌曲所标注的MusicXML文件和Interval文件;从MusicXML文件中提取第一歌词特征,该特征包括MusicXML文件中记录的每个歌词的拼音;基于拼音字典和第一歌词特征提取第一音素序列,该序列包括MusicXML文件中记录的每个歌词的每个音素;从Interval文件中提取第二歌词特征,该特征包括第二音素序列,该序列包括Interval文件中记录的每个音素;将第一音素序列中的第一音素与第二音素序列中的第二音素一一对应地进行比较;对于任一音素对,在该音素对中的音素不一致的情况下,输出第一错误反馈信息。可以自动检测MusicXML文件和Interval文件的歌曲标注结果是否一致,有助于提高歌曲标注的效率和准确度。
  • 歌曲标注检测方法装置系统存储介质
  • [发明专利]语音转换与模型训练方法、装置和系统及存储介质-CN202011054910.X在审
  • 武剑桃;李秀林 - 标贝(北京)科技有限公司
  • 2020-09-29 - 2021-01-05 - G10L13/033
  • 本发明提供一种语音转换方法、装置和系统及存储介质与一种模型训练方法、装置和系统及存储介质。语音转换方法包括:获取源说话者分别在N个不同通道下的N组源语音数据,其中,N为大于1的整数;分别对N组源语音数据中的每组源语音数据进行特征提取,以获得N组源识别声学特征;对N组源识别声学特征进行特征合并,以获得源说话者的声学特征;通过预定映射模型将源说话者的声学特征映射为目标说话者的声学特征;基于目标说话者的声学特征进行语音合成,以获得目标说话者的目标语音。基于多通道语音数据进行模型训练和语音转换,对嘈杂环境的鲁棒性更高,可以减少语音转换时识别不准的现象。
  • 语音转换模型训练方法装置系统存储介质
  • [发明专利]语音识别方法、装置和系统及存储介质-CN202011212947.0在审
  • 王杰;李秀林 - 标贝(北京)科技有限公司
  • 2020-11-02 - 2020-12-25 - G10L15/06
  • 本发明提供一种语音识别方法、装置和系统及存储介质。方法包括:获取待识别语音;提取待识别语音的声学特征;将声学特征输入转换器模型,以在第i个时间步获得转换器模型输出的与第i个语音段相对应的模型分数集合,i=1,2,……,n,模型分数集合包括与转换器模型所建模的文字集合中的所有文字一一对应的模型分数,每个模型分数表示第i个语音段属于该模型分数所对应的文字的概率;结合模型分数集合以及加权有限状态机模块,计算从第1个语音段至第i个语音段中的所有语音段所对应的至少一个转移路径各自的路径分数;基于至少一个转移路径各自的路径分数,获得与第i个语音段相对应的文字解码结果。该方法有助于提高整个语音识别系统的识别正确率。
  • 语音识别方法装置系统存储介质
  • [发明专利]语音识别方法、装置及存储介质-CN201710451642.7有效
  • 李秀林 - 北京嘀嘀无限科技发展有限公司
  • 2017-06-15 - 2020-12-25 - G06F40/284
  • 本申请提供一种语音识别方法、装置及存储介质,涉及计算机技术领域,所述方法包括:获取当前用户提供的待识别语音信息的至少两个候选识别结果及其分数;根据预设的关键词提取规则,从每个候选识别结果中提取预设类型的关键词汇;利用所提取到的关键词汇以及候选识别结果的分数,对每个候选识别结果的分数进行修正,并根据修正结果确定所述待识别语音信息的最终识别结果。由于本申请实施例利用从候选识别结果中提取到的关键词汇对候选识别结果的分数进行修正,实现将关键词汇作为修正的因素,可以使各个候选识别结果获得更加准确的分数,从而根据修正后的分数筛选出更加准确的识别结果。
  • 语音识别方法装置存储介质
  • [发明专利]基于唇形的语音生成方法、装置和系统及存储介质-CN202010650146.6在审
  • 刘博;李秀林 - 标贝(北京)科技有限公司
  • 2020-07-08 - 2020-11-10 - G10L13/047
  • 本发明提供一种基于唇形的语音生成方法、装置和系统及存储介质。方法包括:获取包含唇形信息的实际图像序列;从实际图像序列的每个实际图像中分别提取唇部特征,以获得实际唇部特征序列;将实际唇部特征序列输入唇语识别网络,以获得实际中间表示序列,其中,实际中间表示序列是音子后验概率序列或音子序列;以及将实际中间表示序列输入目标语音生成网络,以获得目标发音人的目标语音,目标语音的内容与实际图像序列中的唇形信息表达的语音内容一致。上述方式无需将唇形信息转换成文本再基于文本进行语音合成,这样可以降低文本识别错误进一步传导带来的影响,同时可以使得生成的语音能够与唇形信息更好地匹配。
  • 基于语音生成方法装置系统存储介质
  • [发明专利]语音合成方法和装置-CN201510728762.8有效
  • 李秀林;关勇;康永国;徐扬凯;陈汉英 - 百度在线网络技术(北京)有限公司
  • 2015-10-30 - 2020-09-25 - G10L13/02
  • 本发明提出一种语音合成方法和装置,该语音合成方法包括:获取以段落或篇章为单位的文本数据;在发音人朗读所述文本数据时进行录制,得到所述文本数据对应的语音数据,其中,发音人在朗读时结合文本数据的语义进行个人情感表达;生成韵律模型,以及,根据所述文本数据和所述语音数据生成声学模型;在需要进行语音合成时,根据预先生成的韵律模型和声学模型对输入文本进行处理,得到所述输入文本对应的合成语音。该方法能够提高合成语音的情感表现力。
  • 语音合成方法装置
  • [发明专利]语音识别后处理方法、装置、系统及存储介质-CN202010479490.3在审
  • 王杰;李秀林 - 标贝(北京)科技有限公司
  • 2020-05-29 - 2020-09-18 - G10L15/02
  • 本发明提供一种语音识别后处理方法、装置、系统及存储介质。语音识别后处理方法包括:实时获取语音识别模块输出的当前字符串;检查用于记录预设规则的规则文件是否存在更新;在所述规则文件存在更新的情况下,将修正规则更新为与所述规则文件中的新预设规则一致;基于所述修正规则对所述当前字符串进行修正,以获得待输出字符串;以及输出所述待输出字符串。上述方法可以支持对后处理所基于的修正规则的实时动态更新,进而支持对语音识别结果的实时修正,在此过程中无需如现有技术那样重启整个语音识别服务。
  • 语音识别处理方法装置系统存储介质
  • [发明专利]人机交互方法、服务端、客户端及存储介质-CN202010390340.5在审
  • 穆向禹;李秀林;胡帅君 - 标贝(北京)科技有限公司
  • 2020-05-09 - 2020-08-28 - G10L15/22
  • 本发明提供一种用于服务端的人机交互方法、服务端与用于客户端的人机交互方法、客户端及存储介质。方法包括:接收客户端发送的与当前用户的咨询问题相关的咨询信息,咨询信息包括用户文本信息和/或用户语音信息;将咨询信息以文本形式输出;接收专家客服输入的与咨询问题对应的专家回复信息,专家回复信息包括专家文本信息和/或专家语音信息;将专家反馈信息输出至客户端,以由客户端输出虚拟形象信息,专家反馈信息包括专家回复信息、虚拟语音信息或虚拟形象信息,虚拟语音信息通过将专家回复信息转换为与虚拟专家形象相对应的语音信息生成,虚拟形象信息通过至少将虚拟语音信息与虚拟专家形象叠加生成。可提升人效及用户体验。
  • 人机交互方法服务端客户端存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top