“鼎富新动力（北京）智能科技有限公司”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果24个，建议您升级VIP下载更多相关专利

[发明专利]一种语音合成方法、装置、电子设备及存储介质-CN202211516712.X在审
发明人：樊冯飞;姚树杰;赵言 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-11-29 - 公布日： 2023-06-23 - 主分类号： G10L13/027 文献下载
摘要：本申请提供一种语音合成方法、装置、电子设备及存储介质，其中语音合成方法包括：获取目标说话人训练数据，并提取目标说话人音色特征；在预训练数据中筛选与目标说话人的相似说话人音色特征；将训练好的预训练语音合成模型的模型参数加载至finetune语音合成模型；采用相似说话人音色特征与目标说话人音色特征共同训练finetune语音合成模型；将待合成文本输入训练好的finetune语音合成模型进行语音合成任务。通过预选构建的预训练模型，通过finetune的方式对预训练模型进行微调，以满足语音合成任务的及时性需求，极大提升了个性化语音合成模型的训练效率，进而提升了个性化语音合成任务的整体效率。
一种语音合成方法装置电子设备存储介质

[发明专利]一种文本的韵律识别方法、装置及应用-CN202211610445.2在审
发明人：姚树杰;赵言 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-12-14 - 公布日： 2023-06-06 - 主分类号： G06F16/683 文献下载
摘要：本申请提供了一种文本的韵律识别方法、装置及应用，使得录制音频的韵律和标注文本中的韵律标签精确匹配。方法包括：获取第一说话人根据第一文本录制的第一音频；根据第一音频和第一文本，确定第一文本中与音频的停顿时间段对应的第一位置；将第一文本输入第一神经网络模型以预测第一中间韵律标签，获取第二文本，第二文本包括第一中间韵律标签和第一文本；确定第一中间韵律标签在第二文本中的第二位置；根据第一位置和第二位置，确定候选位置；根据候选位置、第一音频和第一文本，确定训练数据集以训练第二神经网络模型，使得第二神经网络模型学习韵律标签对应候选位置的特征；使用训练好的第二神经网络模型识别目标文本的韵律标签。
一种文本韵律识别方法装置应用

[发明专利]一种通话音频处理方法及装置-CN202310027081.3在审
发明人：先永春;姚树杰 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2023-01-09 - 公布日： 2023-05-16 - 主分类号： G10L15/26 文献下载
摘要：本申请提供一种通话音频处理方法及装置。所述方法包括：对通话音频进行声道分离并提取有效语音片段，识别出对应的会话文本后，将会话文本按照时间顺序进行排列，基于每个会话文本对应的角色和时间顺序提取问答对，利用语言理解模型来对问答对进行推理和预测，生成问答对的问答类型和问答结果，最终将问答相关性较高的问答对的问答结果按照问答类型聚类后，得到通话音频的关键信息。整个方法基于问答对对通话音频进行分析，更加贴近实际应用场景，结合语言理解模型对通话音频的关键信息进行自动提取，最终整理出通话音频对应的关键信息，可以极大地提升作业效率，也可以避免在智能语音系统以外进行沟通时信息的缺失，有利于业务整体进展把控。
一种通话音频处理方法装置

[发明专利]一种语音合成方法和装置-CN202310078716.2在审
发明人：樊冯飞;姚树杰;赵言;先永春 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2023-01-17 - 公布日： 2023-05-12 - 主分类号： G10L13/027 文献下载
摘要：本申请提供了一种语音合成方法和装置，能够提升合成的语音的拟人化程度，使得合成的语音情感丰富。该方法包括：获取与训练文本对应的训练音频及标准的梅尔频谱；根据训练文本和训练音频，提取训练音频中每个音素的标准的语音特征；根据训练文本和训练音频，确定训练文本的情感标签序列，情感标签序列包含的数字表征训练文本中相应位置的文字是否用于表达情感；根据标准的梅尔频谱、标准的语音特征、情感标签序列、训练文本对应的音素标识序列和说话人的标识，确定训练数据；基于训练数据训练语音合成模型，使得语音合成模型学习到每个音素的语音特征，以及每个文字的情感特征；根据目标文本和训练好的语音合成模型，确定目标文本对应的合成语音。
一种语音合成方法装置

[发明专利]一种韵律标注方法、装置及应用-CN202211370337.2在审
发明人：赵言;姚树杰;樊冯飞 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-11-03 - 公布日： 2023-03-21 - 主分类号： G10L13/10 文献下载
摘要：本申请提供了一种韵律标注方法、装置及应用，能够使录制的语音音频韵律和标注文本韵律精确匹配。方法包括：获取特定说话人根据经过韵律标注的第一文本录制的第一语音数据，第一文本包括多个韵律标签，不同韵律标签表示的停顿的持续时长不同；根据第一语音数据和第一文本，统计多个韵律标签中每一韵律标签的持续时长，以获取每一韵律标签的持续时长的统计数据；根据每一韵律标签对应的统计数据，确定每一韵律标签持续时长的取值范围；获取特定说话人根据未经过韵律标注的第二文本录制的第二语音数据；根据第二语音数据获取第二语音数据各个停顿的持续时长，根据每一韵律标签的持续时长的取值范围和各个停顿的持续时长，对第二文本进行韵律标注。
一种韵律标注方法装置应用

[发明专利]一种机器人对话方法及装置-CN202211125045.2在审
发明人：黄国瑞 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-09-15 - 公布日： 2022-12-13 - 主分类号： G06F40/35 文献下载
摘要：本申请提供一种机器人对话方法及装置，应用于自然语言处理技术领域，其中，机器人对话方法应用于机器人对话平台，该机器人对话方法可以包括：根据对话信息调用预先配置好的目标插件，并获取与对话信息对应的插件信息；向业务系统发送对话信息以及插件信息，以使业务系统根据对话信息以及插件信息返回对应的业务数据；根据业务数据实现机器人对话。在上述方案中，机器人对话平台可以复用于不同的业务系统上，并通过采用不同的插件实现客户的定制化需求；同时，由于无需开发定制化的代码写入机器人对话平台中，因此可以提高机器人对话平台的实现效率。
一种机器人对话方法装置

[发明专利]一种目标任务决策方法、装置、电子设备及存储介质-CN202210713906.2在审
发明人：姚树杰 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-06-22 - 公布日： 2022-10-25 - 主分类号： G06Q10/06 文献下载
摘要：本申请提供一种目标任务决策方法、装置、电子设备及存储介质，该方法包括：获取目标任务对应的客户数据，并使用训练后的增益模型对客户数据进行计算，获得个体干预效应值，个体干预效应值表征单个客户在群体的子集中平均期望因果效应；根据个体干预效应值对目标任务进行决策。通过训练后的增益模型来对客户数据进行计算，获得个体干预效应值，并根据个体干预效应值对目标任务进行决策，获得决策结果；由于增益模型不仅能够考虑到客户数据与客户转化率之间的关联关系，同时有效地考虑到客户数据的因变量与任务结果的转化率之间存在因果关系，因此，能够尽量达到全局最优化效果，从而有效地提高了目标任务进行决策的正确率。
一种目标任务决策方法装置电子设备存储介质

[发明专利]一种音频生成方法及装置-CN202210792253.1在审
发明人：赵言;樊冯飞;姚树杰 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-07-05 - 公布日： 2022-10-11 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例提供一种音频生成方法及装置，方法包括获取第一话术集，基于预设的语言模型对第一话术集中的话术语料进行顺滑度检查，确定目标语料，并生成包含目标语料的第二话术集，在预设的录制环境下对第二话术集进行录制，得到初始音频数据集。将初始音频数据集与预设的公开数据集进行归一化处理，得到目标音频数据集。本申请能够基于目标业务场景生成第二话术集，使得第二话术集中的话术语料与目标业务场景相贴合。还可以在预设的录制环境下对第二话术集进行录制，可以保证录制效果。此外，能够基于初始音频数据集和公开数据集共同生成目标音频数据集，该目标音频数据集应用至语音合成模型训练过程中可以保证训练的准确性。
一种音频生成方法装置

[发明专利]一种语音识别方法及系统-CN202210787025.5在审
发明人：王鹏雷 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-07-04 - 公布日： 2022-10-04 - 主分类号： G10L15/04 文献下载
摘要：本申请提供一种语音识别方法及系统。所述方法包括：对于目标语音数据流与缓存语音数据流共同组成的待处理语音数据流，根据语音活动检测参数，利用预设GMM模型从待处理语音数据流中提取非静音的有效数据帧，对有效数据帧依次进行降噪处理、文本数据转换以及语义识别，得到当前语义识别率，在当前语义识别率小于第一预设阈值的情况下，分别调整语音活动检测参数、缓存指令和降噪参数。整个方法可以根据语音识别率实时调整语音活动检测参数、缓存参数以及降噪参数等配置参数，从而可以根据实际对话场景不断修正配置参数，使得配置参数在对话场景发生变化时能够及时地适应，语音提取准确性较高，进而语义识别率也较高。
一种语音识别方法系统

[发明专利]一种语音交互方法、系统、电子设备及存储介质-CN202210725106.2在审
发明人：姚树杰;田绍伟;李子建;赵言;先永春;胡加明 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-06-23 - 公布日： 2022-10-04 - 主分类号： G10L15/22 文献下载
摘要：本申请提供一种语音交互方法、系统、电子设备及存储介质，在双工通信的基础上，在对话机器人播报过程中获取到用户语音流，根据用户语音流以及播报的播报状态，判断是否打断播报，使机器人在“说话”的过程中及时捕捉和理解用户的“输入”，理解到有意义的语义则暂停播报并针对最新输入进行答复或采取相应动作，在用户想要打断对话时能够打断对话机器人的当前播报，提高了客户在交流过程中的拟人化交流及个性化体验，提高了对话的灵活性。并且，相较于纯语义打断，结合了语义和播报状态综合判断是否需要打断的打断策略更具有可控性和灵活性，可配置性也更强。
一种语音交互方法系统电子设备存储介质

[发明专利]一种人机交互方法、装置、电子设备及存储介质-CN202210729336.6在审
发明人：王鹏雷;胡加明 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-06-24 - 公布日： 2022-09-13 - 主分类号： G06F16/35 文献下载
摘要：本申请提供一种人机交互方法、装置、电子设备及存储介质，该方法包括：接收终端设备发送的会话请求，会话请求包括：用户标识和语音信息；获取用户标识对应的用户画像，并从多个会话配置信息中匹配出用户画像对应的会话配置信息；根据用户画像对应的会话配置信息对语音信息进行处理，获得会话请求对应的会话响应；向终端设备发送会话请求对应的会话响应。通过用户画像对应的会话配置信息对语音信息进行处理，获得会话请求对应的会话响应，使得实时生成的会话响应始终围绕终端设备对应的用户画像，避免了人机交互的会话场景随意切换的情况，有效地满足了实际会话场景中的特定业务需求。
一种人机交互方法装置电子设备存储介质

[发明专利]一种对话流诊断方法和装置-CN202210685361.9在审
发明人：田绍伟;李子建;姚树杰;先永春;胡加明 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-06-15 - 公布日： 2022-09-02 - 主分类号： G06F16/9032 文献下载
摘要：本申请提供了一种对话流诊断方法和装置，该方法包括：获取用户与对话终端交互的对话记录，对话记录的对话终端部分是其根据对话流的第一单分支路径生成的；确定对话记录是否包含关键字；若包含，则根据关键字确定第一单分支路径的第一节点的类型，第一节点与包含关键字的对话记录相匹配；根据第一节点的类型和对话记录确定回答话术，回答话术用于触发对话终端根据对话流其他路径作出第一响应，第二单分支路径与第一单分支路径不同；若第一响应出现异常，则校验用于对话终端作出第一响应的节点的配置。该方法基于对话记录对应的单分支对话流路径，能够自动、高效、全面地检验其他路径的运行情况，对话流覆盖率高且能提升对话流的鲁棒性。
一种对话诊断方法装置

[发明专利]一种知识库数据增强方法及装置-CN202210714448.4在审
发明人：李子建;姚树杰 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-06-22 - 公布日： 2022-08-30 - 主分类号： G06F16/35 文献下载
摘要：本申请提供一种知识库数据增强方法及装置，应用于数据处理领域，其中，知识库数据增强方法包括：循环执行交叉验证的步骤，得到交叉验证结果；其中，交叉验证结果包括多个测试结果；交叉验证的步骤包括：将知识库中的数据集划分为训练集以及测试集，其中，数据集包括多个意图类别，每个意图类别包括多个语句，训练集以及测试集均包括数据集中全部的意图类别；利用训练集对初始的第一文本分类模型进行训练，得到训练好的第二文本分类模型；利用第二文本分类模型对测试集进行测试，得到一个测试结果；根据交叉验证结果计算知识库中每个语句的错误率，并根据错误率对知识库进行更新。
一种知识库数据增强方法装置

[发明专利]一种对话管理方法、装置、计算机设备和存储介质-CN202210723432.X在审
发明人：赵汝成;黄国瑞;先永春 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-06-21 - 公布日： 2022-08-30 - 主分类号： G06F16/332 文献下载
摘要：本申请实施例提供了一种对话管理方法、装置、计算机设备和存储介质，通过获取用户发出的语音流数据，并根据语音流数据确定出初始用户意图。在确定了初始用户意图后，可以根据初始用户意图获取目标状态机流程图。然后通过状态机控制用户说状态节点、机器人思考状态节点及机器人说状态节点执行目标状态机流程图，确定初始用户意图的答复结果。由于目标状态机流程图由状态机的流程控制，仅包括了三个状态节点，可以通过用户说状态节点触发，经由一系列机器人思考状态节点，最终会流转到某一个机器人说状态节点上进行应答通过问答的形式完全实现，执行逻辑简单，且与运营侧平台发布的复杂节点构成的流程图完全解耦，简化了运营维护复杂度。
一种对话管理方法装置计算机设备存储介质

[发明专利]一种智能对话方法及装置-CN202210301607.8在审
发明人：黄国瑞;李腾;先永春;王炼;胡加明 -专利权人： 鼎富新动力（北京）智能科技有限公司
申请日： 2022-03-24 - 公布日： 2022-06-24 - 主分类号： G06F16/9032 文献下载
摘要：本申请提供一种智能对话方法及装置，该智能对话方法包括:接收用户输入的提问信息；通过统一识别引擎对提问信息进行意图识别，得到多个问法意图；根据多个问法意图进行统一意图排序，在多个问法意图中确定出提问意图；匹配与提问意图相对应的多层对话流程；在统一知识库中查找与多层对话流程相匹配的应答信息；根据多层对话流程，输出应答信息。可见，实施这种实施方式，能够统一识别引擎、统一应答引擎来避免在对话过程中多种引擎的同时执行，从而能够降低机器人智能对话问答过程中的资源消耗和延时，进而使得智能对话机器人能够提供更好的服务体验。
一种智能对话方法装置

1
2
下一页»
尾页
共 24 条