[发明专利]人工智能对话方法有效
| 申请号: | 202110350584.5 | 申请日: | 2021-03-31 | 
| 公开(公告)号: | CN112905781B | 公开(公告)日: | 2022-05-03 | 
| 发明(设计)人: | 徐戈;方荟;张华;林涌超;杨晓燕;王炅 | 申请(专利权)人: | 闽江学院 | 
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/63 | 
| 代理公司: | 福州市景弘专利代理事务所(普通合伙) 35219 | 代理人: | 黄以琳;张忠波 | 
| 地址: | 350108 福建省*** | 国省代码: | 福建;35 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 人工智能 对话 方法 | ||
1.一种人工智能对话方法,其特征在于,包括如下步骤,获取用户语音输入,将用户语音输入识别、转化为文本输入,
对所述文本输入执行意图理解,根据意图理解的结果选择将文本输入送入开域对话及自定义问答流程、任务式对话流程;
其中,开域对话及自定义问答流程如下,
对文本输入计算第一句子向量;
根据第一句子向量与答案库中的问题的句子向量比对结果,找出与第一句子向量相似度最高的答案库中的问题;
返回该问题的答案;
任务式对话流程的步骤如下:
对文本输入计算第二句子向量;
根据第二句子向量与任务式对话库中任务代表句子的句子向量比对结果,找出相似度最高的任务代表句子,获取任务代表句子对应的任务;
获取任务代表句子对应的任务所要获取的信息;
检测所述文本输入中是否包含所述要获取的信息;
如果没有,则提示用户补充信息,直至所有要获取的信息均被检测到。
2.根据权利要求1所述的人工智能对话方法,其特征在于,还包括步骤,在任务式对话步骤开始时,首先对用户分配一个临时ID,并保存每个ID与要获取的信息的获取状态的对应表。
3.根据权利要求2所述的人工智能对话方法,其特征在于,对于分配了临时ID的用户,检测其是否与服务器保持连接,如果超过一定时长T未与服务器保持连接,则销毁所述临时ID。
4.根据权利要求1所述的人工智能对话方法,其特征在于,还包括步骤,在意图理解的部分设置优先级,即当开域对话及问答流程、或任务式对话流程均可被选择时,按预设的的优先级处理。
5.根据权利要求4所述一种人工智能对话方法,其特征在于,设置所述任务式对话的优先级高于问答,设置所述问答高于开域对话。
6.根据权利要求1所述的人工智能对话方法,其特征在于,还包括步骤,构建标注语料库,并用该语料库训练一个开域对话模型,在进入开域对话流程时直接使用该开域对话模型返回结果。
7.根据权利要求1所述的人工智能对话方法,其特征在于,开域对话流程的答案库通过语料库训练获得,所述语料库通过如下方式标注:
切分步骤:
获取N个待标注音频文件F1,F2,F3 ... FN,
对每个待标注音频文件Fi,计算Mi个切分点,并将Fi切分为Mi +1个音频片段,i取值为1,2,3……N,与所述待标注音频文件的数量一致,
将所有待标注音频文件切分形成的音频片段乱序处理,生成乱序处理后的音频片段集合As;
记录所有待标注音频文件的切分点位置,以及所述切分点位置与所述切分点位置对应的所述音频片段集合As中的元素的对应关系,形成切分记录Rs;
处理步骤:
获取乱序处理后的音频片段集合As,
对乱序后的音频片段进行标注处理,形成标注记录Ls;
合成步骤:
获取标注记录Ls,
获取切分记录Rs,
利用Rs将Ls中的标注内容重组排列,使得重组后的标注内容的顺序与所述待标注音频文件的内容一致,形成重组标注记录RLs;重组标注记录RLs作为语料库,所述切分记录Rs对所述处理步骤隔离。
8.如权利要求7所述的人工智能对话方法,其特征在于,所述乱序处理后的音频片段集合As中,每两个相邻的音频片段以大于等于P1的概率不属于同一个待标注音频文件,以大于或等于P2的概率不是同一个待标注音频文件的相邻两个音频片段。
9.如权利要求8所述的人工智能对话方法,其特征在于,生成乱序处理后的音频片段集合As之后还包括如下步骤:
将音频片段集合As的内的音频片段随机重命名,记录重命名后的音频文件和原待标注音频文件的对应关系,将音频片段集合As的音频片段以文件名首字母顺序排序。
10.根据权利要求9所述的人工智能对话方法,其特征在于,还执行校验重排操作:
获取两个相邻的音频片段属于同一个待标注音频文件的音频片段集合S1,获取两个相邻的音频片段是同一个待标注音频文件的相邻两个切分的音频片段集合S2,如果N(S1)/N(As)1-P1,则将属于S1的音频片段文件再次随机重命名;
如果N(S2)/N(As)1-P2,则将属于S2的音频片段文件再次随机重命名,其中N(S1)表示音频片段集合S1中符合的音频文件总数,N(S2)表示音频片段集合S2中符合的音频文件总数;
执行所述校验重排操作,直到满足条件:每两个相邻的音频片段以大于或等于P1的概率不属于同一个待标注音频文件,以大于或等于P2的概率不是同一个待标注音频文件的相邻两个切分为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110350584.5/1.html,转载请声明来源钻瓜专利网。





