[发明专利]一种会话场景数据库的创建方法及装置有效
申请号: | 201510741076.4 | 申请日: | 2015-11-04 |
公开(公告)号: | CN106649404B | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 陈包容 | 申请(专利权)人: | 陈包容 |
主分类号: | G06F16/21 | 分类号: | G06F16/21 |
代理公司: | 34152 合肥初云专利代理事务所(普通合伙) | 代理人: | 周翠娟 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 会话 场景 数据库 创建 方法 装置 | ||
1.一种会话场景数据库的创建方法,其特征在于,包括:
预先设定至少一个场景信息项;
建立与所述场景信息项对应的初始数据库,所述初始数据库包括至少一个以所述场景信息项为会话主题的初始会话对,所述初始会话对以二元句对的形式进行保存;
获取与所述初始会话对语义关联的初始数据库作为所述初始会话对的关联数据库,所述获取与初始会话对语义关联的初始数据库作为初始会话对的关联数据库包括:选取预先设定的与初始会话对语义关联度大于预设关联阈值的场景信息项对应的初始数据库作为初始会话对的关联数据库;
在所述关联数据库中创建以所述关联数据库对应的场景信息项为会话主题且与所述初始会话对中的会话发起句对应的关联答复句,并将所述会话发起句以及所述关联答复句作为所述初始会话对的关联会话对;
将所述场景信息项对应的初始数据库中的初始会话对,以及以所述初始数据库作为关联数据库时在其中创建的所述关联会话对,作为所述场景信息项的场景数据库;
将所述场景信息项对应的场景数据库的集合作为会话场景数据库。
2.根据权利要求1所述的会话场景数据库的创建方法,其特征在于,获取与所述初始会话对语义关联的初始数据库,作为所述初始会话对的关联数据库包括:
采集所述初始会话对所属的初始数据库中的所有初始会话对作为样本会话对;
计算所述样本会话对中的样本会话发起句或样本会话答复句与除所述初始会话对对应的场景信息项外的其他所述场景信息项之间的相似度,获得与所述初始会话对对应的场景信息项的关联场景信息项,计算所述样本会话对中的样本会话发起句或样本会话答复句与除所述初始会话对对应的场景信息项外的其他所述场景信息项之间的相似度,获得与所述初始会话对对应的场景信息项的关联场景信息项包括:
对所述样本会话对中的样本会话发起句或样本会话答复句进行预处理,获得分词文本,所述预处理包括分词、语义消歧、词性标注;
计算所述分词文本对应的词向量与除所述初始会话对对应的场景信息项外的其他所述场景信息项对应的词向量之间的相似度;
选取所述相似度大于预设相似度阈值的场景信息项作为与所述初始会话对对应的场景信息项的关联场景信息项;
将与所述初始会话对对应的场景信息项的关联场景信息项对应的初始数据库作为所述初始会话对的关联数据库。
3.根据权利要求2所述的会话场景数据库的创建方法,其特征在于,选取所述相似度大于预设相似度阈值的场景信息项作为与所述初始会话对对应的场景信息项的关联场景信息项之后还包括:
根据所述分词文本对应的词向量与除所述初始会话对对应的场景信息项外的其他所述场景信息项对应的词向量之间的相似度,创建所述分词文本与所述场景信息项之间的关联映射关系表,并保存所述关联映射关系表。
4.根据权利要求1-3任一所述的会话场景数据库的创建方法,其特征在于,所述场景信息项包括:
姓名、性别、年龄、即时通讯账号、电子邮箱地址、家庭地址、职业类别、职务、工作单位、单位地址、银行账号、好友印象、兴趣爱好、朋友圈状态、心情、最近关注话题、当前通讯状态、时间、节日、季节、地理位置信息、距离、标记添加的备注信息、通讯频率、通讯次数、通讯时长、发起历史通讯的选择方式,其中,所述选择方式包括从通讯录发起通讯方式、从历史通话记录发起通讯方式、从短信通讯模块发起通讯方式以及从拨号盘发起通讯方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈包容,未经陈包容许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510741076.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文件存储中的索引实现方法和系统
- 下一篇:木制椅子