[发明专利]一种基于语义表示的个性化检索式对话方法和系统有效
申请号: | 202011055580.6 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112182159B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 窦志成;马跃元;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/211;G06F40/216;G06F40/30;G06N3/0442 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 表示 个性化 检索 对话 方法 系统 | ||
本发明涉及一种基于语义表示的个性化检索式对话方法和系统,包括以下步骤:S1从用户发言历史语句集中抽取出个性化特征语句p;S2根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;S3将候选集C中的所有候选回复r={rsubgt;1/subgt;,rsubgt;2/subgt;,...,rsubgt;n/subgt;}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复rsubgt;i/subgt;的语句匹配得分score(q,p,rsubgt;i/subgt;);S4将候选回复rsubgt;i/subgt;的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。其针对社交媒体平台的开放域对话系统,个性化对话数据更易获得,数据可扩展性强。
技术领域
本发明涉及一种基于语义表示的个性化检索式对话方法和系统,属于人工智能技术领域。
背景技术
个性化对话系统的实现主要可以分为两种形式,一种是为计算机直接设定键值对形式的个性化特征,即给定系统用户的具体年龄、性别、职业等信息。系统计算按照这种特征对应用户群体的说话风格给出回复。固定性格的个性化对话系统早期是通过机器学习和规则实现的,这种早期的个性化聊天机器人,使用定义输入输出模式、系统个性化与系统表现,决定针对某一输入的回复。而随着人工智能的发展,深度学习技术可用于个性化聊天系统的构建。然而,由于单一性格对话对话集的缺乏,使用深度学习技术解决固定性格的个性化聊天系统的工作较少。部分学者将个性定义为包含具体的年龄、性别、爱好等信息的键值对,引入个性检测器,基于序列到序列模型(SeqSeq)的解码器等,构建个性化聊天系统。
另一种个性化对话系统的实现方法是为计算机提供个性相关的描述性语句,或构建直接从用户的说话历史中提取个性化信息的个性化对话系统。在实现时,可以事先给定聊天者描述性的个性化特征语句,让聊天者按此性格进行对话,收集这些对话语句,构建出个性化对话对话集,进而构建出个性化聊天系统。也可以利用用户说话历史,抽取用户的个性化信息,将个性化特征语句与输入语句表示为向量,与回复语句进行语句匹配排序。
使用人工构建的个性化对话数据集进行研究的方法,存在个性化对话数据集规模较小,数据可扩展性差的缺陷。而使用用户历史提取个性化特征的方法,在用户特征语句数目较多、主题较为集中时,该模型的预测结果可能与特征语句的相关性强,而与用户输入语句相关性差,导致模型给出的回复并非输入语句的合理回复,造成模型返回的回复不佳,用户体验较差。
发明内容
针对上述问题,本发明的目的是提供一种基于语义表示的个性化检索式对话方法和系统。该系统是针对社交媒体平台的开放域对话系统,个性化对话数据更易获得,数据可扩展性强。
为实现上述目的,本发明采取以下技术方案:一种基于语义表示的个性化检索式对话方法,包括以下步骤:S1从用户发言历史语句集中抽取出个性化特征语句p;S2根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;S3将候选集C中的所有候选回复r={r1,r2,...,rn}分别与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);S4将候选回复集中的语句按匹配得分进行排序,选出得分最高的候选回复作为最终的个性化回复。
步骤S1中将满足以下特征的语句作为个性化特征语句p,其提取方法为:1)句子长度为5~30个字符;2)句中包含“我”;3)句中至少存在一个动词;4)句中存在名词,形容词或代词;5)句中包括用户历史语句中出现频次前20%的非停用词词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011055580.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分支网络网关监控方法、装置及存储介质
- 下一篇:一种产科护理用清洗装置