[发明专利]基于言语行为理论的用户交互意图识别方法及系统在审
申请号: | 201710171926.0 | 申请日: | 2017-03-22 |
公开(公告)号: | CN107153672A | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 崔宸熙;刘春阳;曾大军;赵志云;张旭;李雄;王萌;王磊 | 申请(专利权)人: | 中国科学院自动化研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 郭文浩,李飞 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 言语 行为 理论 用户 交互 意图 识别 方法 系统 | ||
1.一种基于言语行为理论的用户交互意图识别方法,其特征在于,所述用户交互意图识别方法包括:
基于外部知识源构建行为标记语词典,各意图类别分别对应一个行为标记语词典,每个所述行为标记语词典中包含有多个行为标记语;
根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;
利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。
2.根据权利要求1所述的基于言语行为理论的用户交互意图识别方法,其特征在于,所述基于外部知识源构建行为标记语词典包括:
针对每一意图类别选择设定数量的种子词,构造初始行为标记语词典;
选取待加入到所述初始行为标记语词典中的扩充词;
计算所述扩充词与种子词的语义相似度;
筛选出语义相似度大于相似度阈值的扩充词,并添加到对应的所述初始行为标记语词典中,形成对应各所述意图类别的行为标记语词典。
3.根据权利要求2所述的基于言语行为理论的用户交互意图识别方法,其特征在于,所述扩充词分为记载在知网HowNet中的扩充词和未记载在HowNet中的扩充词。
4.根据权利要求3所述的基于言语行为理论的用户交互意图识别方法,其特征在于,对于记载在HowNet中的扩充词,根据以下公式确定所述扩充词与种子词的语义相似度:
其中,w1为种子词,w2为记载在HowNet中的扩充词,sim(w1,w2)为w2与w1的语义相似度,表示w1,w2对应的义原节点在HowNet概念树上的距离,α表示可调参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;国家计算机网络与信息安全管理中心,未经中国科学院自动化研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710171926.0/1.html,转载请声明来源钻瓜专利网。