[发明专利]实体热门度的计算方法及装置、应用方法及装置有效
申请号: | 201710029383.9 | 申请日: | 2017-01-16 |
公开(公告)号: | CN106844603B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 简仁贤;陈思聪;产文;贾陆华;叶俊杰;董彦均;袁皓;曹军;乔巍;靳颖超 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/332 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 任媛 |
地址: | 200233 上海市浦东新区自由贸*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 热门 计算方法 装置 应用 方法 | ||
本发明提供了知识图谱中实体热门度的计算方法及装置、知识图谱中实体热门度在人机对话中的应用方法及装置,通过对知识图谱中实体热门度的计算,将其应用在人机对话过程中,使知识类的问答的给分能有效得到定量化。本发明实现了知识类回答的自信分数设定,减少日常用语抢答闲聊类的回答;实现了在人与情感聊天机器人对话中的话题延伸,比如对话中聊到某一话题,机器人可以主动发问相关热门词条的应用;实现了知识类回答中对于实体多义词的处理,在对话上下文没出现其他线索时输出默认实体词条的回答。
技术领域
本发明涉及人工智能对话系统,尤其涉及知识图谱中实体热门度的计算方法及装置、知识图谱中实体热门度在人机对话中的应用方法及装置。
背景技术
含知识图谱的人工智能对话系统,比传统语料检索的对话系统的优势在于其多具备了知识和常识方面的回答能力,人在与这类人工智能对话系统聊天时能感受到机器人和人一样能记忆知识,懂知识,聊知识。含知识图谱的人工智能对话系统的结构流程通常是用户输入句,闲聊类回答与基于知识图谱的知识类回答作为并行处理(各自给出候选回答并给一个自信分数,分数越高越希望出此结果),最后由一个最终排序器从所有候选回答中挑选最合适的回送给用户。
当知识图谱的实体(词条)数量达到百万千万甚至上亿的数量级的时候,实体(词条)会大量涉及日常用语,例如:我是谁(电影名),你好(歌曲名)等等。因此基于知识图谱的知识类回答需要做到:判别用户输入句的意图是否想问知识;所问词条是否属于日常用语;触发知识类回答是否会抢答闲聊类的回答模块;如何设置回答自信分数等问题。不能解决这类问题就会造成知识类回答抢答了原本应该触发的闲聊;另外,同名实体触发的优先级问题也是需要解决的。
发明内容
本发明的目的是提供知识图谱中实体热门度的计算方法及装置、知识图谱中实体热门度在人机对话中的应用方法及装置,旨在解决现有的人工智能对话系统在人机对话过程中遇到同名实体时,无法根据用户输入句的意图确定应该触发知识类回答还是闲聊类回答,以及同名实体触发的优先级无法确定的问题。
本发明解决其技术问题所采用的技术方案是:
一种知识图谱中实体热门度的计算方法,包括:
抓取知识图谱中实体的百科页面,对所述实体的百科页面的基础属性进行统计,获取基础属性的统计结果;所述基础属性包括属性数量、链接数量、页面篇幅、出品日期/上映时间、百科页面浏览次数统计、百科页面最近更新统计、日常用语的实体出现频率中的一种或多种;
根据所述基础属性的统计结果,设置各基础属性的初始热门度;
对各基础属性的初始热门度进行归一化处理,获取各基础属性的归一化热门度;
获取各基础属性的加权系数;
根据各基础属性的加权系数,对各基础属性的归一化热门度进行加权求和,获取实体热门度。
在上述实施例的基础上,进一步地,还包括:
定期更新实体热门度。
在上述实施例的基础上,进一步地,所述定期更新实体热门度的步骤,具体为:
对各基础属性的初始热门度进行更新;
根据更新后的各基础属性的初始热门度,对各基础属性的归一化热门度进行更新;
根据更新后的各基础属性的归一化热门度,对实体热门度进行更新;或者,
根据搜索网站的热搜榜单、排名及排名变化,获取热搜数据;
对社区网站的短评与长评按时间序列进行计数,获取社区数据;
对人机对话记录中的实体按时间序列进行计数,获取对话数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710029383.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:采用旋转对齐方式且带有滚动接触面的容器盖
- 下一篇:一种核工业用容器闭合装置