[发明专利]用于确定主题的方法和装置有效
| 申请号: | 201811624901.2 | 申请日: | 2018-12-28 |
| 公开(公告)号: | CN109710939B | 公开(公告)日: | 2023-06-09 |
| 发明(设计)人: | 王经委;张傲;刘佳祥;孙宇;李芝 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 确定 主题 方法 装置 | ||
本申请实施例公开了用于确定主题的方法和装置。该方法的一具体实施方式包括:确定待识别语句序列;计算待识别语句序列与目标领域内主题模板集合中每个主题模板的相似度,其中,主题模板集合中的每个主题模板对应目标领域内至少一个主题中的主题,主题模板包括主题阶段序列,主题阶段包括主题语句序列;根据关联参数确定待识别语句序列的主题,其中,关联参数包括待识别语句序列与主题模板集合中每个主题模板的相似度。该实施方式降低了主题分割过程中的人工成本。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于确定主题的方法和装置。
背景技术
随着智能设备的普及和用户数量的增长,人机交互方式也在改变,对话系统(例如,苹果公司的siri智能语音助手、亚马逊公司的Alex智能助理、中国联通智能客服等)逐步被普遍应用。对话系统的主题分割是将对话内容划分为多个段落,每个段落内的对话语句属于同一主题,不同段落对应不同主题。
现有技术主要采用有监督学习方法,人工标注训练语料,再基于训练语料来训练模型来检测段落之间的分割位置。
发明内容
本申请实施例提出了用于确定主题的方法和装置。
第一方面,本申请实施例提供了一种用于确定主题的方法,该方法包括:确定待识别语句序列;计算待识别语句序列与目标领域内主题模板集合中每个主题模板的相似度,其中,主题模板集合中的每个主题模板对应目标领域内至少一个主题中的主题,主题模板包括主题阶段序列,主题阶段包括主题语句序列;根据关联参数确定待识别语句序列的主题,其中,关联参数包括待识别语句序列与主题模板集合中每个主题模板的相似度。
第二方面,本申请实施例提供了一种用于确定主题的装置,该装置包括:第一确定单元,被配置成确定待识别语句序列;计算单元,被配置成计算待识别语句序列与目标领域内主题模板集合中每个主题模板的相似度,其中,主题模板集合中的每个主题模板对应目标领域内至少一个主题中的主题,主题模板包括主题阶段序列,主题阶段包括主题语句序列;第二确定单元,被配置成根据关联参数确定待识别语句序列的主题,其中,关联参数包括待识别语句序列与主题模板集合中每个主题模板的相似度。
第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的用于确定主题的方法和装置,通过预先为目标领域设定主题和主题对应的主题模板,主题模板包括主题阶段序列,主题阶段包括主题语句序列。然后,再计算待识别语句序列与目标领域内主题模板集合中每个主题模板的相似度。最后,根据关联参数确定待识别语句序列的主题,其中,关联参数包括待识别语句序列与主题模板集合中每个主题模板的相似度。从而,不用人工标注大量的训练语料,只需要为目标领域内不同的主题设定主题模板即可,大大减少了人工标注成本,同时还能解决因为人工标注的标准不同所导致的主题识别准确低的问题,即提高了主题识别的准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例可以应用于其中的示例性系统架构图;
图2A是根据本申请的用于确定主题的方法的一个实施例的流程图;
图2B是根据本申请的第一相似度计算步骤的一个实施例的分解流程图;
图2C是根据本申请的第二相似度计算步骤的一个实施例的分解流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811624901.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:依存句法树构建系统
- 下一篇:一种文章立意的分析及文章评分方法、装置





