[发明专利]一种标记用户语料的内容的方法及系统有效
| 申请号: | 201910047104.0 | 申请日: | 2019-01-18 |
| 公开(公告)号: | CN109783775B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
| 主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/30;G06F40/279;G06F40/211;G06F16/36 |
| 代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
| 地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 标记 用户 语料 内容 方法 系统 | ||
本发明提供了一种标记用户语料的内容的方法及系统,其方法包括:建立单一知识点体系;获取单一知识点体系之间的映射关系;根据知识点体系和映射关系生成复合型知识点体系;获取知识点对应的知识点实体;根据知识点实体和复合型知识点体系训练生成复合型NLP模型;获取用户语料;解析用户语料得到对应的语料语义;将语料语义和复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,语料知识点层级为语料知识点在对应的单一知识点体系中的层级;根据语料知识点、语料知识点实体以及语料知识点层级生成知识标记。本发明通过建立复合型NLP模型从而快速准确地对用户语料的内容实现多个体系的知识点标注。
技术领域
本发明涉及信息处理技术领域,尤指一种标记用户语料的内容的方法及系统。
背景技术
随着网络的高速发展,智能终端也逐渐变得越来越普及,日常生活中方方面面都有可能涉及到。例如通过智能终端搜索资源,一般为了搜索到需要的资源,都是需要对资源进行内容标记。
在内容标记过程中,如果用户需要从多个体系角度对用户语料的内容进行标记,例如,用户语料为“李白和杜甫的五言绝句和七言绝句分别有哪些”,分别从作者和诗词的体系对用户语料的内容进行标记,那么一般需要先建立目录体系“作者”和“诗词”,再针对目录体系对用户语料的内容进行人工标注的方法,但是对于不同体系的知识点的内容的标注,需要对用户语料的内容进行多次拆分,例如,首先根据体系“作者”对用户语料的内容进行拆分,然后再次根据体系“诗词”对用户语料的内容进行拆分,比较主观而且任务量大,需要很长的耗时和人力成本投入。
因此,需要一种标记用户语料的内容的方法及系统。
发明内容
本发明的目的是提供一种标记用户语料的内容的方法及系统,实现通过建立复合型NLP模型从而快速准确地对用户语料的内容实现多个体系的知识点标注。
本发明提供的技术方案如下:
本发明提供一种标记用户语料的内容的方法,包括:
建立单一知识点体系;
获取所述单一知识点体系之间的映射关系;
根据所述单一知识点体系和所述映射关系生成复合型知识点体系;
获取所述单一知识点体系中的知识点实体;
根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型;
获取用户语料;
解析所述用户语料得到对应的语料语义;
将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级;
根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
进一步的,所述的建立单一知识点体系具体包括:
获取知识点以及所述知识点之间的连接关系;
根据所述知识点和所述连接关系建立所述单一知识点体系。
进一步的,所述的根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型具体包括:
根据所述知识点实体生成对应的正则表达式和实体语义槽;
根据所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义;
根据所述知识点语义和所述复合型知识点体系训练生成复合型NLP模型。
进一步的,所述的根据所述知识点实体生成对应的正则表达式和实体语义槽具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910047104.0/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





