[发明专利]用于利用机器学习分类器来使用知识表示的系统和方法在审
申请号: | 201680091990.1 | 申请日: | 2016-11-23 |
公开(公告)号: | CN110168579A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | M·W·威尔森;I·伊利亚斯;P·J·斯威尼 | 申请(专利权)人: | 启创互联公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N5/02 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 加拿大*** | 国省代码: | 加拿大;CA |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类器 内容项 机器学习 训练数据 知识表示 感兴趣对象 学习分类器 标签分配 训练机器 验证数据 合成 | ||
提供了用于为机器学习分类器生成训练数据的系统和方法。基于感兴趣对象被合成的知识表示被用来将标签分配给内容项。标记的内容项可以被用作训练数据以用于训练机器学习分类器。标记的内容项也可以被用作针对分类器的验证数据。
技术领域
本文描述的教导涉及机器学习和信息检索领域。具体地,本文所公开的教导涉及在数字信息系统环境中部署方法以用于使用与被表达为知识表示的一个或多个数据集相关联的信息来对信息进行分类,训练分类器模型以对信息进行分类和/或使用分类器结果来完善知识表示。
背景技术
信息技术通常被用来向用户提供各种类型的信息,诸如,文本、音频、视频和任何合适的其它类型的信息。在一些情况下,响应于用户采取的动作来向用户提供信息。例如,可以响应于用户输入的搜索查询或者响应于用户已经订阅了诸如电子邮件警报或电子通讯等内容来向用户提供信息。在其它情况下,在用户没有特别请求信息的情况下,将这种信息提供或“推送”给用户。例如,偶尔可能会向用户呈现广告或恳求。
存在可以经由信息技术提供给用户的大量内容和信息。实际上,由于经由互联网、万维网(WWW)和任何其它合适的信息供应源可获得大量信息,并且因为可用信息跨大量独立拥有和操作的网络和服务器分布,所以定位用户感兴趣的信息带来了挑战。当感兴趣的信息跨大型专用网络分布时,存在类似的挑战。
发明内容
本文呈现的发明概念被图示在许多不同的实施例中,每个实施例都示出了一个或多个概念,但是应该理解,一般而言,这些概念不是相互排斥的,并且即使在没有被图示时也可以组合使用。
一些实施例提供了一种为机器学习分类器生成训练数据的方法,该方法包括:基于感兴趣对象,接收被编码为非瞬态计算机可读数据结构的知识表示,该知识表示包括至少一个概念和/或两个或更多个概念之间的关系;接收内容项的第一集合,其中第一集合包括没有标签的一个或多个内容项,其中标签将内容项分类为一个或多个类别;为第一集合中的一个或多个相应内容项确定一个或多个分数,其中相应内容项的分数基于知识表示和相应内容项的内容;以及通过基于与第一集合中的一个或多个相应内容项相关联的分数将标签分配给第一集合中的一个或多个相应内容项来为机器学习分类器生成训练数据。
一些实施例提供了一种用于为机器学习分类器生成训练数据的系统,该系统包括:至少一个处理器,该至少一个处理器被配置为执行方法,该方法包括:基于感兴趣对象,接收被编码为非瞬态计算机可读数据结构的知识表示,该知识表示包括至少一个概念和/或两个或更多个概念之间的关系;接收内容项的第一集合,其中第一集合包括没有标签的一个或多个内容项,其中标签将内容项分类为一个或多个类别;为第一集合中的一个或多个相应内容项确定一个或多个分数,其中相应内容项的分数基于知识表示和相应内容项的内容;以及通过基于与第一集合中的一个或多个相应内容项相关联的分数将标签分配给第一集合中的一个或多个相应内容项来为机器学习分类器生成训练数据。
一些实施例提供了一种存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,该处理器可执行指令在由至少一个处理器执行时使至少一个处理器执行为机器学习分类器生成训练数据的方法,该方法包括:基于感兴趣对象,接收被编码为非瞬态计算机可读数据结构的知识表示,该知识表示包括至少一个概念和/或两个或更多个概念之间的关系;接收内容项的第一集合,其中第一集合包括没有标签的一个或多个内容项,其中标签将内容项分类为一个或多个类别;为第一集合中的一个或多个相应内容项确定一个或多个分数,其中相应内容项的分数基于知识表示和相应内容项的内容;以及通过基于与第一集合中的一个或多个相应内容项相关联的分数将标签分配给第一集合中的一个或多个相应内容项来为机器学习分类器生成训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于启创互联公司,未经启创互联公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680091990.1/2.html,转载请声明来源钻瓜专利网。