[发明专利]对自然语言问题的基于学习的处理在审
申请号: | 201380035865.5 | 申请日: | 2013-07-02 |
公开(公告)号: | CN104471568A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | M·周;F·魏;X·刘;H·孙;Y·段;C·孙;H-Y·舒姆 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 胡利鸣 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 所描述的技术使得能够使用基于机器学习的方法来收集和分析来自web搜索的证据来回答自然语言问题。接收到的自然语言问题被分析以提取查询单元并使用基于规则的探试和/或通过机器学习训练的分类器来确定问题类型、答案类型和/或词汇答案类型。查询生成模板被用于生成多个经排序的查询,这多个经排序的查询被用于收集证据来确定对于自然语言问题的答案。基于暗暗类型和/或词汇答案类型来从结果中提取候选答案,并使用先前被离线训练的排序器对候选答案进行排序。计算候选答案的置信度水平,并且如果排名第一(前几)的回答的置信度水平超过阈值,则该排名第一(前几)的回答可被提供给用户。 | ||
搜索关键词: | 自然语言 问题 基于 学习 处理 | ||
【主权项】:
一种计算机实现的方法,包括:分析自然语言问题以预测所述自然语言问题的问题类型和答案类型;至少部分基于所述问题类型以及至少部分基于从所述自然语言问题中提取的一个或多个查询单元来公式化经排序的多个搜索查询;从经由搜索引擎执行所述经排序的多个搜索查询中的至少一些所得到的多个搜索结果中确定一个或多个候选答案,所述确定至少部分基于所述答案类型;根据为所述一个或多个候选答案中的每一个确定的置信度水平来对所述一个或多个候选答案进行排序;以及至少部分基于确定所述一个或多个候选答案中排名最高的候选答案具有高于预定的阈值置信度的置信度水平来提供所述排名最高的候选答案。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380035865.5/,转载请声明来源钻瓜专利网。