[发明专利]模型的生成方法及装置、重要度获取方法及装置在审
申请号: | 201410723276.2 | 申请日: | 2014-12-03 |
公开(公告)号: | CN104572820A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 石磊;连荣忠;张鹏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 方法 装置 重要 获取 | ||
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种模型的生成方法及装置、重要度获取方法及装置。
【背景技术】
对于给定的文本,准确地计算出其中每个词条的重要度,进而可以应用于后续的搜索或者语义分析等。例如,搜索场景下,用户输入查询文本时,该查询文本中包含若干词条,其中会存在冗余词条,如果用真个查询文本进行搜索,会影响搜索效率以及降低搜索结果的质量。因此,需要对查询文本中的词条进行重要度计算,然后利用其中重要度较高的一些词条去进行搜索,去掉其中的冗余词条。
现有技术中,有能够依据给定的词条输出重要度或者重要度排序的模型,这些模型能够保证输出的词条的重要度的数值的准确性,或者能够保证属于同一个文本的两个词条之间的重要度排序的准确性。然而,如果既需要获得词条的重要度的数值,同时还需要词条的重要度排序,那么目前的模型都无法满足,另外,也不能够获得词条的重要度的其他信息,如词条的重要度之间的区分度、重要度的取值范围等,因此,目前用于获取词条的重要度信息的模型的可靠性比较低。
【发明内容】
有鉴于此,本发明实施例提供了一种模型的生成方法及装置、重要度获取方法及装置,可以解决现有技术中获得词条的重要度信息的模型的可靠性比较低的问题。
本发明实施例的一方面,提供一种模型的生成方法,包括:
依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个,构建M个候选模型,M为大于0的整数;
利用所述M个候选模型,获得所述词条的M个归一化的候选模型输出值;
利用评估模型对所述M个归一化的候选模型输出值进行评估,以获得目标模型输出值,将所述目标模型输出值所对应的候选模型作为目标模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个,构建M个候选模型之前,所述方法还包括:
利用初始模型,获得所述词条的初始模型输出值;
依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型输出值,获得所述词条的归一化的初始模型输出值;
依据所述词条的归一化的初始模型输出值,获得所述词条的重要度准确率;和/或,依据所述词条的归一化的初始模型输出值或者所述词条的初始模型输出值,获得所述词条之间的排序准确率;和/或,依据所述词条的归一化的初始模型输出值,获得所述词条之间的区分度准确率。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述词条的重要度准确率的数目为N个,所述词条之间的排序准确率的数目为P个,词条之间的区分度准确率的数目为Q个,N、P和Q均为正整数,且不同时为0,且N、P和Q中至少一个大于或者等于2,所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个,构建M个候选模型,包括:
依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区分度准确率中至少一个,获得K个目标准确率,K为大于1且小于或等于的整数;
依据所述K个目标准确率,对初始模型的第一模型参数进行调整,以获得M个第二模型参数;
依据所述M个第二模型参数,构建所述M个候选模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述依据所述K个目标准确率,对初始模型的第一模型参数进行调整,以获得M个第二模型参数,包括:
依据所述K个目标准确率以及预设的准确率阈值,获得大于或者等于所述准确率阈值的M个目标准确率;
对所述M个目标准确率中的每个所述目标准确率分别进行求导运算,以获得M个梯度值;
依据所述M个梯度值中每个所述梯度值,分别对所述初始模型的第一模型参数进行调整,以获得M个第二模型参数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用所述M个候选模型,获得所述词条的M个归一化的候选模型输出值,包括:
利用所述M个候选模型,获得所述词条的M个候选模型输出值;
依据所述词条的每个候选模型输出值、所述词条所在文本中其他词条的候选模型输出值,获得所述词条的M个归一化的候选模型输出值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述评估模型包括所述词条所在文本中所有词条的标准输出值,所述利用评估模型对所述M个归一化的候选模型输出值进行评估,以获得目标模型输出值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司;,未经百度在线网络技术(北京)有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410723276.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:资源的推荐方法及装置
- 下一篇:一种垃圾数据的清理方法和系统