[发明专利]模型的生成方法及装置、重要度获取方法及装置在审

申请号：	201410723276.2	申请日：	2014-12-03
公开（公告）号：	CN104572820A	公开（公告）日：	2015-04-29
发明（设计）人：	石磊;连荣忠;张鹏	申请（专利权）人：	百度在线网络技术(北京)有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京鸿德海业知识产权代理事务所(普通合伙) 11412	代理人：	袁媛
地址：	100085 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型生成方法装置重要获取
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

【技术领域】

本发明涉及计算机应用技术领域，尤其涉及一种模型的生成方法及装置、重要度获取方法及装置。

【背景技术】

对于给定的文本，准确地计算出其中每个词条的重要度，进而可以应用于后续的搜索或者语义分析等。例如，搜索场景下，用户输入查询文本时，该查询文本中包含若干词条，其中会存在冗余词条，如果用真个查询文本进行搜索，会影响搜索效率以及降低搜索结果的质量。因此，需要对查询文本中的词条进行重要度计算，然后利用其中重要度较高的一些词条去进行搜索，去掉其中的冗余词条。

现有技术中，有能够依据给定的词条输出重要度或者重要度排序的模型，这些模型能够保证输出的词条的重要度的数值的准确性，或者能够保证属于同一个文本的两个词条之间的重要度排序的准确性。然而，如果既需要获得词条的重要度的数值，同时还需要词条的重要度排序，那么目前的模型都无法满足，另外，也不能够获得词条的重要度的其他信息，如词条的重要度之间的区分度、重要度的取值范围等，因此，目前用于获取词条的重要度信息的模型的可靠性比较低。

【发明内容】

有鉴于此，本发明实施例提供了一种模型的生成方法及装置、重要度获取方法及装置，可以解决现有技术中获得词条的重要度信息的模型的可靠性比较低的问题。

本发明实施例的一方面，提供一种模型的生成方法，包括：

依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，M为大于0的整数；

利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值；

利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，将所述目标模型输出值所对应的候选模型作为目标模型。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型之前，所述方法还包括：

利用初始模型，获得所述词条的初始模型输出值；

依据所述词条的初始模型输出值以及所述词条所在文本中其他词条的初始模型输出值，获得所述词条的归一化的初始模型输出值；

依据所述词条的归一化的初始模型输出值，获得所述词条的重要度准确率；和/或，依据所述词条的归一化的初始模型输出值或者所述词条的初始模型输出值，获得所述词条之间的排序准确率；和/或，依据所述词条的归一化的初始模型输出值，获得所述词条之间的区分度准确率。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述词条的重要度准确率的数目为N个，所述词条之间的排序准确率的数目为P个，词条之间的区分度准确率的数目为Q个，N、P和Q均为正整数，且不同时为0，且N、P和Q中至少一个大于或者等于2，所述依据获得的词条的重要度准确率、词条之间的排序准确率和词条之间的区分度准确率中至少一个，构建M个候选模型，包括：

依据所述词条的重要度准确率、所述词条之间的排序准确率和所述词条之间的区分度准确率中至少一个，获得K个目标准确率，K为大于1且小于或等于的整数；

依据所述K个目标准确率，对初始模型的第一模型参数进行调整，以获得M个第二模型参数；

依据所述M个第二模型参数，构建所述M个候选模型。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述依据所述K个目标准确率，对初始模型的第一模型参数进行调整，以获得M个第二模型参数，包括：

依据所述K个目标准确率以及预设的准确率阈值，获得大于或者等于所述准确率阈值的M个目标准确率；

对所述M个目标准确率中的每个所述目标准确率分别进行求导运算，以获得M个梯度值；

依据所述M个梯度值中每个所述梯度值，分别对所述初始模型的第一模型参数进行调整，以获得M个第二模型参数。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述利用所述M个候选模型，获得所述词条的M个归一化的候选模型输出值，包括：

利用所述M个候选模型，获得所述词条的M个候选模型输出值；

依据所述词条的每个候选模型输出值、所述词条所在文本中其他词条的候选模型输出值，获得所述词条的M个归一化的候选模型输出值。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述评估模型包括所述词条所在文本中所有词条的标准输出值，所述利用评估模型对所述M个归一化的候选模型输出值进行评估，以获得目标模型输出值，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。