[发明专利]意图识别方法、装置、可读介质及电子设备在审
申请号: | 202010634548.7 | 申请日: | 2020-07-02 |
公开(公告)号: | CN111783440A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 王鑫宇;张永华 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216;G06F16/33 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李柯莹 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 装置 可读 介质 电子设备 | ||
1.一种意图识别方法,其特征在于,所述方法包括:
获取检索信息,所述检索信息包括至少一个检索词;
针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;
根据所述目标概率,识别所述检索信息对应的目标意图。
2.根据权利要求1所述的方法,其特征在于,所述检索信息包括多个所述检索词;
所述分别确定该检索词在所述检索信息中属于每一预设主题的目标概率,包括:
遍历每一所述预设主题,并将当前遍历到的所述预设主题作为目标预设主题;
将该检索词作为第一检索词,该检索词外的其他每一所述检索词分别作为第二检索词;
获取所述第一检索词属于所述目标预设主题的第一概率;
针对每一所述第二检索词,获取所述第一检索词和该第二检索词同时属于所述目标预设主题的第二概率,以及所述第一检索词和该第二检索词中其中一个属于所述目标预设主题且另一个属于其他预设主题的第三概率,并分别获取该第二检索词属于每一所述预设主题的第四概率;
根据所述第一概率、所述第二概率、所述第三概率和所述第四概率,确定所述第一检索词在所述检索信息中属于所述目标预设主题的目标概率。
3.根据权利要求2所述的方法,其特征在于,通过如下公式确定检索词在检索信息中属于预设主题的目标概率:
其中,Fx表示第x个预设主题,Wy表示第y个检索词,Q表示检索信息,P(Fx|Wy|Q)表示第y个检索词在检索信息中属于第x个预设主题的目标概率,P(Fx|Wy)表示第y个检索词属于第x个预设主题的概率,Fi表示第i个预设主题,Wj表示第j个检索词,P(Fi|Wj)表示第j个检索词属于第i个预设主题的概率,P(both in Fx|Wj,Wy)表示第j个检索词和第y个检索词同时属于第x个预设主题的概率,P(only one in Fx|Wj,Wy)表示第j个检索词和第y个检索词中其中一个属于第x个预设主题且另一个属于其他预设主题的概率,m表示预设主题的个数,n表示检索词的个数。
4.根据权利要求2所述的方法,其特征在于,所述检索信息为针对媒体文件的检索信息,所述媒体文件具有在每一所述预设主题下的主题内容;
所述检索词属于目标预设主题的概率是通过如下方式确定的:
针对每一所述预设主题,获取所述检索词包括在该预设主题的主题内容中的媒体文件的第一使用量,并确定该第一使用量之和;
根据所述检索词包括在所述目标预设主题的主题内容中的媒体文件的第一使用量,以及所述第一使用量之和,确定所述检索词属于所述目标预设主题的概率。
5.根据权利要求4所述的方法,其特征在于,通过如下公式,确定所述检索词属于所述目标预设主题的概率:
其中,Ft表示所述目标预设主题,W表示检索词,P(Ft|W)表示该检索词属于所述目标预设主题的概率,count(W in Ft)表示该检索词包括在所述目标预设主题的主题内容中的媒体文件的第一使用量,Fi表示第i个预设主题,count(W in Fi)表示该检索词包括在第i个预设主题的主题内容中的媒体文件的第一使用量,m表示预设主题的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010634548.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能的升降座椅
- 下一篇:检索处理方法、装置、可读介质及电子设备