[发明专利]文本描述的生成方法、装置、电子设备及存储介质在审
申请号: | 201911117717.3 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110866195A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 邓颖;张金超;牛成 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/9535;G06F40/30;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 描述 生成 方法 装置 电子设备 存储 介质 | ||
1.一种文本描述的生成方法,其特征在于,所述方法包括:
获取目标单位关联的原始文本;
根据所述原始文本生成目标数值,所述目标数值用于优化预设置的模型;
根据所述目标数值针对所述模型执行迭代优化,以完成所述模型的训练;
获取目标地理位置点关联的N条原始文本,N为正整数;
将所述N条原始文本输入所述模型中,生成所述N条文本对应的N条语义特征文本;
计算所述N条语义特征文本的加权平均和,得到所述目标地理位置点的分布式表示文本;
将所述分布式表示文本输入预设的解码器中,得到所述目标地理位置点的文本描述。
2.如权利要求1所述的方法,其特征在于,所述分布式表示文本包括第一数量个特征类别,所述得到所述目标地理位置点的文本描述之后,所述方法还包括:
接收到用户设备发送的位置推荐请求;
解析所述位置推荐请求,确定所述位置推荐请求中包括的第二数量个特征类别和所述第二数量个特征类别的权重值;
若所述第一数量个特征类别包含所述第二数量个特征类别,则计算所述第二数量个特征类别中每个特征类别与对应的特征类别的相似度,所述对应的特征类别指的是所述第一数量个特征类别中的特征类别;
根据所述相似度和所述第二数量个特征类别的权重计算得到匹配分值;
若所述匹配分值大于预设阈值,则向所述用户设备发送所述目标地理位置点的所述文本描述。
3.如权利要求1所述的方法,其特征在于,所述分布式表示文本包括第一数量个特征类别,所述得到所述目标地理位置点的文本描述之后,所述方法还包括:
接收到用户设备发送的位置推荐请求;
解析所述位置推荐请求,获取所述位置推荐请求中包括的至少一个位置信息;
确定所述至少一个位置信息中每个位置信息对应的分布式表示;
确定所述至少一个位置信息的分布式表示包含的特征类别的总数量,得到第三数量个特征类别;
确定所述第三数量个特征类别在所述至少一个位置信息的分布式表示中的出现概率;
从所述第三数量个特征类别中筛选出所述出现概率大于预设阈值的第四数量个特征类别;
若所述目标地理位置点的分布式文本包含所述第四数量个特征类别,则向所述用户设备发送所述目标地理位置点的所述文本描述。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述原始文本生成目标数值,包括:
根据所述原始文本中的每个字符生成语义特征文本;
针对所述语义特征文本执行无监督学习操作,生成输出文本;
根据所述语义特征文本确定所述目标单位在至少一个特征类型中的特征分布概率;
根据所述输出文本和所述特征分布概率生成所述目标数值。
5.如权利要求4所述的方法,其特征在于,所述根据所述输出文本和所述特征分布概率生成所述目标数值,包括:
根据所述输出文本计算生成重构误差;
根据所述特征分布概率计算得到损失数值;
根据所述重构误差和所述损失数值生成目标数值。
6.如权利要求5所述的方法,其特征在于,所述根据所述输出文本计算生成重构误差,包括:
确定所述语义特征文本中每个字符和所述输出文本中每个字符的对应关系;
根据所述对应关系确定所述语义特征文本中每个字符和对应的所述输出文本中的字符之间的差异性信息;
根据所述差异性信息生成所述语义特征文本和所述输出文本之间的所述重构误差。
7.如权利要求5所述的方法,其特征在于,所述根据所述输出文本计算生成重构误差,包括:
根据预设公式计算所述语义特征文本和所述输出文本的交叉熵之和;所述述预设公式为:
其中,V是数据库中字符的总数量,xjt为所述语义特征文本中第t个字符的编码数值;yjt为所述输出文本中第t个字符等于所述词典中第j个字符的概率;
确定所述交叉熵之和为所述重构误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911117717.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能化的移动式办公装置
- 下一篇:一种UART接口的数据接收方法和装置