[发明专利]文章内容转换方法和装置在审
申请号: | 201811366388.1 | 申请日: | 2018-11-16 |
公开(公告)号: | CN111274767A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 张之硕;王亚波 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F16/9535 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张晓霞;刘芳 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章内容 转换 方法 装置 | ||
本发明提供一种文章内容转换方法和装置。该方法包括:获取用户触发的文章读取请求,所述文章读取请求中携带有所述用户的用户标识和请求读取的文章的文章标识;根据所述用户标识,调取所述用户的用户向量,所述用户向量是根据所述用户的个人信息生成的;根据所述用户向量、所述文章标识和转换模型,对所述文章的内容进行转换。由于用户向量是根据用户的个人信息生成的,结合该用户向量和转换模型转换得到的文章更加符合不同用户的需求,提升了不同用户对该篇文章的认同感。
技术领域
本发明涉及数据处理技术,尤其涉及一种文章内容转换方法和装置。
背景技术
随着互联网技术的不断发展,人们每天接触到的新闻信息、娱乐信息、广告信息以及科技信息等急剧攀升。如何根据用户自身情况,比如:文化程度、个人喜好以及收入水平等向用户推送符合用户需求的信息,是目前亟待解决的问题。
目前,对购物平台来说,可根据用户浏览及购买商品的记录,向不同用户个性化推荐其需要的商品,还可在广告位个性化显示相应的广告。使得每个人看到的推荐商品和广告位上的广告都不尽相同。然而,在通过软文广告及资讯等文章向用户推荐商品时,文章内容却无法做到千人千面。
发明内容
本发明提供一种文章内容转换方法和装置,用于根据用户个体情况对文章内容进行转换,提高用户对阅读认同感。
第一方面,本发明提供一种文章内容转换方法,包括:
获取用户触发的文章读取请求,所述文章读取请求中携带有所述用户的用户标识和请求读取的文章的文章标识;
根据所述用户标识,调取所述用户的用户向量,所述用户向量是根据所述用户的个人信息生成的;
根据所述用户向量、所述文章标识和转换模型,对所述文章的内容进行转换。
可选的,所述根据所述用户标识,调取所述用户的用户向量之前,所述方法还包括:
根据所述用户的个人信息,采用词嵌入技术生成所述用户向量。
可选的,所述根据所述用户向量、所述文章标识和转换模型,对所述文章的内容进行转换,包括:
根据所述文章标识,调取所述文章;
根据所述用户向量和转换模型,对所述文章的内容进行转换。
可选的,所述根据所述用户向量和转换模型,对所述文章的内容进行转换之前,所述方法还包括:
获取所述文章中带有标记信息的内容;
相应的,所述根据所述用户向量和转换模型,对所述文章的内容进行转换,包括:
根据所述用户向量和转换模型,对所述带有标记信息的内容进行转换。
可选的,所述根据所述用户向量和转换模型,对所述带有标记信息的内容进行转换,包括:
判断所述带有标记信息的内容是词语还是语句;
若所述带有标记信息的内容是词语,则根据所述用户向量和词袋模型 CBOW,确定所述带有标记信息的内容被转换后的目标词语;
将所述带有标记信息的内容替换为目标词语;
若所述带有标记信息的内容是语句,则根据所述用户向量和序列转换模型Seq2Seq,确定所述带有标记信息的内容被转换后的目标语句;
将所述带有标记信息的内容替换为目标语句。
可选的,所述根据所述用户向量和词袋模型CBOW,确定所述带有标记信息的内容被转换后的目标词语,包括:
根据所述带有标记信息的内容的上下文所包含的词语,预测至少一个候选词语;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811366388.1/2.html,转载请声明来源钻瓜专利网。