[发明专利]留学文书撰写方法、装置及电子设备在审
申请号: | 201910042070.6 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109766537A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 许志源 | 申请(专利权)人: | 北京未名复众科技有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27;G06N99/00 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王术兰 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个人信息 撰写 装置及电子设备 改写 描述文本 匹配 迁移 文书数据库 查找 个人特点 人力成本 生产效率 时间成本 预设 输出 申请 | ||
本发明提供了一种留学文书撰写方法、装置及电子设备,该留学文书撰写方法包括获取个人信息,该个人信息包括待申请的学校名称、专业名称、个人特点;从预设的文书数据库中查找与该个人信息匹配的相似文书;基于迁移模型,从相似文书中选取实体描述段落;该迁移模型是通过预先训练的模型得到的;对该实体描述段落进行改写,并输出改写后的实体描述段落以撰写留学文书。该方式可以自动根据申请人的个人信息,查找匹配的相似文书,并对相似文书中的实体描述段落进行改写,得到满足申请人需求的实体描述文本,进而使申请人根据该实体描述文本进行留学文书的撰写,有效节省了人力成本和时间成本,并提高了生产效率。
技术领域
本发明涉及文本处理技术领域,尤其是涉及一种留学文书撰写方法、装置及电子设备。
背景技术
留学文书主要以个人陈述、推荐信、个人简历及短文材料构成。留学文书是出国留学申请中的重要材料,学生在申请海外学校时,绝大多数的学校都要求申请人提交申请文书(即留学文书)。海外院校招生官通过留学文书了解申请者是否符合申请条件。留学文书写作好坏对录取结果的影响非常大。
传统的留学文书写作需要全部依赖人工,需要耗费大量的人力成本和时间,且生产效率低。
发明内容
有鉴于此,本发明的目的在于提供一种留学文书撰写方法、装置及电子设备,以有效节省留学文书撰写时的人力成本和时间成本,并提高了生产效率。
第一方面,本发明实施例提供了一种留学文书撰写方法,包括:
获取个人信息,所述个人信息包括待申请的学校名称、专业名称、个人特点;
从预设的文书数据库中查找与所述个人信息匹配的相似文书;
基于迁移模型,从所述相似文书中选取实体描述段落;其中所述迁移模型是通过预先训练的模型得到的;
对所述实体描述段落进行改写,并输出改写后的实体描述段落以撰写留学文书。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,对所述实体描述段落进行改写的步骤,包括:
基于预先训练的基于同义词的向量模型,对所述实体描述段落中的相应词汇进行同义词替换;和/或
将属于第一语言的所述实体描述段落翻译为属于第二语言的第一段落,将所述第一段落翻译为属于所述第一语言的第二段落。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,对所述实体描述段落进行改写的步骤包括:
获取当前选择的改写方式,所述改写方式包括同义词改写方式、翻译改写方式及混合改写方式;
基于当前选择的所述改写方式,对所述实体描述段落进行改写。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述迁移模型的训练过程包括:
获取若干个预先训练的神经网络模型;
将所述神经网络模型并联或者串联,得到迁移模型;
将文书样本输入至所述迁移模型,对所述迁移模型进行训练。
结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,将文书样本输入至所述迁移模型,对所述迁移模型进行训练的步骤包括:
对所述文书样本中的段落进行实体标注;
将标注后的文书样本输入至所述迁移模型,以使所述迁移模型对所述文书样本中的段落进行实体识别,并返回错误率;
基于所述错误率调整所述迁移模型中各个所述神经网络模型的每一层的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京未名复众科技有限公司,未经北京未名复众科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910042070.6/2.html,转载请声明来源钻瓜专利网。