[发明专利]一种基于深度学习的文本自动生成方法有效

专利信息
申请号: 201810058680.0 申请日: 2018-01-22
公开(公告)号: CN108197294B 公开(公告)日: 2021-10-22
发明(设计)人: 黄文明;卫万成;邓珍荣 申请(专利权)人: 桂林电子科技大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司: 桂林市华杰专利商标事务所有限责任公司 45112 代理人: 杨雪梅
地址: 541004 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度学习的文本自动生成方法,包括获得文本生成模型和调用文本生成模型两个阶段。第一阶段包括数据预处理;深度学习算法模型构建;训练深度学习模型;获得文本生成模型。第二阶段包括:接受用户输入的文本;提取用户输入文本的特征信息;调用文本生成模型;生成与用户输入文本的特征信息相匹配的文本。第一阶段采用深度学习算法模型,使得训练过程更加自动化,免去了过多的人工干预,训练过程采用一系列训练策略,使得文本生成模型生成的文本可读性更强。第二阶段,对用户输入信息进行分类,识别用户意图,跟据用户的意图生成出用户想要的文本。本发明方法实现相对简单,应用性强,尤其在文章生成方面将会有很大的应用。
搜索关键词: 一种 基于 深度 学习 文本 自动 生成 方法
【主权项】:
1.一种基于深度学习的文本自动生成方法,其方法包括两个阶段:阶段1:获得文本生成模型;阶段2:调用文本生成模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810058680.0/,转载请声明来源钻瓜专利网。

同类专利
  • 基于新闻数据的事件脉络生成方法、终端设备和存储介质-202310876811.7
  • 麦淼;梁秀霞;王梦环;罗小龙 - 广东南方智媒科技有限公司
  • 2023-07-17 - 2023-10-27 - G06F40/211
  • 本发明公开了一种基于新闻数据的事件脉络生成方法、终端设备和存储介质,所述包括根据用户输入的事件信息初步筛选新闻事件;针对筛选出的新闻事件确定其集中发布事件以及关键句;根据集中发布时间和关键句进一步筛选新闻事件;然后针对进一步筛选出的新闻事件进行相似度计算,筛选出独立新闻事件以及独立新闻事件的相似新闻事件;最后根据独立新闻时间的发布时间以及相似新闻事件的个数,最终确定脉络节点事件;生成时间脉络。通过实施本发明实施例能够提高事件脉络生成的准确性。
  • 链上资产发放方法及装置-202310855968.1
  • 徐惠 - 蚂蚁区块链科技(上海)有限公司
  • 2023-07-12 - 2023-10-27 - G06F40/211
  • 本说明书一个或多个实施例提供一种链上资产发放方法及装置。其中,该方法应用于区块链系统,包括:获取将待识别语句输入语言模型后得到的待评估数据;基于所述待评估数据评估所述待识别语句对所述语言模型的贡献度;所述贡献度用于表征所述待识别语句对所述语言模型的优化操作的帮助程度;基于所述贡献度向所述待识别语句的提供方发放链上资产;其中,发放的链上资产数额与所述贡献度呈正相关。
  • 知识点检测方法、装置、设备及可读存储介质-201911087235.8
  • 李松;汪洋;付瑞吉;王士进;魏思 - 科大讯飞股份有限公司
  • 2019-11-08 - 2023-10-24 - G06F40/211
  • 本申请实施例公开了一种知识点检测方法、装置、设备及可读存储介质,获取试题题目,以及试题的M个正确答案和N个错误答案;将各个正确答案分别与题目组合得到M个第一类文本,将各个错误答案分别与题目组合得到N个第二类文本;对于M个第一类文本中的每一个第一类文本,将该第一类文本分别与每一个第二类文本构成一个句对,根据各个句对的表征第一类文本和第二类文本差异的特征信息得到试题对应的知识点。提供了一种高效、准确的知识点自动检测方案。
  • 一种数据集音素级别的文本全覆盖方法、装置及设备-202310949101.2
  • 卜辉;徐昕 - 苏州希尔范式智能科技有限公司
  • 2023-07-31 - 2023-10-20 - G06F40/211
  • 本发明涉及语音技术领域,具体涉及一种数据集音素级别的文本全覆盖方法、装置及设备。该方法包括:获取文本数据集;其中,所述文本数据集由句子组成;基于预设分词器和预设字典,生成与所述文本数据集对应的音素级别的文本;确定所述音素级别的文本中各个音素的频次;筛选出频次低于预设频次的音素作为缺失音素;确定包含所述缺失音素对应词或字的句子作为补充文本,将所述补充文本添加到所述文本数据集中。以解决现有技术中因人工校准出现的音素级别的文本不完整和准确率低的问题。
  • 一种对话系统的语句智能澄清方法及系统-201911301662.1
  • 王亚平;王志刚;杨硕;刘振宇;王芳;刘雅婷;王泽皓 - 航天信息股份有限公司
  • 2019-12-17 - 2023-10-20 - G06F40/211
  • 本发明公开了一种对话系统的语句智能澄清方法及系统,包括:对获取的用户句子序列进行分词处理,以获取所述用户句子序列中的多个单词;将所述用户句子序列中的多个单词与预设的歧义句子语料库中的数据进行匹配,以确定所述用户句子序列是否为歧义句子;当所述用户句子序列为歧义句子时,以中文的结束标点符号为切分依据,对所述用户句子序列进行分句处理,以获取切分子句;计算切分子句的向量与预设的意图语料库中每个意图类别的加权平均向量的相似度,根据所述相似度确定切分子句的意图。本发明得到方法能够识别歧义句子,对歧义句子进行多意图的分类,给出对应的澄清话术,帮助用户尽快完成相关任务需求,提升了用户体验。
  • 零指代位置检测方法、装置、设备及计算机可读存储介质-202010110444.6
  • 楼星雨;许开河;王少军 - 平安科技(深圳)有限公司
  • 2020-02-21 - 2023-10-20 - G06F40/211
  • 本发明涉及自然语言处理技术领域,公开了一种零指代位置检测方法及装置、设备和计算机可读存储介质,该方法包括:将输入的文本和需进行零指代位置检测的待检测语句进行拼接,以获取目标文本,并根据预设形式对目标文本中的字和特征进行表征,以获取各表征矩阵;将各表征矩阵分别嵌入到低维稠密表征矩阵中,并对已迁入表征矩阵的低维稠密表征矩阵进行相加,以获取各目标稠密表征矩阵;将各目标稠密表征矩阵依次输入到语言表征模型进行模型训练,以获取各所述字对应的字向量;将各所述字向量输入到CRF中进行预测,并根据预测结果确定所述待检测语句的零指代位置。解决了现有技术中进行零指代位置检测时,识别精度低的技术问题。
  • 面向政务咨询服务的智能问答句子对语义匹配方法和装置-202010855426.0
  • 鹿文鹏;于瑞 - 齐鲁工业大学
  • 2020-08-24 - 2023-10-17 - G06F40/211
  • 本发明公开了面向政务咨询服务的智能问答句子对语义匹配方法和装置,属于人工智能、自然语言处理技术领域。本发明要解决的技术问题为如何捕获更深层次的语义上下文特征和句子间的交互信息、减少语义信息的丢失,以实现句子对的智能语义匹配,采用的技术方案为:通过构建并训练由多粒度嵌入模块、门控深层特征残差式融合网络模块、语义特征交互匹配模块和标签预测模块组成的句子对语义匹配模型,实现对句子信息的门控深层特征残差式融合表示,同时通过注意力机制和门控机制生成句子对的最终匹配张量并判定句子对的匹配程度,以达到对句子对进行智能语义匹配的目标。该装置包括句子对语义匹配知识库构建单元、训练数据集生成单元、句子对语义匹配模型构建单元及句子对语义匹配模型训练单元。
  • 一种事件句法融合结构的事件检测方法及计算机可读介质-202310810598.X
  • 李霏;邓凯方;季源泽;姬东鸿;滕冲 - 武汉大学
  • 2023-07-03 - 2023-10-13 - G06F40/211
  • 本发明提出了一种事件句法融合结构的事件检测方法及计算机可读介质。本发明在语料库随机选择多个目标文本构建训练集,标记训练集中每个目标文本的多个标记事件触发词标签、每个标记事件触发词标签的多个标记论元标签;构建事件抽取网络,通过反向传播和梯度下降算法优化训练得到优化后事件抽取网络;通过网络实时获取非结构化的时事热点新闻,通过优化后的事件抽取网络预测时事热点新闻中的事件触发词以及事件触发词对应的多个论元,以构建时事热点新闻的结构化的事件信息。本发明融合事件句法结构解决了中文中存在的文本结构复杂、事件触发词和论元语义交互困难的问题,提升了中文事件抽取的性能,实现了可应用于中文各类文本的事件抽取系统。
  • 一种基于改进上下文词表示的汉语-越南语依存句法分析方法-202310721191.X
  • 李英;张振国;余正涛;高盛祥 - 昆明理工大学
  • 2023-06-16 - 2023-10-13 - G06F40/211
  • 本发明涉及基于改进上下文词表示的汉语‑越南语依存句法分析方法,属于自然语言处理技术领域。本发明首先:收集大量无标注数据,并对数据进行预处理,获得大规模可用的越南语无标注数据。然后,利用无标注数据对XLM‑RoBERTa的模型参数进行微调,获取越南语语言相关的上下文词表示。接着,获取输入句子中每个词所对应的微调XLM‑RoBERTa模型的最后四层输出,并将其作为额外输入增强基于特征扩展的句法分析模型。最后,将语言对抗网络融入特征扩展模型,尝试从资源丰富的汉语依存句法数据中捕获更多的越南语可用的句法信息,从而提高越南语依存句法分析的性能。本发明在汉语‑越南语依存句法分析上取得了较好的实验结果。
  • 一种基于增量学习和多模型融合的中文实体关系抽取方法-202110091226.7
  • 金康荣;胡岩峰;刘洋;时聪;顾爽;刘午凌;付啟明 - 中国科学院电子学研究所苏州研究院
  • 2021-01-22 - 2023-10-13 - G06F40/211
  • 本发明提出了一种基于增量学习和多模型融合的中文实体关系抽取方法,预训练词向量模型、实体识别模型和依存句法分析模型,并初始化关系数据簇;获取扩充关系数据簇的增量学习样本集,利用实体识别模型得到样本的实体集合,利用依存句法分析模型提取样本中每句句子的主语、谓语和宾语,利用词向量模型将句子中的谓语转换为词向量,投射到关系数据簇中,然后通过增量学习的方式不断扩充每个关系数据簇的数据量,最终得到扩充完成的关系数据簇;获取中文实体关系抽取的测试样本集,结合预训练模型和扩充完成的关系数据簇,确定测试样本对应的关系数据种类,完成中文实体关系抽取。本发明不需要大量人工标注,扩展能力强,泛化度高。
  • 一种汉语自然语言文本的词语切分方法-201911223545.8
  • 黄少滨;张幻;程序;严江;申林山;李熔盛 - 哈尔滨工程大学
  • 2019-12-03 - 2023-10-13 - G06F40/211
  • 本发明属于自然语言文本处理技术领域,具体涉及一种汉语自然语言文本的词语切分方法。本发明基于无监督学习中的基于良好度量的方法设计,在其中加入了少量工作量的人工的步骤,即需要人工整理中心词,人工整理中心词的优点是使词表的质量和词语类别更加可控,进一步地,可以降低对语料词语分布特征的需求,特别适用于语料的词语分布不理想以及领域合成词的中心词数量较少的情况。本发明的词语切分方法适用于领域的自然语言文本,特别地,最适用于在领域合成词和非标准词较多的领域,其分词效果好于通用的开放域分词工具的效果,结果有益于进一步在相关领域自然语言处理的后续步骤,特别是在知识抽取或知识图谱中的应用中。
  • 标签生成方法、装置、设备和介质-202310849212.6
  • 邓勇;马宝昌;陈亮宇 - 贝壳找房(北京)科技有限公司
  • 2023-07-11 - 2023-10-10 - G06F40/211
  • 本公开实施例公开了一种标签生成方法、装置、设备和介质,其中,方法包括:获取第一文本集和至少一个自定义字符串,第一文本集包括至少一种类型的第一文本,且至少一个自定义字符串中的每个自定义字符串对应一种类型的第一文本;基于至少一个自定义字符串及其对应类型的第一文本,生成第一样本语料;基于第一样本语料,对初始语言模型进行预训练,以使初始语言模型学习至少一个自定义字符串的语义空间表示,得到预训练语言模型;将至少一个自定义字符串确定为类型标签,以对应表征第一文本的类型,类型标签用于对预训练语言模型进行训练。实现了类型标签的自动生成,提高了类型标签的生成效率和准确度。
  • 基于逐步集成多层注意力的事件表示学习方法及系统-202310917751.9
  • 万齐智;万常选;刘德喜;刘喜平;胡蓉 - 江西财经大学
  • 2023-07-25 - 2023-10-10 - G06F40/211
  • 本发明提出一种基于逐步集成多层注意力的事件表示学习方法及系统,该方法包括:获取文本中词语的结点嵌入表示,利用文本生成词语依存树及词语短语树,并构建词语‑短语依存树以及短语‑结构依存树,以词语的结点嵌入表示作为初始输入,采用上一层的输出转化为下一层输入的方式依次对词语依存树、词语‑短语依存树和短语‑结构依存树的结点嵌入表示进行更新,得到事件嵌入表示;每层转化包含转化注意力系数和语义重要性注意力系数,揭示转化过程中结点的不同重要程度。本发明不依赖于事先给定的各种关系,通过词语‑短语‑结构‑对象的转化策略,有指导地逐步编码事件及其上下文中蕴含的语义信息,利用包含事件的文本片段实现事件嵌入表示学习。
  • 文本的语义分析方法、语义分析装置及终端-201811622833.6
  • 熊友军;廖洪涛;庄思捷 - 深圳市优必选科技有限公司
  • 2018-12-28 - 2023-10-10 - G06F40/211
  • 本发明适用于自然语言处理技术领域,提供了一种文本的语义分析方法、语义分析装置及终端。其中,所述语义分析方法包括:获取目标文本的候选领域;从预设的领域字典中选取与所述候选领域对应的领域字典,并利用选取的领域字典对所述目标文本进行领域内的依存句法分析;基于所述目标文本的领域内的依存句法分析结果,从所述候选领域中选取所述目标文本的意图领域;从所述目标文本在所述意图领域的依存句法分析结果中抽取实体词槽,并将抽取的实体词槽和所述意图领域的标识作为所述目标文本的第一语义分析结果进行输出。本发明可以获得自然语言文本对应的意图领域和意图实体,能够实现计算机对自然语言文本的语义理解。
  • AI上下文生成方法-202310393825.3
  • 董涛 - 重庆明度科技有限责任公司
  • 2023-04-13 - 2023-09-29 - G06F40/211
  • 本发明涉及计算机技术领域,具体涉及AI上下文生成方法,S1基于当前结点进行递归运算;S2遍历当前结点的父结点的孩子结点,取出未处理的孩子结点;S3判断孩子结点,基于判断结果进行处理;S4基于递归回退条件对当前结点的父结点进行处理;S5若循环遍历当前结点的父结点的孩子结点处理完,将数组temp中的数据合并到数组down的最后位置,并清空数组temp;S6递归回退到孩子结点所在层,继续S2未处理完的孩子结点;S7递归运算结束后,将数组down和数组up按序合并为数组collections,并按数组collections的逆序,根据结点的深度信息构建人工智能系统的数据结构,该方法减少了数据量,帮助人工智能系统快速理解当前对话的上下文以正确理解当前对话的主题和对方的意图。
  • 一种实体关系抽取方法及系统-202110761402.3
  • 宋辉;田嘉鹏;盛戈皞;孟祥麟;张钊棋;钱勇;罗林根;江秀臣 - 上海交通大学
  • 2021-07-06 - 2023-09-26 - G06F40/211
  • 本发明公开了一种实体关系抽取方法,其通过标注电力设备局部放电中文文本,获得训练样本和实测样本;构建自注意网络双向编译表示模型,用训练样本对其进行预训练,将训练样本或实测样本输入上述模型中,得到第一向量序列,并将第一向量序列输入多层自注意力网络得到第二向量序列,将需要进行关系抽取的两个实体的向量序列片段从第一向量序列中提取,用最大池化法得到两个实体的语义特征向量,计算得到两个实体的位置特征向量并与语义特征向量相加得到两个实体向量;用分段最大池化法将第二向量序列转化为句子向量,将句子向量与两个实体向量拼接在一起,而后输入全连接神经网络中进行关系分类,得到两个实体在文本句子中的关系。
  • 基于深度学习语言模型融合语义特征的关键词提取方法-202011216875.7
  • 刘洪涛;苏宁 - 重庆邮电大学
  • 2020-11-04 - 2023-09-26 - G06F40/211
  • 本发明请求保护一种基于深度学习语言模型融合语义特征的关键词提取方法,属于于文本处理中的关键词提取研究领域,对于目标文本,首先使用文本处理工具对其进行处理,仅保留其中的形容词和名词,作为目标文本的候选关键词,然后将这些候选关键词输入到预训练语言模型,得到每个候选关键词的向量表示,接着将目标文档进行分句处理,按句子为单位,同样输入到预训练语言模型中,得到每个句子的向量表示,对于每个候选关键词,计算其与文本中每个句子的相似度之和的均值,作为该候选关键词的最终得分,最后根据候选关键词的得分高低排序,得到文本的关键词。
  • 神经网络关系抽取方法、计算机设备及可读存储介质-202010752459.2
  • 回艳菲;王健宗;程宁 - 平安科技(深圳)有限公司
  • 2020-07-30 - 2023-09-26 - G06F40/211
  • 本发明公开了一种神经网络关系抽取方法,包括:构建双通道神经网络模型;获取待处理的句子;对所述句子进行依存句法分析,得到所述句子的两个子句;将两个子句输入到第一通道中,通过CNN模型进行特征抽取,得到第一抽取信息;将所述句子输入到第二通道中,通过LSTM模型进行特征抽取,得到第二抽取信息;通过注意力机制将所述第一抽取信息与所述第二抽取信息进行加权汇总得到所述语句最终的抽取特征,将所述最终的抽取特征输入到softmax层以完成对所述目标实体之间的关系类别进行分类。本发明还提供一种计算机设备及计算机可读存储介质。本发明提供的神经网络关系抽取方法,能够高质量地进行关系抽取。
  • 用于将自然语言需求转换成为语义建模语言语句的方法和系统-201810514356.5
  • E.C.勒布朗;A.克拉波 - 通用电气公司
  • 2018-05-25 - 2023-09-26 - G06F40/211
  • 本发明公开了一种系统、计算机可读媒体以及方法,所述方法包括:接收针对系统需求的自然语言表达的文本表示;由处理器分析所述自然语言表达的所述文本表示以确定自然语言对象,所述自然语言对象包括所述自然语言表达的所述文本表示和从中得出的句法属性;由所述处理器遍历建模语言的语法图表示以确定所述自然语言对象的部分转换,所述部分转换包括至少一个本体概念占位符;由所述处理器确定对应于所述至少一个本体概念占位符的本体概念以完成所述自然语言表达的所述文本表示的转换;以及生成所完成转换的记录。
  • 基于大语言模型的长文生成方法、装置、设备及存储介质-202310657274.7
  • 曾锦山;邓雅娇;黄箐;邢振昌;廖云燕 - 江西师范大学
  • 2023-06-05 - 2023-09-22 - G06F40/211
  • 本发明涉及一种基于大语言模型的长文生成方法、装置、设备及存储介质,用户通过流程提示输入文章的主题、读者和体裁,并提供想要包含在文章中的素材;大语言模型根据用户输入的信息,自行拓展信息并生成文章的通用型提纲;用户对提纲进行修改和扩展,包括输入文章各个部分的详细内容和所需素材,本发明将这些信息传递给大语言模型进行整合和扩展,能够充分考虑用户的意图、情境和语义,生成高质量且个性化的长文,从而提高书写效率和质量;用于生成具有特定主题、读者、体裁要求的文章。
  • 融合词性和依赖关系特征的事件因果关系检测方法-202310277972.4
  • 魏建香;陈宇行 - 南京邮电大学
  • 2023-03-21 - 2023-09-22 - G06F40/211
  • 本发明提供了一种融合词性和依赖关系特征的事件因果关系检测方法,将因果关系检测任务转化为短文本级别的序列标注任务并利用预训练的RoBERTa模型生成初步的词嵌入向量,在词嵌入向量中加入词性特征以增强单词的特征表示;将带有因果关系的事件文本转化为依赖有向图的表示,单词间的依赖关系作为依赖有向图的边缘特征;改进边缘特征图注意力网络模型和学习过程;将融合了词性特征的词嵌入向量和图嵌入向量合并后纳入到线性层和条件随机场中,得到最终的因果关系检测结果。本发明在事件因果关系检测任务中融入了词性与依赖关系特征,增强了事件因果关系检测任务中因果句的语义表示。
  • 一种面向国际汉语教学的句子难度等级评定方法及系统-202010180634.5
  • 宋继华;朱淑琴;张引兵;孙京博;陈晨;彭炜明;郭冬冬;宋天宝 - 宋继华;彭炜明;宋天宝
  • 2020-03-16 - 2023-09-22 - G06F40/211
  • 本发明提供一种面向国际汉语教学的句子难度等级评定方法及系统,包括:获取需要进行句子难度等级评定的句子;对句子进行信息标注;构建国际汉语分级词汇知识库;确定句子的词汇难度等级;构建国际汉语分级语法知识库;确定句子的语法难度等级;评定句子难度等级。具有以下优点:本发明提供的面向国际汉语教学的句子难度等级评定方法及系统,依据国际汉语教学词汇大纲构建国际汉语分级词汇知识库,依据国际汉语教学语法大纲构建国际汉语分级语法知识库,结合语料库以及分析工具分析句子,根据构建的知识库获取句子的词汇难度等级和句子的语法难度等级并分析获得句子难度等级,对国际汉语教学领域有着重要意义。
  • 一种话题提取方法、装置、终端设备及存储介质-202010230784.2
  • 赵洋;包荣鑫;王宇;夏政委;朱继刚 - 深圳价值在线信息科技股份有限公司
  • 2020-03-27 - 2023-09-22 - G06F40/211
  • 本申请适用于信息技术领域,提供了一种话题提取方法、装置、终端设备及存储介质,所述方法包括:获取待处理的文本数据;确定所述文本数据中每个词语的词性信息;基于所述每个词语的词性信息,生成所述文本数据的依存句法分析列表,所述依存句法分析列表包括所述文本数据中多个词语对之间的词性依存关系;根据所述多个词语对之间的词性依存关系,确定候选词;从所述依存句法分析列表中提取与所述候选词相匹配的目标词,并将所述候选词与所述目标词组合为与所述文本数据相对应的话题。采用上述方法可以提高提取出的话题的准确性,使话题事件更通顺,语法结构更完整。
  • 一种基于句法指导的文本命名实体信息识别方法-202110259151.9
  • 夏宇;李素建 - 北京大学
  • 2021-03-10 - 2023-09-22 - G06F40/211
  • 本发明公布了一种基于句法指导的文本命名实体信息识别方法,构建基于句法指导的文本命名实体信息识别模型,模型包括基于Transformer模型的编码层、句法指导自注意力层、表示融合层、条件随机场CRF解码层;仅需建模依存句法树结构而无需引入依存关系类型,通过采用注意力机制,采用抽取准确率高、易于获取词级别的词性信息弥补不引入依存关系类型带来的信息缺失。采用本发明方法能够避免自然语言处理中信息抽取中抽取出的依存关系类型的错误传递问题。
  • 事件库构建方法和装置、电子设备、计算机可读介质-202110548521.0
  • 徐思琪;钟辉强;黄强;卓泽城;刘晨晖;周厚谦 - 北京百度网讯科技有限公司
  • 2021-05-19 - 2023-09-19 - G06F40/211
  • 本公开提供了一种事件库构建方法和装置,涉及深度学习、自然语言处理、大数据等技术领域。具体实现方案为:获取至少一个待归库的事件文本数据;基于事件文本数据,得到抽取事件名;将抽取事件名与预设的文本库中事件信息进行匹配,得到属于文本库的召回事件;基于召回事件,检测抽取事件名是否符合归一化条件;响应于检测到抽取事件名不符合归一化条件,则基于抽取事件名,得到事件库的新的事件名,将事件文本数据作为新的事件添加到文本库中。该实施方式提高了事件库构建过程中信息的完整性。
  • 一种基于闭集中文短句测试的去信息掩蔽评估方法及系统-202110686936.4
  • 陶朵朵;刘济生 - 苏州大学附属第一医院
  • 2021-06-21 - 2023-09-19 - G06F40/211
  • 本发明公开了一种基于闭集中文短句测试的去信息掩蔽评估方法及系统,通过根据第一掩蔽声信息、测试短句信息,获得第一测试音,其中第一掩蔽声信息为能量掩蔽或信息掩蔽;基于第一测试音,获得第一测试结果;根据第一测试结果、第一测试音,获得第一测试调整音;基于第一测试调整音获得第二测试结果;根据第一测试音、第一测试调整音,获得第二测试调整音;获得第三测试结果;根据第一设定信噪比对第一、第二、第三测试结果进行筛选;根据筛选后的测试结果,获得第一评估结果。达到了通过对掩蔽声进行分类设定,并不断进行噪音的动态调整,能够将能量掩蔽与信息掩蔽分离,为信息掩蔽评估领域提供了更科学、可靠听觉感知评估手段的技术效果。
  • 一种基于自由文本的中文选择题干扰项生成方法-202110113550.4
  • 戴剑锋;吴梦莹;董黎刚;蒋献 - 浙江工商大学
  • 2021-01-27 - 2023-09-19 - G06F40/211
  • 本发明公开了一种基于自由文本的中文选择题干扰项生成方法,步骤包括:1‑1)对文本进行预处理,解析出核心关键词;1‑2)选择信息句;1‑3)生成正确答案;1‑4)生成问题题干;1‑5)扩展正确答案;1‑6)生成干扰项:基于向量空间模型进行扩展词向量化,使用TF‑IDF方法计算各个扩展词在向量空间里的权重;利用LSI模型将文本用“词语‑文本”矩阵表示,利用奇异值分解将高维稀疏的矩阵转换成低维的文本向量和单词向量,结合扩展词向量空间权重,用余弦相似度方法计算扩展词与知识图谱中三元组的语义相似度;筛选出干扰项;1‑7)结合题干和干扰项生成选择题。本发明生成速度快,占用资源少,难度高,适用于标准化教学和机器学习。
  • 服务外句子生成方法和设备-201810521845.3
  • 金映锡;柳尚贤;全在勋;崔俊辉 - 三星电子株式会社
  • 2018-05-28 - 2023-09-15 - G06F40/211
  • 公开一种服务外句子生成方法和设备。一种服务外(OOS)句子生成方法包括:基于目标服务的目标话语模板以及从目标话语模板生成的目标句子来训练多个模型;基于训练的所述多个模型之中的一个训练的模型以及从另一服务的话语模板生成的句子来生成与目标话语模板类似的类似话语模板;基于训练的所述多个模型之中的另一训练的模型以及类似话语模板来生成与目标句子类似的类似句子。
  • 一种语句重构模型的训练方法、数据增强方法和相关设备-202310404791.3
  • 郑燕玲;易璟雯;刘伟棠;陈立力;周明伟 - 浙江大华技术股份有限公司
  • 2023-04-11 - 2023-09-12 - G06F40/211
  • 本申请公开了一种语句重构模型的训练方法、数据增强方法和相关设备,训练方法包括:获取原始样本语句,其中原始样本语句位于资源域或目标域,且包括实体词以及插入于原始样本语句内的实体类型标签;将原始样本语句输入语句重构模型进行二次相反域转换,以得到与原始样本语句相同域的相同域样本语句;利用原始样本语句和相同域样本语句的比较结果对语句重构模型进行参数调整;响应于语句重构模型满足预设训练结束条件,得到训练完成的语句重构模型。通过上述方式,本申请能够提高语句重构模型的跨域语句重构效果。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top