[发明专利]声音输出装置以及声音输出方法有效

专利信息
申请号: 201610171393.1 申请日: 2016-03-24
公开(公告)号: CN106168945B 公开(公告)日: 2021-09-28
发明(设计)人: 纪井建彦 申请(专利权)人: 卡西欧计算机株式会社
主分类号: G06F40/247 分类号: G06F40/247;G06F40/242;G10L13/08;G06F3/16;G06F3/0488
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 范胜杰;曹鑫
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种声音输出装置以及声音输出方法。声音输出装置具备:范围指定单元,其使用户从包含多个单词的文本中指定至少包含1个单词的范围;第1声音输出单元,其在通过上述范围指定单元指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及第2声音输出单元,其在通过上述范围指定单元指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出。
搜索关键词: 声音 输出 装置 以及 方法
【主权项】:
一种声音输出装置,其特征在于,具备:范围指定单元,其使用户从包含多个单词的文本中指定至少包含1个单词的范围;第1声音输出单元,其在通过上述范围指定单元指定了1个单词的情况下,从存储有各单词的声音数据的单词数据库中取得与上述指定的单词对应的声音数据并进行声音输出;以及第2声音输出单元,其在通过上述范围指定单元指定了多个单词的情况下,从存储有朗读句子而得的声音数据的句子数据库中提取与上述指定的多个单词对应的部分的声音数据并进行声音输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610171393.1/,转载请声明来源钻瓜专利网。

同类专利
  • 基于人工智能的药学服务推广分析方法-202310980994.7
  • 王英为;李彦亭 - 北京杏林康云信息科技股份有限公司
  • 2023-08-04 - 2023-10-24 - G06F40/247
  • 本发明提供了基于人工智能的药学服务推广分析方法,涉及数据处理技术领域,包括:获取网络医疗平台上的医疗信息源,对医疗信息源进行处理得到病状关键词,根据医疗信息源的病状关键词集合分别计算非共性病状概率和熵极限程度,两者相乘得到判别因子,进而得到聚类距离度量,基于聚类距离度量进行聚类计算得到目标聚簇,然后通过评价目标聚簇内日发病量变化,预测该流行性疾病是否可能出现集中爆发,进而优化各药品销售点对应各类有效药品的储备量。这样,提高了药品生产企业对各药品销售点的药事管理效率,最大化提高了药品销售效率,保证了各基层销售点能够满足客户用药需求,使药品的销售链运转更为健康。
  • 一种临床诊断标准词的匹配方法及装置-202310954858.0
  • 张奇;王勤勤;王实 - 北京惠每云科技有限公司
  • 2023-08-01 - 2023-10-24 - G06F40/247
  • 本申请提供了一种临床诊断标准词的匹配方法及装置,通过对获取到的病历文本进行分析处理,从病历文本中提取出临床诊断原词;对临床诊断原词进行预处理,得到标准诊断原词;分别在预先构建的医疗文本库和医疗知识图谱中搜索,确定标准诊断原词的原词上下文特征以及每个候选诊断标准词的标准上下文特征;基于原词上下文特征和每个标准上下文特征,通过预先训练好的标准词匹配模型,从至少一个候选诊断标准词中,确定出与所述临床诊断原词相匹配的至少一个目标诊断标准词。这样,便可以参考于上下文特征,实现目标诊断标准词的精准匹配,提高了匹配结果的准确性,同时,减少了构建两者之间映射关系的过程,以此,还可以保证匹配的及时性。
  • 基于词性对齐的文本相似度计算方法-202010887857.5
  • 覃勋辉;杜若;唐成友 - 重庆邂智科技有限公司
  • 2020-08-28 - 2023-10-20 - G06F40/247
  • 本发明涉及自然语言处理技术领域,具体为基于词性对齐的文本相似度计算方法,包括:S100:对第一语句和第二语句进行分词和词性标注;S300:计算第一语句的分词和第二语句的分词之间的同义词关系,得到同义词矩阵;S400:依次对每一种词性执行步骤S401至步骤S404;S401:从第一语句和第二语句中提取当前词性对应的分词,得到第一分词序列和第二分词序列;S403:判断第一分词序列与第二分词序列的各个分词之间的对应关系,得到第一语句和第二语句的对齐结果;S404:根据对齐结果统计当前词性的对齐特征;S500:根据统计的对齐特征,计算文本相似度。本申请的基于词性对齐的文本相似度计算方法,能够解决现有算法存在的训练数据量大、计算复杂、准确率低的问题。
  • 诊断名标准化方法、装置、电子设备和存储介质-202010151747.2
  • 汪雪松;干萌 - 讯飞医疗科技股份有限公司
  • 2020-03-06 - 2023-10-17 - G06F40/247
  • 本发明实施例提供一种诊断名标准化方法、装置、电子设备和存储介质,其中方法包括:确定多个诊断名;基于所述多个诊断名中每两个诊断名之间的相似度和医学关系,对每两个诊断名之间的候选同义词关系进行调整,得到每两个诊断名之间的最终同义词关系;基于每两个诊断名之间的最终同义词关系,确定每一诊断名对应的标准化诊断名。本发明实施例提供的方法、装置、电子设备和存储介质,将医学知识融合进同义词关系的确定过程,与相似度相互制约,从而提高了诊断名标准化的准确性和可靠性。
  • 一种健康体检大数据文本资料不合法词清洗的方法-202110087779.5
  • 李红良;雷昉;杨慧琳 - 武汉大学
  • 2021-01-22 - 2023-10-03 - G06F40/247
  • 本发明公开了一种健康体检大数据文本资料不合法词清洗的方法,该方法包括以下步骤:步骤1、通过收集原始的体检数据,通过人工标注及机器训练与挖掘,得到不同体检项目的不合法数据,建立文本资料不合法词库;步骤2、按照指定的数据结构输入待清洗的健康体检文本数据;步骤3、利用文本资料不合法词库对健康体检文本数据进行算法匹配,并判断是否为不合法形态;步骤4、利用算法将匹配的不合法词删除;步骤5、检查输出的健康体检文本数据是否正确;步骤6、对输出健康体检文本数据进行结果检查,并对文本资料不合法词库进行补充;步骤7、完成对不合法词的清洗。本发明提供了一种规范、合理的文本不合法词清洗的方法,算法精度高,计算效率高。
  • 基于改进GA的深度神经网络对抗性文本生成方法及系统-202110511391.3
  • 张鹏程;叶仕俊;吉顺慧 - 河海大学
  • 2021-05-11 - 2023-10-03 - G06F40/247
  • 本发明提出了一种基于改进遗传算法(GA)的深度神经网络对抗性文本生成方法及系统,首先通过收集所需要的文本数据集及标签,将数据集中的词汇编码成词向量,基于词向量距离形成同义词词料库。然后根据词料库对输入的文本进行最佳初始种群的生成,之后对种群进行终止条件的判断并在不满足终止条件的前提下迭代进行基于适应度函数的启发式多点交叉、变异操作和跨世代精英选择操作来得到下一代种群。本发明有针对性地生成初始种群,可以减少迭代时间,在变异操作中加入词性约束和在子代选择中加入语义一致性约束可以提高生成文本的语义一致性,使用跨世代精英选择操作和基于适应度函数的启发式多点交叉,有利于提高对抗性文本的生成成功率。
  • 一种用于自然语言信息隐藏的大规模可替换词词库构建方法-202010428651.6
  • 向凌云;冯章成;傅明;郭国庆;杨双辉;刘宇航 - 长沙理工大学
  • 2020-05-20 - 2023-10-03 - G06F40/247
  • 本发明公开了一种用于自然语言信息隐藏的大规模可替换词词库构建方法,包括:步骤1,对于词典中的每个单词,对其进行计算以将其表示成低维稠密的词向量;步骤2,根据单词间的词向量距离,计算单词间的相似度,获取每个单词的相似词列表;步骤3,进行所有相似词之间的关联关系和相似程度的表示;步骤4,根据相似词之间的关联关系和相似程度构建候选可替换词词组。通过本发明,成功构建了一个大规模的候选可替换词词库,实现了对自然语言信息隐藏方法嵌入容量的提升,并通过候选可替换词的过滤提高了含密文本的质量,实现了秘密信息的安全性的提高。
  • 机器人、实体识别方法、装置和存储介质-202210246113.4
  • 喻祥;左珑;谭泽辛 - 深圳市普渡科技有限公司
  • 2022-03-14 - 2023-09-22 - G06F40/247
  • 本申请涉及一种机器人、实体识别方法、装置和存储介质。该方法包括:获取待识别语句中目标实体的词向量;将目标实体的词向量分别与预设的多个实体库中每个实体库中的词向量进行相似度比对,得到目标实体的词向量与预设的多个实体库中每个实体库中的词向量之间的相似度值;根据目标实体的词向量与预设的多个实体库中每个实体库中的词向量之间的相似度值,从预设的多个实体库中确定目标实体库;根据目标实体库的类别标签,确定目标实体的识别结果。其中,预设的多个实体库中每个实体库对应一个类别标签。该方法无需从待识别语句中直接识别目标实体的类别,不依赖大规模的标注语料。基于多个实体库可以快速识别目标实体的类别,提高了实体识别速率。
  • 基于改进粒子群优化算法的文本对抗样本生成方法及系统-202310685282.2
  • 吉顺慧;郭依坤;张鹏程 - 河海大学
  • 2023-06-09 - 2023-09-12 - G06F40/247
  • 本发明公开了一种基于改进粒子群优化算法的文本对抗样本生成方法及系统。本发明首先对文本数据集中的数据进行预处理,构建同义词词料库。然后根据单词对最终预测的重要性、被同义词替换后对最终预测结果的改变程度和该位置单词与其他位置单词的关联程度三个因素得到单词影响力的评分。在初始化时,优先对评分高的位置进行替换,使初始粒子群处于尽量优的位置来减少搜索次数,同时在适应度函数中加入异化率和语义困惑度的约束,可以提高生成文本对抗样本的语义一致性和不易察觉性。最后通过自适应概率突变的方式,期望粒子在搜索初期自然收敛,而在收敛后增加搜索的多样性,跳出局部范围,有利于提高文本对抗样本的生成成功率并减少搜索次数。
  • 基于神经网络的医学术语处理方法、装置、设备及存储介质-202110865296.3
  • 张颖 - 平安科技(深圳)有限公司
  • 2021-07-29 - 2023-09-01 - G06F40/247
  • 本申请涉及数据处理领域,涉及一种基于神经网络的医学术语处理方法、装置、设备及存储介质,该方法包括:确定待处理医学术语与预设标准医学术语库中的每个标准医学术语之间的第一相似度;根据第一相似度获取待处理医学术语的多个第一候选标准医学术语;将第一候选标准医学术语和待处理医学术语输入预设的医学术语标准化模型,得到各第一候选标准医学术语对应的目标概率;将待处理医学术语输入预设的术语个数预测模型,得到标准医学术语个数;根据标准医学术语个数和目标概率确定待处理医学术语对应的标准医学术语。该方法提高了医学术语标准化的准确性。本申请还涉及区块链领域,上述医学术语标准化模型可存储在区块链中。
  • 顾及地理空间分布的文本情感分类方法及装置-202110762367.7
  • 程旭阳;李圣文 - 中国地质大学(武汉)
  • 2021-07-06 - 2023-08-29 - G06F40/247
  • 本发明提供了一种顾及地理空间分布的文本情感分类方法及装置,该方法包括:使用莫兰指数对文本情感得分在空间中的自相关性进行分析;根据文本间的地理位置距离设定文本空间位置权重矩阵;使用两种不同的构图方式对文本的语义信息和地理空间分布信息进行融合;在顾及地理空间位置信息的同时进行文本的表示学习,得到融合后的文本向量表示;将融合后的文本向量表示进行文本情感预测。本发明引入地理空间位置关系来建模文本与文本之间的信息,可以更加深入地捕获文本间的相似性,从而能够更好的对文本的情感进行分析预测。
  • 一种对抗文本的生成方法、装置、存储介质及电子设备-202310514835.8
  • 张音捷;王之宇;张奕鹏;陈岱渊;白冰;张兴明;刘恬;范逸飞 - 之江实验室
  • 2023-05-09 - 2023-08-25 - G06F40/247
  • 本说明书公开了一种对抗文本的生成方法、装置、存储介质及电子设备,包括:获取用于生成对抗文本的各原始文本,根据预先训练的第一语言模型,确定各原始文本的特征向量,并对各原始文本聚类,得到指定数量的文本簇。然后,从各文本簇中确定代表文本,再确定各代表文本对应的初始对抗文本。然后,根据确定出的代表文本的原始关键词和初始对抗关键词之间的差异,从预设的各思维链提示模板中,确定目标思维链提示模板。之后,根据代表文本和代表文本的初始对抗文本,采用目标思维链提示模板,生成思维链提示文本。将思维链提示文本输入预先训练的第二语言模型,得到目标对抗文本。可以更加灵活地生成对抗文本,减少对抗文本的生成成本。
  • 同义词识别方法、装置、计算机设备及存储介质-202110479989.9
  • 陈岳峰 - 中国平安人寿保险股份有限公司
  • 2021-04-30 - 2023-08-22 - G06F40/247
  • 本申请属于大数据领域,涉及一种同义词识别方法及设备,所述方法包括:根据待同义词识别的文本得到的第一字符串集和根据预设知识库形成的实体集的元素进行检索,生成包含已识别字符串的第二字符串集;基于三个集合生成若干同义词对以将第一字符串集中至少一个字符串链接至实体;根据已识别的字符串生成第三字符串集;基于第一字符串集、第三字符串集和实体集对第一字符串集中的字符串进行补充识别和标注;根据补充识别和标注的字符串更新第三字符串集后对第一字符串集重复补充识别和标注,直到识别召回率满足预设条件。本申请还涉及区块链技术,所述文本中隐私信息可存储于区块链中。本申请基于主动学习通过同义词的可传递性提高了识别准确率。
  • 一种词条的同义判别方法、装置、设备和存储介质-202010190072.2
  • 郭辉;徐伟建;史亚冰;罗雨;彭卫华 - 北京百度网讯科技有限公司
  • 2020-03-18 - 2023-08-18 - G06F40/247
  • 本申请公开了一种词条的同义判别方法、装置、设备和存储介质,涉及知识图谱技术领域。具体实现方案为:获取待进行同义判别的词条对的特征信息;将所述词条对的特征信息输入至训练好的神经网络模型中,得到所述词条对的同义判别结果;本实施例直接将预训练层的结构、参数和特征进行知识迁移,采用预训练层对所述词条对的特征信息进行学习,减少训练过程中的标注量,节省大量的资源和人力进一步提高同义判别效率,提高同义判别结果的准确性。
  • 语句同义改写方法、装置和电子设备-202310269238.3
  • 欧文杰;林悦 - 网易(杭州)网络有限公司
  • 2023-03-15 - 2023-08-15 - G06F40/247
  • 本发明提供了一种语句同义改写方法、装置和电子设备,首先获取待处理语句和个性化参数;对待处理语句进行归一化处理,得到待处理语句对应的标准表达语句;对标准表达语句进行同义句改写,得到多个候选同义句;基于个性化参数和预设的风格化词库,对多个候选同义句进行个性化处理,得到待处理语句对应的多个最终同义句。该方式能够基于一句语句,自动得到多个语义与该语句相同的最终同义句,从而能够使同样的一句语句在不同的设定下表现出不同个性的同义表达;因此,该方式仅需策划人员为每个情景NPC设置一句对白,即可在游戏场景中得到该情景NPC对应的多个个性化的同义表达,从而增加了游戏世界的真实性,也减轻了策划人员的工作量。
  • 一种词条同义判别的寻证方法、装置、设备和存储介质-202010203381.9
  • 郭辉;林义明;史亚冰 - 北京百度网讯科技有限公司
  • 2020-03-20 - 2023-08-15 - G06F40/247
  • 本申请公开了一种词条同义判别的寻证方法、装置、设备和存储介质,涉及知识图谱技术领域。具体实现方案为:获取待进行同义判别的词条对,以及所述词条对所属领域的数据源;将所述数据源中的文本按照设定粒度进行划分,得到多段文本;根据所述词条对在所述多段文本的每段文本中是否出现,计算所述词条对的相关度;如果所述词条对的相关度满足设定条件,将所述词条对共现的文本段作为所述词条对的同义判别证据。本申请实施例将可能同义的词条对出现在的一段段文本提取出来,作为同义判别证据,从而依据词条对的共现进行初步的同义判别,提高同义判别证据的准确性和权威性。
  • 同义短语合并方法与装置-202310685456.5
  • 张探探;程小鸥;庄光庭;康操 - 阿维塔科技(重庆)有限公司
  • 2023-06-09 - 2023-08-08 - G06F40/247
  • 本申请涉及计算机信息领域,提出了一种同义短语合并方法和装置。该方法包括:获取两个或两个以上的待分析短语之间的第一相似度,以及获取所述待分析短语所处位置的语境特征,根据所述语境特征获取所述待分析短语所处语境的第二相似度;根据所述第一相似度和所述第二相似度,对所述待分析短语进行合并处理。通过对待分析短语之间的第一相似度,以及待分析短语所处语境的第二相似度,对待分析短语进行合并处理,从而能够基于短语本身相似的基础上,结合短语所处环境的相似性进行合并处理,能够有效的将语义相同,表述不同的短语进行合并,有利于提高数据分析的准确度,及时高效的关注到对应的热点。
  • 答题评分方法、装置、计算机设备及存储介质-201910014250.3
  • 金戈;徐亮 - 平安科技(深圳)有限公司
  • 2019-01-08 - 2023-08-08 - G06F40/247
  • 本发明实施例公开了一种答题评分方法、装置、计算机设备及存储介质,包括下述步骤:获取目标命题的答题答案;将所述答题答案输入预设的评分模型,所述评分模型为根据所述答题答案和标准答案之间的特征向量,将所述特征向量进行多项式回归的计算模型,所述特征向量表征所述答题答案和标准答案之间的相似度;根据评分模型的输出结果确定所述答题答案的评分。在建立多项式回归模型时,对获取到的训练答案进行同义词拓展,保证同样的语义用不同词语表达的时候获取到相同的分值。通过这种方式对答题答案进行评分,不依赖于特定的关键词或句,提高阅卷评分时的灵活度和准确度,有效保证评分的客观性。
  • 同义词挖掘方法、装置、存储介质及计算机设备-202011278772.3
  • 陈乐清;李炫;曾增烽;刘东煜 - 中国平安人寿保险股份有限公司
  • 2020-11-16 - 2023-08-08 - G06F40/247
  • 本发明公开了一种同义词挖掘方法、装置、存储介质及计算机设备,涉及大数据分析领域。其中方法包括:获取目标语句,并通过全文搜索引擎对所述目标语句进行搜索,得到目标语句的第一相近语句,其中,所述目标语句和所述第一相近语句包含至少一个相同词语;根据所述目标语句和所述第一相近语句,创建相近句子对;对所述相近句子对进行相似度评分,并根据相似度评分得到同义句对,以及对所述同义句对进行词语对齐提取,得到同义词对;将所述同义词对和所述目标语句输入所述全文搜索引擎中进行迭代搜索和迭代提取,得到多个同义句对和多个同义词对。上述方法可以显著提高同义词和同义句的挖掘数量和挖掘质量,降低了同义词挖掘的局限性和技术实现难度。
  • 同义句对生成方法、装置、计算机设备及存储介质-202010738698.2
  • 赵知纬;高维国 - 中国平安人寿保险股份有限公司
  • 2020-07-28 - 2023-07-25 - G06F40/247
  • 本申请涉及人工智能,提供一种同义句对生成方法、装置、计算机设备及存储介质,通过获取样本句子以及同义句子;通过同义句对模型中的预训练模型得到样本句子中每一第一字符串对应的样本隐层向量;通过预训练模型得到同义句子中每一第二字符串对应的同义隐层向量;将样本隐层向量和同义隐层向量输入至注意力模型中,得到注意力矩阵;根据注意力矩阵生成样本句子与同义句子之间的同义句对。本申请通过引入注意力模型,在经过预训练模型提取特征向量的基础上,对特征向量之间的对齐程度和对齐关系进行进一步的检测,提高了同义短语生成的准确性和效率。本申请还涉及区块链技术,同义句对模型存储于区块链网络中。
  • 一种基于跨文化适应的层次化语码混合增广方法-202310227612.3
  • 张寅;李植 - 浙江大学
  • 2023-03-10 - 2023-07-18 - G06F40/247
  • 本发明公开了一种基于跨文化适应的层次化语码混合增广方法。本发明首先获取不同目标语言文化的常见文化概念并组成文化概念集,然后借助多语言语义网络的上下位词关系构建文化概念适应图,再通过层次化语码混合策略将跨文化和跨语言统一起来,提高预训练多语言多模态模型在具有跨文化属性的数据集上的性能。和现有技术相比,本发明利用了语义词典的上下位词关系构建了一种无需标注的文化概念适应方法,同时利用得到的概念结合所提出的层次化语码混合方法,有效地提高预训练多语言多模态模型在具有跨文化属性的数据集上的性能。
  • 一种用于文本情感分类的方法-202110653389.X
  • 谈昊然;韩莹;毕辉 - 南京信息工程大学
  • 2021-06-11 - 2023-07-18 - G06F40/247
  • 本发明公开了一种用于文本情感分类的方法,属于深度学习和自然语言处理技术领域。其结合深度学习和宽度学习的优点,通过建立LSTM‑BLS模型、设置超参数、与其他文本情感分类方法比较,显示了本发明模型在文本情感分析方面具有良好的性能,可以更加准确地对正负向文本进行分类,且保持了文本语义的完整性,提高了文本情感分类的准确率。
  • 一种成语同义词列表的生成方法及装置-201910950701.4
  • 刘晓楠;李长亮;汪美玲;郭昱 - 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司
  • 2019-10-08 - 2023-07-18 - G06F40/247
  • 本申请提供一种成语同义词列表的生成方法及装置,其中所述方法包括:获取用户输入的问题语句,从所述用户输入的问题语句中识别出目标成语;在预设的成语知识图谱中获取与所述目标成语具有相同特征标签的至少一个候选成语,并生成所述至少一个候选成语对应的成语推荐列表;将所述目标成语对应的词嵌入向量分别与所述成语推荐列表中的每个所述候选成语对应的词嵌入向量进行相似度计算,得到每个所述候选成语与所述目标成语对应的相似度数值;根据每个所述候选成语与所述目标成语对应的相似度数值对所述成语推荐列表中的候选成语进行筛选,得到仅包含有与所述目标成语为同义词的候选成语的成语推荐列表。
  • 一种基于多义词和同义词的聚类矫正方法-202310248724.7
  • 郑志松;林锋;吴运昌;丁仙峰 - 江苏数兑科技有限公司
  • 2023-03-15 - 2023-07-04 - G06F40/247
  • 本发明公开了一种基于多义词和同义词的聚类矫正方法,包括以下步骤:构建文本语料库并统计文本的词频信息;在文本的上下文中找出含有多义词或同义词的句子;对于多义词,提取原始句子的特征向量,进行多义矫正,计算词向量的余弦相似度;对于同义词,使用word2vec模型训练文本的上下文重建文本语料库,将单词表示成一个长向量,输入到机器学习模型当中作为语料库,进行同义矫正,将数字存储在哈希表中;进行迭代优化,计算梯度,并在非叶节点处提取向量;本方案通过关注聚类过程中的多义词和同义词问题,使用词袋模型来区分相同词语的语境以及通过word2vec模型来重新聚类具有相似含义的词,达到聚类过程纠正的目的。
  • 一种基于深度学习的中文临床术语标准化方法-202310658037.2
  • 曹天甲;倪广健;程龙龙;田野 - 天津大学;中电云脑(天津)科技有限公司
  • 2023-06-06 - 2023-07-04 - G06F40/247
  • 本发明公开了一种基于深度学习的中文临床术语标准化方法,涉及到临床术语领域,针对每一个诊断原词,进行所述数据的预处理;从标准词集合中产生该诊断原词,利用所述诊断原词达到所述候选集生成;使用所述模型排序对候选集中的每个词进行排序;通过模型预测出标准词个数K,并结合所述模型排序的结果,得到前K个词作为所述标准词集合。所述数据的预处理分为数据清洗和标准词集合生成,所述数据清洗包括清洗诊断原词的无关字符,所述标准词生成包括选取ICD‑10作为标准词集合。针对候选集生成过程,本提案提出一种基于有监督学习与无监督学习融合的候选集生成方法,提高候选集生成的召回率。
  • 一种对话中的槽提取方法、装置、电子设备及存储介质-202011080687.6
  • 张林箭;张聪;衣景龙;范长杰;胡志鹏 - 网易(杭州)网络有限公司
  • 2020-10-10 - 2023-06-30 - G06F40/247
  • 本申请提供了一种对话中的槽提取方法、装置、电子设备及存储介质,该方法包括:在确定接收到的目标语料对应的目标意图后,基于目标语料和目标意图对应的第一槽位,确定目标意图对应的待填充槽位;每一个第一槽位对应有至少一个第一槽值;基于目标意图对应的待填充槽向用户进行第一反问,在接收到用户针对该第一反问的第一回复语料后,计算第一回复语料分别与每一个第一槽值的目标相似度;根据第一回复语料分别与每一个第一槽值的目标相似度,从第一槽值中提取第一回复语料中匹配待填充槽位的第一目标槽值;这样,通过对话流程图来管理对话,提高了槽识别效率,通过相似度计算进行槽提取,动态拓展了NER模型的识别能力,提高了识别的准确度。
  • 一种基于复杂词变化解码的中文词语简化方法及系统-202310330236.0
  • 强继朋;刘康;李滢;李云 - 扬州大学
  • 2023-03-30 - 2023-06-27 - G06F40/247
  • 本发明公开了一种基于复杂词变化解码的中文词语简化方法,包括:基于中文汉语考试词汇等级表,识别词语难度等级,将高难度词语作为目标复杂词;构建中文复述语料,训练中文复述模型;利用所述中文复述模型并基于复杂词变化解码方法,生成存在候选简化词的复述句子;从生成的复述句子中,获取候选简化替代词;利用开源工具和词频对所述候选简化替代词进行排序,获取最终简化词。本发明构造了一个大规模的中文复述语料;利用复述模型进行中文词汇简化任务,并提出了一种基于复杂词变化的解码方法,提高简化准确率;在候选词排序中加入BARTscore,考虑替代词对句子原意的改变。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top