专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果435957个,建议您升级VIP下载更多相关专利
  • [发明专利]新词召回方法和领域词向量表生成方法及其装置-CN202010858432.1在审
  • 胡祖杰 - 中国电信股份有限公司
  • 2020-08-24 - 2022-02-25 - G06F40/247
  • 提供了一种新词召回方法,包括:接收特定领域的一个或多个文档;对每个文档进行分词;计算通过分词发现的新词的左右熵和互信息熵,并基于左右熵和互信息熵获得新词的信息熵得分;基于所述文档以及通用文档,计算每个新词在文档中的词频以及在所述文档和通用文档中的文档频率,并基于词频和文档频率获得每个新词在每个文档中的词频‑文档频率得分;计算每个新词在所有文档中的总词频‑文档频率得分;基于每个新词的信息熵得分和总词频‑文档频率得分,获得每个新词的领域词得分;以及根据领域词得分对所有新词进行排序
  • 新词召回方法领域量表生成及其装置
  • [发明专利]一种基于子词编码和文档频率遮蔽的中文预训练方法-CN202110480038.3在审
  • 邱锡鹏;邵云帆 - 复旦大学
  • 2021-04-30 - 2022-11-01 - G06F40/216
  • 本发明提供了一种基于子词编码和文档频率遮蔽的中文预训练方法,用于中文语言模型的预训练,包括以下步骤:步骤1,收集中文语料,根据语料通过迭代算法学习一元语言模型,得到词典和出现概率;步骤2,基于一元语言模型对中文语言模型的输入文本进行子词编码,得到子词元素序列;步骤3,计算子词元素序列中每个子词元素的文档频率;步骤4,通过文档频率遮蔽预测任务来进行预训练,将文档频率最高的子词元素进行遮蔽,中文语言模型通过对被遮蔽的子词元素进行预测来进行预训练;步骤5,将语料输入中文语言模型,经过子词编码和计算文档频率后通过文档频率遮蔽预测任务进行预训练,在计算训练后得到训练好的中文语言模型。
  • 一种基于编码文档频率遮蔽中文训练方法
  • [发明专利]文档中无效词的识别方法及装置-CN201610957268.3有效
  • 彭际群;何慧梅;王峰伟 - 阿里巴巴集团控股有限公司
  • 2016-10-27 - 2020-06-30 - G06F40/279
  • 本申请涉及计算机技术领域,尤其涉及一种文档中无效词的识别方法及装置,在一种文档中无效词的识别方法中,首先对识别无效词的文档进行预处理,得到与该文档对应的词语集合;然后根据预设的语料库,确定词语集合中各个词语的平均位置以及文档频率;之后根各个词语的平均位置、文档频率以及相关词语的文档频率,确定各个词语的目标权重值;最后根据各个词语的目标权重值,识别第一文档中的无效词。也即本申请是根据词语的平均位置以及文档频率,来从第一文档中识别无效词,由此,可以提高无效词识别的效率。
  • 文档无效识别方法装置
  • [发明专利]基于文本相关性的文本匹配方法、系统和电子设备-CN202110839643.5在审
  • 王兆元;郭艳波;李青龙 - 北京智慧星光信息技术有限公司
  • 2021-07-23 - 2021-10-29 - G06F16/33
  • 本发明公开了一种基于文本相关性的文本匹配方法、系统和电子设备,该方法包括:获取语料关键词文档频率和每一个语料文本包含的语料关键词个数;将语料文本、语料关键词和对应的文档频率得到映射词典;根据待查询文本得到待查询文本关键词;将待查询文本关键词进行词频统计得到词频数统计值;根据待查询关键词和每一个语料文本中包含的语料关键词得到待查询关键词的文档权重值;根据待查询关键词和文档频率映射词典得到待查询关键词文档映射频率;根据词频数统计值、文档权重值和待查询关键词文档映射频率得到相关性分数值;根据相关性分数值得到相关性评分结果;根据相关性评分结果得到文本匹配结果。
  • 基于文本相关性匹配方法系统电子设备
  • [发明专利]基于语义的文档聚类方法、系统及计算机设备-CN202010576446.4有效
  • 余显学 - 平安银行股份有限公司
  • 2020-06-22 - 2022-08-12 - G06F16/33
  • 本发明涉及人工智能技术领域,提供了一种基于语义的文档聚类方法,包括:获取输入文档并对其进行预处理;对处理后的输入文档中所包含的各个单词进行词频统计和文档频率计算,构建词频‑文档矩阵;将词频统计中所采用的单词作为对象输入至预先存储的自然语言处理模型中,得到与词频‑文档矩阵所适配的相似度矩阵;根据相似度矩阵对词频‑文档矩阵进行语义传播,得到第二词频‑文档矩阵;对第二词频‑文档矩阵进行双向聚类,得到至少一个双聚类簇,双聚类簇包含一个文档簇和一个单词簇,根据单词簇中所包含的特征词对文档簇中的各个文档进行标签赋予。本发明解决了现有技术中文档聚类结果精确度不高的问题。本发明还涉及区块链领域,其中的自然语言处理模型可存储在区块链上。
  • 基于语义文档方法系统计算机设备
  • [发明专利]一种基于MapReduce的文档检索方法及系统-CN201510983025.2有效
  • 胡懋地 - 航天信息股份有限公司
  • 2015-12-24 - 2020-12-22 - G06F16/93
  • 本发明公开了提供一种文档检索方法,所述方法包括:获取查询语句;对所述查询语句进行分词划分以获得彼此不同的多个词语;计算所述多个词语中每个词语的词频文档频率TF‑IDF;对多个词语中每个词语进行向量转换以获得词向量V;针对文档库中的每个文档,利用词频文档频率TF‑IDF和词向量V匹配方式,计算每个文档与所述待查询语句的每个词语的多个匹配度;计算所述多个匹配度中的最大值,以获得每个文档与所述待查询语句的每个词语的最大匹配度;以及将每个文档与查询语句中每个词语的最大匹配度求和以获得每个文档与查询语句的匹配度。
  • 一种基于mapreduce文档检索方法系统
  • [发明专利]文本摘要生成方法、装置及计算机设备-CN202211434965.2在审
  • 王梦圆 - 湖南大学
  • 2022-11-16 - 2023-05-09 - G06F16/34
  • 本发明涉及一种文本摘要生成方法、装置及计算机设备,方法包括:获取待生成摘要的源文档并对所述源文档进行预处理,得到目标源文档;对所述目标源文档中各个单词进行计算,得到各单词的词频文档频率值;根据预设训练词向量将所述目标源文档中各个单词转换为单词特征向量;根据CNN模型和LSTM模型对所述目标源文档进行特征提取和向量拼接,得到所述目标源文档的句子特征向量;根据所述目标源文档构建词袋向量,并将所述词袋向量输入至获取的目标NTM模型,得到主题特征向量;将所述单词特征向量、所述句子特征向量、所述主题特征向量及各单词的词频文档频率值输入到获取的目标文本摘要生成模型,生成目标文本摘要。
  • 文本摘要生成方法装置计算机设备
  • [发明专利]一种高效的短文本相似性确定方法和装置-CN202210078359.5在审
  • 刘东亚 - 支付宝(杭州)信息技术有限公司
  • 2022-01-24 - 2022-04-29 - G06K9/62
  • 本公开的一方面涉及一种高效的短文本相似性确定方法,包括对语料库中的短文本进行分词以获得对应的词序列;基于所述语料库中的短文本总数确定惩罚,所述惩罚随所述语料库中的短文本总数增大而减小;确定所述词序列中每个词的词频和调整后的文档频率,其中所述调整后的文档频率基于所述惩罚来计算;用所述调整后的文档频率对每个词的词频进行加权;组合所述词序列中每个词的加权词频以确定所述短文本的词频向量;以及基于所述词频向量来确定所述短文本与其他短文本的相似性
  • 一种高效短文相似性确定方法装置
  • [发明专利]文档的分类方法和装置-CN201610519971.6有效
  • 丁希晨 - 北京奇艺世纪科技有限公司
  • 2016-07-04 - 2019-06-28 - G06F16/35
  • 本发明实施例提供了一种文档的分类方法和装置,该方法包括:通过训练深度神经网络语言模型将待分类文档中的每个分词转换为向量;通过对向量聚类生成相似分词集合;根据特征的集合将待分类文档转换为特征频率文档矩阵;通过计算任意两个待分类文档的向量间的相似度,将特征频率文档矩阵转换为层次聚类树;基于预设的终止条件对层次聚类树在不同高度进行动态切割,得到分类文档。本发明在文档分类时考虑到了分词在特定语境中的上下文信息,从而使得每类文档在语义理解度和语义识别度上均较高;并且,基于预设的终止条件来对层次聚类树进行不同高度的切割,避免了每类文档文档个数差异大的问题,使得文档的分类更加合理。
  • 文档分类方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top