[发明专利]基于人工智能的起名方法在审

申请号：	201810722238.3	申请日：	2018-07-04
公开（公告）号：	CN110750988A	公开（公告）日：	2020-02-04
发明（设计）人：	不公告发明人	申请（专利权）人：	易征宇
主分类号：	G06F40/289	分类号：	G06F40/289;G06F16/33;G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	101114 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	词向量名字计算机排序标签自然语言处理技术个性化定制使用者提供人工智能标签要求函数计算机器学习模型获得排序模型筛选规则向量距离输出风格可选高起点迁移查找关联帮助
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于人工智能的起名方法，其特征在于：根据使用者提供的任意名字作为模板，或/和对名字的要求作为标签，基于词向量模型和排序模型，生成候选名字序列。

2.根据权利要求1所述基于人工智能的起名方法，其特征在于：所述模板是使用者希望获得的候选名字范例，所述标签是使用者对名字意蕴的要求；模板和标签数量任意、可以是文字、图片、音频、视频等数据格式；所有模板和标签组成集合T。

3.根据权利要求1所述基于人工智能的起名方法，其特征在于：所述词向量模型，经语料库训练后，可以生成字词向量集V；所述语料库通过对预先搜集的文本集清洗、分词、去停用词和高频词后获得；字词向量集V中包含语料库中字词的特征向量；从V中查找模板和标签集合T中元素的字词向量，得到V的子集VT；同样从V中查找预设名字集H中所有名字对应的字词向量，得到V的另一个子集VH，计算VH中每个向量与VT所有向量在向量空间中距离，获得与模板和标签距离最小、相关度最大的x个名字。

4.根据权利要求3所述的向量在向量空间中距离，用于表征名字与模板或标签的相关度；对于模板和标签的集合T＝{T₁，T₂，...T_i，...T_n)、名字集合H＝{H₁，H₂，...，H_j，...H_m)来说，如果V同时收录了任意T_i和H_j对应的字词向量，那么直接计算字词向量间距离可获得T_i和H_j的相关度；如果V没有同时收录T_i和H_j的字词向量，但收录了组成T_i和H_j的所有单个文字的字词向量，且单个文字数目相等均为s时，分别计算T_i和H_j对应顺位上文字的字词向量距离，获得距离序列D＝{D₁，D₂，...，D_k，...D_s)，其中D_k是T_i与H_j各自第k个文字的字词向量距离，此时T_i和H_j的相关度为

5.根据权利要求4所述的向量空间中距离，其特征在于距离的类型包括但不限于余弦夹角(Cosine)、欧氏距离(Euclidean Distance)、马氏距离(Mahalanobis Distance)、曼哈顿距离(Manhattan Distance)、切比雪夫距离(Chebyshev Distance)、相关系数(Correlation coefficient)等；本发明的一个优选实施例采用将余弦夹角和欧氏距离归一化后加权求和的方式计算；另一个优选实施例采用将余弦夹角和马氏距离归一化后加权求和的方法。

6.根据权利要求1所述的基于人工智能的起名方法，特征在于所述排序模型采用的算法：包括但不限于基于listwise的ListNet、ListMLE等算法，或基于Pairwise的RankNet、LambdaRank等算法；本发明的一个优选实施例采用ListMLE算法；考虑到计算复杂度，另一个优选实施例采用LambdaMART算法；采用上述各类算法的模型通过对训练数据的学习后可得到算分函数对于任意H_j，存在排序总分将作为降序排序依据获得对应的候选名字序列。

7.根据权利要求6所述的训练数据，特征在于包括以下形式：提供基于特定标签或模板的若干名字后，用户对这些名字进行排序的数据；或是专家对这些名字评分的数据，再或是收集使用者在电子终端对这些名字的选择性点击等操作的记录数据。

8.根据权利要求1所述的基于人工智能的起名方法，特征在于：包括在本发明的精神和原则之内，所作的任何更改、等同替换、改进等，均应包含在本发明的保护范围之内，所述的修改、等同替换和改进包括但不限于如下类型：

a.在本发明的优化实施例中，使用者提供了文字形态的模板和标签，但这种形态也可以更改为图片、视频、音频等，但只要在起名过程中，这些形态的数据被转换成文字或字词向量(词向量)用于取名计算，这样的更改同样在本发明的权利保护范围之内；

b.在本发明的优化实施例中，起名过程采用了word2vec词向量模型及其改进后的模型、基于pairwise和listwise的若干排序模型，但在实际应用中，也可以使用其它类型的词向量模型和排序模型进行等同替换，或是在模型使用过程中对模型的某些方法进行更改；只要在起名过程中，采用词向量模型获取名字的字词向量，或采用排序模型进行候选名字排序，这样的等同替换和更改同样在本发明的权利保护范围之内；

c.在本发明的优化实施例中，起名过程用到的词向量模型和排序模型，是以采用本发明所提供方法的技术人员为主体，自行编写程序源代码构建，自行获取数据并进行训练的，但使用这两类模型的方式也可以替换为：集成其它机构或个人提供、基于机器学习及神经网络的模型和方法开发后实现的人工智能框架、软件开发包SDK、开源代码、闭源程序、网络接口API等；不管是显式地采用还是隐式地集成，不论是自行开发还是底层实现，只要采用本发明所描述的方法起名，且起名结果中包含了词向量模型和排序模型的方法要素，同样在本发明的权利保护范围之内；

d.在本发明的优化实施例中，字词向量在向量空间中距离的计算方法采用综合计算余弦夹角和欧氏距离、或综合计算余弦夹角和马氏距离并加权求和的方法，但仍然可以替换为单独或综合计算马氏距离、曼哈顿距离、切比雪夫距离、相关系数等方法；只要在起名过程中通过计算字词向量间距离来获取相关名字，同样在本发明的权利保护范围之内；

e.对本发明各步骤的顺序、模块的取舍、优化实施例中步骤和模块中参数的调整，同样在本发明的权利保护范围之内；

f.本发明的优化实施例中，起名过程不包括对名字的类型、偏好等的显式的筛选和排序，但筛选和排序规则仍然可以被增加在各个环节前后，这些规则包括但不限于：加入对姓氏的考虑、对名字中文字进行增减和修改，对名字类型或名字中任意单字进行限定、设置除语义相关度以外的其它指标对候选名字进行评分和排序。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于易征宇，未经易征宇许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810722238.3/1.html，转载请声明来源钻瓜专利网。

同类专利

信息处理方法、装置及存储介质-201910913189.6
发明人：林田谦谨 -专利权人：卓尔智联(武汉)研究院有限公司
申请日： 2019-09-25 - 公布日： 2020-02-14 - 主分类号： G06F40/289
摘要：本发明实施例公开了一种信息处理方法、装置及存储介质；其中，方法包括：对第一语料进行分词处理，得到所述第一语料的第一词集；所述第一词集包含至少两个词；确定所述第一词集中任意两个词之间的相关度；利用确定的所述第一词集中任意两个词之间的相关度，构建第一词共现网络；所述第一词共现网络表征所述第一词集中词之间的关联关系；利用所述第一词共现网络的数据，结合图卷积神经网络(GCN)模型，确定第一特征矩阵；所述第一特征矩阵为第一词共现网络中各节点对应的特征矩阵；对所述第一特征矩阵进行降维处理，得到词嵌入初始化结果。如此，能够提供合理的词嵌入初始化结果，从而利用该词嵌入初始化结果达到缩短词嵌入训练周期的效果。

文本序列分词方法、装置及存储介质-201911097121.1
发明人：陈宇鹏;史亮;王铄;王斌;孟二利;过群 -专利权人：北京小米智能科技有限公司
申请日： 2019-11-11 - 公布日： 2020-02-14 - 主分类号： G06F40/289
摘要：本公开揭示了一种文本序列分词方法，属于自然语言处理技术领域。所述方法包括：获取文本序列的n个分词子结果，所述n个分词子结果是通过n个分词模型分别对所述文本序列进行分词处理获得的；通过结果合并模型中的概率确定模型分支对所述n个分词子结果进行处理，获取所述各个分词位置的分词概率；通过所述结果合并中的激活函数对所述各个分词位置处的分词概率进行处理，获取所述文本序列的分词结果。本公开以文本序列中的每个分词位置为单位，对多个分词模型的分词结果进行合并，从而提高了对新出现的文本序列进行分词的准确性。

文本分类方法和装置-201910912343.8
发明人：左赛;魏树桂;王丹丹;赵楠;徐祥朕 -专利权人：苏宁云计算有限公司
申请日： 2019-09-25 - 公布日： 2020-02-11 - 主分类号： G06F40/289
摘要：本申请涉及一种文本分类方法和装置，所述方法包括：对文本进行分词处理，提取文本中的分词信息；分别使用第一分类模型和第二分类模型对所述分词信息进行分类预测，分别获得对应的第一分类列表和第二分类列表；将第一分类列表和第二分类列表进行融合处理，获得最终分类列表。本申请的方案提供一种组合算法，融合了两种不同的分类器模型，形成一个适用于大规模类目的以及不均衡训练数据的分类器；适用于数据量大，类目体系复杂，类目数量上万，且类目之间有交叉包含等情况。

语料处理方法及装置-201510827483.7
发明人：赵凯 -专利权人：北京国双科技有限公司
申请日： 2015-11-24 - 公布日： 2020-02-11 - 主分类号： G06F40/289
摘要：本发明公开了一种语料处理方法及装置。其中，该方法包括：将语料划分为多个词语片段；确定多个词语片段中每个词语片段在向量空间的位置信息；根据确定的位置信息分别统计每个词语片段对应的聚类对象，其中，在向量空间中，每个词语片段与其对应的聚类对象间的距离小于等于距离阈值；根据聚类对象统计结果，将最大聚类对象统计值对应的词语片段的位置作为语料的中心。本发明解决了相关技术中由于短词分布不均匀造成的长词中心的计算结果不精确的技术问题。

一种合同自动生成方法及装置-201910830509.1
发明人：王巍 -专利权人：平安科技(深圳)有限公司
申请日： 2019-09-04 - 公布日： 2020-02-07 - 主分类号： G06F40/289
摘要：本发明实施例提供了一种合同自动生成方法及装置，本发明涉及基架运维技术领域，方法包括：获取合同生成请求，合同生成请求携带待生成合同的基础信息，基础信息包括合同名称及合同业务所属类型；根据待生成合同的基础信息调取合同模板，合同模板包括多个合同要素填充域；获取用户在多个合同要素填充域内输入的合同要素值；根据合同模板及合同要素值生成目标合同；将目标合同与数据库中预存的合同范本进行风险比对，得到目标合同的风险提示信息；输出含风险提示信息的目标合同。本发明实施例提供的技术方案能够解决现有技术中合同制作效率低的问题。

拼音作为特征的中文语音识别后的文本神经网络纠错模型-201910968667.3
发明人：段大高;张露元;梁少虎;丛扬潇;罗志颖;韩忠明 -专利权人：北京工商大学
申请日： 2019-10-12 - 公布日： 2020-02-07 - 主分类号： G06F40/289
摘要：本发明公开一种拼音作为特征的中文语音识别后的文本神经网络纠错模型，包括：1)构建中文语音识别后的文本纠错平行语料库；2)构建拼音编码，将训练集的句子对转化为拼音，通过词嵌入方法编码为拼音编码；3)构建神经网络输入特征，模型输入特征包括三部分：词向量编码，位置编码和拼音编码；4)构建深度卷积的编码器解码器神经网络。由于中文语音识别后的文本错误主要是中文拼音出错，并且一般是局部错误，使用拼音编码作为网络输入的一部分，又使用深度卷积编码器解码器模型，深度卷积编码器对序列局部信息进行有效提取，在解码过程中，使用了拼音特征，又在局部序列进行纠错，从而极大提高了中文语音识别准确度。

地址数据获取方法以及装置-201911055831.8
发明人：范成;周晗;高山;柳超 -专利权人：北京金堤科技有限公司
申请日： 2019-10-31 - 公布日： 2020-02-07 - 主分类号： G06F40/289
摘要：本公开是关于一种地址数据获取方法、装置、电子设备以及存储介质。其中，该方法包括：通过预设的行政区划分词词典对待处理地址信息进行最大概率路径分词处理；对分词处理后的连续多个分词进行关联性分析，得到对应的地址路径链路；若确定所述地址路径链路中存在有效的地址路径链路，根据所述有效的地址路径链路获取与所述待处理地址信息对应的地址数据。本公开可以大幅提高企业的行政区划地址的准确性，且节省人力成本。

基于人工智能的起名方法-201810722238.3
发明人：不公告发明人 -专利权人：易征宇
申请日： 2018-07-04 - 公布日： 2020-02-04 - 主分类号： G06F40/289
摘要：本发明公开基于人工智能的起名方法，涉及计算机自然语言处理技术和机器学习。主要解决计算机起名过程中筛选规则刚性、可选模式有限、重名率偏高、风格迁移困难、个性化定制不足、排序输出不优等问题。方法如下：训练词向量模型获得字词向量集，训练排序模型获得打分函数；由使用者提供任意名字本身作为模板，或/和对名字的要求作为标签，从字词向量集中查找模板、标签和预提供名字的字词向量，通过计算向量距离，获得相关性最高的多个候选名字，由打分函数计算得分并排序输出。本发明能够帮助使用者获得与模板风格相似、意象关联，与标签要求符合、好名优先的候选名字序列，达到在更高起点上提高计算机起名效果与效率的目的。

一种基于语义扩展和最大边缘相关的伪文本生成方法-201910369823.4
发明人：卢玲;杨武 -专利权人：重庆理工大学
申请日： 2019-05-06 - 公布日： 2020-02-04 - 主分类号： G06F40/289
摘要：本发明提出了一种基于语义扩展和最大边缘相关的伪文本生成方法，包括以下步骤：S1，提取原文本的词和/或短语特征；S2，根据步骤S1中提取的特征通过相似度计算生成扩展词；S3，对步骤S2中的扩展词进行筛选候选词；S4，生成伪文本。本发明在较好地控制文本扩展的噪音的同时，实现了文本语义扩展。

基于情感分析与主题特征的突发事件舆情演化分析方法-201810718522.3
发明人：孙越恒;杨宇杰 -专利权人：天津大学
申请日： 2018-06-30 - 公布日： 2020-01-24 - 主分类号： G06F40/289
摘要：本发明公开一种基于情感分析与主题特征的突发事件舆情演化分析方法，主要步骤包括：首先根据中文分词的特点，采用基于字符串匹配的分词方法对数据文本进行分词；其次利用同义词林语料对分词后的词语的在权重和特征上进行扩展并进行情感值计算；然后计算并基于情感差值对数据进行时间分片；最后将时间分片后的数据作为动态主题模型(DTM)的输入，进而得到在时间序列上该突发事件主题词的变化及热度，预测突发事件发展趋势，对照仅考虑文本相似度分片的主题演化结果，验证情感分析在主题演化过程中的作用。

一种流水文件识别方法、装置及计算机存储介质、电子设备-201910846422.3
发明人：龚伟松;范志海;徐毅;李高锋;张慧霞 -专利权人：上海凯京信达科技集团有限公司
申请日： 2019-09-09 - 公布日： 2020-01-24 - 主分类号： G06F40/289
摘要：一种流水文件识别方法、装置及计算机存储介质、电子设备，包括：确定待识别的文件；提取所述文件的字段；将每个字段进行分词得到多个词语；根据预先构建的语义空间将所述文件的每个词语向量化，生成字段向量；将所述字段向量与所述预先构建的语义空间中的每个向量进行匹配，得到每个字段的相关系数；在相关系数超过预设系数阈值的字段数量满足第一预设范围时，确定所述待识别的文件为流水文件。采用本申请中的方案，可以通过对待识别的文件进行字段提取、分词以及向量化处理，再结合预先构建的语义空间进行向量匹配，从而实现自动识别出各种流水文件、非流水文件，进而可以帮助信审和业务人员减少手动处理流水的时间，提高信审效率。

用于文档关键语句识别的方法与设备-201910900141.1
发明人：翟光景;田进太;赵庆平;刘益东 -专利权人：上海蜜度信息技术有限公司
申请日： 2019-09-23 - 公布日： 2020-01-24 - 主分类号： G06F40/289
摘要：本申请的目的是提供一种文档关键语句识别的方法与设备。与现有技术相比，本申请通过基于文档中的文字内容对文档进行分词处理，获得所述文档对应的多个词条；计算每个词条的词条重要性分值，确定词条重要性分值排名靠前的M个词条，其中，M为预设值；对所述文档进行分句处理，获得关于该文档的句子集合；遍历所述句子集合，将包含所述M个词条中的一个或多个的句子筛选出来；基于所述M个词条的词条重要性分值，计算筛选出来的句子的句子重要性分值，确定句子重要性分值最高的一个或多个句子作为文档关键语句，通过这种方式能够准确的识别文档的关键语句，便于了解文档内容。

舆情发现方法、装置、终端设备以及存储介质-201910966956.X
发明人：程景;魏学峰;严明;周洪斌;徐宇挺;刘俊辉;彭斌 -专利权人：腾讯科技(深圳)有限公司
申请日： 2019-10-12 - 公布日： 2020-01-24 - 主分类号： G06F40/289
摘要：本申请实施例公开了一种舆情发现方法、装置、终端设备以及存储介质，该方法包括：获取第一关键词集合和第二关键词集合；获取第一采集周期内针对目标评论对象的第一用户评论集合，第一用户评论集合中包括至少一条用户评论；若第一用户评论集合中的任一用户评论包括第一关键词集合中的任意有效关键词，且不包括第二关键词集合中的任意无效关键词，则确定任一用户评论为有效评论；获取第一用户评论集合中的有效评论对应的第一评论数量，根据第一评论数量生成针对目标评论对象的舆情告警信息。采用本申请实施例，可提高舆情发现的准确率以及发现效率，可操作性强，适用性高。

基于深度学习的主观性文本情感分析方法-201710093687.1
发明人：施寒潇;厉小军;陈南南 -专利权人：浙江工商大学
申请日： 2017-02-21 - 公布日： 2020-01-24 - 主分类号： G06F40/289
摘要：本发明公开了一种基于深度学习的主观性文本情感分析方法，包括：(1)在C&W模型的基础上，构建C&W‑SP模型，将句子的情感标签与词性标签标注于句子内，构建C&W_SPC&W‑SP模型的训练集，并利用该训练集对C&W_SP模型进行训练，得到训练集中每个词的词向量，组成词向量文件；(2)根据获得的词向量文件，利用LSTM模型构建句子向量集；(3)利用句子向量集对神经网络模型进行训练，得到情感分类模型；(4)对测试评论语句进行预处理，测试句子向量将测试句子向量输入到情感分类模型中，计算得到此段评论的情感倾向。该方法情感倾向信息、词性信息加入词语中，提高了情感分析的准确度。

基于深度学习的词句级短文本分类方法-201910901086.8
发明人：杨悦;孟宪禹 -专利权人：哈尔滨工程大学
申请日： 2019-09-23 - 公布日： 2020-01-21 - 主分类号： G06F40/289
摘要：基于深度学习的词句级短文本分类方法，属于自然语言处理技术领域。该方法基于词向量技术将词特征与句特征结合以表现复杂文本特征，通过卷积神经网络多个卷积核对单句句内的词向量进行卷积池化并连接全部特征图获得句向量，再将句向量按时序输入长短期记忆网络进行上下文关联以更好的表达文本内容。将待分类短文本数据经分句、分词、去除停用词并转化词向量等处理后输入词句级卷积循环神经网络进行训练，最终可获得短文本分类模型并完成短文本分类任务。该方法在测试的中文垃圾电子邮件分类与新闻文本分类上均有着较好的表现。

主观题阅卷方法和主观题阅卷装置-201810745153.7
发明人：百华睿 -专利权人：北大方正集团有限公司;北京北大方正电子有限公司
申请日： 2018-07-09 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本发明提出了一种主观题阅卷方法和一种主观题阅卷装置，其中，主观题阅卷方法包括：从阅卷答案中获取主观题答案的答案关键词；根据预设标准答案，计算所述答案关键词与所述预设标准答案中的预设关键词的相似度；根据所述相似度和所述预设标准答案的分值，计算所述阅卷答案的得分。通过本发明的技术方案，可以通过自动、有效的方法根据答案中的关键词与预设标准答案中的预设关键词的相似程度确定答案的得分，避免使用人工进行主观题阅卷，减少了阅卷的人工成本和时间成本，提升了主观题阅卷的效率。

一种词汇表的选择方法、装置及计算机可读存储介质-201810751994.9
发明人：童毅轩;张永伟;董滨;姜珊珊;张佳师 -专利权人：株式会社理光
申请日： 2018-07-10 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本发明实施例提供了一种词汇表的选择方法、装置及计算机可读存储介质。本发明实施例提供的词汇表的选择方法，基于第一词汇表对预训练模型进行训练，并在训练过程中更新模型参数以及词汇权重，进而在训练结束后，利用所获得的目标词汇的词汇权重，对第一词汇表中的词汇进行筛选，得到用于训练目标神经网络模型的第二词汇表，该第二词汇表中包括有价值更高的词汇，从而在基于第二词汇表对目标神经网络模型进行训练时可以提高模型的训练效率减少训练时间，并提升训练得到的模型的准确性。

技术合同认定模型创建方法、装置、设备和存储介质-201910785113.X
发明人：刘晋元;周喆;朱悦;刘振宇;孙虎 -专利权人：上海市研发公共服务平台管理中心;上海科技发展有限公司
申请日： 2019-08-23 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本申请提供的一种本申请的一种技术合同认定模型创建方法、装置、设备和存储介质，通过对所获取的技术合同进行分词和词性标引以建立词向量集；将所述词向量模型内各词汇之间的关联关系转换为多维度的词向量模型；将预设的对应技术合同评判结果的结果库、及所述词向量模型作为神经网络模型的输入，并经神经网络训练学习以得到技术合同认定模型，以供认定出技术合同及其类型。本申请将技术合同进行词条分析，结合已知技术合同的特定词，来设计分词单元及其关联词分析，并优化技术合同中的特定词的抽取，利用已有技术合同及其是否符合技术合同的先知条件来建立智能模型库，节省了人工学习技术合同特点的成本。

关键词提取方法、装置、存储介质及电子设备-201910833971.7
发明人：贾弼然;崔朝辉;赵立军;张霞 -专利权人：东软集团股份有限公司
申请日： 2019-09-04 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本公开涉及一种关键词提取方法、装置、存储介质及电子设备，以增加文本中词与词之间的权重值区分度，使关键词提取更加准确。该方法包括：获取待进行关键词提取的第一文本；对第一文本进行分词，得到多个分词；将多个分词输入词图模型中，得到每个分词对应的权重值；根据每个分词对应的权重值，对第一文本进行关键词提取；其中，词图模型用于通过如下方式确定每个分词的权重值：获取目标词图；在目标词图中，确定第一分词对应的节点与第二分词对应的节点之间的第一边权值；在预设词图中确定第一分词对应的节点与第二分词对应的节点之间的第二边权值；根据第一边权值与第二边权值，确定目标词图中的第一分词对应节点的权重值。

基于文本法律法规与司法解释匹配的深度学习方法和系统-201910843319.3
发明人：孙锬锋;许可;蒋兴浩;聂豪豪 -专利权人：上海交通大学
申请日： 2019-09-06 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本发明提供了一种基于文本匹配法律法规与司法解释的深度学习方法和系统，输入一条司法解释，根据司法解释查询推荐相关的法律法规；输入一条法律法规，根据法律法规查询推荐相关的司法解释。利用逻辑回归和基于Attention的深度学习网络，本将输入的文本(法律法规或司法解释)与数据库中的文本(司法解释或法律法规)进行匹配，输出最相关的多个文本(司法解释或法律法规)。并设计了自动更新，在使用过程中利用实际点击情况更新模型，使模型可以得到实时的调整和优化，填补了基于深度学习网络的司法解释和法律法规自动匹配任务方面的空白。

一种基于评论信息的数据处理方法及装置-201910906324.4
发明人：蒋剑波;刘志锋;肖桂林;陈晓祥;翟红亮;李炜杰;吴思思;周苗 -专利权人：青木数字技术股份有限公司
申请日： 2019-09-24 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本发明公开了一种基于评论信息的数据处理方法，包括：通过开发平台接口获取用户的评价文本数据；通过预先构建的分词词库，将评价文本数据进行分词处理，得到单词列表；将单词列表通过预先构建的维度词词库进行同义词转换；将进行同义词转换后的单词列表通过预先构建的一种或多种情感词库进行情感词语识别，并根据不同的情感词语预设的权值进行计算，对情感词打分；对情感词的得分情况进行统计，整理得到用户的综合评分评价满意度；本发明通过多种词库对用户的评价信息进行多维度识别打分，从评价信息中挖掘得到相关的评价内容，以使商家根据评价内容进行自我调整，改善服务质量。

一种基于大数据的舆情分析系统-201910930327.1
发明人：范双萍;彭秀胜 -专利权人：武汉海昌信息技术有限公司
申请日： 2019-09-29 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本发明提出了一种基于大数据的舆情分析系统，通过设置舆情分析模块包括话题追踪模块，话题追踪模块可以追踪话题的种类、最新动态、舆情相关作者的动态，最新动态包括舆情主体的评论和热度变化等，舆情相关作者的动态包括舆情作者的发帖和交互关系等，重点统计舆情作者的发帖量、舆论倾向和舆论态度变化，可以全面追踪舆情信息中话题的种类、最新动态以及舆情态度变化，为后期的舆情决策模块提供分析基础；通过设置舆情决策模块包括时间线分析模块、同类事件提取模块、舆情发展预测模块，可以将舆情事件按照时间线排布，并提出同类事件进行分析，根据以往的舆情事件的发展状态预测既有的舆情事件发展方向和结果。

基于无监督学习的思想政治教育领域文献分词方法及系统-201910959276.5
发明人：杨星海;臧文经;宋佳惠;刘子钊;张玉璘 -专利权人：青岛科技大学
申请日： 2019-10-10 - 公布日： 2020-01-17 - 主分类号： G06F40/289
摘要：本公开公开了基于无监督学习的思想政治教育领域文献分词方法及系统，包括：构建n‑gram语言模型，利用预先构建的训练集对n‑gram语言模型进行训练，生成字级n‑gram语言模型；接收思想政治教育领域文献的待分词文本，利用维特比Viterbi算法和训练好的字级n‑gram语言模型对输入的待分词文本进行分词并输出初始分词结果；基于初始分词结果，计算领域文献构词指标的词频偏差TFD；根据词频偏差TFD，计算排序词频偏差rTFD；利用计算得到的排序词频偏差rTFD，对初始分词结果中的初始分词词组的合并，实现对分词结果的优化并输出最终分词结果。

餐饮类型确定方法和装置-201910892671.6
发明人：范聪 -专利权人：北京三快在线科技有限公司
申请日： 2019-09-20 - 公布日： 2020-01-14 - 主分类号： G06F40/289
摘要：本公开的实施例提出一种餐饮类型确定方法，包括：通过Word2vec将第一实体和第二实体向量化，以生成第一集合；通过TransE将预先建立的第一实体和第二实体之间的关系向量化，以生成第二集合；通过远程监督从知识图谱和网络百科数据的语句中抽取第一集合中的第一向量和第二向量在第二集合中对应的第三向量。根据本公开的实施例，通过远程监督从知识图谱和网络百科数据中抽取所述实体集合中每对实体之间的关系，相对于现有技术，由于远程监督对于人工依赖很小，可以极大地拓展抽到的关系，使得抽取到更为全面，并且能够保证所提取的关系整体上的准确率，以便后续全面且准确地确定第一实体与第二实体的关系，也即餐饮名称对应的餐饮类型。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于人工智能的起名方法在审

专利文献下载