[发明专利]一种基于词嵌入的协同过滤推荐方法在审
申请号: | 201810561270.8 | 申请日: | 2018-05-29 |
公开(公告)号: | CN110609961A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 何铁科;廉昊;严格;陈振宇;李玉莹 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210093 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一个解决司法研究中的罚金推断问题的推荐方法。该方法以两种方式来推断罚金,一是通过对法律案件进行聚类,然后通过多数投票策略获得目标案件的判罚;另一种是通过协同过滤,即查找目标案件的邻居,然后再次采用投票策略。引入了词嵌入技术,它将文档作为词矩阵进行处理,即嵌入法通过word2vec方法,用浅层神经网络语言模型来学习每个词的向量。本发明目的在于对法官们进行法律案件的最终判决和罚金数额的确定起到实际的指导作用,进而有利于司法事业的发展和社会效率的提高。 | ||
搜索关键词: | 法律案件 推断 嵌入 策略获得 查找目标 社会效率 协同过滤 词矩阵 投票 聚类 浅层 文档 向量 司法 案件 神经 邻居 判决 引入 法官 学习 研究 | ||
【主权项】:
1.一种基于词嵌入的协同过滤推荐方法,其特征在于由聚类方法和协同过滤两种方法组成,采用基于嵌入法的协同过滤方法可以提高推荐的准确性,它考虑了文档中单词的上下文信息,而不是像TF-IDF那样的传统方法将单词看成是独立于文档的。在推荐准确性上优于层次聚类、kNN、k-means和传统的基于TF-IDF结果的协同过滤等方法。该方法包括下列步骤:/n1)数据预处理。对原始文档进行分割。过滤掉停用词、属性标签,放弃词干等。在这一步中每个法律案件获得了一个原始特征空间。/n2)采用基于特征向量的方法和基于特征矩阵的方法进行处理。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810561270.8/,转载请声明来源钻瓜专利网。