[发明专利]一种基于卷积神经网络的红酒推荐方法有效
申请号: | 201910293926.7 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110163716B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 朱全银;万瑾;李翔;孙强;季睿;丁瑾;宗慧 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N3/04;G06V10/764;G06F16/35 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
地址: | 223005 江苏省淮安市洪泽区东七街三号高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 红酒 推荐 方法 | ||
本专利公开发明了一种基于卷积神经网络的红酒推荐方法,对红酒评论数据进行处理,所有数据集的标记化,再对每条文本序列化以及利用Word2vec进行文本分词。将红酒分为8个不同口感的类别作为红酒类别的标签,使用每种红酒的特征和红酒口感类别标签训练神经网络模型,以求得一定范围内的超参数,加强模型训练效果。在训练模型时,卷积核数目,全连接层神经元等超参数都是开发人员凭借经验决定的。本发明可以有效获取一定范围内的超参数使红酒文本多分类更加准确,减少了开发人员的手动调参时间,还可以帮助红酒供应商更明确地了解市场上红酒销售动态。
技术领域
本发明属于特征提取和文本分类技术领域,特别涉及一种基于卷积神经网络的红酒推荐方法。
背景技术
经过上百年的发展,品尝葡萄酒已经成为了一种学问,品酒的基础建立在对葡萄酒基础知识的了解之上,包括葡萄品种、采摘年份、酒庄,还有酿造工艺等等。红酒品种繁多,供应商很难获取消费者的红酒喜好,如若有这个红酒推荐系统则可以帮助红酒供应商更明确地了解市场上红酒销售动态,让供应商做出更加明确的判断来迎合红酒市场的发展。近年来针对这个问题,研究者提出了相应的红酒推荐认定方案,如利用CNN卷积文本分类,RNN循环神经网络分类,决策树,朴素贝叶斯等。
朱全银等人已有的研究基础包括:朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取算法[J].淮阴工学院学报,2015,24(5):18-24;李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;Quanyin Zhu,Sunqun Cao.ANovel Classifier-independent Feature Selection Algorithm for ImbalancedDatasets.2009,p:77-82;Quanyin Zhu,Yunyang Yan,Jin Ding,Jin Qian.The CaseStudy for Price Extracting of Mobile Phone Sell Online.2011,p:282-285;QuanyinZhu,Suqun Cao,Pei Zhou,Yunyang Yan,Hong Zhou.Integrated Price Forecast basedon Dichotomy Backfilling and Disturbance Factor Algorithm.InternationalReview on Computers and Software,2011,Vol.6(6):1089-1093;李翔,朱全银,胡荣林,周泓.一种基于谱聚类的冷链物流配载智能推荐方法.中国专利公开号:CN105654267A,2016.06.08;曹苏群,朱全银,左晓明,高尚兵等人,一种用于模式分类的特征选择方法.中国专利公开号:CN103425994A,2013.12.04;刘金岭,冯万利,张亚红.基于重新标度的中文短信文本聚类方法[J].计算机工程与应用,2012,48(21):146-150.;朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取算法[J].淮阴工学院学报,2015,24(5):18-24;李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;朱全银,辛诚,李翔,许康等人,一种基于K-means和LDA双向验证的网络行为习惯聚类方法.中国专利公开号:CN 106202480A,2016.12.07。
CNN文本卷积神经网络算法:
卷积神经网络(CNN)在计算机视觉领域取得了极大的进展,但是除此之外CNN也逐渐在自然语言处理(NLP)领域攻城略地。卷积神经网络在情感分析中取得了很好的成果,相比于之前浅层的机器学习方法如NB、SVM效果更好,特别实在数据集较大的情况下,并且CNN不用我们手动去提取特征,原浅层ML是需要进行文本特征提取、文本特征表示、归一化、最后进行文本分类。
tanh函数:
这个函数和sigmoid相比收敛速度快,tanh在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。
ReLU函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910293926.7/2.html,转载请声明来源钻瓜专利网。