[发明专利]一种通讯消息中非文明用语的识别方法及装置在审
申请号: | 201610824480.2 | 申请日: | 2016-09-18 |
公开(公告)号: | CN106372062A | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 陈包容 | 申请(专利权)人: | 长沙军鸽软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62;H04L12/58 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的通讯消息中非文明用语的识别方法及装置,通过采集训练样本的与预设的语境属性条目对应的语境属性内容,并基于语境属性内容和训练样本的词向量提取训练样本的特征向量,以及基于提取的特征向量训练用于识别非文明用语的非文明用语识别模型,并最后根据训练好的非文明用语识别模型,确定待识别的通讯消息中是否包含非文明用语,解决了现有技术没有结合通讯消息的语义语境识别非文明用语,导致识别不准确的技术问题,通过采集训练样本的与预设的语境属性条目对应的语境属性内容以及基于训练样本的词向量训练出结合语义语境识别非文明用语的识别模型,使得根据该识别模型识别非文明用语的准确度高,适用性强。 | ||
搜索关键词: | 一种 通讯 消息 中非 文明用语 识别 方法 装置 | ||
【主权项】:
一种通讯消息中非文明用语的识别方法,其特征在于,包括:预先设定语境属性条目;采集训练样本的与所述语境属性条目对应的语境属性内容,其中,所述训练样本包括包含非文明用语和不包含非文明用语训练样本;基于所述训练样本的词向量以及所述语境属性内容,提取所述训练样本的特征向量;根据所述特征向量训练分类器,获得非文明用语识别模型;根据所述非文明用语识别模型,确定待识别的通讯消息中是否包含非文明用语。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙军鸽软件有限公司,未经长沙军鸽软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610824480.2/,转载请声明来源钻瓜专利网。
- 上一篇:铝缓蚀剂及其制备方法和应用
- 下一篇:一种铝合金用水基清洗剂