[发明专利]一种赛事新闻领域词库的构建方法在审
申请号: | 201810310248.6 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108536821A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 吕学强;董志安 | 申请(专利权)人: | 北京信息科技大学;吕学强 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种赛事新闻领域词库的构建方法,包括:识别赛事新闻中的领域词、识别球员名和球队名;本发明提供的赛事新闻领域词库的构建方法,通过改进互信息方法得到构建领域词的方法,通过词语在领域内的频度和分散度以及领域间的集中度改进了互信息方法,并把其他领域的互信息平均值也作为考虑项,用本领域的改进互信息值与其他领域改进互信息的平均值的差,来作为计算词语对类别领域值的计算方法,本发明提出的方法没有涉及到领域内知识,可扩展性比较强,能够取得很好的识别效果,识别准确率高,而且把识别出来的球队名、球员名和领域词添加到领域词库中,可以很好地满足实际应用的需要。 | ||
搜索关键词: | 互信息 词库 构建 改进 词语 可扩展性 频度 分散度 集中度 准确率 应用 | ||
【主权项】:
1.一种赛事新闻领域词库的构建方法,其特征在于,包括:识别赛事新闻中的领域词、识别球员名和球队名。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学;吕学强,未经北京信息科技大学;吕学强许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810310248.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种门禁管理系统及使用方法
- 下一篇:数据迁移方法、装置、系统及存储介质