[发明专利]一种基于人工智能的藏语数据处理方法在审
申请号: | 202210828006.2 | 申请日: | 2022-07-13 |
公开(公告)号: | CN115238686A | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 边巴卓玛;欧珠;丹增阿旺;旦增念扎;谢志东 | 申请(专利权)人: | 西藏查瓦云科技有限责任公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/117;G06F40/242;G06F40/211;G06F40/216 |
代理公司: | 重庆宏知亿知识产权代理事务所(特殊普通合伙) 50260 | 代理人: | 张洁 |
地址: | 850000 西藏自治区拉萨市*** | 国省代码: | 西藏;54 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种基于人工智能的藏语数据处理方法,涉及藏语数据处理技术领域,由以下步骤组成:步骤一、键入藏文文本;步骤二、进行文本预处理;步骤三、进行分词;步骤四、进行歧义检测;步骤五、输出切分结果。利用人工智能大数据对藏语文本进行识别和与藏语词库进行智能比对,将文本中的停用词和错词进行标注出来,便于人工进行复核,确保输入的文本的正确性,然后,将停用词和错词去掉对文本进行精简,这些没有意义的词汇在后续分词检索时会占用大量的资源,造成检索时间长精度低,将它们去除整合成新的文本,有助于后续的处理,提升处理速度和准确率,解决藏文字词直接使用最大匹配算法进行切分所需的检索时间较长的问题。 | ||
搜索关键词: | 一种 基于 人工智能 藏语 数据处理 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西藏查瓦云科技有限责任公司,未经西藏查瓦云科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210828006.2/,转载请声明来源钻瓜专利网。