[发明专利]一种多语种短信息的网络监管方法无效
申请号: | 201010266623.5 | 申请日: | 2010-08-25 |
公开(公告)号: | CN101976231A | 公开(公告)日: | 2011-02-16 |
发明(设计)人: | 孙强国 | 申请(专利权)人: | 孙强国 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06Q50/00;H04W4/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 834700 新疆维吾尔自*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语种 信息 网络 监管 方法 | ||
技术领域:
本发明涉及一种电信运营商或公安、安全等部门对短信息的网络监督管理方法,特别是涉及一种多语种短信息的网络监管方法。
背景技术:
手机短信息的传送是电信运营商在其短信平台上,依据约定的协议和统一的编码规则来对传送字符进行编码传送。如我国电信部门按照CMPT协议和统一的编码标准对短信息进行编码和发送,这里称之为传送码。用户在手机终端上书写或收看短信息则依据的是每个字符对应一个编码(机内码),同时也对应一个特定的字形码,这里称之为显示码。为了使信息显示的统一,机内码有国际或国家标准。但是,对于相同的机内码,手机生产厂家或手机研发公司则可以做成不同的显示字形,即用字符a的机内码显示的却是字符b的外观。即传送码对应的内容与显示码所显示的内容不一致。如,传送码传送的是俄文字母“Д”的unicode码“0414”,而实际上在手机上书写或收看到的字形码是英文的“a”。同样的道理,的短信的书写者手机上发送和在接收者的手机上显示的是“backfire”,而该字符串的传送码在电信监管部门却显示的是“exertion”。
当恐怖分子或其他犯罪分子将某款手机的显示码与电信部门的传送码做成对应不同的字符,将会使装有该种显示码的手机短信息成为密码通讯工具,手机就会成为恐怖分子和不法之徒发布破坏指令、联络、造谣惑众、传播淫秽信息等犯罪活动的工具。所通讯的内容只用发送者和接收者知晓,而电信、公安、安全等部门在目前条件下对此无法实施有效的监管。
现有的短信息的监管方法,主要是利用敏感字词的查找来对有害短信息进行监管,这对传送码和字形码一致的短信可以起到一定的作用。但是,对于上 述的字符a的机内码显示的却是字符b的外观的短信息,目前尚无解决的办法。
发明内容:
本发明的目的便是针对上述缺陷,提出一种根据计算机程序并辅助人工的方法,对发送码所对应的语种的词语与该语种语料库中的词语进行匹配的技术,判断发送语种和显示语种的相似度和吻合度,来判断非法短信息。进而,找出传送码与显示码及显示字符的对应关系,最终破解非法短信。以达到对传送码和字形码不一致的短信息进行有效监管的目的。
本发明解决其技术问题所采用的方法的要点是:
一、利用计算机程序并辅助人工手段,按以下过程处理;
a、根据传送码对应的编码字符集中的字符所属的语种来判断短信息的字符对应的语种,当所涉及的语种数超过一定值时,即可将该短信息视为可疑短信,再采用人工的方法识别,屏蔽或删除;
b、根据短信息的语种,判断传送码中是否存在空格或换行及该语种的逗号、句号、问号等标点符号的编码(简称符号编码),如无符号编码,并且短信息的长度超过一定的字符数,即可将该短信息视为可疑短信,再采用人工的方法识别,屏蔽或删除;
c、以符号编码将传送码对应的字符串编码进行分组,截取分组后的字符串,
c1:将截取分组后的字符串与设定的该语种的敏感词汇(这里的敏感词语是指包含暴力犯罪、杀人、放火、抢劫、煽动、淫秽等词语)语料库中的词语进行对照,当分组后的各个字符串与语料库中的敏感词语吻合度或相似度大于一定数值时,即可将该短信息视为可疑短信,再采用人工的方法识别,屏蔽或删除;
c2:将截取分组后的字符串与设定的该语种的常用高频词的语料库中的词语进行对照,当分组后的各个字符串与语料库中的词语吻合度或相似度小于一定数 值时,即可将该短信息视为可疑短信,再采用人工的方法识别,屏蔽或删除;d、对可疑短信,将每个传送码依次与可疑短信息可能涉及的语种的每个字符分别依次对应,进行排列组合,将排列组合后的全部字符串与该语种的敏感词汇语料库和常用高频词的语料库中的词语进行对照,当吻合度或相似度大于一定数值时,可找出传送码与显示码及真实的字符显示之间的对应关系,进而破解非法短信。
二、对于短信息字符间无符号编码,其长度又未超过一定的字符数的短信息采用上述的步骤c、d处理;
三、对于粘着语语系,如阿拉伯语、维吾尔语、土耳其语、乌尔都语、伊朗语和屈折语语系,如俄语、德语等,涉及的语料库中的词语可以是词干或词根,所截取的字符串可以是分组后的字符串前面的若干位;
四、所述的多语种包括中文、英语、德语、俄语、法语、葡萄牙语、西班牙语、阿拉伯语、维吾尔语、土耳其语、乌尔都语、伊朗语、普什图语、日语、朝鲜语等语种;
五、当判断出发送的短信属非法短信后,监管部门对短信进行屏蔽删除的同时,利用定点功能,锁定非法短信息的发送区域,将不法之徒绳之与法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孙强国,未经孙强国许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010266623.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种静态平衡阀
- 下一篇:一种蛇床子素的制备方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置