专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果189个,建议您升级VIP下载更多相关专利
  • [发明专利]一种利用语义信息计算文本相似度的方法-CN201811094368.3有效
  • 郑志军;程国艮 - 中译语通科技股份有限公司
  • 2018-09-19 - 2023-01-31 - G06F40/30
  • 本发明提供了一种利用语义信息计算文本相似度的方法,具体而言,该方法包括:将给定的文本进行分词处理得到对应的词序列,然后将上述词序列中的每个单词对应于训练好的词向量取出形成词向量序列,进一步确定给定文本中词序列的关键词,形成关键词序列;判定所述文本中的词是否属于关键词序列并分别赋予不同的权重;在获取了词向量和对应权重的基础上,将句子的词向量与权重值进行加权求和得到语义向量序列,最后利用文本间的语义向量的夹角余弦表示不同文本的相似度。该方法充分考虑了文本中每个词在文本相似度计算中的作用,强调每个词对相似度的贡献的区别,从语义的角度重新定义了求不同文本相似度的方法。
  • 一种利用语义信息计算文本相似方法
  • [发明专利]一种基于主动学习和深度学习相结合的命名实体模型和系统-CN201811332518.X有效
  • 张力文;程国艮 - 中译语通科技股份有限公司
  • 2018-11-09 - 2023-01-31 - G06F40/295
  • 命名实体识别是信息抽取中的一项基础任务,现阶段工业界主要采用性能卓越的有监督方法来抽取命名实体,但这类方法过分依赖于人工的标注语料,而获取大规模的标注语料是十分困难的。如何利用有效地利用丰富的未标注语料是目前亟待解决的问题。本发明提供了一种基于主动学习和深度学习相结合的命名实体模型及系统。本系统是让命名实体识别模型自动从未标注语料中,选取最有训练价值的代标注例句,提交人工进行标注后,再加入到训练集中,以提高模型的性能。该系统可以让标注人员极大限度地提高工作效率,有效地减少人力成本;本模型的构建使用卷积神经网络(CNN)作为编码器,以减少未登录词对任务的影响;使用长短期记忆网络(LSTM)/GRU作为解码器,以加速模型的训练速度。本发明采用人工与自动相结合的方式进行标注来扩展训练语料,在提高实体识别的精确率和召回率的同时,能够显著地降低人工标注的工作量。
  • 一种基于主动学习深度相结合命名实体模型系统
  • [发明专利]一种数据治理方法、装置、电子设备及存储介质-CN202210979812.X在审
  • 程国艮;邢飞;严凤兵 - 中译语通科技股份有限公司
  • 2022-08-16 - 2022-12-27 - G06F16/2455
  • 本申请提供了一种数据治理方法、装置、电子设备及存储介质,方法包括:获取初始数据表,其中,初始数据表中包括若干个初始字段,对于每一初始字段,该初始字段下存在初始数据;对于每一初始字段,从数据治理规则库中查找该初始字段是否存在对应的至少一个数据治理规则,若存在,则将每一数据治理规则向用户进行显示;响应于用户对于所显示的每一数据治理规则中目标数据治理规则的选定操作,按照目标数据治理规则所具有的数据治理逻辑,对该初始字段下的初始数据进行数据治理,得到目标治理数据以及目标治理数据所属的目标字段。本申请能够降低技术人员的工作负担,提升工作效率。
  • 一种数据治理方法装置电子设备存储介质
  • [发明专利]一种数据查重方法-CN201811274839.9有效
  • 鄢亚东;程国艮 - 中译语通科技股份有限公司
  • 2018-10-30 - 2022-12-13 - G06F40/194
  • 本发明提供一种利用DBCursor光标和hashMap进行海量数据查重的方法,对海量资源数据采用DBCursor光标读取数据,使用.next()按顺序读取数据库中数据,读取结束后以close()关闭连接;分批次遍历资源数据列表,使用simHash算法将资源数据库中的文本计算为simHash指纹签名,存储成String类型,并将指纹签名分成n个片段,其中n为自然数;用上述得到的simHash签名分成的片段作为key,对应的sinHash+堆号作为value值;利用hashMap的键值执行目标文本的查重。该方法克服了传统方法效率低下,内存占用率高的问题,兼顾了效率和准确率的平衡。
  • 一种数据方法
  • [发明专利]事件关系的抽取方法、装置、电子设备和存储介质-CN202210954746.0在审
  • 郑志军;陈自岩;程国艮 - 中译语通科技股份有限公司
  • 2022-08-10 - 2022-11-18 - G06F40/205
  • 本申请提供了一种事件关系的抽取方法、装置、电子设备和存储介质,所述方法包括:所述方法包括:将目标文本输入监督学习模型,得到编码后的多个时序序列,其中,每个所述时序序列指示所述文本中包含当前字符上下文语义信息的编码向量;对每个所述时序序列进行解码,得到事件论元的半指针矩阵和事件关系的半指针矩阵,其中,所述事件论元的半指针矩阵的每个元素能够表示一个字符指代的一个论元的类型角色,事件关系的半指针矩阵的每个元素能够表示一个字符指代的一个事件的关系角色;基于对所述事件论元的半指针矩阵、所述事件关系的半指针矩阵的解析,抽取出事件角色和事件对的关系。本申请提高事件角色和事件关系抽取的准确率。
  • 事件关系抽取方法装置电子设备存储介质
  • [发明专利]一种网页的镜像方法、装置、电子设备及存储介质-CN202210995219.4在审
  • 武寨青;程国艮;李欣杰 - 中译语通科技股份有限公司
  • 2022-08-18 - 2022-11-15 - G06F16/958
  • 本申请提供了一种网页的镜像方法、装置、电子设备及存储介质,其中,该方法包括响应网页镜像指令,获取网页镜像指令所指示的原始网页的截图和内容数据,内容数据为用于渲染生成原始网页的数据;将原始网页的截图输入预先训练好的区域识别模型,以输出原始网页中的所有网页元素的第一区域信息以及所有网页元素的类别;根据输出的所有网页元素的类别,确定出所有目标网页元素和所有非目标网页元素;在原始网页的内容数据中提取出所有目标网页元素对应的内容数据;根据所有非目标网页元素的第一区域信息和所有目标网页元素的第一区域信息,重新确定所有目标网页元素的第二区域信息,以构建更准确的网页镜像。
  • 一种网页方法装置电子设备存储介质
  • [发明专利]一种数据抓取策略的确定方法、装置及设备-CN202210981063.4在审
  • 武寨青;程国艮;李欣杰 - 中译语通科技股份有限公司
  • 2022-08-16 - 2022-11-08 - G06F16/951
  • 本申请提供了一种数据抓取策略的确定方法、装置及设备,其中,该方法包括:针对每个爬虫测试程序,从该爬虫测试程序中抽取该爬虫测试程序对应的爬虫行为特征,并确定该爬虫测试程序对应的测试爬取目标针对该爬虫测试程序的反馈结果;根据所有爬虫测试程序对应的爬虫行为特征以及反馈结果,确定爬虫测试模型;将针对爬取目标的候选爬虫策略所对应的至少一个爬虫行为特征输入爬虫测试模型,获得爬取目标针对候选爬虫策略的预测反馈结果;根据预测反馈结果对候选爬虫策略进行调整,以获得针对爬取目标的目标爬取策略。达到有针对性的设计爬取策略,避免爬虫资源的浪费,并能够持续、稳定地进行数据抓取的效果。
  • 一种数据抓取策略确定方法装置设备
  • [发明专利]一种短视频质量的确定方法、装置、电子设备及存储介质-CN202210916082.9在审
  • 武寨青;程国艮;李欣杰 - 中译语通科技股份有限公司
  • 2022-08-01 - 2022-11-01 - G06F16/78
  • 本申请提供了一种短视频质量的确定方法、装置、电子设备及存储介质,包括:对待检测的短视频进行特征提取,确定出待检测的短视频的时间序列特征;将待检测的短视频的时间序列特征输入至与预先训练好的视频质量检测模型之中,确定出待检测的短视频的质量等级;其中,视频质量检测模型是通过利用多个样本视频的互动行为数据确定出的分类标签以及多个样本视频的时间特征序列训练出来的。通过利用多个样本视频的互动行为数据确定出的分类标签以及多个样本视频的时间特征序列训练出来视频质量检测模型,将待检测的短视频输入至视频质量检测模型之中,快速准确地确定出待检测的短视频的质量等级,从而提高了短视频的质量等级确定的效率以及准确性。
  • 一种视频质量确定方法装置电子设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top