[发明专利]差分抽取装置、方法以及程序在审

专利信息
申请号: 202111008156.0 申请日: 2021-08-31
公开(公告)号: CN114519998A 公开(公告)日: 2022-05-20
发明(设计)人: 田中大贵;笼嶋岳彦;岩田宪治;藤村浩司 申请(专利权)人: 株式会社东芝
主分类号: G10L13/04 分类号: G10L13/04;G10L13/08;G10L15/02;G10L15/183
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 李今子
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 抽取 装置 方法 以及 程序
【说明书】:

本发明的实施方式涉及差分抽取装置、方法以及程序。实施方式的差分抽取装置具备文本获取部、发音串变换部、标记串变换部以及比较部。所述文本获取部获取记载有输入标记串的文本。所述发音串变换部将所述输入标记串变换为发音串。所述标记串变换部将所述发音串变换为输出标记串。所述比较部比较所述输入标记串和所述输出标记串而抽取差分。

优先权基础申请等关联申请的引用

本申请以2020年11月4日提交的日本专利申请第2020-184610号为基础,主张优先权,其全部内容通过引用并入本文。

技术领域

本发明的实施方式涉及差分抽取装置、方法以及程序。

背景技术

一般而言,用于通过搜索未登记于词典的未知词作为词典登记的候补,从而支援用户的词典登记作业的技术正在开发。作为这种技术,例如,已知有如下方式:从对文本进行词素解析而得到的结果抽取复合词,如果该复合词未登记于已构建词典,则视为未知词。

该方式通常不特别成为问题,但根据本发明人的研究,有时关于即使不登记也成为正确的标记的未知词也作为词典登记的候补而被抽取。在该情况下,会登记不需要登记的词。

发明内容

本发明要解决的课题是提供能够防止未知词中的即使不登记也成为正确的标记的未知词的登记的差分抽取装置、方法以及程序。

实施方式的差分抽取装置具备文本获取部、发音串变换部、标记串变换部以及比较部。所述文本获取部获取记载有输入标记串的文本。所述发音串变换部将所述输入标记串变换为发音串。所述标记串变换部将所述发音串变换为输出标记串。所述比较部比较所述输入标记串和所述输出标记串而抽取差分。

根据上述结构的差分抽取装置,能够防止未知词中的即使不登记也成为正确的标记的未知词的登记。

附图说明

图1是例示第1实施方式的差分抽取装置的结构的框图。

图2是例示第1实施方式中的从发音串向标记串的变换的示意图。

图3是用于说明第1实施方式中的比较部的示意图。

图4是例示第1实施方式中的显示画面的示意图。

图5是用于说明第1实施方式中的动作的流程图。

图6是用于说明第1实施方式中的动作的示意图。

图7是例示第1实施方式中的日语的音节的示意图。

图8是例示第1实施方式中的发音状态声响得分矢量的示意图。

图9是例示第1实施方式的变形例的特征量变换部的框图。

图10是用于说明第1实施方式的变形例中的动作的流程图。

图11是例示第2实施方式的差分抽取装置的结构的框图。

图12是用于说明第2实施方式中的动作的流程图。

图13是用于说明第2实施方式中的单词推测部的示意图。

图14是例示第2实施方式中的显示画面的示意图。

图15是示出第2实施方式中的指示例的示意图。

图16是例示第3实施方式的差分抽取装置的结构的框图。

图17是用于说明第3实施方式中的动作的流程图。

图18是例示第3实施方式的显示画面的示意图。

图19是示出第3实施方式的单词登记部的登记例的示意图。

图20是示出第3实施方式的登记反映时的显示例的示意图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111008156.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top