[发明专利]差分抽取装置、方法以及程序在审
申请号: | 202111008156.0 | 申请日: | 2021-08-31 |
公开(公告)号: | CN114519998A | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 田中大贵;笼嶋岳彦;岩田宪治;藤村浩司 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/08;G10L15/02;G10L15/183 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李今子 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽取 装置 方法 以及 程序 | ||
本发明的实施方式涉及差分抽取装置、方法以及程序。实施方式的差分抽取装置具备文本获取部、发音串变换部、标记串变换部以及比较部。所述文本获取部获取记载有输入标记串的文本。所述发音串变换部将所述输入标记串变换为发音串。所述标记串变换部将所述发音串变换为输出标记串。所述比较部比较所述输入标记串和所述输出标记串而抽取差分。
优先权基础申请等关联申请的引用
本申请以2020年11月4日提交的日本专利申请第2020-184610号为基础,主张优先权,其全部内容通过引用并入本文。
技术领域
本发明的实施方式涉及差分抽取装置、方法以及程序。
背景技术
一般而言,用于通过搜索未登记于词典的未知词作为词典登记的候补,从而支援用户的词典登记作业的技术正在开发。作为这种技术,例如,已知有如下方式:从对文本进行词素解析而得到的结果抽取复合词,如果该复合词未登记于已构建词典,则视为未知词。
该方式通常不特别成为问题,但根据本发明人的研究,有时关于即使不登记也成为正确的标记的未知词也作为词典登记的候补而被抽取。在该情况下,会登记不需要登记的词。
发明内容
本发明要解决的课题是提供能够防止未知词中的即使不登记也成为正确的标记的未知词的登记的差分抽取装置、方法以及程序。
实施方式的差分抽取装置具备文本获取部、发音串变换部、标记串变换部以及比较部。所述文本获取部获取记载有输入标记串的文本。所述发音串变换部将所述输入标记串变换为发音串。所述标记串变换部将所述发音串变换为输出标记串。所述比较部比较所述输入标记串和所述输出标记串而抽取差分。
根据上述结构的差分抽取装置,能够防止未知词中的即使不登记也成为正确的标记的未知词的登记。
附图说明
图1是例示第1实施方式的差分抽取装置的结构的框图。
图2是例示第1实施方式中的从发音串向标记串的变换的示意图。
图3是用于说明第1实施方式中的比较部的示意图。
图4是例示第1实施方式中的显示画面的示意图。
图5是用于说明第1实施方式中的动作的流程图。
图6是用于说明第1实施方式中的动作的示意图。
图7是例示第1实施方式中的日语的音节的示意图。
图8是例示第1实施方式中的发音状态声响得分矢量的示意图。
图9是例示第1实施方式的变形例的特征量变换部的框图。
图10是用于说明第1实施方式的变形例中的动作的流程图。
图11是例示第2实施方式的差分抽取装置的结构的框图。
图12是用于说明第2实施方式中的动作的流程图。
图13是用于说明第2实施方式中的单词推测部的示意图。
图14是例示第2实施方式中的显示画面的示意图。
图15是示出第2实施方式中的指示例的示意图。
图16是例示第3实施方式的差分抽取装置的结构的框图。
图17是用于说明第3实施方式中的动作的流程图。
图18是例示第3实施方式的显示画面的示意图。
图19是示出第3实施方式的单词登记部的登记例的示意图。
图20是示出第3实施方式的登记反映时的显示例的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111008156.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:有机电致发光材料及其器件