本发明公开了一种基于拼音的对话系统文本纠错系统及方法,本发明实施例在基于拼音的对话系统文本中检测到异常信息后,采用设置的文本模糊匹配策略(TFM,Text Fuzzy Matching)将异常信息与设置的信息列表进行匹配后,得到匹配的信息,采用设置的基于拼音的文本相似度算法(PTS,Pinyin‑Based Text Similarity)将异常信息与得到的匹配信息进行相似度计算,得到相似度最高的信息,对异常信息进行纠正。本发明实施例在降低纠错成本的基础上,提高纠错准确性。
本发明公开了一种基于拼音的对话系统文本纠错系统及方法,设置了基于拼音的文本容错模型(PTFM,Pinyin‑Based Text Fault‑Tolerant Model),该PTFM在基于领域问题集及领域实体的情况下,实现对基于拼音的对话系统文本中的异常领域实体和异常领域词的容错。这样,本发明实施例就可以在降低纠错成本的基础上,实现各个领域的基于拼音的对话系统文本的纠错。