本公开涉及一种语音合成方法、装置、可读介质及电子设备,包括获取用户输入的待处理声音和目标文本,声音片段含有噪声;从待处理声音中提取待处理频谱数据;根据待处理频谱数据和目标文本生成与待处理声音的音色和目标文本对应的目标频谱数据;根据目标频谱数据合成得到与目标文本对应的目标声音。这样,在用户输入的任意长度且含有噪声的声音片段的情况下也能处理得到清晰的发音,也即提高了对多种SNR信噪比(SIGNAL NOISE RATIO,SNR or S/N)环境下的语音合成的效果,无需用户在无噪声的环境下、按照限定的内容或长时间的语音输入,在保证语音合成效果的前提下大大简化了用户语音合成的复杂度。