一种语音合成方法、装置、智能终端及可读介质[发明专利]
来源:华佗健康网
专利内容由知识产权出版社提供
专利名称:一种语音合成方法、装置、智能终端及可读介质专利类型:发明专利
发明人:黄东延,盛乐园,熊友军申请号:CN201980003174.4申请日:20191223公开号:CN111133507A公开日:20200508
摘要:本发明公开了一种语音合成方法,包括:获取待合成文本,根据预设的语音特征提取算法提取待合成文本的待处理梅尔频谱特征;将待处理梅尔频谱特征输入预设的ResUnet网络模型,获取第一中间特征;对待处理梅尔频谱特征进行平均池化处理和第一下采样处理,获取第二中间特征,以第二中间特征和ResUnet网络模型输出的第一中间特征为输入,进行反卷积处理和第一上采样处理,获取与待处理梅尔频谱特征对应的目标梅尔频谱特征;将目标梅尔频谱特征转换为语音,生成与待合成文本对应的目标语音。此外,本发明还公开了一种语音合成装置、智能终端及计算机可读存储介质。采用本发明,可以提高文本的梅尔频谱特征预测的准确性,提高语音合成的准确性。
申请人:深圳市优必选科技股份有限公司
地址:518000 广东省深圳市南山区学苑大道1001号南山智园C1栋16、22楼
国籍:CN
代理机构:深圳中细软知识产权代理有限公司
代理人:彭佳伟
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容