logo
在线语音合成
语音合成服务TTS(Text-To-Speech),将用户提供的文稿转换为更接近金融口语的语音音频,更可根据不同的用户需求自定义采样率、位宽、音高、格式及发音人,以适用不同场景的需求。
提供方: 万得智能开放平台
  • 在线体验

  • 返回信息

  • 入参信息

在线体验

返回信息

无相关信息

入参信息

请求体:
描述: multipart/form-data
键值类型名称描述
RootobjectRoot
textstring需要获取读音的文本需要获取读音的文本(必须),UTF-8编码【计划限制】:限制长度,限制值待定。
sampleRatestring调节音频采样率调节音频采样率(默认24000)支持范围:8000~24000范围内的整数
pitchShiftstring调节音高调节音高(默认0)正数为升调,负数为降调,范围在-10~10之间的整数
bitWidestring调节音频位宽调节音频位宽(默认PCM_16)支持:PCM_32, PCM_16, PCM_U8PCM_32音频质量最高,PCM_U8(电话音质)音频质量最低
formatstring选择音频格式选择音频格式(默认wav)支持wav,aac (有损压缩,压缩率23%)
speakerstring发音人ID发音人ID(默认0)如需获取其他发音人,请联系您的客户经理申请
AddInfostringAddInfo【预留】未来可能用到的其他信息,暂不做处理