本文档对语音合成SDK支持的能力进行说明。 * **SDK名称**:语音合成SDK * **SDK开发者**:北京火山引擎科技有限公司 * **主要功能**:语音合成SDK支持将文字实时合成语音,适用于实时语音播报的场景,如有声阅读、导航、语音助手等等。 ## SDK接入 | | | | \ |平台/语言 |集成指南 |调用流程 | |---|---|---| | | | | \ |Android |[集成指南](/docs/6561/79832) |[调用流程](/docs/6561/79834) | | | | | \ |iOS |[集成指南](/docs/6561/79835) |[调用流程](/docs/6561/79837) | **其他相关信息**: * [SDK版本信息](/docs/6561/79830) * [SDK隐私政策](/docs/6561/116696) * [开发者使用合规规范](/docs/6561/116711) # 合成能力 **在线合成**:云端合成,发起网络请求,边合成边播放(支持TTS的websocket接口,能够使用声音复刻音色以及TTS大小模型音色) **离线合成**:本地离线引擎合成,需要相关资源文件,边合成边播放; # 合成策略 离在线语音合成SDK,除了可以单独使用的在线合成及离线合成外,提供了在线合成发生网络超时后,切换离线合成的两种策略,用户可以通过配置建连超时和接收超时两个参数来控制切换的敏感程度。 * **在线优先**:优先发起在线合成,失败后(网络超时),启动离线合成引擎开始合成; * **并发合成**:同时发起在线合成与离线合成,在线请求失败的情况下,使用离线合成数据,该模式下,可以配置更短的超时时间以提升效果,但会消耗更多系统性能; # 合成场景 语音合成SDK提供了两种种合成场景,以满足不同的需求: * **普通场景**:又称单句场景,引擎每次启动,只合成、播放一句音频的模式。 * **小说场景**:适用于听书业务,每次启动引擎后可以根据需求合成多句音频。 # 合成效果 通过对发音人、音调、音量和语速等参数的调整,可以获得不同的发声效果,更好满足您业务场景中的播报需求。