- 接入火山引擎豆包 Chat API 生成儿童故事(SSE 流式进度) - 新增 /api/stories 接口加载历史故事到书架 - 新增 /api/playlist 接口加载历史歌曲到唱片架 - 书架排序:预设故事在前,AI 生成在后 - AI 生成的故事显示"暂无封面"淡紫渐变占位 - 保存故事时传回真实标题+内容(不再用 mock) - 修复 Windows GBK 编码导致的中文乱码问题 - 新增 MusicGenerationService 单例管理音乐生成 - 音乐页心情卡片 UI 重做 + 歌词可读性优化 - 添加豆包 API 参考文档和故事创作 prompt Co-authored-by: Cursor <cursoragent@cursor.com>
2.2 KiB
2.2 KiB
本文档对语音合成SDK支持的能力进行说明。
- SDK名称:语音合成SDK
- SDK开发者:北京火山引擎科技有限公司
- 主要功能:语音合成SDK支持将文字实时合成语音,适用于实时语音播报的场景,如有声阅读、导航、语音助手等等。
SDK接入
| | | | \
| 平台/语言 | 集成指南 | 调用流程 |
|---|---|---|
| Android | 集成指南 | 调用流程 |
| iOS | 集成指南 | 调用流程 |
其他相关信息:
合成能力
在线合成:云端合成,发起网络请求,边合成边播放(支持TTS的websocket接口,能够使用声音复刻音色以及TTS大小模型音色) 离线合成:本地离线引擎合成,需要相关资源文件,边合成边播放;
合成策略
离在线语音合成SDK,除了可以单独使用的在线合成及离线合成外,提供了在线合成发生网络超时后,切换离线合成的两种策略,用户可以通过配置建连超时和接收超时两个参数来控制切换的敏感程度。
- 在线优先:优先发起在线合成,失败后(网络超时),启动离线合成引擎开始合成;
- 并发合成:同时发起在线合成与离线合成,在线请求失败的情况下,使用离线合成数据,该模式下,可以配置更短的超时时间以提升效果,但会消耗更多系统性能;
合成场景
语音合成SDK提供了两种种合成场景,以满足不同的需求:
- 普通场景:又称单句场景,引擎每次启动,只合成、播放一句音频的模式。
- 小说场景:适用于听书业务,每次启动引擎后可以根据需求合成多句音频。
合成效果
通过对发音人、音调、音量和语速等参数的调整,可以获得不同的发声效果,更好满足您业务场景中的播报需求。