rtc_prd/API相关/离在线语音合成SDK概览.md
seaislee1209 8f5fb32b37 feat(story,music,server): 豆包故事生成 + 历史数据持久化 + 封面占位
- 接入火山引擎豆包 Chat API 生成儿童故事(SSE 流式进度)
- 新增 /api/stories 接口加载历史故事到书架
- 新增 /api/playlist 接口加载历史歌曲到唱片架
- 书架排序:预设故事在前,AI 生成在后
- AI 生成的故事显示"暂无封面"淡紫渐变占位
- 保存故事时传回真实标题+内容(不再用 mock)
- 修复 Windows GBK 编码导致的中文乱码问题
- 新增 MusicGenerationService 单例管理音乐生成
- 音乐页心情卡片 UI 重做 + 歌词可读性优化
- 添加豆包 API 参考文档和故事创作 prompt

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-09 23:11:58 +08:00

46 lines
2.2 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

本文档对语音合成SDK支持的能力进行说明。
* **SDK名称**语音合成SDK
* **SDK开发者**:北京火山引擎科技有限公司
* **主要功能**语音合成SDK支持将文字实时合成语音适用于实时语音播报的场景如有声阅读、导航、语音助手等等。
<span id="sdk接入"></span>
## SDK接入
| | | | \
|平台/语言 |集成指南 |调用流程 |
|---|---|---|
| | | | \
|Android |[集成指南](/docs/6561/79832) |[调用流程](/docs/6561/79834) |
| | | | \
|iOS |[集成指南](/docs/6561/79835) |[调用流程](/docs/6561/79837) |
**其他相关信息**
* [SDK版本信息](/docs/6561/79830)
* [SDK隐私政策](/docs/6561/116696)
* [开发者使用合规规范](/docs/6561/116711)
<span id="合成能力"></span>
# 合成能力
**在线合成**云端合成发起网络请求边合成边播放支持TTS的websocket接口能够使用声音复刻音色以及TTS大小模型音色
**离线合成**:本地离线引擎合成,需要相关资源文件,边合成边播放;
<span id="合成策略"></span>
# 合成策略
离在线语音合成SDK除了可以单独使用的在线合成及离线合成外提供了在线合成发生网络超时后切换离线合成的两种策略用户可以通过配置建连超时和接收超时两个参数来控制切换的敏感程度。
* **在线优先**:优先发起在线合成,失败后(网络超时),启动离线合成引擎开始合成;
* **并发合成**:同时发起在线合成与离线合成,在线请求失败的情况下,使用离线合成数据,该模式下,可以配置更短的超时时间以提升效果,但会消耗更多系统性能;
<span id="合成场景"></span>
# 合成场景
语音合成SDK提供了两种种合成场景以满足不同的需求
* **普通场景**:又称单句场景,引擎每次启动,只合成、播放一句音频的模式。
* **小说场景**:适用于听书业务,每次启动引擎后可以根据需求合成多句音频。
<span id="合成效果"></span>
# 合成效果
通过对发音人、音调、音量和语速等参数的调整,可以获得不同的发声效果,更好满足您业务场景中的播报需求。