Baji_Rtc_Toy

Author	SHA1	Message	Date
Rdzleo	22b7a70d7d	fix: 同步 Kapi 软 RTC 退出五连修到数字人项目（待命音 + 欢迎语杂音）从 Kapi commit b1577d8 / a3a476f 完整移植 5 个修复，覆盖三类问题： 1. 开机/唤醒后按 BOOT 进 RTC 房间，欢迎语前 1-3 秒杂音 2. 软 RTC 退出（41s 无对话触发 Dialog watchdog）后待命音"卡卡正在待命"无声/杂音/被截 3. 软退出后按 BOOT 唤醒，欢迎语前杂音【修复 1】OnAudioChannelOpened EnableOutput(true) 后立刻灌 200ms silence - 防止 I2S DMA 启动后到 RTC 真实 PCM 到达 1-3s 空窗的杂音【修复 2】LeaveRoom 加 notify_closed 参数（默认 true 不变老路径） - hibernate 路径传 false 跳过 on_audio_channel_closed_ 回调 - 避免回调链 player_pipeline_close → EnableOutput(false) 误关 codec 导致待命音无声【修复 3】LeaveRoom 不再 volc_rtc_destroy, 保留 rtc_handle_ - 唤醒时 OpenAudioChannel 直接 volc_rtc_start 复用 handle, 不死循环 - 服务端 AI 任务无需 destroy 也会按 180s 兜底机制清理【修复 4 - 最隐蔽】LeaveRoom 末尾重置 downlink_is_pcm_ = false - 火山 RTC 下行是 PCM, DataCallback 设 downlink_is_pcm_=true - 不重置 → PlaySound 的 Opus 包被 OnAudioOutput 当成 raw PCM 字节流直接写 codec → 杂音而非待命音 - 唤醒重连后 DataCallback 收下一包会自动重置, 不影响欢迎语【修复 5】OnAudioInput 入口加 hibernating_ guard - hibernate 期间禁用输入侧, 防止访问关闭的 codec → std::bad_alloc abort - 不冻结 OnAudioOutput, 让待命音队列正常被消费【EnterIdleHibernate 重写】套用 Kapi 新顺序: Step 0: hibernating_=true + 50ms (让 OnAudioInput guard 生效) Step 1: LeaveRoom(false) (codec output 保留) Step 2: background_task->WaitForCompletion Step 3: 清空 audio_decode_queue_ Step 4: EnableInput(false) + close recorder_pipeline Step 5: 强制 esp_pm 禁用 Light Sleep Step 5.5: EnableOutput(false→true) + 200ms silence (清 LeaveRoom 副作用) Step 6: SetDeviceState(idle) → PlaySound 待命音 Step 7: WaitForAudioPlayback (队列消费完毕) Step 7.5: background_task->WaitForCompletion + vTaskDelay(1000) (DMA + ES8311 FIFO + 功放尾音衰减, 防尾音截断) Step 8: player_pipeline_close Step 9: NVS idle_cycles_++ Step 10: 显示字幕"已自动退出RTC对话..."(数字人特有, 保留) 【WakeFromHibernate】调整 hibernating_=false 顺序 - 先放下 hibernating_, 让 ToggleChatState 期间 OnAudioInput guard 通过 - 否则 ToggleChatState 期间音频上行迟迟不开编译: kapi.bin 0x41c000 (4.21MB), 分区 25% 空闲。实测三项全通: 欢迎语干净 + 待命音清晰完整 + 唤醒欢迎语干净。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-18 10:11:36 +08:00
Rdzleo	b8a5fe958f	feat(rtc-only): Phase 6 - RTC 空闲软休眠（B+C 双源 + 真退房 + 字幕提示 + 内存兜底）按 GSD 框架 .planning/milestones/digital_human_rtc/phases/phase_06_idle_hibernate/ 规划完成 Phase 6 软退出 RTC 机制。替代旧的"40s 硬重启退出"方案。 ## 核心变更 ### 1. 倒计时刷新（B+C 双源方案） \| 方案 \| 监听源 \| 实施位置 \| 状态 \| \|------\|--------\|---------\|------\| \| A 扬声器流 \| I2S/PCM 输出 \| application.cc audio output 3 处 \| 宏关闭（PHASE6_ENABLE_AUDIO_FALLBACK） \| \| B 字幕监听 \| RTC subtitle 消息 \| application.cc:1300 subtitle 分支 \| 启用 \| \| C 智能体状态 \| RTC conv_status 消息 \| application.cc:1260 conv_status 分支 \| 启用 \| 复用现有 DIALOG_IDLE_COUNTDOWN_SECONDS=40 不新增常量。 ### 2. 真退出 RTC 房间（释放 License） - 新增 Protocol 基类虚函数 LeaveRoom（默认回退到 CloseAudioChannel） - VolcRtcProtocol::LeaveRoom 覆写：volc_rtc_stop + volc_rtc_destroy - 火山官方文档明确：真退房必须 leaveRoom + destroyRTCEngine - CloseAudioChannel 只 stop 不够（真人仍在房间继续计费） - 服务端 AI 任务在 180s 内自动清理（火山平台机制） ### 3. EnterIdleHibernate / WakeFromHibernate EnterIdleHibernate 流程（严格顺序）： 1. protocol_->LeaveRoom() # 真退房 2. codec->EnableInput/Output(false) # 重置 codec 状态机 3. recorder_pipeline_close() 4. hibernating_.store(true) # 关键：先设标志阻止 PowerSaveTimer 5. esp_pm_configure(light_sleep=false) # 双保险禁用 Light Sleep 6. SetDeviceState(kDeviceStateIdle) 7. idle_cycles_++ + NVS 持久化 8. 字幕"已自动退出RTC对话，按BOOT键重新连接RTC"（5 次重试间隔 200ms） WakeFromHibernate 流程： 1. 检查 idle_cycles_ >= 50 → 硬重启清理碎片（兜底） 2. 清空字幕 3. ToggleChatState → OpenAudioChannel → 自动重建 rtc_handle_ 4. RTC 重新加入房间（实测 2-3s 完成） ### 4. CanEnterSleepMode 加 hibernating 检查防止 hibernate 期间 PowerSaveTimer 触发 esp_pm_configure(light_sleep=true) 导致 I2C 总线进入低功耗 → 唤醒后 ES7210/ES8311 通信失败 abort。 ### 5. Dialog Watchdog 触发动作改造旧：esp_restart() 整机重启（黑屏 15-25s + WiFi 重连）新：Schedule(EnterIdleHibernate) 软退房（不熄屏 + 字幕提示） ### 6. BOOT 唤醒走 WakeFromHibernate 路径 iot_button 回调中检测 IsHibernating()，派发到独立 task 执行 WakeFromHibernate（避免阻塞 esp_timer 任务，CLAUDE.md 经验）。 ### 7. OpenAudioChannel 适配重建 LeaveRoom 销毁 rtc_handle_ 后，OpenAudioChannel 头部检测 NULL 触发 Start() 异步重建，轮询 5s 等待就绪。NVS 缓存 device_secret 所以重建通常 100ms 完成。 ## 实测验证（用户协作） \| 阶段 \| 时间 \| \|------\|------\| \| 40s 触发软休眠 \| ✅ \| \| LeaveRoom 真退房 \| ✅ "✓ 已真退出 RTC 房间（leaveRoom + destroyRTCEngine）" \| \| 屏幕保持 + 字幕显示 \| ✅ "已自动退出RTC对话，按BOOT键重新连接RTC" \| \| BOOT 按键唤醒 \| ✅ \| \| RTC 实例重建 \| ✅ 100ms \| \| RTC 重新加入房间 \| ✅ 2-3s \| \| 连续 2 次软休眠+唤醒 \| ✅ 无 abort/I2C 失败 \| \| 时间对比 \| 旧硬重启 15-25s → 软休眠 3-5s（省 80%） \| ## 6 个关键踩坑修复（详见 HIBERNATE_REPORT.md） 1. codec 状态机未重置 → 唤醒后 I2C abort 2. PowerSaveTimer Light Sleep 干扰 I2C 总线 3. hibernating_ 设置时序错误 4. dynamic_cast 在 -fno-rtti 下编译失败 → 改基类虚函数 5. LeaveRoom 后 OpenAudioChannel 直接失败 → 加重建逻辑 6. 字幕 LVGL 锁竞争 → 推迟到最后 + 5 次重试 ## 文档产出（同时提交） - .planning/.../phase_06_idle_hibernate/PLAN.md（含实施变更记录 V1-V6） - .planning/.../phase_06_idle_hibernate/HIBERNATE_REPORT.md（验证报告） - .planning/.../ROADMAP.md（Phase 1-5 ✅ + Phase 6 进行中状态更新） - docs/Rtc_AIavatar/数字人表情渲染方案_云端预渲染+BLE+OTA.md 新增第 19 章 RTC 空闲倒计时方案选型与软退出（9 小节） - docs/Rtc_AIavatar/RTC软退出方案_移植参考.md 完整移植参考（10 章 + 3 附录，可移植到其他火山 RTC 项目） - docs/Rtc_AIavatar/音频卡顿_全局资源分析.md 全局资源分析 + 13 项优化建议（不改代码）	2026-05-13 17:28:36 +08:00
Rdzleo	da098bf482	1、新增了在日志打印中接收字幕详细信息的代码	2026-03-17 09:45:29 +08:00
Rdzleo	ccea0c681c	feat: HTTPS故事播放 + RTC/HTTPS双向音频切换状态机 + 协议层优化 1、新增HTTPS故事播放功能：SendStoryRequest通过蓝牙MAC请求故事API，支持intro+body两段式无缝播放，替换原WebSocket故事请求方式； 2、新增HttpsPlaybackFromUrl通用HTTPS音频下载播放方法，支持JSON格式Opus帧流式解码播放； 3、新增RTC↔HTTPS双向音频切换三标志位状态机（opus_playback_active_/https_playback_active_/https_playback_abort_），HTTPS播放期间静默丢弃RTC PCM包，OnAudioOutput捕获is_opus_frame防止残留Opus帧杂音； 4、新增AbortHttpsPlayback中止方法，使用独立高优先级任务(priority=10)执行DMA flush；AbortSpeaking也新增DMA缓冲区flush确保扬声器立即静音； 5、协议层新增OnBotMessage回调，非字幕Bot下行消息立即中止HTTPS播放；volc_rtc_protocol移除is_binary依赖改为直接前缀检测，新增info前缀识别，subv字幕排除on_bot_message_由subtitle handler单独处理； 6、subtitle字幕USER/AI区分从CONFIG_VOLC_DEVICE_NAME比较改为bot_前缀判断，用户说话时立即中止HTTPS播放； 7、Kconfig新增STORY_API_URL故事播放API地址配置； 8、设备注册RTC服务时，设备名称从Wi-Fi MAC地址改为使用蓝牙MAC地址 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-05 13:45:52 +08:00
Rdzleo	98e40ac163	feat: 火山RTC字幕文本实时显示 + 字幕日志精简 1. DataCallback 新增 subv（字幕）二进制消息前缀识别，字幕数据正确解析并转发到应用层 2. OnIncomingJson 处理 type:"subtitle"，通过 userId 区分用户语音识别(STT)和 AI 回复文本 3. 字幕日志简化：subv 消息仅打印"接收下行二进制消息(字幕)"，不展开 JSON 内容 4. 新增postman请求的参数 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-02 15:11:34 +08:00
Rdzleo	58c33e3cb4	feat: AI对话模式emoji表情系统 + 中文字体 + 分区优化 1. 新增AI对话LVGL界面（ai_chat_ui），支持emoji图片 + 状态文本 + 聊天消息 2. 新增7个emoji表情资源（64×64 PNG C数组）：neutral/happy/sad/angry/crying/funny/laughing 3. 新增阿里巴巴普惠体20px 4bpp中文字体（GB2312字符集） 4. 利用火山RTC会话状态（VOLC_MSG_CONV_STATUS）驱动emoji切换： - LISTENING→happy, THINKING→neutral, ANSWERING→laughing - INTERRUPTED→funny, ANSWER_FINISH→happy 5. 设备状态emoji映射：Listening→happy, Speaking→laughing, Dialog→happy 6. 配网模式显示happy emoji 7. 分区优化：model 3MB→64KB，OTA 5MB→6.5MB 8. 编译优化：-Og→-Os，移除SimSun CJK字体 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-28 18:14:19 +08:00
Rdzleo	03496efecb	1、初始化代码，待适配中....	2026-02-24 15:28:34 +08:00

7 Commits