Baji_Rtc_Toy

Author	SHA1	Message	Date
Rdzleo	70f0cdd07a	feat(rtc): 偶发连接失败完整修复 (A+B+C 三件套) 实测根因 (DIAG 埋点确认): 火山 RTC SDK 启动时一次性申请大量 lwIP socket fd, 默认 CONFIG_LWIP_MAX_SOCKETS=10 不够 SDK 分配, 触发 SocketConnection-Lite.c:191 bind local ip failed → ICE 协商失败 → wait connect bits=0x0 超时. 实测对比: 修复前: 冷启动 RTC join 30+ 秒超时 × 3 次失败修复后: 冷启动 RTC join 1.6 秒成功, 软退出 + 唤醒重连 2.3 秒成功 ✅ 修复内容: [A] sdkconfig: CONFIG_LWIP_MAX_SOCKETS=10 → 20 根治 lwIP socket fd 不足. 16 是临界值, 20 留 25% 余量应对 burst 场景 (HTTP 重试 / DNS 查询 / NTP 同步并发). 代价: +6 fd × ~200B = 1.2 KB RAM (忽略). [B] application.h/cc + volc_rtc_protocol.h/cc: 失败 3 次后销毁 + 重建 engine 新增 VolcRtcProtocol::ForceRebuildEngine() public 方法. OpenAudioChannel 连续失败 3 次时调用 (application.cc:566-573): - 销毁 rtc_handle_ + reset SDK 内部状态污染 - 等待 2 秒让 lwIP 释放残留 socket fd (TIME_WAIT) - 触发 Phase 6 重建路径 (rtc_handle_=nullptr → Start()) 应对 A 修复后仍可能出现的 SDK 内部状态错乱 (e.g. ICE Agent 异常). 本次实测未触发 (A 已解决主要问题), 但保留作为兜底防御. [C] volc_rtc_protocol.cc: DIAG_RTC_BIND_ENABLE 一键开关诊断埋点在 join_room 前/后 + ForceRebuildEngine 前/后打印: - lwIP socket fd 使用量 (sockets=N/MAX) - heap free + psram free - WiFi rssi - 失败时的 errno + strerror 验证完成后改 0 关闭, 编译器消除 #if 块, 零运行时开销. 文件改动: sdkconfig \| LWIP_MAX_SOCKETS 10→20 main/application.h \| +audio_channel_retry_count_ main/application.cc \| +重试计数 + static_cast → ForceRebuildEngine 调用 main/protocols/volc_rtc_protocol.h \| +ForceRebuildEngine() 声明 main/protocols/volc_rtc_protocol.cc \| +DIAG 埋点 + diag_count_used_sockets() + ForceRebuildEngine() Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-21 10:23:21 +08:00
Rdzleo	c6ecdb124c	feat(audio): 同步 Kapi 软件 AEC + NULL crash fix 到数字人项目来源: Kapi commit 63b21fd (NULL fix) + a369796 (软件 AEC) 完整移植改动: - components/common/src/volc_rtc.c on_global_error 加 message ? message : "(null)" 防御. 解决: idle ≥10 分钟后服务端 session 超时 / NAT 表过期触发的 printf("%s", NULL) → strlen panic → 设备重启. - main/CMakeLists.txt REQUIRES 末尾加 esp-sr (提供 esp_aec.h 同步 API). - main/application.h +7 个 AEC 成员 + 5 个函数声明 (recorder/player pipeline 后). - main/application.cc +InitAec / DeinitAec / AppendRefSamples / GetDelayedRef / ApplyAEC (~170 行). OnAudioOutput 三个 codec output 位置都加 AppendRefSamples hook. ReadAudio 两条路径 (recorder_pipeline + codec 直读) 加 lazy InitAec + ApplyAEC + target_samples = max(samples, chunk_size). PHASE8_DIAG_ENABLE 默认 0 (诊断埋点已完成根因定位, 关闭减少日志噪声). 实测效果 (30 分钟设备验证): AI 说话: mic=285 ref=8310 clean=31 (消除 89%) AI 说话: mic=660 ref=7489 clean=57 (消除 91%) AI 说话: mic=156 ref=2748 clean=0 (消除 100%) 用户说话: mic=224 ref=8 clean=224 (passthrough 正常) 资源占用: Flash +59 KB (+1.2%) Internal SRAM +35-50 KB (+10-15%) PSRAM +10-15 KB (<0.2%) Core 1 CPU +6-12% @240MHz Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-19 16:54:55 +08:00
Rdzleo	b8a5fe958f	feat(rtc-only): Phase 6 - RTC 空闲软休眠（B+C 双源 + 真退房 + 字幕提示 + 内存兜底）按 GSD 框架 .planning/milestones/digital_human_rtc/phases/phase_06_idle_hibernate/ 规划完成 Phase 6 软退出 RTC 机制。替代旧的"40s 硬重启退出"方案。 ## 核心变更 ### 1. 倒计时刷新（B+C 双源方案） \| 方案 \| 监听源 \| 实施位置 \| 状态 \| \|------\|--------\|---------\|------\| \| A 扬声器流 \| I2S/PCM 输出 \| application.cc audio output 3 处 \| 宏关闭（PHASE6_ENABLE_AUDIO_FALLBACK） \| \| B 字幕监听 \| RTC subtitle 消息 \| application.cc:1300 subtitle 分支 \| 启用 \| \| C 智能体状态 \| RTC conv_status 消息 \| application.cc:1260 conv_status 分支 \| 启用 \| 复用现有 DIALOG_IDLE_COUNTDOWN_SECONDS=40 不新增常量。 ### 2. 真退出 RTC 房间（释放 License） - 新增 Protocol 基类虚函数 LeaveRoom（默认回退到 CloseAudioChannel） - VolcRtcProtocol::LeaveRoom 覆写：volc_rtc_stop + volc_rtc_destroy - 火山官方文档明确：真退房必须 leaveRoom + destroyRTCEngine - CloseAudioChannel 只 stop 不够（真人仍在房间继续计费） - 服务端 AI 任务在 180s 内自动清理（火山平台机制） ### 3. EnterIdleHibernate / WakeFromHibernate EnterIdleHibernate 流程（严格顺序）： 1. protocol_->LeaveRoom() # 真退房 2. codec->EnableInput/Output(false) # 重置 codec 状态机 3. recorder_pipeline_close() 4. hibernating_.store(true) # 关键：先设标志阻止 PowerSaveTimer 5. esp_pm_configure(light_sleep=false) # 双保险禁用 Light Sleep 6. SetDeviceState(kDeviceStateIdle) 7. idle_cycles_++ + NVS 持久化 8. 字幕"已自动退出RTC对话，按BOOT键重新连接RTC"（5 次重试间隔 200ms） WakeFromHibernate 流程： 1. 检查 idle_cycles_ >= 50 → 硬重启清理碎片（兜底） 2. 清空字幕 3. ToggleChatState → OpenAudioChannel → 自动重建 rtc_handle_ 4. RTC 重新加入房间（实测 2-3s 完成） ### 4. CanEnterSleepMode 加 hibernating 检查防止 hibernate 期间 PowerSaveTimer 触发 esp_pm_configure(light_sleep=true) 导致 I2C 总线进入低功耗 → 唤醒后 ES7210/ES8311 通信失败 abort。 ### 5. Dialog Watchdog 触发动作改造旧：esp_restart() 整机重启（黑屏 15-25s + WiFi 重连）新：Schedule(EnterIdleHibernate) 软退房（不熄屏 + 字幕提示） ### 6. BOOT 唤醒走 WakeFromHibernate 路径 iot_button 回调中检测 IsHibernating()，派发到独立 task 执行 WakeFromHibernate（避免阻塞 esp_timer 任务，CLAUDE.md 经验）。 ### 7. OpenAudioChannel 适配重建 LeaveRoom 销毁 rtc_handle_ 后，OpenAudioChannel 头部检测 NULL 触发 Start() 异步重建，轮询 5s 等待就绪。NVS 缓存 device_secret 所以重建通常 100ms 完成。 ## 实测验证（用户协作） \| 阶段 \| 时间 \| \|------\|------\| \| 40s 触发软休眠 \| ✅ \| \| LeaveRoom 真退房 \| ✅ "✓ 已真退出 RTC 房间（leaveRoom + destroyRTCEngine）" \| \| 屏幕保持 + 字幕显示 \| ✅ "已自动退出RTC对话，按BOOT键重新连接RTC" \| \| BOOT 按键唤醒 \| ✅ \| \| RTC 实例重建 \| ✅ 100ms \| \| RTC 重新加入房间 \| ✅ 2-3s \| \| 连续 2 次软休眠+唤醒 \| ✅ 无 abort/I2C 失败 \| \| 时间对比 \| 旧硬重启 15-25s → 软休眠 3-5s（省 80%） \| ## 6 个关键踩坑修复（详见 HIBERNATE_REPORT.md） 1. codec 状态机未重置 → 唤醒后 I2C abort 2. PowerSaveTimer Light Sleep 干扰 I2C 总线 3. hibernating_ 设置时序错误 4. dynamic_cast 在 -fno-rtti 下编译失败 → 改基类虚函数 5. LeaveRoom 后 OpenAudioChannel 直接失败 → 加重建逻辑 6. 字幕 LVGL 锁竞争 → 推迟到最后 + 5 次重试 ## 文档产出（同时提交） - .planning/.../phase_06_idle_hibernate/PLAN.md（含实施变更记录 V1-V6） - .planning/.../phase_06_idle_hibernate/HIBERNATE_REPORT.md（验证报告） - .planning/.../ROADMAP.md（Phase 1-5 ✅ + Phase 6 进行中状态更新） - docs/Rtc_AIavatar/数字人表情渲染方案_云端预渲染+BLE+OTA.md 新增第 19 章 RTC 空闲倒计时方案选型与软退出（9 小节） - docs/Rtc_AIavatar/RTC软退出方案_移植参考.md 完整移植参考（10 章 + 3 附录，可移植到其他火山 RTC 项目） - docs/Rtc_AIavatar/音频卡顿_全局资源分析.md 全局资源分析 + 13 项优化建议（不改代码）	2026-05-13 17:28:36 +08:00
Rdzleo	919bf8f28f	feat: GIF动画表情系统 + 情绪映射增强 + HTTPS音频中止修复一、新增功能： 1、新增8种GIF动画表情(200x89) + 3种叠加图标(45x45)，实现22种情绪标签到GIF的映射表； 2、新增30+组英文近义词情绪fallback映射（如worried→sad），防止AI使用非标准标签时GIF无法切换； 3、新增HTTPS中止后诊断日志，自动追踪前20帧音频处理流程便于定位无声问题；二、Bug修复： 4、修复HTTPS播放中止后RTC音频解码参数未恢复（16000/60→8000/20），通过background_task_串行化恢复； 5、修复AbortHttpsPlayback解码器竞态崩溃，将重置/恢复/DMA flush全部串行化执行； 6、修复LVGL gifdec不支持无全局颜色表GIF的问题，支持仅使用局部颜色表的压缩GIF； 7、修复GIF透明区域显示黑色方块，canvas初始alpha改为0x00； 8、修复lv_gif定时器gif对象为NULL时的空指针崩溃；三、优化： 9、情绪标签从等待is_final改为第一条字幕即时触发GIF切换，新增去重和回复结束自动恢复neutral； 10、对话状态表情映射优化：THINKING→thinking、ANSWERING→happy、INTERRUPTED→surprised； 11、CPU核心绑定：LVGL任务Core0，音频循环Core1，避免GIF解码与音频争抢； 12、中文情绪词映射扩展，新增担心/心疼/着急等映射； Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-19 15:28:14 +08:00
Rdzleo	23613e1cd3	1、新增obtain_music Function Calling音乐播放功能，4处协议分支均支持URL直播和音乐API两种HTTPS方式； 2、Kconfig新增MUSIC_API_URL音乐播放API地址配置； 3、重构SendStoryRequest和SendMusicRequest为HttpsApiPlayback通用方法，消除故事/音乐播放~440行重复代码； 4、修正4处obtain_story注释和日志：WebSocket描述改为HTTPS API（与实际实现一致）；	2026-03-05 15:44:47 +08:00
Rdzleo	ccea0c681c	feat: HTTPS故事播放 + RTC/HTTPS双向音频切换状态机 + 协议层优化 1、新增HTTPS故事播放功能：SendStoryRequest通过蓝牙MAC请求故事API，支持intro+body两段式无缝播放，替换原WebSocket故事请求方式； 2、新增HttpsPlaybackFromUrl通用HTTPS音频下载播放方法，支持JSON格式Opus帧流式解码播放； 3、新增RTC↔HTTPS双向音频切换三标志位状态机（opus_playback_active_/https_playback_active_/https_playback_abort_），HTTPS播放期间静默丢弃RTC PCM包，OnAudioOutput捕获is_opus_frame防止残留Opus帧杂音； 4、新增AbortHttpsPlayback中止方法，使用独立高优先级任务(priority=10)执行DMA flush；AbortSpeaking也新增DMA缓冲区flush确保扬声器立即静音； 5、协议层新增OnBotMessage回调，非字幕Bot下行消息立即中止HTTPS播放；volc_rtc_protocol移除is_binary依赖改为直接前缀检测，新增info前缀识别，subv字幕排除on_bot_message_由subtitle handler单独处理； 6、subtitle字幕USER/AI区分从CONFIG_VOLC_DEVICE_NAME比较改为bot_前缀判断，用户说话时立即中止HTTPS播放； 7、Kconfig新增STORY_API_URL故事播放API地址配置； 8、设备注册RTC服务时，设备名称从Wi-Fi MAC地址改为使用蓝牙MAC地址 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-05 13:45:52 +08:00
Rdzleo	c24a9bc162	feat: 集成 dzbj LVGL 显示模块 + 配网模式内存优化阶段1: 将 dzbj 项目的 LVGL 8.3.11 LCD 显示集成到 AI小智主项目，开机显示 ScreenHome 界面，同时优化配网模式下的内存使用，确保 WiFi+BLE+LVGL 三者共存运行。 ## 新增功能 ### dzbj 显示模块集成 - 新增 main/dzbj/ 目录，移植 LCD 驱动(ST77916 QSPI)、触摸驱动(CST816S)、 LVGL 初始化和 SquareLine Studio UI 界面 - I2C 总线共享：dzbj 触摸控制器复用主项目的 I2C_NUM_1 总线 - GPIO 冲突解决：LED(GPIO21)、Touch1(GPIO1)、Touch4(GPIO7) 改为 NC，电池 ADC 从 GPIO6 改为 GPIO3 - 添加 LVGL、esp_lcd_st77916、esp_lcd_touch_cst816s 等组件依赖 - managed_components 纳入版本管理 ### 配网模式轻量化启动 - BoxAudioCodec: 新增 output_only 模式，仅创建 I2S TX 通道（省 ~13KB DMA）跳过 ES7210 ADC 初始化（省 ~2-4KB） - AudioCodec: 新增 StartOutputOnly() 方法，仅启用扬声器输出 - Application: 配网模式跳过 Opus 编码器、输入重采样器、协议初始化、天气位置检测等网络业务 - 板级构造函数: 配网模式跳过电池检测、IMU传感器、PowerSaveTimer ### WifiBoard 配网流程修复 - NeedsProvisioning() 静态方法: 读取 NVS force_ap 和 SSID 列表，用于提前判断配网模式 - force_ap 竞态修复: 构造函数不再清零 force_ap，改在 StartNetwork() 清零，确保 NeedsProvisioning() 能正确读到 force_ap=1 - Application 缓存 provisioning_mode_ 成员变量，避免重复读 NVS ### BLE 配网重启修复 - 配网成功后用 esp_timer 延迟重启替代 xTaskCreate，避免内存紧张时任务创建失败导致设备不重启 - 注释掉 WiFi 连接成功后的 MAC 地址发送步骤 ### sdkconfig 内存优化 - BT_ALLOCATION_FROM_SPIRAM_FIRST=y (BLE 动态分配优先 PSRAM) - SPIRAM_MALLOC_RESERVE_INTERNAL=32768 - NVS_ALLOCATE_CACHE_IN_SPIRAM=y - WiFi 静态缓冲区数量优化 (RX=10, TX=8) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-27 17:07:51 +08:00
Rdzleo	03496efecb	1、初始化代码，待适配中....	2026-02-24 15:28:34 +08:00

8 Commits