Baji_Rtc_Toy

Author	SHA1	Message	Date
Rdzleo	4b7b1949d4	perf(rtc-only): Phase 6 收尾 - 卡顿优化 + PowerSaveTimer 守卫 + 开机加速代码改动: - AudioLoop 加 vTaskDelay(1)，让出 Core 1 idle task 防 WiFi/RTC 饥饿 - BackgroundTask 优先级 2 → 5，提升 Opus 解码实时性 - LVGL 刷新 5ms → 16ms (60Hz)，CPU 占用降 60% - GIF 定时器 20ms → 33ms (3 处)，PSRAM 流量减半 - AI 字幕推送 100ms 节流，避免 LVGL 锁争抢 - EnterIdleHibernate 清空 audio_decode_queue_，防 standby_sound 残留误触发首帧 - PowerSaveTimer OnEnterSleepMode 加 device_state 守卫，拦截 dialog/connecting 期间关功放（修复欢迎语期间被静音 bug） - 取消开机 ADC 阻塞采样，开机播报响应从 6 秒缩到 < 3 秒新增规划: - Phase 7 占位文档：电量保护 + PowerSaveTimer 重构 + 唤醒杂音根治 + RTC 抖动缓解 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 11:38:48 +08:00
Rdzleo	f2be9922b6	feat(rtc-only): Phase 5 - RTC 字幕显示恢复（透明背景 + 2 行黑字 + 锁优化）按 GSD 框架 .planning/milestones/digital_human_rtc/phases/phase_05_subtitle_restore/ 规划完成 Phase 5 字幕显示恢复。 ## 核心变更（main/dzbj/ai_chat_ui.c） ### 1. chat_container 重构 - 新增 static chat_container 变量（lv_obj 父容器） - 尺寸 320×56（= 2 行字 + padding 4px*2） - 位置 LV_ALIGN_BOTTOM_MID 距底 10px - 完全透明背景（LV_OPA_TRANSP），无灰底 - 初始 HIDDEN，有内容时显示 ### 2. chat_label 改造 - 黑色文本（用户反馈白字在浅色背景上不清晰） - 尺寸 312×48 限制最多 2 行 - LV_LABEL_LONG_WRAP → LV_LABEL_LONG_DOT，超出 2 行自动 ... 截断 - font_puhui_20_4 中文字体不变 ### 3. ai_chat_set_chat_message() 实现原为空函数（PoC 期间 return），本 Phase 完整实现： - 锁外去重：static last_content[256]，相同内容直接返回 - lvgl_port_lock 200ms → 500ms（GIF 解码繁忙时给予更长等待） - 内容空时隐藏容器，非空显示 - 成功更新后缓存 last_content ### 4. z-index 修复 bg_gif_demo_start() 后立即 lv_obj_move_foreground(chat_container) 否则 bg_img/gif_obj 后于 chat_container 创建会遮挡字幕 ## 实测验证（用户协作） 60s 对话期间： - ✅ AI 字幕完整推送 3 次（含 54 字符长字幕） - ✅ LVGL 锁超时 14 次 → 0 次（锁外去重生效） - ✅ 表情切换 + 字幕同步工作 - ✅ 长字幕自动 2 行截断 - ✅ 无 abort/重启 ## 调用链（已对接 application.cc 现有逻辑，无需改协议层） RTC 字幕 → display->SetChatMessage(role, msg) → AiChatDisplay::SetChatMessage → ai_chat_set_chat_message() ← 本 Phase 实现 ## GSD 文档 - PLAN.md - SUBTITLE_REPORT.md（含锁优化对比 + 布局规划 + 用户决策记录）	2026-05-13 13:35:41 +08:00
Rdzleo	497c1b4654	feat(rtc-only): Phase 4 - 情绪标签 → 数字人 hiyori GIF 映射 + 切换接口按 GSD 框架 .planning/milestones/digital_human_rtc/phases/phase_04_emotion_mapping/ 规划完成 Phase 4 情绪映射 + 运行时切换。 ## 核心变更 ### bg_gif_demo 新增运行时切换接口 ```c esp_err_t bg_gif_demo_switch_gif(const char new_gif_path); ``` 实现要点: - 先 heap_caps_free(g_gif_data) 释放旧 PSRAM，再加载新 GIF，单峰仅一份 - 内部 static last_gif_path 去重（相同路径直接返回 ESP_OK） - 切换后立即 lv_timer_set_period(timer, 20) 防止 lv_gif_set_src 重建为默认 10ms - LVGL 锁保护 200ms 超时 ### 22 情绪 → 3 hiyori GIF 映射表定义在 main/dzbj/ai_chat_ui.c USE_BG_GIF_POC 包裹内： \| GIF \| 情绪标签 (个数) \| \|-----\|----------------\| \| m06 (默认/积极) \| neutral, happy, laughing, funny, loving, relaxed, delicious, kissy, confident, silly, blink, curious (12) \| \| m07 (思考/疲倦) \| sleepy, thinking, confused, embarrassed, dizzy (5) \| \| m03 (负面/严肃) \| sad, crying, angry, surprised, shocked (5) \| 22 个标准情绪 100% 覆盖，未映射的情绪默认 fallback 到 m06。 ### ai_chat_set_emotion 改造 PoC 模式下优先切换数字人大图（不再切隐藏的 emoji 200x89）： ```c #ifdef USE_BG_GIF_POC if (bg_gif_demo_is_running()) { const char path = find_hiyori_gif(emotion); bg_gif_demo_switch_gif(path); return; } #endif // 非 PoC 模式 fallback emoji 路径保留 ``` ## 调用链（已与现有 RTC 字幕解析对接，无需改 application.cc） RTC 字幕 → application.cc:1419 display->SetEmotion(emo) → AiChatDisplay::SetEmotion (display/ai_chat_display.cc) → ai_chat_set_emotion (dzbj/ai_chat_ui.c) → bg_gif_demo_switch_gif (PoC 模式) → 数字人 hiyori GIF 切换 ## 烧录验证（用户实测）监控 60s 期间捕获情绪切换： - neutral / happy → m06（已在播，去重） - thinking → m07 切换成功 (590ms 延迟) - confused → m07 去重跳过 - AI 回复结束 → 自动回到 neutral - 无 abort / 重启 m06 ↔ m07 切换屏幕可视确认，m03 走相同代码路径无需重复测试。 ## GSD 文档（同时提交） - .planning/milestones/digital_human_rtc/phases/phase_04_emotion_mapping/PLAN.md - .planning/milestones/digital_human_rtc/phases/phase_04_emotion_mapping/EMOTION_REPORT.md	2026-05-13 11:59:38 +08:00
Rdzleo	7d1c7dc1f0	feat(rtc-only): Phase 3 - 数字人 GIF 资源准备（hiyori m03/m06/m07，209x360）按 GSD 框架 .planning/milestones/digital_human_rtc/phases/phase_03_gif_resources/ 规划完成 Phase 3 数字人表情 GIF 资源处理。 ## 处理方式（与 PoC 阶段 hiyori_m05.gif 一致） ```bash gifsicle --resize _x360 -O3 input.gif -o output.gif ``` - 高度 = LCD 360px，宽度按原比例自动算 → 209px - 不裁剪（保持源 GIF 完整人物） - 不加 --lossy / --colors（保留 256 色，画质优先） - 只用 -O3 优化文件大小 ## 处理结果 \| GIF \| 用途 \| 源 \| 处理后 \| 节省 \| \|-----\|------\|-----\|--------\|------\| \| m03 \| 负面/严肃 \| 407×700 3.3MB \| 209×360 1.15MB \| 66% \| \| m06 \| 默认/积极 \| 407×700 1.3MB \| 209×360 0.44MB \| 66% \| \| m07 \| 思考/疲倦 \| 407×700 1.2MB \| 209×360 0.40MB \| 66% \| \| 合计 \| — \| 5.7MB \| 1.94MB \| 66% \| ## 决策过程（避免后续重复犯错） Phase 3 初稿曾尝试裁剪到 240×320 + PIL 全帧 bbox 居中裁剪，用户烧录后反馈"视觉感官不好"——角色被横向压扁（240×320 纵横比 0.75 vs 源 407×700 纵横比 0.583）。回归 PoC 等比例缩放方式后效果与 PoC 一致。 PoC 处理标准已写入用户级 feedback memory（feedback_hiyori_gif_processing.md），后续 hiyori GIF 处理一律用本方式，除非用户主动要求修改。 ## 显示效果（用户已目视确认） LCD 360×360 居中显示 209×360 GIF： - 垂直方向: 360 = 360，完全充满 - 横向: 209 < 360，左右各 75.5px 留边显示背景图 - 角色比例: 完整保留源 GIF 的 407:700 = 0.582 纵横比，人物细高自然 ## 删除项 - spiffs_image/hiyori_m05.gif (2.3MB) 已删除 - 被 m06/m07/m03 替代文件历史保留在 git，可通过 git show eb96130:spiffs_image/hiyori_m05.gif 恢复 ## 默认表情切换 main/dzbj/ai_chat_ui.c:234: - PoC: bg_gif_demo_start(..., "/spiflash/hiyori_m05.gif") - Phase 3: bg_gif_demo_start(..., "/spiflash/hiyori_m06.gif") ## 烧录运行时验证 - 烧录后 0 次重启（连续监控 18 秒） - BG_GIF: GIF 已加载到 PSRAM: /spiflash/hiyori_m06.gif (441.8 KB) - AudioCodec: Audio codec started（首次冷启动直接成功） - 用户目视确认显示效果良好 ## GSD 文档（同时提交） - .planning/milestones/digital_human_rtc/phases/phase_03_gif_resources/PLAN.md - .planning/milestones/digital_human_rtc/phases/phase_03_gif_resources/GIF_REPORT.md ## SPIFFS 容量新 SPIFFS 4.94MB 当前实际占用 ~2MB（40%），余量 ~2.94MB 充足。	2026-05-13 11:42:30 +08:00
Rdzleo	eb96130fc9	feat(Rtc_AIavatar): 数字人透明 GIF 显示方案 PoC 完成（背景图+透明GIF叠加）源代码变更: - main/dzbj/bg_gif_demo.c/h: 方案 C 最终实现 - JPG 背景图(lv_img) + 透明 GIF(lv_gif) 叠加 - main/dzbj/dual_gif_demo.c/h: 方案 B 中间产物 - 双 GIF 循环切换 - main/dzbj/sprite_demo.c/h: 方案 A 已弃用 - DMA 直写 GRAM 与 LVGL 争抢 LCD IO 失败 - main/dzbj/ai_chat_ui.c: 集成 USE_BG_GIF_POC 开关，加载背景图+透明 GIF - main/dzbj/lcd.c: panel_handle 移除 static，便于其他模块访问 - main/CMakeLists.txt: 新增 3 个 dzbj 模块编译资源新增: - spiffs_image/Background_360x360.jpg: 设备背景图(20KB) - spiffs_image/hiyori_m05.gif: Cubism Editor 直接导出的透明 GIF(2.3MB) - docs/Rtc_AIavatar/: Live2D 模型(Hiyori/Haru) + 32 段 Haru GIF + 方案文档第18章 PoC 实战记录 - tools/sprite_poc/: Python GIF→RGB565 转换脚本踩坑要点(详见 docs/Rtc_AIavatar 第18章): - PIL Image.quantize() 会破坏 RGBA 透明度，必须改用 gifsicle - PIL 保存动画 GIF 仅第1帧有透明，后续帧不透明 - LVGL gifdec 按帧读取 - Cubism Editor 直接导出 GIF 才能逐帧保留透明信息(FREE 版限制部分模型) - gifsicle --lossy 会严重锯齿化，去掉只保留 --colors 256 + -O3 即可 - 裁剪居中需用全帧 bbox 不能只看第1帧(Live2D 角色每帧位置有偏移) - LVGL 默认不支持 PNG，背景图用 JPG + esp_jpeg 解码到 RGB565 buffer - 透明 GIF 显示黑色背景: gifdec.c canvas 初始化 alpha 须改为 0x00	2026-05-12 17:14:49 +08:00
Rdzleo	919bf8f28f	feat: GIF动画表情系统 + 情绪映射增强 + HTTPS音频中止修复一、新增功能： 1、新增8种GIF动画表情(200x89) + 3种叠加图标(45x45)，实现22种情绪标签到GIF的映射表； 2、新增30+组英文近义词情绪fallback映射（如worried→sad），防止AI使用非标准标签时GIF无法切换； 3、新增HTTPS中止后诊断日志，自动追踪前20帧音频处理流程便于定位无声问题；二、Bug修复： 4、修复HTTPS播放中止后RTC音频解码参数未恢复（16000/60→8000/20），通过background_task_串行化恢复； 5、修复AbortHttpsPlayback解码器竞态崩溃，将重置/恢复/DMA flush全部串行化执行； 6、修复LVGL gifdec不支持无全局颜色表GIF的问题，支持仅使用局部颜色表的压缩GIF； 7、修复GIF透明区域显示黑色方块，canvas初始alpha改为0x00； 8、修复lv_gif定时器gif对象为NULL时的空指针崩溃；三、优化： 9、情绪标签从等待is_final改为第一条字幕即时触发GIF切换，新增去重和回复结束自动恢复neutral； 10、对话状态表情映射优化：THINKING→thinking、ANSWERING→happy、INTERRUPTED→surprised； 11、CPU核心绑定：LVGL任务Core0，音频循环Core1，避免GIF解码与音频争抢； 12、中文情绪词映射扩展，新增担心/心疼/着急等映射； Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-19 15:28:14 +08:00
Rdzleo	58c33e3cb4	feat: AI对话模式emoji表情系统 + 中文字体 + 分区优化 1. 新增AI对话LVGL界面（ai_chat_ui），支持emoji图片 + 状态文本 + 聊天消息 2. 新增7个emoji表情资源（64×64 PNG C数组）：neutral/happy/sad/angry/crying/funny/laughing 3. 新增阿里巴巴普惠体20px 4bpp中文字体（GB2312字符集） 4. 利用火山RTC会话状态（VOLC_MSG_CONV_STATUS）驱动emoji切换： - LISTENING→happy, THINKING→neutral, ANSWERING→laughing - INTERRUPTED→funny, ANSWER_FINISH→happy 5. 设备状态emoji映射：Listening→happy, Speaking→laughing, Dialog→happy 6. 配网模式显示happy emoji 7. 分区优化：model 3MB→64KB，OTA 5MB→6.5MB 8. 编译优化：-Og→-Os，移除SimSun CJK字体 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-28 18:14:19 +08:00

7 Commits