实机验证通过后,按 Kapi 无屏底座路线补齐 Pendant RTC 吊坠项目的迁移修复。 1. BLE 配网与资源隔离 - sdkconfig.defaults 开启 BT 优先 PSRAM 分配,并将 LWIP socket 上限提升到 20 - sdkconfig.defaults.esp32s3 允许 BSS/NOINIT 放入 PSRAM,释放内部 SRAM 给 BLE/WiFi/RTC - 配网模式 codec 使用 StartOutputOnly(),跳过麦克风 RX DMA 和 ES7210 输入链路 - ResetWifiConfiguration() 改为独立 wifi_reset task,避免在 iot_button/esp_timer 回调中阻塞延时 - WifiBoard 增加 IsWifiConfigMode(),供启动阶段判断是否走配网资源隔离路径 2. 音频底噪与 DMA 残留修复 - AudioCodec 增加 StartOutputOnly(),支持仅启动扬声器输出 - RTC 音频通道打开后灌入 200ms silence PCM,覆盖 I2S DMA 残留数据 - 软退出进入待命前重启 codec output 并再次灌静音,减少待命音/欢迎语前杂音 - box_audio_codec 在无硬件回采时使用 channel_mask=0,避免 I2S slot mask 被错误污染 3. 软件 loopback AEC - 引入 esp_aec 底层同步 API,使用 DAC 输出复制构建 ref ring - 上行 mic PCM 与延迟 ref 做同步消回声,适配无屏无硬件回采的 Pendant 形态 - AEC 采用 lazy init,减少启动阶段对 WiFi/BLE 内部 SRAM 的压力 - ref 静音时直接 passthrough,避免 AI 静音后误压制用户语音 - 在 player_pipeline_write 和 codec->OutputData 两条下行路径都追加 ref hook 4. RTC 连接稳定性与软退出 - VolcRtcProtocol 增加 LeaveRoom(bool notify_closed),支持 stop 房间但保留 rtc_handle - hibernate 路径使用 LeaveRoom(false),避免关闭回调顺手关掉 codec output 导致待命音无声 - LeaveRoom/ForceRebuildEngine 重置 downlink_is_pcm_ 和首包标志,避免本地 Opus 音效被当 PCM 播成杂音 - OpenAudioChannel 连续失败 3 次后 ForceRebuildEngine,清理 RTC SDK 内部异常状态 - 加入 DIAG-RTC socket/heap/PSRAM/RSSI 日志,便于定位 ICE socket 和内存问题 5. Dialog watchdog 与 BOOT 唤醒 - Dialog watchdog 到期不再写 reboot_dlg_idle 后 esp_restart - 新增 EnterIdleHibernate():软退房、清空残留音频队列、关闭麦克风、播放待命音后静默 - 新增 WakeFromHibernate():BOOT 唤醒后复用 RTC engine 并通过 ToggleChatState() 重连 RTC - BOOT 单击优先判断 IsHibernating(),异步唤醒,避免走普通按键状态机 - hibernate 期间禁止 PowerSaveTimer 进入 Light Sleep,保护 I2C/codec 总线 6. 文档与衍生项目沉淀 - 更新石头光源属性检测方案文档 - 将 Pendant 实测通过的软退出、AEC、BLE 配网隔离经验同步到衍生项目移植规则
234 lines
11 KiB
C++
234 lines
11 KiB
C++
#ifndef _APPLICATION_H_
|
||
#define _APPLICATION_H_
|
||
|
||
#include <freertos/FreeRTOS.h>
|
||
#include <freertos/event_groups.h>
|
||
#include <freertos/task.h>
|
||
#include <esp_timer.h>
|
||
|
||
#include <string>
|
||
#include <mutex>
|
||
#include <list>
|
||
#include <atomic>
|
||
|
||
#include <opus_encoder.h>
|
||
#include <opus_decoder.h>
|
||
#include <opus_resampler.h>
|
||
|
||
#include "protocol.h"
|
||
#include "websocket_protocol.h"
|
||
#include "ota.h"
|
||
#include "background_task.h"
|
||
#include "audio/simple_pipeline.h"
|
||
// #include "ble_service.h" // BLE JSON Service 暂不使用
|
||
|
||
#if CONFIG_USE_WAKE_WORD_DETECT
|
||
#include "wake_word_detect.h"
|
||
#elif CONFIG_USE_CUSTOM_WAKE_WORD
|
||
#include "custom_wake_word.h"
|
||
#endif
|
||
#if CONFIG_USE_AUDIO_PROCESSOR
|
||
#include "audio_processor.h"
|
||
#endif
|
||
|
||
#define SCHEDULE_EVENT (1 << 0)
|
||
#define AUDIO_INPUT_READY_EVENT (1 << 1)
|
||
#define AUDIO_OUTPUT_READY_EVENT (1 << 2)
|
||
|
||
// 未知状态、启动中、WiFi配网模式、空闲待命、连接服务器、语音监听中、语音播报中、固件升级中、设备激活中、致命错误
|
||
enum DeviceState {
|
||
kDeviceStateUnknown,
|
||
kDeviceStateStarting,
|
||
kDeviceStateWifiConfiguring,
|
||
kDeviceStateIdle,
|
||
kDeviceStateConnecting,
|
||
kDeviceStateListening,
|
||
kDeviceStateSpeaking,
|
||
kDeviceStateDialog,
|
||
kDeviceStateUpgrading,
|
||
kDeviceStateActivating,
|
||
kDeviceStateFatalError
|
||
};
|
||
// OPUS音频帧时长(60ms)
|
||
#define OPUS_FRAME_DURATION_MS 60
|
||
// 应用程序主类(单例模式)
|
||
class Application {
|
||
public:
|
||
static Application& GetInstance() {
|
||
static Application instance;
|
||
return instance;
|
||
}
|
||
// 删除拷贝构造函数和赋值运算符
|
||
Application(const Application&) = delete;
|
||
Application& operator=(const Application&) = delete;
|
||
|
||
void Start(); // 启动应用程序
|
||
DeviceState GetDeviceState() const { return device_state_; } // 获取当前状态
|
||
bool IsVoiceDetected() const { return voice_detected_; } // 语音检测状态
|
||
void Schedule(std::function<void()> callback); // 任务调度
|
||
void SetDeviceState(DeviceState state); // 状态变更
|
||
void Alert(const char* status, const char* message, const char* emotion = "", const std::string_view& sound = "");// 警报管理 状态、消息、情感、声音
|
||
void DismissAlert();// 关闭警报
|
||
void AbortSpeaking(AbortReason reason);// 打断语音播报
|
||
void AbortHttpsPlayback(const char* reason);// 中止HTTPS音频播放并清空DMA
|
||
void SendStoryRequest(); // 通过HTTPS故事API请求并播放故事
|
||
void SendMusicRequest(); // 通过HTTPS音乐API请求并播放音乐
|
||
void HttpsPlaybackFromUrl(const std::string& url); // 通过HTTPS下载JSON并播放音频(故事/歌曲等)
|
||
void ToggleChatState();// 切换聊天状态
|
||
void ToggleListeningState();// 切换监听状态
|
||
void StartListening();// 开始监听
|
||
void StopListening();// 停止监听
|
||
void SendTextMessage(const std::string& text);// 发送文本消息
|
||
void UpdateIotStates();// 更新IOT设备状态
|
||
void Reboot();// 系统重启
|
||
void WakeWordInvoke(const std::string& wake_word);// 唤醒词回调
|
||
void PlaySound(const std::string_view& sound);// 播放声音
|
||
void WaitForAudioPlayback();// 等待音频播报完成
|
||
bool IsAudioQueueEmpty(); // 检查音频队列是否为空
|
||
void ClearAudioQueue(); // 清空音频播放队列
|
||
bool CanEnterSleepMode();// 检查是否可以进入睡眠模式
|
||
void EnterIdleHibernate(); // RTC 空闲软退出
|
||
void WakeFromHibernate(); // 从空闲软退出状态唤醒并重连 RTC
|
||
bool IsHibernating() const { return hibernating_.load(); }
|
||
void StopAudioProcessor();// 停止音频处理器
|
||
void ResetDecoder();// 重置解码器状态(用于修复音频播放问题)
|
||
bool IsSafeToOperate(); // 🔧 检查当前是否可以安全执行操作
|
||
void AbortSpeakingAndReturnToIdle(); // 🔴 专门处理从说话状态到空闲状态的切换
|
||
void AbortSpeakingAndReturnToListening(); // 🔵 专门处理从说话状态到聆听状态的切换
|
||
void PauseAudioPlayback(); // ⏸️ 暂停音频播放
|
||
void ResumeAudioPlayback(); // ▶️ 恢复音频播放
|
||
void SuppressNextIdleSound(); // 🔇 抑制下一个空闲状态的声音播放
|
||
void SetLowBatteryTransition(bool value);
|
||
bool IsLowBatteryTransition() const;
|
||
void InitializeWebsocketProtocol(); // 🌐 初始化WebSocket协议(RTC连接成功后调用)
|
||
// void SendTextViaWebsocket(const std::string& text);// 🌐 通过WebSocket发送文本消息
|
||
|
||
// 姿态传感器接口
|
||
bool IsImuSensorAvailable(); // 检查IMU传感器是否可用
|
||
bool GetImuData(float* acc_x, float* acc_y, float* acc_z,
|
||
float* gyro_x, float* gyro_y, float* gyro_z,
|
||
float* temperature); // 获取IMU传感器数据
|
||
void OnMotionDetected(); // 运动检测事件处理
|
||
bool IsAudioPaused() const { return audio_paused_; } // 检查音频是否暂停
|
||
bool ShouldSkipDialogIdleSession() const { return skip_dialog_idle_session_; }// 是否跳过对话待机会话
|
||
void ClearDialogIdleSkipSession();// 清除对话待机会话标志位
|
||
bool IsDialogUploadEnabled() const { return dialog_upload_enabled_; }// 是否启用对话上传
|
||
void SetDialogUploadEnabled(bool enabled);// 设置对话上传状态
|
||
|
||
// // BLE JSON 命令处理(暂不使用)
|
||
// void HandleBleJsonCommand(const std::string& cmd, int msg_id, cJSON* data, BleJsonService& service);
|
||
|
||
private:
|
||
void HttpsApiPlayback(const char* api_url, const char* tag, const char* task_name);// HTTPS API音频播放通用实现
|
||
Application();// 构造函数
|
||
~Application();// 析构函数
|
||
|
||
// 配置使用唤醒词检测
|
||
#if CONFIG_USE_WAKE_WORD_DETECT
|
||
WakeWordDetect wake_word_detect_;
|
||
#elif CONFIG_USE_CUSTOM_WAKE_WORD
|
||
CustomWakeWord wake_word_detect_;
|
||
#endif
|
||
// 音频处理器
|
||
#if CONFIG_USE_AUDIO_PROCESSOR
|
||
AudioProcessor audio_processor_;
|
||
#endif
|
||
Ota ota_;
|
||
std::mutex mutex_;
|
||
std::list<std::function<void()>> main_tasks_;
|
||
std::unique_ptr<Protocol> protocol_;
|
||
std::unique_ptr<WebsocketProtocol> websocket_protocol_; // 🌐 WebSocket协议实例(RTC连接后初始化)
|
||
EventGroupHandle_t event_group_ = nullptr;
|
||
esp_timer_handle_t clock_timer_handle_ = nullptr;
|
||
volatile DeviceState device_state_ = kDeviceStateUnknown;
|
||
std::atomic<bool> is_aborting_{false}; // 🔧 原子标志:防止重复中止操作
|
||
std::atomic<std::chrono::steady_clock::time_point> last_safe_operation_; // 🔧 最后安全操作时间戳
|
||
std::atomic<bool> is_switching_to_listening_{false}; // 🔵 标志:正在主动切换到聆听状态
|
||
std::atomic<bool> is_low_battery_transition_{false};
|
||
std::atomic<bool> hibernating_{false}; // RTC 空闲软退出状态
|
||
int idle_cycles_ = 0; // 累计软退出次数
|
||
static constexpr int IDLE_CYCLES_REBOOT_THRESHOLD = 50; // 软退出多次后硬重启清碎片
|
||
void SaveIdleCyclesToNvs();
|
||
void LoadIdleCyclesFromNvs();
|
||
void ResetIdleCyclesNvs();
|
||
ListeningMode listening_mode_ = kListeningModeAutoStop;
|
||
#if CONFIG_USE_REALTIME_CHAT
|
||
bool realtime_chat_enabled_ = true;
|
||
#else
|
||
bool realtime_chat_enabled_ = false;
|
||
#endif
|
||
std::atomic<bool> ws_downlink_enabled_{true};// 🌐 WebSocket下行通道是否启用
|
||
std::atomic<bool> opus_playback_active_{false};// 🌐 Opus解码播放活跃标志(WS/HTTPS共用)
|
||
std::atomic<bool> https_playback_active_{false};// 🌐 HTTPS音频播放进行中标志
|
||
std::atomic<bool> https_playback_abort_{false};// 🌐 HTTPS音频播放中止标志
|
||
bool aborted_ = false;
|
||
int audio_channel_retry_count_ = 0;
|
||
bool voice_detected_ = false;
|
||
bool audio_paused_ = false; // 音频暂停状态标志
|
||
float current_speaker_volume_ = 0.0f; // 当前扬声器音量,用于语音打断判断
|
||
bool first_idle_location_checked_ = false;// 是否首次查询城市天气
|
||
bool send_pcm_uplink_ = true; // 是否发送PCM音频数据到服务器,由SDK内部转码为G711A
|
||
bool send_g711a_uplink_ = false;// 是否直接发送G711A音频数据到服务器
|
||
|
||
std::chrono::time_point<std::chrono::steady_clock> last_audio_input_time_;
|
||
std::chrono::time_point<std::chrono::steady_clock> last_audible_output_time_; // 最后一次有声音输出的时间点
|
||
bool skip_dialog_idle_session_; // 是否跳过对话待机会话标志
|
||
bool dialog_upload_enabled_ = true; // 对话上传状态标志
|
||
bool dialog_watchdog_running_; // 对话看门狗运行标志
|
||
int dialog_watchdog_last_logged_; // 对话看门狗上次记录的日志时间
|
||
TaskHandle_t dialog_watchdog_task_handle_; // 对话看门狗任务句柄
|
||
int clock_ticks_;
|
||
TaskHandle_t main_loop_task_handle_;
|
||
TaskHandle_t check_new_version_task_handle_;
|
||
|
||
// Audio encode / decode
|
||
TaskHandle_t audio_loop_task_handle_;
|
||
BackgroundTask* background_task_;
|
||
std::chrono::steady_clock::time_point last_output_time_;
|
||
std::list<std::vector<uint8_t>> audio_decode_queue_;
|
||
|
||
std::unique_ptr<OpusEncoderWrapper> opus_encoder_;
|
||
std::unique_ptr<OpusDecoderWrapper> opus_decoder_;
|
||
|
||
OpusResampler input_resampler_;// 输入音频采样器
|
||
OpusResampler reference_resampler_;// 参考音频采样器
|
||
OpusResampler output_resampler_;// 输出音频采样器
|
||
OpusResampler uplink_resampler_;// 上传音频采样器
|
||
|
||
player_pipeline_handle_t player_pipeline_ = nullptr;
|
||
recorder_pipeline_handle_t recorder_pipeline_ = nullptr;
|
||
|
||
// 软件 loopback AEC: DAC 输出复制到 ref ring, 上行 mic 与延迟 ref 做同步消回声。
|
||
void *aec_handle_ = nullptr;
|
||
int aec_chunk_size_ = 0;
|
||
int16_t *ref_ring_buf_ = nullptr;
|
||
int ref_ring_capacity_ = 0;
|
||
int ref_ring_write_idx_ = 0;
|
||
int ref_ring_filled_ = 0;
|
||
int aec_ref_delay_samples_ = 800;
|
||
SemaphoreHandle_t ref_ring_mutex_ = nullptr;
|
||
void InitAec();
|
||
void DeinitAec();
|
||
void AppendRefSamples(const int16_t *pcm, int samples);
|
||
void GetDelayedRef(int16_t *ref_out, int samples);
|
||
void ApplyAEC(std::vector<int16_t>& mic_inout);
|
||
|
||
void MainLoop();// 主事件循环
|
||
void OnAudioInput();// 音频输入回调
|
||
void OnAudioOutput();// 音频输出回调
|
||
void ReadAudio(std::vector<int16_t>& data, int sample_rate, int samples);// 读取音频数据
|
||
void SetDecodeSampleRate(int sample_rate, int frame_duration);// 设置解码采样率
|
||
void CheckNewVersion();// 检查新固件版本
|
||
void ShowActivationCode();// 显示激活码
|
||
void OnClockTimer();// 时钟定时器回调
|
||
void SetListeningMode(ListeningMode mode);// 设置监听模式
|
||
void AudioLoop();// 音频处理循环
|
||
bool suppress_next_idle_sound_ = false;// 标志:是否抑制下一个空闲状态的声音播放
|
||
void StartDialogWatchdog();// 启动对话看门狗
|
||
void StopDialogWatchdog(); // 停止对话看门狗
|
||
|
||
const char* DeviceStateToString(DeviceState state); // 状态枚举转字符串
|
||
};
|
||
|
||
#endif // _APPLICATION_H_
|