feat: 语音确认、联调与运维增强

- 语音：序数解析（第一个/第二个等）、解析失败计数与 API detail.retry_remaining；百度 ASR 固定 dev_pid 为普通话；SurgeryPipelineError 支持 extra 并入 HTTP detail。 - Demo：demo 路由与假 RTSP、客户端 index 与 README；BackendResolver 与配置调整。 - 可观测：消耗 TSV 日志、语音文件日志、终端 Markdown 辅助；相关测试与依赖更新。 - 注意：.env 仍被 gitignore，本地密钥不会进入本提交。 Made-with: Cursor
2026-04-23 14:24:20 +08:00
parent 42720f81cf
commit 0c05463617
39 changed files with 3030 additions and 143 deletions
--- a/app/services/baidu_speech.py
+++ b/app/services/baidu_speech.py
@@ -52,8 +52,13 @@ class BaiduSpeechService:
        rate: int = 16000,
        options: dict[str, Any] | None = None,
    ) -> dict[str, Any]:
-        """短语音识别。返回百度 JSON（含 `err_no`、`result` 等）。"""
-        return self._client_or_raise().asr(speech, format, rate, options)
+        """短语音识别。返回百度 JSON（含 `err_no`、`result` 等）。
+
+        固定使用普通话模型（`dev_pid` 来自配置），避免未传参时误用服务端默认导致偏英语等结果。
+        """
+        merged: dict[str, Any] = dict(options or {})
+        merged["dev_pid"] = int(settings.baidu_speech_asr_dev_pid)
+        return self._client_or_raise().asr(speech, format, rate, merged)

    def synthesis(
        self,