feat: 手术视频消耗、待确认与持久化改造

- 新增 Alembic 初始迁移、领域明细模型及归档持久化与重试链路\n- 拆分视频会话注册表、分类处理、推理时间窗聚合与流处理\n- 消耗日志：TSV/Markdown 含 top2/top3；item_id 优先产品编码；待确认记「待确认」行，语音确认后落正式行并更新汇总\n- 待确认时内存/DB 明细为占位行，确认后替换；拒绝时移除占位\n- 分类 probs 先 detach/cpu 再转 NumPy，修复 MPS/CUDA 上推理被静默跳过\n- 补充集成测试、归档与设备张量等单测 Made-with: Cursor
2026-04-23 20:42:21 +08:00
parent 69980d8073
commit 3d7bd70355
55 changed files with 4544 additions and 2050 deletions
--- a/app/services/baidu_speech.py
+++ b/app/services/baidu_speech.py
@@ -5,7 +5,7 @@ from typing import Any

 from aip import AipSpeech

-from app.config import settings
+from app.config import Settings, settings as _default_settings


 class BaiduSpeechNotConfiguredError(RuntimeError):
@@ -15,13 +15,14 @@ class BaiduSpeechNotConfiguredError(RuntimeError):
 class BaiduSpeechService:
    """百度短语音识别（asr）与在线语音合成（synthesis），基于 `baidu-aip` 的 `AipSpeech`。"""

-    def __init__(self) -> None:
+    def __init__(self, app_settings: Settings | None = None) -> None:
+        self._s = app_settings or _default_settings
        self._client: AipSpeech | None = None
        self._lock = Lock()

    @property
    def configured(self) -> bool:
-        return settings.baidu_speech_configured
+        return self._s.baidu_speech_configured

    def _client_or_raise(self) -> AipSpeech:
        if not self.configured:
@@ -32,16 +33,16 @@ class BaiduSpeechService:
        with self._lock:
            if self._client is None:
                client = AipSpeech(
-                    settings.baidu_speech_app_id,
-                    settings.baidu_speech_api_key,
-                    settings.baidu_speech_secret_key,
+                    self._s.baidu_speech_app_id,
+                    self._s.baidu_speech_api_key,
+                    self._s.baidu_speech_secret_key,
                )
-                if settings.baidu_speech_connection_timeout_ms is not None:
+                if self._s.baidu_speech_connection_timeout_ms is not None:
                    client.setConnectionTimeoutInMillis(
-                        settings.baidu_speech_connection_timeout_ms
+                        self._s.baidu_speech_connection_timeout_ms
                    )
-                if settings.baidu_speech_socket_timeout_ms is not None:
-                    client.setSocketTimeoutInMillis(settings.baidu_speech_socket_timeout_ms)
+                if self._s.baidu_speech_socket_timeout_ms is not None:
+                    client.setSocketTimeoutInMillis(self._s.baidu_speech_socket_timeout_ms)
                self._client = client
            return self._client

@@ -57,7 +58,7 @@ class BaiduSpeechService:
        固定使用普通话模型（`dev_pid` 来自配置），避免未传参时误用服务端默认导致偏英语等结果。
        """
        merged: dict[str, Any] = dict(options or {})
-        merged["dev_pid"] = int(settings.baidu_speech_asr_dev_pid)
+        merged["dev_pid"] = int(self._s.baidu_speech_asr_dev_pid)
        return self._client_or_raise().asr(speech, format, rate, merged)

    def synthesis(