feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库 - 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等后端 - 记忆 - 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数 - 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关 - repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新后端 - 对话 WS - 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确 - 助手多段回复持久化使用统一分隔符，与分段逻辑一致后端 - Agent - reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发后端 - 回忆录任务 - transcript ingest 记录 source_id；任务成功结?
2026-03-27 16:01:28 +08:00
parent 1374f6e8f5
commit e4bf0710c7
70 changed files with 3404 additions and 557 deletions
--- a/api/app/agents/chat/reply_limits.py
+++ b/api/app/agents/chat/reply_limits.py
@@ -2,6 +2,49 @@

 from __future__ import annotations

+import re
+
+
+def segments_from_llm_response(
+    response_text: str,
+    *,
+    max_segments: int = 3,
+    min_paragraph_chars: int = 12,
+) -> list[str]:
+    """
+    优先按字面 [SPLIT] 拆段；若模型只输出一段、但用空行写了多段，再按段落拆。
+    解决「两段话 + 换行」却未写 [SPLIT] 时仍要拆气泡 / 多段 TTS 的情况。
+    """
+    text = (response_text or "").strip()
+    if not text:
+        return []
+    primary = [p.strip() for p in text.split("[SPLIT]") if p.strip()]
+    if len(primary) > 1:
+        return primary[:max_segments]
+    blob = primary[0] if primary else text
+    if "\n" not in blob:
+        return [blob]
+    paras = [p.strip() for p in re.split(r"\n\s*\n+", blob) if p.strip()]
+    if len(paras) < 2:
+        return [blob]
+    paras = [p for p in paras if len(p) >= min_paragraph_chars]
+    if len(paras) < 2:
+        return [blob]
+    return paras[:max_segments]
+
+
+def nonempty_segments_or_fallback(
+    segments: list[str],
+    *,
+    fallback: str,
+) -> list[str]:
+    """去掉空段；若全部为空白/空串则返回单条 fallback，避免 WS 下发空 text。"""
+    cleaned = [s for s in segments if (s or "").strip()]
+    if cleaned:
+        return cleaned
+    fb = (fallback or "").strip()
+    return [fb] if fb else ["…"]
+

 def truncate_chat_segments(
    segments: list[str],