api/app/agents/chat/reply_limits.py

"""访谈/资料追问：回复条数与单条字数硬限制（不靠长 prompt）。"""

from __future__ import annotations

import re


def strip_markdown_for_chat(text: str) -> str:
    """
    将模型偶然输出的常见 Markdown 剥成纯文本，供 App 聊天气泡展示。
    保留换行与字面量 [SPLIT]；不做完整 MD 解析，以简单可预测为主。
    """
    if not text:
        return text
    s = text
    # 围栏代码块（含首行语言标记）：整段替换为块内正文，去掉栅栏
    s = re.sub(
        r"```(?:[^\n`]*)\n([\s\S]*?)```",
        r"\1",
        s,
        flags=re.MULTILINE,
    )
    s = s.replace("```", "")
    # 图片 ![alt](url) → alt；链接 [label](url) → label
    s = re.sub(r"!\[([^\]]*)\]\([^)]*\)", r"\1", s)
    s = re.sub(r"\[([^\]]*)\]\([^)]*\)", r"\1", s)
    # ATX 标题
    s = re.sub(r"(?m)^#{1,6}\s+", "", s)
    # 无序列表行首（仅限行首减号/星号/+ 后接空格，避免误判「—」）
    s = re.sub(r"(?m)^\s*[-*+]\s+", "", s)
    # 有序列表「数字. 」仅行首
    s = re.sub(r"(?m)^\s*\d+\.\s+", "", s)
    # 粗体/删除线常见标记
    s = s.replace("**", "").replace("__", "")
    s = s.replace("~~", "")
    # 行内反引号
    s = s.replace("`", "")
    # 孤立 emphasis：*词* 或 _词_（不含跨行）
    s = re.sub(r"(?<![*])\*([^*\n]+)\*(?![*])", r"\1", s)
    s = re.sub(r"(?<![_])_([^_\n]+)_(?![_])", r"\1", s)
    # 分割线
    s = re.sub(r"(?m)^\s*---+\s*$", "", s)
    return s


def strip_parenthetical_asides_for_chat(text: str) -> str:
    """
    去掉模型输出的表演性括注（全角「（…）」与半角「(...)」），迭代至不再有可删对。

    口述回忆录场景下助理回复几乎不需要夹注；若写成「（约1993年）」等说明也会被删，属产品上有意识取舍，
    与禁止「（轻轻笑）」类舞台说明一致。须在 strip_markdown_for_chat 之后调用（链接里的 () 已先处理）。
    """
    if not text:
        return text
    s = text
    prev: str | None = None
    while prev != s:
        prev = s
        s = re.sub(r"（[^）]*）", "", s)
        s = re.sub(r"\([^)]*\)", "", s)
    s = re.sub(r"[ \t]{2,}", " ", s)
    return s.strip()


def strip_leading_en_period_ack_for_chat(text: str) -> str:
    """
    去掉段首生硬的「嗯。」（可重复），即使后面还有正文；只剥字符串开头，不误伤句中「嗯。」。
    支持全角/半角句号。
    """
    s = (text or "").strip()
    if not s:
        return s
    # 允许多次「嗯。」/「嗯嗯。」叠在段首；句号仅匹配全角 。、． 与 ASCII `.`
    s2 = re.sub(r"^(?:嗯+(?:。|．|\.)+\s*)+", "", s)
    return s2.strip()


def segments_from_llm_response(
    response_text: str,
    *,
    max_segments: int = 3,
    min_paragraph_chars: int = 12,
) -> list[str]:
    """
    优先按字面 [SPLIT] 拆段；若模型只输出一段、但用空行写了多段，再按段落拆。
    解决「两段话 + 换行」却未写 [SPLIT] 时仍要拆气泡 / 多段 TTS 的情况。
    """
    text = strip_markdown_for_chat((response_text or "").strip())
    text = strip_parenthetical_asides_for_chat(text)
    if not text:
        return []
    primary = [
        strip_leading_en_period_ack_for_chat(p)
        for p in text.split("[SPLIT]")
        if strip_leading_en_period_ack_for_chat(p).strip()
    ]
    if len(primary) > 1:
        return primary[:max_segments]
    blob = primary[0] if primary else strip_leading_en_period_ack_for_chat(text)
    blob = strip_leading_en_period_ack_for_chat(blob)
    if "\n" not in blob:
        return [blob]
    paras = [
        strip_leading_en_period_ack_for_chat(p)
        for p in re.split(r"\n\s*\n+", blob)
        if strip_leading_en_period_ack_for_chat(p).strip()
    ]
    if len(paras) < 2:
        return [blob]
    paras = [p for p in paras if len(p) >= min_paragraph_chars]
    if len(paras) < 2:
        return [blob]
    return paras[:max_segments]


def nonempty_segments_or_fallback(
    segments: list[str],
    *,
    fallback: str,
) -> list[str]:
    """去掉空段；若全部为空白/空串则返回单条 fallback，避免 WS 下发空 text。"""
    cleaned = [s for s in segments if (s or "").strip()]
    if cleaned:
        return cleaned
    fb = (fallback or "").strip()
    return [fb] if fb else ["…"]


def truncate_chat_segments(
    segments: list[str],
    *,
    max_segments: int,
    max_chars_per_segment: int,
) -> list[str]:
    """保留前 max_segments 条，每条截断至 max_chars_per_segment（按字符数，中文友好）。"""
    if not segments:
        return []
    out: list[str] = []
    for raw in segments[:max_segments]:
        s = (raw or "").strip()
        if not s:
            continue
        if len(s) > max_chars_per_segment:
            # 保留 1 个字符给省略号，使总长度不超过上限
            s = s[: max_chars_per_segment - 1].rstrip() + "…"
        out.append(s)
    return out
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								"""访谈/资料追问：回复条数与单条字数硬限制（不靠长 prompt）。"""
 								from __future__ import annotations
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								import re
-												fix/ 修复AI聊天时回复markdown导致聊天气泡布局问题

											
										
										
											2026-04-03 14:06:55 +08:00
+								def strip_markdown_for_chat(text: str) -> str:
 								    """
 								    将模型偶然输出的常见 Markdown 剥成纯文本，供 App 聊天气泡展示。
 								    保留换行与字面量 [SPLIT]；不做完整 MD 解析，以简单可预测为主。
 								    """
 								    if not text:
 								        return text
 								    s = text
 								    # 围栏代码块（含首行语言标记）：整段替换为块内正文，去掉栅栏
 								    s = re.sub(
 								        r"```(?:[^\n`]*)\n([\s\S]*?)```",
 								        r"\1",
 								        s,
 								        flags=re.MULTILINE,
 								    )
 								    s = s.replace("```", "")
 								    # 图片 ![alt](url) → alt；链接 [label](url) → label
 								    s = re.sub(r"!\[([^\]]*)\]\([^)]*\)", r"\1", s)
 								    s = re.sub(r"\[([^\]]*)\]\([^)]*\)", r"\1", s)
 								    # ATX 标题
 								    s = re.sub(r"(?m)^#{1,6}\s+", "", s)
 								    # 无序列表行首（仅限行首减号/星号/+ 后接空格，避免误判「—」）
 								    s = re.sub(r"(?m)^\s*[-*+]\s+", "", s)
 								    # 有序列表「数字. 」仅行首
 								    s = re.sub(r"(?m)^\s*\d+\.\s+", "", s)
 								    # 粗体/删除线常见标记
 								    s = s.replace("**", "").replace("__", "")
 								    s = s.replace("~~", "")
 								    # 行内反引号
 								    s = s.replace("`", "")
 								    # 孤立 emphasis：*词* 或 _词_（不含跨行）
 								    s = re.sub(r"(?<![*])\*([^*\n]+)\*(?![*])", r"\1", s)
 								    s = re.sub(r"(?<![_])_([^_\n]+)_(?![_])", r"\1", s)
 								    # 分割线
 								    s = re.sub(r"(?m)^\s*---+\s*$", "", s)
 								    return s
-												feat(chat): host-style memoir prompts and strip parenthetical stage directions

- Add strip_parenthetical_asides_for_chat in reply pipeline before [SPLIT]
- Expand output_rules bans (performance parens) and voice as warm host
- Refocus opening/guided prompts on pulling conversation toward memoir oral history
- Align interview opening fallbacks with memoir-first tone
- Add unit tests for parenthetical stripping

											
										
										
											2026-04-10 13:55:08 +08:00
+								def strip_parenthetical_asides_for_chat(text: str) -> str:
 								    """
 								    去掉模型输出的表演性括注（全角「（…）」与半角「(...)」），迭代至不再有可删对。
 								    口述回忆录场景下助理回复几乎不需要夹注；若写成「（约1993年）」等说明也会被删，属产品上有意识取舍，
 								    与禁止「（轻轻笑）」类舞台说明一致。须在 strip_markdown_for_chat 之后调用（链接里的 () 已先处理）。
 								    """
 								    if not text:
 								        return text
 								    s = text
 								    prev: str | None = None
 								    while prev != s:
 								        prev = s
 								        s = re.sub(r"（[^）]*）", "", s)
 								        s = re.sub(r"\([^)]*\)", "", s)
 								    s = re.sub(r"[ \t]{2,}", " ", s)
 								    return s.strip()
-												fix:
1. 修复安卓部分机型顶部安全区遮挡回忆录标题的问题；
2. 降低封面图生成阈值和展示逻辑，独立封面图未生成时，使用正文图；
3. 去掉“嗯。”生硬回答，去掉不合理段首承接词；
4. 新增章节封面所需最少插图数的配置项

											
										
										
											2026-04-16 20:42:54 +08:00
+								def strip_leading_en_period_ack_for_chat(text: str) -> str:
 								    """
 								    去掉段首生硬的「嗯。」（可重复），即使后面还有正文；只剥字符串开头，不误伤句中「嗯。」。
 								    支持全角/半角句号。
 								    """
 								    s = (text or "").strip()
 								    if not s:
 								        return s
 								    # 允许多次「嗯。」/「嗯嗯。」叠在段首；句号仅匹配全角 。、． 与 ASCII `.`
 								    s2 = re.sub(r"^(?:嗯+(?:。|．|\.)+\s*)+", "", s)
 								    return s2.strip()
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								def segments_from_llm_response(
 								    response_text: str,
 								    *,
 								    max_segments: int = 3,
 								    min_paragraph_chars: int = 12,
 								) -> list[str]:
 								    """
 								    优先按字面 [SPLIT] 拆段；若模型只输出一段、但用空行写了多段，再按段落拆。
 								    解决「两段话 + 换行」却未写 [SPLIT] 时仍要拆气泡 / 多段 TTS 的情况。
 								    """
-												fix/ 修复AI聊天时回复markdown导致聊天气泡布局问题

											
										
										
											2026-04-03 14:06:55 +08:00
+								    text = strip_markdown_for_chat((response_text or "").strip())
-												feat(chat): host-style memoir prompts and strip parenthetical stage directions

- Add strip_parenthetical_asides_for_chat in reply pipeline before [SPLIT]
- Expand output_rules bans (performance parens) and voice as warm host
- Refocus opening/guided prompts on pulling conversation toward memoir oral history
- Align interview opening fallbacks with memoir-first tone
- Add unit tests for parenthetical stripping

											
										
										
											2026-04-10 13:55:08 +08:00
+								    text = strip_parenthetical_asides_for_chat(text)
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    if not text:
 								        return []
-												fix:
1. 修复安卓部分机型顶部安全区遮挡回忆录标题的问题；
2. 降低封面图生成阈值和展示逻辑，独立封面图未生成时，使用正文图；
3. 去掉“嗯。”生硬回答，去掉不合理段首承接词；
4. 新增章节封面所需最少插图数的配置项

											
										
										
											2026-04-16 20:42:54 +08:00
+								    primary = [
 								        strip_leading_en_period_ack_for_chat(p)
 								        for p in text.split("[SPLIT]")
 								        if strip_leading_en_period_ack_for_chat(p).strip()
 								    ]
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    if len(primary) > 1:
 								        return primary[:max_segments]
-												fix:
1. 修复安卓部分机型顶部安全区遮挡回忆录标题的问题；
2. 降低封面图生成阈值和展示逻辑，独立封面图未生成时，使用正文图；
3. 去掉“嗯。”生硬回答，去掉不合理段首承接词；
4. 新增章节封面所需最少插图数的配置项

											
										
										
											2026-04-16 20:42:54 +08:00
+								    blob = primary[0] if primary else strip_leading_en_period_ack_for_chat(text)
 								    blob = strip_leading_en_period_ack_for_chat(blob)
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    if "\n" not in blob:
 								        return [blob]
-												fix:
1. 修复安卓部分机型顶部安全区遮挡回忆录标题的问题；
2. 降低封面图生成阈值和展示逻辑，独立封面图未生成时，使用正文图；
3. 去掉“嗯。”生硬回答，去掉不合理段首承接词；
4. 新增章节封面所需最少插图数的配置项

											
										
										
											2026-04-16 20:42:54 +08:00
+								    paras = [
 								        strip_leading_en_period_ack_for_chat(p)
 								        for p in re.split(r"\n\s*\n+", blob)
 								        if strip_leading_en_period_ack_for_chat(p).strip()
 								    ]
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    if len(paras) < 2:
 								        return [blob]
 								    paras = [p for p in paras if len(p) >= min_paragraph_chars]
 								    if len(paras) < 2:
 								        return [blob]
 								    return paras[:max_segments]
 								def nonempty_segments_or_fallback(
 								    segments: list[str],
 								    *,
 								    fallback: str,
 								) -> list[str]:
 								    """去掉空段；若全部为空白/空串则返回单条 fallback，避免 WS 下发空 text。"""
 								    cleaned = [s for s in segments if (s or "").strip()]
 								    if cleaned:
 								        return cleaned
 								    fb = (fallback or "").strip()
 								    return [fb] if fb else ["…"]
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
 								def truncate_chat_segments(
 								    segments: list[str],
 								    *,
 								    max_segments: int,
 								    max_chars_per_segment: int,
 								) -> list[str]:
 								    """保留前 max_segments 条，每条截断至 max_chars_per_segment（按字符数，中文友好）。"""
 								    if not segments:
 								        return []
 								    out: list[str] = []
 								    for raw in segments[:max_segments]:
 								        s = (raw or "").strip()
 								        if not s:
 								            continue
 								        if len(s) > max_chars_per_segment:
 								            # 保留 1 个字符给省略号，使总长度不超过上限
 								            s = s[: max_chars_per_segment - 1].rstrip() + "…"
 								        out.append(s)
 								    return out