api/app/features/memory/summarizer.py

"""会话摘要与滚动摘要（LLM + JSON）。"""

from __future__ import annotations

from typing import Any

from app.core.langchain_llm import ainvoke_json_object, invoke_json_object
from app.core.logging import get_logger
from app.features.memory.llm_schemas import (
    RollingSummaryPayload,
    SessionSummaryPayload,
    parse_json_payload,
)

logger = get_logger(__name__)

_ROLLING_SUMMARY_MERGE_RULES_ZH = (
    "若新材料与已有摘要在同一人物或事件上存在明显事实冲突（如阵亡与在世、牺牲与退休、军衔或驻地去向矛盾），"
    "以新材料为准，删除或改写旧摘要中的矛盾句；不得把两处矛盾信息拼接成一句。"
    "不得将两则无因果关联的信息强行合成因果关系。"
)


def _max_input_chars() -> int:
    from app.core.config import settings

    return settings.memory_enrichment_max_chars


def generate_session_summary_sync(llm: Any, chunk_texts: list[str]) -> str:
    """为本批块生成 session 级短摘要。"""
    if not llm:
        return ""
    lim = _max_input_chars()
    combined = "\n\n".join(t for t in chunk_texts if t).strip()[:lim]
    if not combined:
        return ""
    prompt = (
        "用 2～8 句中文概括下列口述/对话要点，不编造、不评价。只输出 JSON："
        '{"summary":"..."}\n\n文本：\n'
        f"{combined}"
    )
    try:
        raw = invoke_json_object(
            llm, prompt, max_tokens=2048, agent="memory.session_summary_sync"
        )
        parsed = parse_json_payload(raw, SessionSummaryPayload)
        if parsed is None:
            return ""
        return str(parsed.summary or "").strip()
    except (TypeError, ValueError) as e:
        logger.warning("generate_session_summary_sync 失败: {}", e)
        return ""


async def generate_session_summary_async(llm: Any, chunk_texts: list[str]) -> str:
    if not llm:
        return ""
    lim = _max_input_chars()
    combined = "\n\n".join(t for t in chunk_texts if t).strip()[:lim]
    if not combined:
        return ""
    prompt = (
        "用 2～8 句中文概括下列口述/对话要点，不编造、不评价。只输出 JSON："
        '{"summary":"..."}\n\n文本：\n'
        f"{combined}"
    )
    try:
        raw = await ainvoke_json_object(
            llm, prompt, max_tokens=2048, agent="memory.session_summary_async"
        )
        parsed = parse_json_payload(raw, SessionSummaryPayload)
        if parsed is None:
            return ""
        return str(parsed.summary or "").strip()
    except (TypeError, ValueError) as e:
        logger.warning("generate_session_summary_async 失败: {}", e)
        return ""


def generate_rolling_summary_sync(
    llm: Any, existing_summary: str | None, new_chunk_texts: list[str]
) -> str:
    """合并已有滚动摘要与新材料。"""
    if not llm:
        return (existing_summary or "").strip()
    lim = _max_input_chars()
    new_t = "\n\n".join(t for t in new_chunk_texts if t).strip()[:lim]
    if not new_t and not (existing_summary or "").strip():
        return ""
    ex = (existing_summary or "").strip()[:lim]
    prompt = (
        "将「已有滚动摘要」与「新材料」合并为更新后的滚动摘要（中文，段落）。"
        "保留人物与时间线索；不编造；可省略无关细节。\n"
        f"{_ROLLING_SUMMARY_MERGE_RULES_ZH}\n"
        '只输出 JSON：{"rolling_summary":"..."}\n\n'
        f"【已有摘要】\n{ex}\n\n【新材料】\n{new_t}"
    )
    try:
        raw = invoke_json_object(
            llm, prompt, max_tokens=3072, agent="memory.rolling_summary_sync"
        )
        parsed = parse_json_payload(raw, RollingSummaryPayload)
        if parsed is None:
            return (existing_summary or "").strip()
        return str(parsed.rolling_summary or "").strip()
    except (TypeError, ValueError) as e:
        logger.warning("generate_rolling_summary_sync 失败: {}", e)
        return (existing_summary or "").strip()


async def generate_rolling_summary_async(
    llm: Any, existing_summary: str | None, new_chunk_texts: list[str]
) -> str:
    if not llm:
        return (existing_summary or "").strip()
    lim = _max_input_chars()
    new_t = "\n\n".join(t for t in new_chunk_texts if t).strip()[:lim]
    if not new_t and not (existing_summary or "").strip():
        return ""
    ex = (existing_summary or "").strip()[:lim]
    prompt = (
        "将「已有滚动摘要」与「新材料」合并为更新后的滚动摘要（中文，段落）。"
        "保留人物与时间线索；不编造。\n"
        f"{_ROLLING_SUMMARY_MERGE_RULES_ZH}\n"
        '只输出 JSON：{"rolling_summary":"..."}\n\n'
        f"【已有摘要】\n{ex}\n\n【新材料】\n{new_t}"
    )
    try:
        raw = await ainvoke_json_object(
            llm, prompt, max_tokens=3072, agent="memory.rolling_summary_async"
        )
        parsed = parse_json_payload(raw, RollingSummaryPayload)
        if parsed is None:
            return (existing_summary or "").strip()
        return str(parsed.rolling_summary or "").strip()
    except (TypeError, ValueError) as e:
        logger.warning("generate_rolling_summary_async 失败: {}", e)
        return (existing_summary or "").strip()
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								"""会话摘要与滚动摘要（LLM + JSON）。"""
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								from __future__ import annotations
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								from typing import Any
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								from app.core.langchain_llm import ainvoke_json_object, invoke_json_object
 								from app.core.logging import get_logger
 								from app.features.memory.llm_schemas import (
 								    RollingSummaryPayload,
 								    SessionSummaryPayload,
 								    parse_json_payload,
 								)
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								logger = get_logger(__name__)
-												feat(api): 访谈路径轻量门控、Memoir Phase1 批处理与叙事/记忆管线加固

- 新增 utterance_substance：短时/应答/元话语可跳过记忆检索、阶段 LLM 与资料抽取 LLM；可配置
- 输入归一化：LLM 模式默认仅语音/ASR；配置项写入 .env.example
- Memoir Phase1：可选 batch LLM 一次性抽取+分类（失败回退逐段）；Extraction 空槽位时阶段与 current_stage 对齐，prompt 约束收紧
- 叙事与忠实度：narrative_safety、证据重叠/场合锚点、标题 slots 与履历短语 grounded；fidelity 解析失败 fail-open 可配置
- 章节管线：锁 TTL 上调、锁竞争 Celery 重试、Phase2 immediate singleflight 等；story_pipeline_sync / chapter_compose / memoir_tasks 联动
- Memory：compaction / repo / summarizer / evidence 小修；事实 FTS 未命中是否回退最近事实可配置
- 新增 memoir_pipeline_trace；补充 memoir_reliability 文档与多项回归/门控测试

											
										
										
											2026-04-03 10:12:59 +08:00
+								_ROLLING_SUMMARY_MERGE_RULES_ZH = (
 								    "若新材料与已有摘要在同一人物或事件上存在明显事实冲突（如阵亡与在世、牺牲与退休、军衔或驻地去向矛盾），"
 								    "以新材料为准，删除或改写旧摘要中的矛盾句；不得把两处矛盾信息拼接成一句。"
 								    "不得将两则无因果关联的信息强行合成因果关系。"
 								)
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
 								def _max_input_chars() -> int:
 								    from app.core.config import settings
 								    return settings.memory_enrichment_max_chars
 								def generate_session_summary_sync(llm: Any, chunk_texts: list[str]) -> str:
 								    """为本批块生成 session 级短摘要。"""
 								    if not llm:
 								        return ""
 								    lim = _max_input_chars()
 								    combined = "\n\n".join(t for t in chunk_texts if t).strip()[:lim]
 								    if not combined:
 								        return ""
 								    prompt = (
 								        "用 2～8 句中文概括下列口述/对话要点，不编造、不评价。只输出 JSON："
 								        '{"summary":"..."}\n\n文本：\n'
 								        f"{combined}"
 								    )
 								    try:
 								        raw = invoke_json_object(
 								            llm, prompt, max_tokens=2048, agent="memory.session_summary_sync"
 								        )
 								        parsed = parse_json_payload(raw, SessionSummaryPayload)
 								        if parsed is None:
 								            return ""
 								        return str(parsed.summary or "").strip()
 								    except (TypeError, ValueError) as e:
 								        logger.warning("generate_session_summary_sync 失败: {}", e)
 								        return ""
 								async def generate_session_summary_async(llm: Any, chunk_texts: list[str]) -> str:
 								    if not llm:
 								        return ""
 								    lim = _max_input_chars()
 								    combined = "\n\n".join(t for t in chunk_texts if t).strip()[:lim]
 								    if not combined:
 								        return ""
 								    prompt = (
 								        "用 2～8 句中文概括下列口述/对话要点，不编造、不评价。只输出 JSON："
 								        '{"summary":"..."}\n\n文本：\n'
 								        f"{combined}"
 								    )
 								    try:
 								        raw = await ainvoke_json_object(
 								            llm, prompt, max_tokens=2048, agent="memory.session_summary_async"
 								        )
 								        parsed = parse_json_payload(raw, SessionSummaryPayload)
 								        if parsed is None:
 								            return ""
 								        return str(parsed.summary or "").strip()
 								    except (TypeError, ValueError) as e:
 								        logger.warning("generate_session_summary_async 失败: {}", e)
 								        return ""
 								def generate_rolling_summary_sync(
 								    llm: Any, existing_summary: str | None, new_chunk_texts: list[str]
 								) -> str:
 								    """合并已有滚动摘要与新材料。"""
 								    if not llm:
 								        return (existing_summary or "").strip()
 								    lim = _max_input_chars()
 								    new_t = "\n\n".join(t for t in new_chunk_texts if t).strip()[:lim]
 								    if not new_t and not (existing_summary or "").strip():
 								        return ""
 								    ex = (existing_summary or "").strip()[:lim]
 								    prompt = (
 								        "将「已有滚动摘要」与「新材料」合并为更新后的滚动摘要（中文，段落）。"
 								        "保留人物与时间线索；不编造；可省略无关细节。\n"
-												feat(api): 访谈路径轻量门控、Memoir Phase1 批处理与叙事/记忆管线加固

- 新增 utterance_substance：短时/应答/元话语可跳过记忆检索、阶段 LLM 与资料抽取 LLM；可配置
- 输入归一化：LLM 模式默认仅语音/ASR；配置项写入 .env.example
- Memoir Phase1：可选 batch LLM 一次性抽取+分类（失败回退逐段）；Extraction 空槽位时阶段与 current_stage 对齐，prompt 约束收紧
- 叙事与忠实度：narrative_safety、证据重叠/场合锚点、标题 slots 与履历短语 grounded；fidelity 解析失败 fail-open 可配置
- 章节管线：锁 TTL 上调、锁竞争 Celery 重试、Phase2 immediate singleflight 等；story_pipeline_sync / chapter_compose / memoir_tasks 联动
- Memory：compaction / repo / summarizer / evidence 小修；事实 FTS 未命中是否回退最近事实可配置
- 新增 memoir_pipeline_trace；补充 memoir_reliability 文档与多项回归/门控测试

											
										
										
											2026-04-03 10:12:59 +08:00
+								        f"{_ROLLING_SUMMARY_MERGE_RULES_ZH}\n"
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								        '只输出 JSON：{"rolling_summary":"..."}\n\n'
 								        f"【已有摘要】\n{ex}\n\n【新材料】\n{new_t}"
 								    )
 								    try:
 								        raw = invoke_json_object(
 								            llm, prompt, max_tokens=3072, agent="memory.rolling_summary_sync"
 								        )
 								        parsed = parse_json_payload(raw, RollingSummaryPayload)
 								        if parsed is None:
 								            return (existing_summary or "").strip()
 								        return str(parsed.rolling_summary or "").strip()
 								    except (TypeError, ValueError) as e:
 								        logger.warning("generate_rolling_summary_sync 失败: {}", e)
 								        return (existing_summary or "").strip()
 								async def generate_rolling_summary_async(
 								    llm: Any, existing_summary: str | None, new_chunk_texts: list[str]
 								) -> str:
 								    if not llm:
 								        return (existing_summary or "").strip()
 								    lim = _max_input_chars()
 								    new_t = "\n\n".join(t for t in new_chunk_texts if t).strip()[:lim]
 								    if not new_t and not (existing_summary or "").strip():
 								        return ""
 								    ex = (existing_summary or "").strip()[:lim]
 								    prompt = (
 								        "将「已有滚动摘要」与「新材料」合并为更新后的滚动摘要（中文，段落）。"
 								        "保留人物与时间线索；不编造。\n"
-												feat(api): 访谈路径轻量门控、Memoir Phase1 批处理与叙事/记忆管线加固

- 新增 utterance_substance：短时/应答/元话语可跳过记忆检索、阶段 LLM 与资料抽取 LLM；可配置
- 输入归一化：LLM 模式默认仅语音/ASR；配置项写入 .env.example
- Memoir Phase1：可选 batch LLM 一次性抽取+分类（失败回退逐段）；Extraction 空槽位时阶段与 current_stage 对齐，prompt 约束收紧
- 叙事与忠实度：narrative_safety、证据重叠/场合锚点、标题 slots 与履历短语 grounded；fidelity 解析失败 fail-open 可配置
- 章节管线：锁 TTL 上调、锁竞争 Celery 重试、Phase2 immediate singleflight 等；story_pipeline_sync / chapter_compose / memoir_tasks 联动
- Memory：compaction / repo / summarizer / evidence 小修；事实 FTS 未命中是否回退最近事实可配置
- 新增 memoir_pipeline_trace；补充 memoir_reliability 文档与多项回归/门控测试

											
										
										
											2026-04-03 10:12:59 +08:00
+								        f"{_ROLLING_SUMMARY_MERGE_RULES_ZH}\n"
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								        '只输出 JSON：{"rolling_summary":"..."}\n\n'
 								        f"【已有摘要】\n{ex}\n\n【新材料】\n{new_t}"
 								    )
 								    try:
 								        raw = await ainvoke_json_object(
 								            llm, prompt, max_tokens=3072, agent="memory.rolling_summary_async"
 								        )
 								        parsed = parse_json_payload(raw, RollingSummaryPayload)
 								        if parsed is None:
 								            return (existing_summary or "").strip()
 								        return str(parsed.rolling_summary or "").strip()
 								    except (TypeError, ValueError) as e:
 								        logger.warning("generate_rolling_summary_async 失败: {}", e)
 								        return (existing_summary or "").strip()