api/app/features/memory/extractor.py

"""从 transcript 块中抽取结构化事实（LLM + JSON）。"""

from __future__ import annotations

from typing import Any

from app.core.langchain_llm import ainvoke_json_object, invoke_json_object
from app.core.llm_gateway import LlmGateway, LlmUseCase
from app.core.logging import get_logger
from app.features.memory.llm_schemas import (
    FactsExtractionPayload,
    facts_payload_to_dicts,
    parse_json_payload,
)

logger = get_logger(__name__)


def _max_transcript_chars() -> int:
    from app.core.config import settings

    return settings.memory_enrichment_max_chars


def _facts_extraction_instructions(narrator_label: str) -> str:
    return (
        "你是回忆录事实抽取助手。用户正在口述人生回忆，所有内容默认是**过去发生的事**，"
        "而非当前或未来计划（除非原文明确说「现在」「打算」「准备将要」等）。\n\n"
        "## 抽取规则\n"
        "1. subject 必须用明确的人名或固定称谓：\n"
        f"   - 叙述者本人统一用「{narrator_label}」\n"
        "   - 其他人用全名或稳定专名（如「王伟」），禁止用「他」「她」「我」「我们大伙」等代词作 subject；"
        "若代词在上下文中可唯一解析为某人，则 subject 写该人姓名/专名\n"
        "2. 事件、职务变动、地点迁移等一律按**过去回忆**理解；travel/调动/命令类表述勿写成「即将要做」"
        "除非原文明确为未来时态\n"
        "3. 若可推断大约年代或人生阶段，将 approximate_era 写入 object_json（与 value 等字段并存），"
        '例如 "1990年代"、"2001年"、"退休后"、"30岁前后"\n'
        "4. fact_type: person|event|relation|place|milestone\n"
        "5. predicate：简短中文谓语（如「出生地」「担任职务」「调往」）\n"
        "6. object_json：字符串或对象；可含 value、approximate_era 等\n"
        "7. confidence 0..1；source_chunk_id 必须等于某段 [chunk_id=...] 中的 id\n\n"
        '只输出 JSON：{"facts":[...]}，无事实则 {"facts":[]}。\n\n'
    )


def extract_facts_from_transcript_sync(
    llm: Any,
    numbered_blocks: str,
    *,
    narrator_name: str | None = None,
) -> list[dict]:
    """同步：带 chunk_id 标记的文本 → 事实列表。"""
    if not llm or not (numbered_blocks or "").strip():
        return []
    text = numbered_blocks.strip()[: _max_transcript_chars()]
    narrator_label = (narrator_name or "").strip() or "叙述者"
    prompt = _facts_extraction_instructions(narrator_label) + text
    try:
        raw = invoke_json_object(
            llm,
            prompt,
            max_tokens=4096,
            agent="memory.extract_facts_sync",
        )
        parsed = parse_json_payload(raw, FactsExtractionPayload)
        if parsed is None:
            return []
        return facts_payload_to_dicts(parsed)
    except (TypeError, ValueError) as e:
        logger.warning("extract_facts_from_transcript_sync 解析失败: {}", e)
        return []


async def extract_facts_from_transcript_async(
    llm: Any,
    numbered_blocks: str,
    *,
    narrator_name: str | None = None,
) -> list[dict]:
    """异步版。"""
    if not llm or not (numbered_blocks or "").strip():
        return []
    text = numbered_blocks.strip()[: _max_transcript_chars()]
    narrator_label = (narrator_name or "").strip() or "叙述者"
    prompt = _facts_extraction_instructions(narrator_label) + text
    try:
        raw = await ainvoke_json_object(
            llm,
            prompt,
            max_tokens=4096,
            agent="memory.extract_facts_async",
        )
        parsed = parse_json_payload(raw, FactsExtractionPayload)
        if parsed is None:
            return []
        return facts_payload_to_dicts(parsed)
    except (TypeError, ValueError) as e:
        logger.warning("extract_facts_from_transcript_async 解析失败: {}", e)
        return []


async def extract_facts(chunk_text: str, *, user_id: str) -> list[dict]:
    """兼容旧接口：单块文本（无 chunk id 时传空 source_chunk_id）。"""
    from app.core.db import AsyncSessionLocal
    from app.features.user.models import User

    llm = LlmGateway().langchain_llm_for(
        LlmUseCase("memory.extract_facts.compat", fast=True)
    )
    narrator_name: str | None = None
    try:
        async with AsyncSessionLocal() as db:
            u = await db.get(User, user_id)
            if u and (u.nickname or "").strip():
                narrator_name = (u.nickname or "").strip()
    except Exception:
        pass

    blocks = f"[chunk_id=null]\n{chunk_text}"
    facts = await extract_facts_from_transcript_async(
        llm, blocks, narrator_name=narrator_name
    )
    for f in facts:
        if f.get("source_chunk_id") in (None, "null", ""):
            f["source_chunk_id"] = None
    return facts
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								"""从 transcript 块中抽取结构化事实（LLM + JSON）。"""
 								from __future__ import annotations
 								from typing import Any
 								from app.core.langchain_llm import ainvoke_json_object, invoke_json_object
-												feat(api): 收敛对话与记忆流程边界，引入 LLM 网关与专用服务

- MemoryService 异步路径委托 MemoryIngestService / MemoryRetrievalService；富化派发经 MemoryEnrichmentScheduler
- WebSocket pipeline 经 ChatTurnService 与显式 DTO 编排单轮对话；回忆录片段入队由 MemoirIngestScheduler 封装
- 新增 LlmGateway（LlmUseCase），各 agent、任务与适配器对齐 ports
- 补充 memory 提示适配、runtime 类型、memory-retrieval 文档、ai-touchpoints 说明与扫描脚本及配套测试

Made-with: Cursor

											
										
										
											2026-04-30 09:17:01 +08:00
+								from app.core.llm_gateway import LlmGateway, LlmUseCase
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								from app.core.logging import get_logger
 								from app.features.memory.llm_schemas import (
 								    FactsExtractionPayload,
 								    facts_payload_to_dicts,
 								    parse_json_payload,
 								)
 								logger = get_logger(__name__)
 								def _max_transcript_chars() -> int:
 								    from app.core.config import settings
 								    return settings.memory_enrichment_max_chars
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								def _facts_extraction_instructions(narrator_label: str) -> str:
 								    return (
 								        "你是回忆录事实抽取助手。用户正在口述人生回忆，所有内容默认是**过去发生的事**，"
 								        "而非当前或未来计划（除非原文明确说「现在」「打算」「准备将要」等）。\n\n"
 								        "## 抽取规则\n"
 								        "1. subject 必须用明确的人名或固定称谓：\n"
 								        f"   - 叙述者本人统一用「{narrator_label}」\n"
 								        "   - 其他人用全名或稳定专名（如「王伟」），禁止用「他」「她」「我」「我们大伙」等代词作 subject；"
 								        "若代词在上下文中可唯一解析为某人，则 subject 写该人姓名/专名\n"
 								        "2. 事件、职务变动、地点迁移等一律按**过去回忆**理解；travel/调动/命令类表述勿写成「即将要做」"
 								        "除非原文明确为未来时态\n"
 								        "3. 若可推断大约年代或人生阶段，将 approximate_era 写入 object_json（与 value 等字段并存），"
 								        '例如 "1990年代"、"2001年"、"退休后"、"30岁前后"\n'
 								        "4. fact_type: person|event|relation|place|milestone\n"
 								        "5. predicate：简短中文谓语（如「出生地」「担任职务」「调往」）\n"
 								        "6. object_json：字符串或对象；可含 value、approximate_era 等\n"
 								        "7. confidence 0..1；source_chunk_id 必须等于某段 [chunk_id=...] 中的 id\n\n"
 								        '只输出 JSON：{"facts":[...]}，无事实则 {"facts":[]}。\n\n'
 								    )
 								def extract_facts_from_transcript_sync(
 								    llm: Any,
 								    numbered_blocks: str,
 								    *,
 								    narrator_name: str | None = None,
 								) -> list[dict]:
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    """同步：带 chunk_id 标记的文本 → 事实列表。"""
 								    if not llm or not (numbered_blocks or "").strip():
 								        return []
 								    text = numbered_blocks.strip()[: _max_transcript_chars()]
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								    narrator_label = (narrator_name or "").strip() or "叙述者"
 								    prompt = _facts_extraction_instructions(narrator_label) + text
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    try:
 								        raw = invoke_json_object(
 								            llm,
 								            prompt,
 								            max_tokens=4096,
 								            agent="memory.extract_facts_sync",
 								        )
 								        parsed = parse_json_payload(raw, FactsExtractionPayload)
 								        if parsed is None:
 								            return []
 								        return facts_payload_to_dicts(parsed)
 								    except (TypeError, ValueError) as e:
 								        logger.warning("extract_facts_from_transcript_sync 解析失败: {}", e)
 								        return []
 								async def extract_facts_from_transcript_async(
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								    llm: Any,
 								    numbered_blocks: str,
 								    *,
 								    narrator_name: str | None = None,
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								) -> list[dict]:
 								    """异步版。"""
 								    if not llm or not (numbered_blocks or "").strip():
 								        return []
 								    text = numbered_blocks.strip()[: _max_transcript_chars()]
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								    narrator_label = (narrator_name or "").strip() or "叙述者"
 								    prompt = _facts_extraction_instructions(narrator_label) + text
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    try:
 								        raw = await ainvoke_json_object(
 								            llm,
 								            prompt,
 								            max_tokens=4096,
 								            agent="memory.extract_facts_async",
 								        )
 								        parsed = parse_json_payload(raw, FactsExtractionPayload)
 								        if parsed is None:
 								            return []
 								        return facts_payload_to_dicts(parsed)
 								    except (TypeError, ValueError) as e:
 								        logger.warning("extract_facts_from_transcript_async 解析失败: {}", e)
 								        return []
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
 								async def extract_facts(chunk_text: str, *, user_id: str) -> list[dict]:
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    """兼容旧接口：单块文本（无 chunk id 时传空 source_chunk_id）。"""
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								    from app.core.db import AsyncSessionLocal
 								    from app.features.user.models import User
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
-												feat(api): 收敛对话与记忆流程边界，引入 LLM 网关与专用服务

- MemoryService 异步路径委托 MemoryIngestService / MemoryRetrievalService；富化派发经 MemoryEnrichmentScheduler
- WebSocket pipeline 经 ChatTurnService 与显式 DTO 编排单轮对话；回忆录片段入队由 MemoirIngestScheduler 封装
- 新增 LlmGateway（LlmUseCase），各 agent、任务与适配器对齐 ports
- 补充 memory 提示适配、runtime 类型、memory-retrieval 文档、ai-touchpoints 说明与扫描脚本及配套测试

Made-with: Cursor

											
										
										
											2026-04-30 09:17:01 +08:00
+								    llm = LlmGateway().langchain_llm_for(
 								        LlmUseCase("memory.extract_facts.compat", fast=True)
 								    )
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								    narrator_name: str | None = None
 								    try:
 								        async with AsyncSessionLocal() as db:
 								            u = await db.get(User, user_id)
 								            if u and (u.nickname or "").strip():
 								                narrator_name = (u.nickname or "").strip()
 								    except Exception:
 								        pass
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    blocks = f"[chunk_id=null]\n{chunk_text}"
-												聊天和回忆录证据检索都走 pgvector，去掉 Postgres FTS/content_tsv，新迁移删掉 content_tsv 列（部署要先 alembic upgrade）。

Embedding 端口增加 is_available()，聊天和回忆录日志用统一方式表示向量是否真能调用。

记忆整理（compaction）支持 Beat 定期扫用户；

事实抽取提示与 subject 归一化，减少同一人多种称呼；

											
										
										
											2026-04-03 11:43:16 +08:00
+								    facts = await extract_facts_from_transcript_async(
 								        llm, blocks, narrator_name=narrator_name
 								    )
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    for f in facts:
 								        if f.get("source_chunk_id") in (None, "null", ""):
 								            f["source_chunk_id"] = None
 								    return facts