api/app/features/memory/retriever.py

"""Hybrid retriever — metadata filter + FTS + vector retrieval + score fusion."""

from sqlalchemy.ext.asyncio import AsyncSession

from app.features.memory.evidence import retrieve_evidence_bundle_async
from app.features.memory.repo import search_chunks_fts, search_chunks_vector
from app.ports.embedding import EmbeddingProvider


def _rrf_merge(
    fts_items: list[dict], vector_items: list[dict], k: int = 60
) -> list[dict]:
    """Reciprocal Rank Fusion. Merge FTS and vector results by id."""
    scores: dict[str, float] = {}
    for rank, item in enumerate(fts_items):
        cid = item["id"]
        scores[cid] = scores.get(cid, 0) + 1 / (k + rank + 1)
    for rank, item in enumerate(vector_items):
        cid = item["id"]
        scores[cid] = scores.get(cid, 0) + 1 / (k + rank + 1)

    all_items = {x["id"]: x for x in fts_items + vector_items}
    sorted_ids = sorted(scores.keys(), key=lambda i: scores[i], reverse=True)
    return [all_items[i] for i in sorted_ids]


class HybridRetriever:
    """Combine FTS, vector, and metadata filter into evidence bundle."""

    def __init__(
        self,
        db: AsyncSession,
        *,
        embedding_provider: EmbeddingProvider | None = None,
    ):
        self._db = db
        self._embedding = embedding_provider

    async def retrieve(self, user_id: str, query: str, *, top_k: int = 10) -> dict:
        """
        Return evidence bundle:
        {relevant_chunks, relevant_summaries, relevant_facts, timeline_hints, relevant_stories}
        """
        if not query.strip():
            return await retrieve_evidence_bundle_async(
                self._db,
                user_id,
                query,
                top_k=top_k,
                merged_chunk_dicts=[],
            )

        q = query.strip()
        fts_chunks = await search_chunks_fts(
            self._db, user_id=user_id, query=query, limit=top_k * 2
        )

        vector_chunks: list[dict] = []
        if self._embedding and q:
            q_emb = await self._embedding.embed_text(q)
            if q_emb:
                vector_chunks = await search_chunks_vector(
                    self._db, user_id=user_id, query_embedding=q_emb, limit=top_k * 2
                )

        merged = _rrf_merge(fts_chunks, vector_chunks)[:top_k]
        merged_chunk_dicts = [
            {
                "id": c["id"],
                "content": c["content"],
                "chunk_index": c.get("chunk_index", 0),
            }
            for c in merged
        ]

        return await retrieve_evidence_bundle_async(
            self._db,
            user_id,
            query,
            top_k=top_k,
            merged_chunk_dicts=merged_chunk_dicts,
        )
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`"""Hybrid retriever — metadata filter + FTS + vector retrieval + score fusion."""`

			`from sqlalchemy.ext.asyncio import AsyncSession`

feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路数据库 - 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等后端 - 记忆 - 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数 - 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关 - repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新后端 - 对话 WS - 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确 - 助手多段回复持久化使用统一分隔符，与分段逻辑一致后端 - Agent - reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发后端 - 回忆录任务 - transcript ingest 记录 source_id；任务成功结? 2026-03-27 16:01:28 +08:00			`from app.features.memory.evidence import retrieve_evidence_bundle_async`
			`from app.features.memory.repo import search_chunks_fts, search_chunks_vector`
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`from app.ports.embedding import EmbeddingProvider`


			`def _rrf_merge(`
			`fts_items: list[dict], vector_items: list[dict], k: int = 60`
			`) -> list[dict]:`
			`"""Reciprocal Rank Fusion. Merge FTS and vector results by id."""`
			`scores: dict[str, float] = {}`
			`for rank, item in enumerate(fts_items):`
			`cid = item["id"]`
			`scores[cid] = scores.get(cid, 0) + 1 / (k + rank + 1)`
			`for rank, item in enumerate(vector_items):`
			`cid = item["id"]`
			`scores[cid] = scores.get(cid, 0) + 1 / (k + rank + 1)`

			`all_items = {x["id"]: x for x in fts_items + vector_items}`
			`sorted_ids = sorted(scores.keys(), key=lambda i: scores[i], reverse=True)`
			`return [all_items[i] for i in sorted_ids]`
Merge branch 'refactor/backend-architecture' into development 2026-03-18 17:18:23 +08:00

			`class HybridRetriever:`
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`"""Combine FTS, vector, and metadata filter into evidence bundle."""`

			`def __init__(`
			`self,`
			`db: AsyncSession,`
			`*,`
			`embedding_provider: EmbeddingProvider \| None = None,`
			`):`
			`self._db = db`
			`self._embedding = embedding_provider`

			`async def retrieve(self, user_id: str, query: str, *, top_k: int = 10) -> dict:`
			`"""`
			`Return evidence bundle:`
			`{relevant_chunks, relevant_summaries, relevant_facts, timeline_hints, relevant_stories}`
			`"""`
feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路数据库 - 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等后端 - 记忆 - 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数 - 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关 - repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新后端 - 对话 WS - 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确 - 助手多段回复持久化使用统一分隔符，与分段逻辑一致后端 - Agent - reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发后端 - 回忆录任务 - transcript ingest 记录 source_id；任务成功结? 2026-03-27 16:01:28 +08:00			`if not query.strip():`
			`return await retrieve_evidence_bundle_async(`
			`self._db,`
			`user_id,`
			`query,`
			`top_k=top_k,`
			`merged_chunk_dicts=[],`
			`)`

			`q = query.strip()`
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`fts_chunks = await search_chunks_fts(`
			`self._db, user_id=user_id, query=query, limit=top_k * 2`
			`)`

			`vector_chunks: list[dict] = []`
feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路数据库 - 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等后端 - 记忆 - 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数 - 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关 - repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新后端 - 对话 WS - 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确 - 助手多段回复持久化使用统一分隔符，与分段逻辑一致后端 - Agent - reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发后端 - 回忆录任务 - transcript ingest 记录 source_id；任务成功结? 2026-03-27 16:01:28 +08:00			`if self._embedding and q:`
			`q_emb = await self._embedding.embed_text(q)`
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`if q_emb:`
			`vector_chunks = await search_chunks_vector(`
			`self._db, user_id=user_id, query_embedding=q_emb, limit=top_k * 2`
			`)`

			`merged = _rrf_merge(fts_chunks, vector_chunks)[:top_k]`
feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路数据库 - 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等后端 - 记忆 - 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数 - 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关 - repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新后端 - 对话 WS - 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确 - 助手多段回复持久化使用统一分隔符，与分段逻辑一致后端 - Agent - reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发后端 - 回忆录任务 - transcript ingest 记录 source_id；任务成功结? 2026-03-27 16:01:28 +08:00			`merged_chunk_dicts = [`
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`{`
			`"id": c["id"],`
			`"content": c["content"],`
			`"chunk_index": c.get("chunk_index", 0),`
			`}`
			`for c in merged`
			`]`

feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路数据库 - 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等后端 - 记忆 - 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数 - 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关 - repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新后端 - 对话 WS - 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确 - 助手多段回复持久化使用统一分隔符，与分段逻辑一致后端 - Agent - reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发后端 - 回忆录任务 - transcript ingest 记录 source_id；任务成功结? 2026-03-27 16:01:28 +08:00			`return await retrieve_evidence_bundle_async(`
			`self._db,`
			`user_id,`
			`query,`
			`top_k=top_k,`
			`merged_chunk_dicts=merged_chunk_dicts,`
重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括： 1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。 2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。 3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。 4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。 5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。 6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。 7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。 2026-03-20 10:30:07 +08:00			`)`