feat(api): 回忆录管线简化、路由延迟池与相关加固

- Phase1/2：移除 MemoirOrchestrator.run 与 process_memoir_segments 别名；文档改为 process_memoir_phase1。 - 槽位校验集中到 stage_constants（filter_stage_slots），批处理与顺序路径及 state_service 写库一致。 - StoryRoute：no_llm/parse_error/invalid_target 保守 new_story；短篇护栏不覆盖这些 fallback。 - Phase2 低置信单路径可选延迟（StoryPipelineResult.deferred）：不写 Chapter/Story，Segment 记录 defer 元数据，冷却内不重复消费；上限后停自动重试，Phase1 同类目新段唤醒池内段。 - Alembic 0017：segments 表 narrative_defer_* 列。 - ProfileAgent：经 LlmGateway/注入 Provider 统一聊天与 JSON，新增测试。 - ImagePromptOrchestrator：LLM 初始化失败可依配置降级或硬失败；补充策略测试。 - 配套单测与 README/本地开发文档表述更新。 Co-authored-by: Cursor <cursoragent@cursor.com>
2026-05-06 13:18:02 +08:00
parent 3234396254
commit 59d4b19d7d
24 changed files with 1182 additions and 183 deletions
--- a/api/app/agents/chat/profile_agent.py
+++ b/api/app/agents/chat/profile_agent.py
@@ -22,7 +22,6 @@ from app.agents.chat.reply_limits import (
 from app.agents.chat.schemas import ProfileExtractionOutput
 from app.core.agent_logging import agent_span, log_agent_payload, log_agent_summary
 from app.core.config import settings
-from app.core.dependencies import get_llm_provider
 from app.core.llm_call import allm_json_call
 from app.core.llm_gateway import LlmGateway, LlmUseCase
 from app.core.logging import get_logger
@@ -31,11 +30,53 @@ from app.ports.llm import LLMProvider
 logger = get_logger(__name__)


-def _get_langchain_llm():
-    try:
-        return LlmGateway().langchain_llm_for(LlmUseCase("chat.profile"))
-    except Exception:
-        return None
+class _ProviderBackedProfileGateway:
+    def __init__(self, provider: LLMProvider) -> None:
+        self._provider = provider
+
+    async def chat_text(
+        self,
+        messages: list[dict],
+        *,
+        use_case: LlmUseCase | None = None,
+        temperature: float | None = None,
+        model: str | None = None,
+        max_tokens: int | None = None,
+    ) -> str:
+        resolved_temperature = temperature
+        if resolved_temperature is None:
+            resolved_temperature = (
+                use_case.temperature
+                if use_case and use_case.temperature is not None
+                else 0.7
+            )
+        return await self._provider.complete(
+            messages,
+            temperature=resolved_temperature,
+            model=model if model is not None else (use_case.model if use_case else None),
+            max_tokens=(
+                max_tokens
+                if max_tokens is not None
+                else (use_case.max_tokens if use_case else None)
+            ),
+        )
+
+    async def json_object(
+        self,
+        prompt: str,
+        schema: type[ProfileExtractionOutput],
+        *,
+        use_case: LlmUseCase,
+        fallback_factory: Any = None,
+    ) -> ProfileExtractionOutput:
+        return await allm_json_call(
+            getattr(self._provider, "langchain_llm", None),
+            prompt,
+            schema,
+            max_tokens=use_case.max_tokens or 1024,
+            agent=use_case.name,
+            fallback_factory=fallback_factory,
+        )


 def _langchain_messages_to_port(messages: List[Any]) -> list[dict]:
@@ -66,14 +107,17 @@ def _message_contents_char_count(messages: List[Any]) -> int:
 class ProfileAgent:
    """用户资料收集 Specialist Agent"""

-    def __init__(self, llm_provider: LLMProvider | None = None):
-        self._llm_provider = llm_provider
-        self.llm = _get_langchain_llm()
-
-    def _provider(self) -> LLMProvider:
-        if self._llm_provider is not None:
-            return self._llm_provider
-        return get_llm_provider()
+    def __init__(
+        self,
+        llm_provider: LLMProvider | None = None,
+        llm_gateway: Any | None = None,
+    ) -> None:
+        if llm_gateway is not None:
+            self._llm_gateway = llm_gateway
+        elif llm_provider is not None:
+            self._llm_gateway = _ProviderBackedProfileGateway(llm_provider)
+        else:
+            self._llm_gateway = LlmGateway()

    async def _invoke_chat(
        self,
@@ -88,8 +132,9 @@ class ProfileAgent:
        with agent_span(
            logger, f"{agent_name}.llm", conversation_id=conversation_id or ""
        ):
-            response_text = await self._provider().complete(
+            response_text = await self._llm_gateway.chat_text(
                port_messages,
+                use_case=LlmUseCase("chat.profile", max_tokens=max_tokens),
                max_tokens=max_tokens,
            )
        logger.info(
@@ -130,7 +175,7 @@ class ProfileAgent:
        conversation_id: Optional[str] = None,
    ) -> Dict[str, Any]:
        """从用户消息中提取资料字段，不持久化"""
-        if not self.llm or not missing_fields:
+        if not missing_fields:
            return {}
        recent_dialogue = ""
        if conversation_id:
@@ -151,12 +196,13 @@ class ProfileAgent:
            prompt = get_profile_extraction_prompt(
                user_message, missing_fields, recent_dialogue=recent_dialogue or None
            )
-            parsed = await allm_json_call(
-                self.llm,
+            parsed = await self._llm_gateway.json_object(
                prompt,
                ProfileExtractionOutput,
-                max_tokens=settings.chat_profile_extract_max_tokens,
-                agent="ProfileAgent.extract_profile_from_message",
+                use_case=LlmUseCase(
+                    "ProfileAgent.extract_profile_from_message",
+                    max_tokens=settings.chat_profile_extract_max_tokens,
+                ),
                fallback_factory=lambda: ProfileExtractionOutput(),
            )
            result = {}
@@ -197,8 +243,6 @@ class ProfileAgent:
        interview_stage_hint: str = "",
    ) -> List[str]:
        """生成资料追问回复，不持久化（由 Orchestrator 负责）"""
-        if not self.llm:
-            return ["谢谢！还能告诉我更多吗？"]
        try:
            prompt = get_profile_followup_prompt(
                missing_fields,
@@ -260,8 +304,6 @@ class ProfileAgent:
        nickname: str = "",
    ) -> List[str]:
        """生成资料收集开场白，不持久化（由 Orchestrator 负责）"""
-        if not self.llm:
-            return ["你好！在开始之前，能告诉我你是哪一年出生的吗？"]
        try:
            prompt = get_profile_greeting_prompt(missing_fields, nickname)
            hw = await get_history_with_window(
--- a/api/app/agents/image_prompt/orchestrator.py
+++ b/api/app/agents/image_prompt/orchestrator.py
@@ -9,8 +9,12 @@ from __future__ import annotations
 from typing import Any, Optional

 from app.agents.image_prompt.prompt_agent import PromptGenerationAgent
+from app.core.config import settings
+from app.core.logging import get_logger
 from app.features.memoir.memoir_images.settings import MemoirImageSettings

+logger = get_logger(__name__)
+

 class ImagePromptOrchestrator:
    """
@@ -76,5 +80,15 @@ def get_image_prompt_orchestrator() -> ImagePromptOrchestrator:
    """Celery / 后台任务入口：统一装配 LLM 与 MemoirImageSettings。"""
    from app.core.llm_gateway import LlmGateway, LlmUseCase

-    llm = LlmGateway().langchain_llm_for(LlmUseCase("image_prompt"))
-    return ImagePromptOrchestrator(llm=llm, settings=MemoirImageSettings.from_env())
+    image_settings = MemoirImageSettings.from_env()
+    try:
+        llm = LlmGateway().langchain_llm_for(LlmUseCase("image_prompt"))
+    except Exception as e:
+        if settings.image_prompt_fallback_disabled:
+            raise
+        logger.warning(
+            "ImagePromptOrchestrator LLM 初始化失败，使用确定性 fallback: {}",
+            e,
+        )
+        llm = None
+    return ImagePromptOrchestrator(llm=llm, settings=image_settings)
--- a/api/app/agents/memoir/batch_phase1_prep.py
+++ b/api/app/agents/memoir/batch_phase1_prep.py
@@ -10,7 +10,6 @@ from typing import Any, Callable, Dict, List

 from app.agents.memoir.prompts import get_batch_memoir_phase1_prep_prompt
 from app.agents.memoir.schemas import BatchPhase1LLMOutput
-from app.agents.stage_constants import STAGE_SLOT_KEYS
 from app.agents.state_schema import MemoirStateSchema
 from app.core.config import settings
 from app.core.llm_call import LLMCallError, llm_json_call
@@ -19,11 +18,6 @@ from app.features.conversation.models import Segment

 logger = get_logger(__name__)

-STAGE_ALLOWED_SLOTS: Dict[str, frozenset[str]] = {
-    k: frozenset(v) for k, v in STAGE_SLOT_KEYS.items()
-}
-
-
 def _slots_snapshot(state: MemoirStateSchema) -> dict:
    snap: dict = {}
    for stage, buckets in (state.slots or {}).items():
--- a/api/app/agents/memoir/orchestrator.py
+++ b/api/app/agents/memoir/orchestrator.py
@@ -8,12 +8,9 @@ from __future__ import annotations

 import time
 from dataclasses import dataclass
-from typing import Any, Callable, Dict, List, Optional, Set, Tuple
+from typing import Any, Callable, Dict, List, Optional, Set

-from app.agents.memoir.batch_phase1_prep import (
-    STAGE_ALLOWED_SLOTS,
-    run_batch_phase1_prep_chunked,
-)
+from app.agents.memoir.batch_phase1_prep import run_batch_phase1_prep_chunked
 from app.agents.memoir.classification_agent import (
    ClassificationAgent,
    _looks_like_fragment_only,
@@ -22,7 +19,11 @@ from app.agents.memoir.classification_agent import (
    _detect_stage as detect_stage_from_keywords,
 )
 from app.agents.memoir.extraction_agent import ExtractionAgent, ExtractionResult
-from app.agents.stage_constants import normalize_chapter_category, normalize_chat_stage
+from app.agents.stage_constants import (
+    filter_stage_slots,
+    normalize_chapter_category,
+    normalize_chat_stage,
+)
 from app.agents.state_schema import MemoirStateSchema
 from app.core.agent_logging import agent_span, agent_summary_enabled, log_agent_detail
 from app.core.config import settings
@@ -92,7 +93,7 @@ class MemoirOrchestrator:
        )
        if use_batch:
            try:
-                result = self._prepare_batches_via_batch_llm(
+                prepared_batch = self._prepare_batches_via_batch_llm(
                    segments=segments,
                    state=state,
                    classify_extract_llm=classify_extract_llm,
@@ -104,7 +105,7 @@ class MemoirOrchestrator:
                    "msg=Phase1 批处理 LLM 路径已使用",
                    len(segments),
                )
-                return result
+                return prepared_batch
            except Exception as e:
                logger.warning(
                    "event=phase1_batch_path_fallback segment_count={} exc={} "
@@ -132,8 +133,12 @@ class MemoirOrchestrator:
                    stage_slots=stage_slots_raw,
                    llm=classify_extract_llm,
                )
-            detected_stage = result.detected_stage
-            for slot_name, snippet in result.slots.items():
+            fb = state.current_stage or "childhood"
+            detected_stage = normalize_chat_stage(result.detected_stage, fb)
+            result_slots = filter_stage_slots(detected_stage, result.slots, fb)
+            if not result_slots:
+                detected_stage = normalize_chat_stage(fb, fb)
+            for slot_name, snippet in result_slots.items():
                state = update_slot(detected_stage, slot_name, snippet, [segment.id])

            with agent_span(
@@ -148,7 +153,7 @@ class MemoirOrchestrator:
                    segment_id=segment.id,
                )
            chapter_category = classify_result.category
-            if (not result.slots) and classify_result.llm_said_none:
+            if (not result_slots) and classify_result.llm_said_none:
                segment_skip_story_ids.add(str(segment.id))
            segment_chapter_category[str(segment.id)] = chapter_category

@@ -166,7 +171,7 @@ class MemoirOrchestrator:
                logger,
                "MemoirOrchestrator.segment_done segment_id={} slots={}",
                segment.id,
-                list((result.slots or {}).keys()),
+                list(result_slots.keys()),
            )
            category_to_segments.setdefault(chapter_category, []).append(segment)

@@ -211,8 +216,7 @@ class MemoirOrchestrator:
            else:
                detected_stage = normalize_chat_stage(row.detected_stage, fb)

-            allowed = STAGE_ALLOWED_SLOTS.get(detected_stage, frozenset())
-            result_slots = {k: v for k, v in result_slots.items() if k in allowed}
+            result_slots = filter_stage_slots(detected_stage, result_slots, fb)
            if not result_slots:
                detected_stage = normalize_chat_stage(fb, fb)

@@ -269,72 +273,3 @@ class MemoirOrchestrator:
            segment_skip_story_ids=segment_skip_story_ids,
            segment_chapter_category=segment_chapter_category,
        )
-
-    def run(
-        self,
-        *,
-        segments: List[Segment],
-        llm: Any,
-        user_profile: str = "",
-        user_birth_year: Any = None,
-        get_or_create_state: Callable[[], MemoirStateSchema],
-        update_slot: Callable[[str, str, str, List[str]], MemoirStateSchema],
-        acquire_lock: Callable[[str], bool],
-        release_lock: Callable[[str], None],
-        process_category: Callable[
-            [
-                str,
-                List[Segment],
-                MemoirStateSchema,
-                str,
-                Any,
-                Any,
-            ],
-            Tuple[Any, bool],
-        ],
-        raise_retry: Callable[[], None],
-        llm_fast: Any | None = None,
-    ) -> Tuple[Set[str], int]:
-        """
-        执行回忆录流水线。
-        process_category(category, segments, state, user_profile, user_birth_year, llm)
-        返回 (chapter, has_images_to_generate)。
-        返回 (chapters_to_enqueue, processed_count)。
-        raise_retry 用于锁竞争时抛出 Celery retry。
-        """
-        prepared = self.prepare_batches(
-            segments=segments,
-            llm=llm,
-            llm_fast=llm_fast,
-            get_or_create_state=get_or_create_state,
-            update_slot=update_slot,
-            on_phase1_chunk=None,
-        )
-        state = prepared.state
-        chapters_to_enqueue: Set[str] = set()
-        category_to_segments = prepared.category_to_segments
-
-        # 按 category 调用 process_category：叙事生成、持久化、封面入队标记
-        for chapter_category, category_segments in category_to_segments.items():
-            if not acquire_lock(chapter_category):
-                logger.warning(
-                    "章节锁竞争: category={}, 延迟重试",
-                    chapter_category,
-                )
-                raise_retry()
-
-            try:
-                chapter, has_images = process_category(
-                    chapter_category,
-                    category_segments,
-                    state,
-                    user_profile,
-                    user_birth_year,
-                    llm,
-                )
-                if chapter and has_images:
-                    chapters_to_enqueue.add(chapter.id)
-            finally:
-                release_lock(chapter_category)
-
-        return chapters_to_enqueue, len(segments)
--- a/api/app/agents/memoir/story_route_agent.py
+++ b/api/app/agents/memoir/story_route_agent.py
@@ -31,6 +31,9 @@ PLAN_BATCH_MAX_SEGMENTS = 48
 # 童年 / 求学 / 家庭：模型与后处理均倾向「少拆分、优先续写」
 APPEND_FIRST_CHAPTER_CATEGORIES = frozenset({"childhood", "education", "family"})

+# These route outcomes are conservative fail-safes, not semantic append matches.
+FALLBACK_NEW_STORY_REASONS = frozenset({"no_llm", "parse_error", "invalid_target"})
+

 def default_append_target_story_id(
    candidate_stories: list[Story],
@@ -220,13 +223,6 @@ class StoryRouteAgent:
        story_meta: dict[str, dict[str, int]] | None = None,
    ) -> StoryRouteDecision:
        if not llm:
-            fb = default_append_target_story_id(candidate_stories, story_meta, settings)
-            if fb and fb in valid_story_ids:
-                return StoryRouteDecision(
-                    decision="append_story",
-                    target_story_id=fb,
-                    reason="no_llm_default_append",
-                )
            return StoryRouteDecision(
                decision="new_story",
                new_story_title=None,
@@ -241,13 +237,6 @@ class StoryRouteAgent:
        )

        def _decide_fallback() -> StoryRouteDecision:
-            fb = default_append_target_story_id(candidate_stories, story_meta, settings)
-            if fb and fb in valid_story_ids:
-                return StoryRouteDecision(
-                    decision="append_story",
-                    target_story_id=fb,
-                    reason="parse_error_default_append",
-                )
            return StoryRouteDecision(
                decision="new_story",
                new_story_title=None,
@@ -266,22 +255,8 @@ class StoryRouteAgent:
        if decision.decision == "append_story":
            tid = decision.target_story_id
            if not tid or tid not in valid_story_ids:
-                fb = default_append_target_story_id(
-                    candidate_stories, story_meta, settings
-                )
-                if fb and fb in valid_story_ids:
-                    logger.info(
-                        "StoryRoute append 无效 target_story_id={}，回退默认 append {}",
-                        tid,
-                        fb,
-                    )
-                    return StoryRouteDecision(
-                        decision="append_story",
-                        target_story_id=fb,
-                        reason="invalid_target_default_append",
-                    )
                logger.warning(
-                    "StoryRoute append 无效 target_story_id={}，且无可用默认目标，回退 new_story",
+                    "StoryRoute append 无效 target_story_id={}，回退 new_story",
                    tid,
                )
                return StoryRouteDecision(
--- a/api/app/agents/stage_constants.py
+++ b/api/app/agents/stage_constants.py
@@ -68,6 +68,35 @@ STAGE_SLOT_KEYS: dict[str, tuple[str, ...]] = {
    "belief": ("value", "regret", "pride", "lesson"),
 }

+STAGE_ALLOWED_SLOTS: dict[str, frozenset[str]] = {
+    k: frozenset(v) for k, v in STAGE_SLOT_KEYS.items()
+}
+
+
+def allowed_slot_names_for_stage(
+    stage: str | None,
+    fallback: str = "childhood",
+) -> frozenset[str]:
+    stage_norm = normalize_chat_stage(stage, fallback=fallback)
+    return STAGE_ALLOWED_SLOTS.get(stage_norm, frozenset())
+
+
+def is_valid_stage_slot(
+    stage: str | None,
+    slot_name: str,
+    fallback: str = "childhood",
+) -> bool:
+    return slot_name in allowed_slot_names_for_stage(stage, fallback=fallback)
+
+
+def filter_stage_slots(
+    stage: str | None,
+    slots: dict[str, str],
+    fallback: str = "childhood",
+) -> dict[str, str]:
+    allowed = allowed_slot_names_for_stage(stage, fallback=fallback)
+    return {k: v for k, v in (slots or {}).items() if k in allowed}
+
 # 人生阶段 / 章节类目的年龄参照（仅用于 prompt 时间提示；非业务校验）
 STAGE_ERA_HINTS: dict[str, tuple[int, int]] = {
    "childhood": (0, 12),
--- a/api/app/agents/style_profiles.py
+++ b/api/app/agents/style_profiles.py
@@ -22,7 +22,6 @@ from __future__ import annotations
 from dataclasses import dataclass, field
 from typing import List, Tuple

-
 # =============================================================================
 # 共享：Memoir 评测维度单一事实源
 # =============================================================================