api/app/agents/memoir/extraction_agent.py

"""
ExtractionAgent：从用户消息中提取 5-stage 状态与 slots。
对应现有逻辑：get_state_extraction_prompt + JSON 解析
"""

from __future__ import annotations

from dataclasses import dataclass
from typing import Any, Dict

from app.agents.memoir.prompts import get_state_extraction_prompt
from app.agents.memoir.schemas import StateExtractionOutput
from app.agents.stage_constants import normalize_chat_stage
from app.core.config import settings
from app.core.llm_call import LLMCallError, llm_json_call
from app.core.logging import get_logger

logger = get_logger(__name__)


@dataclass
class ExtractionResult:
    """状态提取结果"""

    detected_stage: str
    slots: Dict[str, str]


class ExtractionAgent:
    """从用户消息中提取 detected_stage 和 slots"""

    def extract(
        self,
        user_message: str,
        current_stage: str,
        stage_slots: Dict[str, Any],
        llm: Any,
        *,
        language: str = "zh",
    ) -> ExtractionResult:
        """
        提取结构化信息并判断阶段。
        llm 需支持 .invoke(prompt) 同步调用（Celery 任务内使用）。
        """
        detected_stage = current_stage
        extracted_slots: Dict[str, str] = {}

        if not llm:
            return ExtractionResult(
                detected_stage=detected_stage, slots=extracted_slots
            )

        try:
            prompt = get_state_extraction_prompt(
                user_message=user_message,
                current_stage=current_stage,
                stage_slots={
                    k: v.model_dump() if hasattr(v, "model_dump") else v
                    for k, v in (stage_slots or {}).items()
                },
                language=language,
            )
            parsed = llm_json_call(
                llm,
                prompt,
                StateExtractionOutput,
                max_tokens=settings.memoir_extraction_max_tokens,
                agent="ExtractionAgent.extract",
            )
            raw_slots = parsed.slots or {}
            extracted_slots = {
                k: v if isinstance(v, str) else str(v) for k, v in raw_slots.items()
            }
            if not extracted_slots:
                # 无实质 slot 时不推断阶段，避免元话语被标成任意 childhood 等（与服务端护栏一致）
                detected_stage = normalize_chat_stage(
                    current_stage, fallback=current_stage
                )
            else:
                raw_detected = parsed.detected_stage or current_stage
                detected_stage = normalize_chat_stage(
                    str(raw_detected) if raw_detected is not None else None,
                    fallback=current_stage,
                )
        except LLMCallError as e:
            logger.warning("ExtractionAgent LLM 解析失败: {}", e)

        return ExtractionResult(detected_stage=detected_stage, slots=extracted_slots)
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								"""
 								ExtractionAgent：从用户消息中提取 5-stage 状态与 slots。
 								对应现有逻辑：get_state_extraction_prompt + JSON 解析
 								"""
-												chore/ 删除无用文件

											
										
										
											2026-03-19 14:36:14 +08:00
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								from __future__ import annotations
 								from dataclasses import dataclass
 								from typing import Any, Dict
-												fix/various fixes

											
										
										
											2026-03-20 15:15:35 +08:00
+								from app.agents.memoir.prompts import get_state_extraction_prompt
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								from app.agents.memoir.schemas import StateExtractionOutput
-												feat(memoir): 回忆录分段两阶段管线（Phase1 分类 / Phase2 叙事）与配置、测试

											
										
										
											2026-04-02 16:37:14 +08:00
+								from app.agents.stage_constants import normalize_chat_stage
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								from app.core.config import settings
 								from app.core.llm_call import LLMCallError, llm_json_call
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								from app.core.logging import get_logger
 								logger = get_logger(__name__)
 								@dataclass
 								class ExtractionResult:
 								    """状态提取结果"""
-												chore/ 删除无用文件

											
										
										
											2026-03-19 14:36:14 +08:00
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								    detected_stage: str
 								    slots: Dict[str, str]
 								class ExtractionAgent:
 								    """从用户消息中提取 detected_stage 和 slots"""
 								    def extract(
 								        self,
 								        user_message: str,
 								        current_stage: str,
 								        stage_slots: Dict[str, Any],
 								        llm: Any,
-												feat(i18n): persist language preference and thread through chat, memoir, TTS

- Add users.language_preference (Alembic 0018, default zh); capture at signup/SMS
  only; expose on auth and profile APIs
- Lite English prompts for chat and memoir; localized stage labels and agent
  names (Life Echo / 岁月知己)
- Tencent TTS: language-aware synthesis, ModelType=1 for 501004, English chunking
- WebSocket pipeline: emit all AGENT_RESPONSE segments when TTS cancels; INFO logs
  for tts_this_turn and TTS decisions; on-demand TTS logging
- Expo: device language on auth, i18n tiers/agent name, [SPLIT] streaming UX fixes
- Tests for migration, prompts, pipeline, router tts_this_turn, reply segments

Co-authored-by: Cursor <cursoragent@cursor.com>

											
										
										
											2026-05-11 16:16:49 +08:00
+								        *,
 								        language: str = "zh",
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								    ) -> ExtractionResult:
 								        """
 								        提取结构化信息并判断阶段。
 								        llm 需支持 .invoke(prompt) 同步调用（Celery 任务内使用）。
 								        """
 								        detected_stage = current_stage
 								        extracted_slots: Dict[str, str] = {}
 								        if not llm:
-												chore/ 删除无用文件

											
										
										
											2026-03-19 14:36:14 +08:00
+								            return ExtractionResult(
 								                detected_stage=detected_stage, slots=extracted_slots
 								            )
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
 								        try:
 								            prompt = get_state_extraction_prompt(
 								                user_message=user_message,
 								                current_stage=current_stage,
 								                stage_slots={
 								                    k: v.model_dump() if hasattr(v, "model_dump") else v
 								                    for k, v in (stage_slots or {}).items()
 								                },
-												feat(i18n): persist language preference and thread through chat, memoir, TTS

- Add users.language_preference (Alembic 0018, default zh); capture at signup/SMS
  only; expose on auth and profile APIs
- Lite English prompts for chat and memoir; localized stage labels and agent
  names (Life Echo / 岁月知己)
- Tencent TTS: language-aware synthesis, ModelType=1 for 501004, English chunking
- WebSocket pipeline: emit all AGENT_RESPONSE segments when TTS cancels; INFO logs
  for tts_this_turn and TTS decisions; on-demand TTS logging
- Expo: device language on auth, i18n tiers/agent name, [SPLIT] streaming UX fixes
- Tests for migration, prompts, pipeline, router tts_this_turn, reply segments

Co-authored-by: Cursor <cursoragent@cursor.com>

											
										
										
											2026-05-11 16:16:49 +08:00
+								                language=language,
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								            )
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								            parsed = llm_json_call(
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								                llm,
 								                prompt,
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								                StateExtractionOutput,
 								                max_tokens=settings.memoir_extraction_max_tokens,
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								                agent="ExtractionAgent.extract",
 								            )
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								            raw_slots = parsed.slots or {}
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								            extracted_slots = {
-												chore/ 删除无用文件

											
										
										
											2026-03-19 14:36:14 +08:00
+								                k: v if isinstance(v, str) else str(v) for k, v in raw_slots.items()
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
+								            }
-												feat(api): 访谈路径轻量门控、Memoir Phase1 批处理与叙事/记忆管线加固

- 新增 utterance_substance：短时/应答/元话语可跳过记忆检索、阶段 LLM 与资料抽取 LLM；可配置
- 输入归一化：LLM 模式默认仅语音/ASR；配置项写入 .env.example
- Memoir Phase1：可选 batch LLM 一次性抽取+分类（失败回退逐段）；Extraction 空槽位时阶段与 current_stage 对齐，prompt 约束收紧
- 叙事与忠实度：narrative_safety、证据重叠/场合锚点、标题 slots 与履历短语 grounded；fidelity 解析失败 fail-open 可配置
- 章节管线：锁 TTL 上调、锁竞争 Celery 重试、Phase2 immediate singleflight 等；story_pipeline_sync / chapter_compose / memoir_tasks 联动
- Memory：compaction / repo / summarizer / evidence 小修；事实 FTS 未命中是否回退最近事实可配置
- 新增 memoir_pipeline_trace；补充 memoir_reliability 文档与多项回归/门控测试

											
										
										
											2026-04-03 10:12:59 +08:00
+								            if not extracted_slots:
 								                # 无实质 slot 时不推断阶段，避免元话语被标成任意 childhood 等（与服务端护栏一致）
 								                detected_stage = normalize_chat_stage(
 								                    current_stage, fallback=current_stage
 								                )
 								            else:
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								                raw_detected = parsed.detected_stage or current_stage
-												feat(api): 访谈路径轻量门控、Memoir Phase1 批处理与叙事/记忆管线加固

- 新增 utterance_substance：短时/应答/元话语可跳过记忆检索、阶段 LLM 与资料抽取 LLM；可配置
- 输入归一化：LLM 模式默认仅语音/ASR；配置项写入 .env.example
- Memoir Phase1：可选 batch LLM 一次性抽取+分类（失败回退逐段）；Extraction 空槽位时阶段与 current_stage 对齐，prompt 约束收紧
- 叙事与忠实度：narrative_safety、证据重叠/场合锚点、标题 slots 与履历短语 grounded；fidelity 解析失败 fail-open 可配置
- 章节管线：锁 TTL 上调、锁竞争 Celery 重试、Phase2 immediate singleflight 等；story_pipeline_sync / chapter_compose / memoir_tasks 联动
- Memory：compaction / repo / summarizer / evidence 小修；事实 FTS 未命中是否回退最近事实可配置
- 新增 memoir_pipeline_trace；补充 memoir_reliability 文档与多项回归/门控测试

											
										
										
											2026-04-03 10:12:59 +08:00
+								                detected_stage = normalize_chat_stage(
 								                    str(raw_detected) if raw_detected is not None else None,
 								                    fallback=current_stage,
 								                )
-												feat(api): 统一 LLM JSON 调用层 llm_json_call，按域 Schema 迁移 chat/memoir agents

											
										
										
											2026-04-03 13:34:27 +08:00
+								        except LLMCallError as e:
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								            logger.warning("ExtractionAgent LLM 解析失败: {}", e)
-												feat: 生成回忆录agent结构封装

											
										
										
											2026-03-19 10:38:11 +08:00
 								        return ExtractionResult(detected_stage=detected_stage, slots=extracted_slots)