refactor: 进一步重构agents目录结构符合多agent架构

2026-03-19 10:54:48 +08:00
parent c21cda3e78
commit 67fb5d2cb6
23 changed files with 98 additions and 167 deletions
--- a/api/app/agents/memoir/classification_agent.py
+++ b/api/app/agents/memoir/classification_agent.py
@@ -8,7 +8,7 @@ from typing import Any, Optional

 from app.core.logging import get_logger

-from app.agents.prompts.memory_prompts import (
+from app.agents.memoir.prompts import (
    CHAPTER_CATEGORIES,
    get_chapter_classification_prompt,
 )
--- a/api/app/agents/memoir/extraction_agent.py
+++ b/api/app/agents/memoir/extraction_agent.py
@@ -11,7 +11,7 @@ from typing import Any, Dict
 from app.core.logging import get_logger
 from app.features.memoir.memoir_images.json_payload import extract_json_payload

-from app.agents.prompts.memory_prompts import get_state_extraction_prompt
+from app.agents.memoir.prompts import get_state_extraction_prompt

 logger = get_logger(__name__)

--- a/api/app/agents/memoir/memory_agent.py
+++ b/api/app/agents/memoir/memory_agent.py
@@ -8,12 +8,12 @@ from typing import Dict, List, Optional
 from app.core.dependencies import get_llm_provider
 from app.core.logging import get_logger

-from app.agents.prompts import (
+from app.agents.memoir.prompts import (
+    CHAPTER_CATEGORIES,
+    STAGE_TO_ORDER,
    get_chapter_classification_prompt,
    get_text_rewrite_prompt,
    inject_image_placeholder_template,
-    CHAPTER_CATEGORIES,
-    STAGE_TO_ORDER,
 )

 logger = get_logger(__name__)
--- a/api/app/agents/memoir/narrative_agent.py
+++ b/api/app/agents/memoir/narrative_agent.py
@@ -8,7 +8,7 @@ from typing import Any, Dict, Optional

 from app.core.logging import get_logger

-from app.agents.prompts.memory_prompts import (
+from app.agents.memoir.prompts import (
    get_creative_title_prompt,
    get_narrative_prompt,
 )
--- a/api/app/agents/memoir/placeholder_agent.py
+++ b/api/app/agents/memoir/placeholder_agent.py
@@ -3,7 +3,7 @@ PlaceholderInjectAgent：对 narrative 做占位符模板注入。
 对应现有逻辑：inject_image_placeholder_template
 纯函数式，无 LLM 调用。
 """
-from app.agents.prompts.memory_prompts import inject_image_placeholder_template
+from app.agents.memoir.prompts import inject_image_placeholder_template


 def inject_placeholders(content: str) -> str:
--- a/api/app/agents/memoir/processor.py
+++ b/api/app/agents/memoir/processor.py
@@ -13,7 +13,7 @@ from app.core.logging import get_logger
 from app.core.task_tracker import task_tracker

 from app.agents.state_schema import MemoirStateSchema
-from app.agents.prompts.memory_prompts import (
+from app.agents.memoir.prompts import (
    get_creative_title_prompt,
    get_narrative_prompt,
    get_state_extraction_prompt,
--- a/api/app/agents/memoir/prompts.py
+++ b/api/app/agents/memoir/prompts.py
@@ -0,0 +1,351 @@
+"""
+回忆录整理 Agent 提示词模板
+"""
+import json
+import re
+from typing import Optional
+
+CHAPTER_CATEGORIES = {
+    "childhood": "童年与成长背景",
+    "education": "教育经历与青年时期",
+    "career_early": "崭露头角",
+    "career_achievement": "主要成就与巅峰时刻",
+    "career_challenge": "挫折、挑战与重大转折",
+    "family": "家庭与情感",
+    "beliefs": "信念与价值观",
+    "summary": "人生总结",
+}
+
+CHAPTER_ORDER = [
+    "childhood",
+    "education",
+    "career_early",
+    "career_achievement",
+    "career_challenge",
+    "family",
+    "beliefs",
+    "summary",
+]
+
+STAGE_TO_ORDER = {
+    "childhood": 0,
+    "education": 1,
+    "career": 2,
+    "career_early": 2,
+    "career_achievement": 3,
+    "career_challenge": 4,
+    "family": 5,
+    "belief": 6,
+    "beliefs": 6,
+    "summary": 7,
+}
+
+IMAGE_PLACEHOLDER_TEMPLATE = (
+    "温暖怀旧风格，年代感复古色调，柔和光影，朴素温馨氛围，安静治愈，低饱和度，"
+    "质感柔和细腻，简约构图，充满岁月沉淀感与故事感，高清唯美插画封面，不要包含文字，"
+    "要适合老年人审美，画面要真实可信、让老年人产生共鸣与代入感，"
+    "场景环境、建筑风格、服饰器物必须严格符合所述时代背景和地域特色，"
+    "有朦胧怀旧的年代感。"
+)
+
+_IMAGE_PLACEHOLDER_ANY_BRACES_RE = re.compile(
+    r"(\{\{)+IMAGE:\s*([^}]+)(\}\})+",
+    re.DOTALL,
+)
+
+
+def inject_image_placeholder_template(content: str) -> str:
+    """
+    入库前对章节正文做占位符处理：用正则匹配所有图片占位符位置，拼上固定模板。
+    支持任意层数花括号，输出统一为四层大括号 + 固定模板 + 描述。
+    """
+    if not content or not content.strip():
+        return content
+
+    def replace_one(match: re.Match) -> str:
+        inner = (match.group(2) or "").strip()
+        if not inner:
+            return match.group(0)
+        if inner.startswith(IMAGE_PLACEHOLDER_TEMPLATE):
+            desc = inner[len(IMAGE_PLACEHOLDER_TEMPLATE):].lstrip("。").strip()
+            return "{{{{IMAGE:" + IMAGE_PLACEHOLDER_TEMPLATE + ("。" + desc if desc else "") + "}}}}"
+        return "{{{{IMAGE:" + IMAGE_PLACEHOLDER_TEMPLATE + "。" + inner + "}}}}"
+
+    content = _IMAGE_PLACEHOLDER_ANY_BRACES_RE.sub(replace_one, content)
+    return content
+
+
+def get_system_prompt() -> str:
+    """获取整理 Agent 的系统提示词"""
+    return """你是一位专业的传记作家和文字编辑，擅长将口语化的对话内容整理成优雅的书面语回忆录章节。
+
+你的任务：
+1. 接收对话段落文本（口语化，可能来自语音转写）
+2. **先提炼对话中与人生经历相关的核心内容**，过滤掉无关信息
+3. 识别内容主题，归类到对应章节（童年/教育/事业/家庭/信念/总结）
+4. 将口语化表达改写为书面语，保持原意和情感
+5. 生成合适的章节标题和段落结构
+6. 提取关键信息，形成连贯的叙述
+7. 建议插图位置（在描述场景、人物、地点的地方）
+
+## 内容筛选原则（最重要）
+对话中往往夹杂大量与回忆录无关的噪音，你必须严格筛选，只保留有价值的内容：
+
+应该保留的内容：
+- 具体的人生事件、经历、故事
+- 提到的人物及其关系（家人、朋友、同事、恩师等）
+- 地点、时间、场景描写
+- 用户的情感表达、内心感受
+- 人生感悟、价值观、信念
+- 具体的细节（食物、声音、画面等）
+
+应该过滤掉的内容：
+- 语气词、填充词（嗯、啊、那个、就是说、对对对、然后呢等）
+- 对话中的寒暄、问候（你好、谢谢、好的等）
+- 用户与AI助手之间的交互指令（你帮我、我想问、你说得对等）
+- 重复、冗余的表述（取核心含义即可）
+- 与个人经历完全无关的闲聊内容
+
+## 改写原则
+- 保持用户的真实情感
+- 使用优雅但不失亲切的书面语，不要直接引用对话原话
+- 适当添加过渡句，使段落连贯
+- 保留生动的细节，但将口语表达改写为书面叙述
+- 去除口语中的填充词和无意义重复
+- 保持时间顺序和逻辑清晰
+
+## 章节分类规则
+- 童年相关 → "童年与成长背景"
+- 学校、老师、同学 → "教育经历与青年时期"
+- 工作、职业、成就 → "主要成就与巅峰时刻" 或 "崭露头角"
+- 困难、挫折 → "挫折、挑战与重大转折"
+- 伴侣、孩子、家庭生活 → "家庭与情感"
+- 价值观、信念、座右铭 → "信念与价值观"
+- 总结、感悟、展望 → "人生总结"
+"""
+
+
+def get_chapter_classification_prompt(segments_text: str) -> str:
+    """获取章节分类的提示词"""
+    return f"""{get_system_prompt()}
+
+请分析以下对话内容，**忽略其中的语气词、寒暄和无关对话**，只关注涉及人生经历的实质内容，判断应该归类到哪个章节类别：
+- childhood: 童年与成长背景
+- education: 教育经历与青年时期
+- career_early: 崭露头角（早期事业）
+- career_achievement: 主要成就与巅峰时刻
+- career_challenge: 挫折、挑战与重大转折
+- family: 家庭与情感
+- beliefs: 信念与价值观
+- summary: 人生总结
+
+对话内容：
+{segments_text}
+
+请只返回章节类别（如：childhood），不要返回其他内容。
+如果对话内容中没有任何与人生经历相关的实质内容，返回 none。"""
+
+
+def get_text_rewrite_prompt(segments_text: str, chapter_category: str, existing_content: str = "") -> str:
+    """获取文本改写的提示词"""
+    chapter_name = CHAPTER_CATEGORIES.get(chapter_category, chapter_category)
+    existing_section = f"\n\n已有章节内容：\n{existing_content}" if existing_content else ""
+    return f"""{get_system_prompt()}
+
+请将以下口语化的对话内容改写为书面语，归类到"{chapter_name}"章节。
+
+对话内容：
+{segments_text}
+{existing_section}
+
+请按照以下格式返回 JSON：
+{{
+    "title": "章节标题",
+    "content": "改写后的书面语内容（包含图片占位符）",
+    "summary": "章节摘要（50字以内）"
+}}
+
+要求：
+1. 标题要简洁有力，能概括章节主题
+2. 内容要流畅自然，保持原意和情感
+3. 如果已有章节内容，请将新内容与已有内容自然融合
+4. 在内容中适当位置插入图片占位符
+
+## 图片占位符格式（必须严格遵守）
+- **唯一合法格式**：开头恰好四个左花括号、结尾恰好四个右花括号，中间为 IMAGE:具体描述。即：{{{{IMAGE:具体的图片描述}}}}
+- 禁止使用两层 {{ }}、六层 {{{{{{ }}}}}} 或任意其它层数，否则会在手机端显示异常。
+- 占位符单独占一行，描述要具体、有画面感。系统会在入库前自动拼上统一风格模板，你只需写场景描述即可。
+
+正确示例（仅此格式）：
+{{{{IMAGE:南方小镇的青石板路，两旁是白墙黑瓦的老房子}}}}
+{{{{IMAGE:奶奶坐在院子里的藤椅上，手里摇着蒲扇}}}}"""
+
+
+def get_state_extraction_prompt(user_message: str, current_stage: str, stage_slots: dict) -> str:
+    """抽取结构化信息并判断阶段"""
+    slot_keys = list(stage_slots.keys())
+    all_stage_slots = {
+        "childhood": ["place", "people", "daily_life", "emotion", "turning_event"],
+        "education": ["school", "city", "motivation", "challenge", "change"],
+        "career": ["job", "environment", "decision", "pressure", "growth"],
+        "family": ["relationship", "conflict", "support", "responsibility", "change"],
+        "belief": ["value", "regret", "pride", "lesson"],
+    }
+
+    return f"""{get_system_prompt()}
+
+你需要从用户话语中**先提炼与人生经历相关的核心内容**，然后抽取结构化信息，并判断用户实际在谈论哪个人生阶段。
+
+系统当前跟踪的阶段：{current_stage}
+该阶段可填 slots：{slot_keys}
+
+所有阶段及其 slots 参考：
+{json.dumps(all_stage_slots, ensure_ascii=False, indent=2)}
+
+用户话语：
+{user_message}
+
+请只返回 JSON，格式如下：
+{{
+  "detected_stage": "childhood|education|career|family|belief",
+  "slots": {{
+    "slot_key": "snippet"
+  }},
+  "emotion": "neutral|warm|low|highlight",
+  "is_new_chapter": true
+}}
+
+要求：
+1. **先忽略话语中的语气词、填充词、寒暄、与AI的交互指令等无关内容**，只关注涉及人生经历的实质信息
+2. **detected_stage 必须根据用户话语的实际内容判断**，不要默认沿用系统当前阶段。用户可能在聊不同阶段的事情
+3. slots 的 key 必须属于 detected_stage 对应的 slot 列表
+4. slots 只填写确实提到的、与人生经历相关的实质内容
+5. **snippet 应是提炼后的核心信息**，去除语气词和冗余表达，50 字以内
+6. 如果用户话语中没有任何与人生经历相关的实质内容（如纯粹的寒暄、指令、语气词），slots 为空对象
+"""
+
+
+def _build_age_hint(stage: str, birth_year: Optional[int] = None) -> str:
+    """根据人生阶段和出生年份推算大致年龄区间"""
+    if not birth_year:
+        return ""
+    stage_age_ranges = {
+        "childhood": (0, 12),
+        "education": (6, 22),
+        "career": (18, 60),
+        "career_early": (18, 30),
+        "career_achievement": (25, 55),
+        "career_challenge": (20, 55),
+        "family": (20, 60),
+        "belief": (30, 70),
+        "beliefs": (30, 70),
+        "summary": (50, 80),
+    }
+    age_range = stage_age_ranges.get(stage)
+    if not age_range:
+        return ""
+    year_start = birth_year + age_range[0]
+    year_end = birth_year + age_range[1]
+    return f"大约 {year_start}-{year_end} 年（{age_range[0]}-{age_range[1]} 岁）"
+
+
+def get_creative_title_prompt(
+    stage: str,
+    emotion: str,
+    slots: dict,
+    user_profile: str = "",
+    birth_year: Optional[int] = None,
+) -> str:
+    """生成有创意的章节标题，包含年龄/时间信息"""
+    age_hint = _build_age_hint(stage, birth_year)
+    profile_section = f"\n用户基本信息：\n{user_profile}" if user_profile else ""
+    time_section = f"\n时间参考：{age_hint}" if age_hint else ""
+
+    return f"""{get_system_prompt()}
+
+请根据阶段和情绪生成 1 个有创意的章节标题。
+阶段：{stage}
+情绪：{emotion}
+可用信息：{slots}{profile_section}{time_section}
+
+要求：
+1. 标题格式：「时间标注 · 标题正文」
+   - 时间标注用年龄或年代表示，如"6-12岁"、"1980年代"、"二十出头"
+   - 标题正文 12-18 字以内
+2. 情绪 + 人生阶段 + 意象
+3. 示例风格：
+   - 《6-12岁 · 那条巷子尽头的蝉鸣》
+   - 《18岁 · 第一次离开家的夏天》
+   - 《25-35岁 · 在陌生城市站稳脚跟》
+   - 《四十不惑 · 慢下来，人生开始发声》
+   - 《1990年代 · 不是所有选择都被理解》
+
+只输出标题文字，不要加引号或书名号。
+"""
+
+
+def get_narrative_prompt(
+    stage: str,
+    slots: dict,
+    new_content: str,
+    existing_content: str = "",
+    user_profile: str = "",
+    birth_year: Optional[int] = None,
+) -> str:
+    """将新对话改写为叙述（只输出新内容的改写，不重复已有内容）"""
+    context_tail = ""
+    if existing_content:
+        context_tail = existing_content[-300:] if len(existing_content) > 300 else existing_content
+    context_section = f"\n\n【衔接上下文（已有内容的末尾，仅供参考衔接，不要重复）】：\n{context_tail}" if context_tail else ""
+    profile_section = f"\n\n用户基本信息：\n{user_profile}" if user_profile else ""
+    age_hint = _build_age_hint(stage, birth_year)
+    time_section = f"\n时间参考：{age_hint}" if age_hint else ""
+
+    return f"""{get_system_prompt()}
+
+请将以下新的对话内容改写为第一人称文学叙述。
+阶段：{stage}
+可用信息：{slots}{profile_section}{time_section}
+
+新的对话内容：
+{new_content}
+{context_section}
+
+## 第一步：提炼核心内容
+在改写之前，请先从对话内容中提炼出与人生经历相关的核心信息：
+- 提取具体的事件、人物、地点、时间、感受
+- 丢弃语气词（嗯、啊、那个、就是说）、寒暄（你好、谢谢）、与AI的交互（你帮我整理一下、对对对你说得对）、无意义的重复
+- 如果对话内容中几乎没有与人生经历相关的实质内容，请输出空字符串
+
+## 第二步：改写为叙述
+基于提炼后的核心内容进行文学改写：
+1. 使用第一人称叙述
+2. **不要直接引用对话原话**，将所有内容改写为流畅的书面叙述
+3. **只输出新内容的改写结果**，不要重复已有内容
+4. 如果有衔接上下文，确保新内容与之自然衔接（语气、时间线连贯）
+5. 语气自然，有情绪
+6. 在适合配图的地方插入图片占位符
+7. 如果有用户的基本信息（出生地、成长地等），在叙述中自然融入地域文化和时代背景
+8. **不要将对话中的交互性语言（如"我跟你说"、"你知道吗"）写入叙述**
+9. **不要在正文中插入章节标题或分类标签**（如"章节：信念与价值观"、"## 童年与成长背景"等），章节标题由系统单独管理
+
+## 图片占位符格式（必须严格遵守）
+- **唯一合法格式**：开头恰好四个左花括号、结尾恰好四个右花括号，即：{{{{IMAGE:具体的图片描述}}}}
+- 禁止两层 {{ }}、六层 {{{{{{ }}}}}} 或其它层数，否则会在手机端显示多余花括号。
+- 占位符单独占一行，描述要具体、有画面感。系统会在入库前自动拼上统一风格模板，你只需写场景描述即可。
+
+正确示例（仅此格式）：
+- {{{{IMAGE:南方小镇的青石板路，两旁是白墙黑瓦的老房子}}}}
+- {{{{IMAGE:奶奶坐在院子里的藤椅上，手里摇着蒲扇}}}}
+- {{{{IMAGE:少年背着书包站在火车站台上，回望身后的小镇}}}}
+- {{{{IMAGE:泛黄的大学录取通知书，压在一摞旧课本下}}}}
+
+图片占位符要求：
+- 描述要具体、有画面感，便于后续生成或匹配图片
+- 每 200-300 字左右可以插入一个
+- 单独占一行，不要嵌入段落中
+- 不要使用括号或星号等其他格式
+- **花括号必须且仅能为四层**：{{{{ 与 }}}} 各四个，不多不少
+
+只输出新对话内容的改写结果（包含图片占位符）。如果对话中没有值得记录的人生经历内容，输出空字符串。
+"""