api/agents/memory_agent.py

"""
回忆录整理 Agent：基于传记结构，将口语改写为书面语，归类到章节
支持异步调用
"""
import json
import logging
from typing import List, Dict, Optional

from services.llm_service import llm_service

from .prompts import (
    get_memory_prompt,
    get_chapter_classification_prompt,
    get_text_rewrite_prompt,
    inject_image_placeholder_template,
    CHAPTER_CATEGORIES,
    STAGE_TO_ORDER,
)

logger = logging.getLogger(__name__)


class MemoryAgent:
    """回忆录整理 Agent（支持异步）"""
    
    def __init__(self):
        # 使用 LLM 服务获取 LLM 实例
        self.llm = llm_service.get_llm()
    
    async def classify_chapter(self, segments_text: str) -> str:
        """
        异步分类章节
        
        Args:
            segments_text: 对话段落文本
        
        Returns:
            章节类别（如：childhood）
        """
        if not self.llm:
            # 如果没有配置 LLM，返回默认类别
            return "childhood"
        
        try:
            prompt = get_chapter_classification_prompt(segments_text)
            
            # 异步调用 LLM
            response = await self.llm.ainvoke(prompt)
            
            # 提取类别
            content = response.content if hasattr(response, 'content') else str(response)
            category = content.strip().lower()
            
            # 验证类别是否有效
            if category in CHAPTER_CATEGORIES:
                return category
            
        except Exception as e:
            logger.error(f"分类章节失败: {e}")
        
        # 默认返回 childhood
        return "childhood"
    
    async def rewrite_to_literary(
        self,
        segments_text: str,
        chapter_category: str,
        existing_content: Optional[str] = None
    ) -> Dict:
        """
        异步将口语改写为书面语
        
        Args:
            segments_text: 对话段落文本
            chapter_category: 章节类别
            existing_content: 已有章节内容（可选）
        
        Returns:
            包含 title, content, summary, image_suggestions 的字典
        """
        if not self.llm:
            # 如果没有配置 LLM，返回基本结构
            return {
                "title": CHAPTER_CATEGORIES.get(chapter_category, "章节"),
                "content": segments_text,
                "summary": "",
                "image_suggestions": []
            }
        
        try:
            prompt = get_text_rewrite_prompt(segments_text, chapter_category, existing_content or "")
            
            # 异步调用 LLM
            response = await self.llm.ainvoke(prompt)
            
            # 尝试解析 JSON
            content = response.content if hasattr(response, 'content') else str(response)
            content = content.strip()
            
            # 移除可能的 markdown 代码块标记
            if content.startswith("```json"):
                content = content[7:]
            if content.startswith("```"):
                content = content[3:]
            if content.endswith("```"):
                content = content[:-3]
            content = content.strip()
            
            result = json.loads(content)
            result["content"] = inject_image_placeholder_template(result.get("content") or "")
            return result

        except json.JSONDecodeError:
            # 如果解析失败，返回基本结构
            raw = response.content if hasattr(response, 'content') else str(response)
            return {
                "title": CHAPTER_CATEGORIES.get(chapter_category, "章节"),
                "content": inject_image_placeholder_template(raw),
                "summary": "",
                "image_suggestions": []
            }
        except Exception as e:
            logger.error(f"改写文本失败: {e}")
            return {
                "title": CHAPTER_CATEGORIES.get(chapter_category, "章节"),
                "content": segments_text,
                "summary": "",
                "image_suggestions": []
            }
    
    async def process_segments(
        self,
        segments: List[Dict],
        existing_chapters: Optional[Dict[str, Dict]] = None
    ) -> Dict[str, Dict]:
        """
        异步处理对话段落，生成或更新章节
        
        Args:
            segments: 对话段落列表，每个包含 transcript_text
            existing_chapters: 已有章节字典，key 为 category
        
        Returns:
            更新后的章节字典
        """
        if existing_chapters is None:
            existing_chapters = {}
        
        # 按章节分类组织段落
        segments_by_category: Dict[str, List[str]] = {}
        
        for segment in segments:
            text = segment.get("transcript_text", "")
            if not text:
                continue
            
            # 异步分类
            category = await self.classify_chapter(text)
            
            if category not in segments_by_category:
                segments_by_category[category] = []
            
            segments_by_category[category].append(text)
        
        # 为每个类别生成或更新章节
        updated_chapters = existing_chapters.copy()
        
        for category, texts in segments_by_category.items():
            combined_text = "\n\n".join(texts)
            existing_content = existing_chapters.get(category, {}).get("content", "")
            
            # 异步改写为书面语
            result = await self.rewrite_to_literary(combined_text, category, existing_content)
            
            # 更新章节
            updated_chapters[category] = {
                "title": result.get("title", CHAPTER_CATEGORIES.get(category, "章节")),
                "content": result.get("content", ""),
                "summary": result.get("summary", ""),
                "image_suggestions": result.get("image_suggestions", []),
                "category": category,
                "order_index": STAGE_TO_ORDER.get(category, 999)
            }
        
        return updated_chapters
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								"""
 								回忆录整理 Agent：基于传记结构，将口语改写为书面语，归类到章节
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								支持异步调用
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								"""
 								import json
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								import logging
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								from typing import List, Dict, Optional
-												refactor: 更新Agent模块

- 优化conversation_agent代码结构
- 优化memory_agent代码结构
- 改进错误处理和代码可读性

											
										
										
											2026-01-18 15:57:53 +08:00
 								from services.llm_service import llm_service
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								from .prompts import (
 								    get_memory_prompt,
 								    get_chapter_classification_prompt,
 								    get_text_rewrite_prompt,
-												feat: 新增图片占位符提示词固定模板 入库时拼接

											
										
										
											2026-03-11 09:48:06 +08:00
+								    inject_image_placeholder_template,
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								    CHAPTER_CATEGORIES,
-												feat: 增强对话代理以检测用户阶段并更新章节排序

- 在 api/agents/conversation_agent.py 中添加 _detect_user_stage 方法，以通过关键词检测用户谈论的人生阶段。
- 在 api/agents/memory_agent.py 中更新章节排序逻辑，使用 STAGE_TO_ORDER 替代 CHAPTER_ORDER。
- 在 api/agents/state_schema.py 中添加方法以获取各阶段的填充情况。
- 在 api/agents/prompts/conversation_prompts.py 中更新对话提示，包含用户阶段检测和整体进度信息。
- 在 api/migrations/fix_chapter_order_index.sql 中添加 SQL 脚本以修复章节 order_index 的问题。
- 更新相关文档和提示以反映新功能。

											
										
										
											2026-02-13 21:45:56 +01:00
+								    STAGE_TO_ORDER,
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								)
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								logger = logging.getLogger(__name__)
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								class MemoryAgent:
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								    """回忆录整理 Agent（支持异步）"""
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								    def __init__(self):
-												refactor: 更新Agent模块

- 优化conversation_agent代码结构
- 优化memory_agent代码结构
- 改进错误处理和代码可读性

											
										
										
											2026-01-18 15:57:53 +08:00
+								        # 使用 LLM 服务获取 LLM 实例
 								        self.llm = llm_service.get_llm()
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								    async def classify_chapter(self, segments_text: str) -> str:
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								        """
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								        异步分类章节
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								        Args:
 								            segments_text: 对话段落文本
 								        Returns:
 								            章节类别（如：childhood）
 								        """
 								        if not self.llm:
 								            # 如果没有配置 LLM，返回默认类别
 								            return "childhood"
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								        try:
 								            prompt = get_chapter_classification_prompt(segments_text)
 								            # 异步调用 LLM
 								            response = await self.llm.ainvoke(prompt)
 								            # 提取类别
 								            content = response.content if hasattr(response, 'content') else str(response)
 								            category = content.strip().lower()
 								            # 验证类别是否有效
 								            if category in CHAPTER_CATEGORIES:
 								                return category
 								        except Exception as e:
 								            logger.error(f"分类章节失败: {e}")
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								        # 默认返回 childhood
 								        return "childhood"
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								    async def rewrite_to_literary(
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								        self,
 								        segments_text: str,
 								        chapter_category: str,
 								        existing_content: Optional[str] = None
 								    ) -> Dict:
 								        """
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								        异步将口语改写为书面语
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								        Args:
 								            segments_text: 对话段落文本
 								            chapter_category: 章节类别
 								            existing_content: 已有章节内容（可选）
 								        Returns:
 								            包含 title, content, summary, image_suggestions 的字典
 								        """
 								        if not self.llm:
 								            # 如果没有配置 LLM，返回基本结构
 								            return {
 								                "title": CHAPTER_CATEGORIES.get(chapter_category, "章节"),
 								                "content": segments_text,
 								                "summary": "",
 								                "image_suggestions": []
 								            }
 								        try:
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								            prompt = get_text_rewrite_prompt(segments_text, chapter_category, existing_content or "")
 								            # 异步调用 LLM
 								            response = await self.llm.ainvoke(prompt)
 								            # 尝试解析 JSON
 								            content = response.content if hasattr(response, 'content') else str(response)
 								            content = content.strip()
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								            # 移除可能的 markdown 代码块标记
 								            if content.startswith("```json"):
 								                content = content[7:]
 								            if content.startswith("```"):
 								                content = content[3:]
 								            if content.endswith("```"):
 								                content = content[:-3]
 								            content = content.strip()
 								            result = json.loads(content)
-												feat: 新增图片占位符提示词固定模板 入库时拼接

											
										
										
											2026-03-11 09:48:06 +08:00
+								            result["content"] = inject_image_placeholder_template(result.get("content") or "")
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								            return result
-												feat: 新增图片占位符提示词固定模板 入库时拼接

											
										
										
											2026-03-11 09:48:06 +08:00
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								        except json.JSONDecodeError:
 								            # 如果解析失败，返回基本结构
-												feat: 新增图片占位符提示词固定模板 入库时拼接

											
										
										
											2026-03-11 09:48:06 +08:00
+								            raw = response.content if hasattr(response, 'content') else str(response)
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								            return {
 								                "title": CHAPTER_CATEGORIES.get(chapter_category, "章节"),
-												feat: 新增图片占位符提示词固定模板 入库时拼接

											
										
										
											2026-03-11 09:48:06 +08:00
+								                "content": inject_image_placeholder_template(raw),
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								                "summary": "",
 								                "image_suggestions": []
 								            }
 								        except Exception as e:
 								            logger.error(f"改写文本失败: {e}")
 								            return {
 								                "title": CHAPTER_CATEGORIES.get(chapter_category, "章节"),
 								                "content": segments_text,
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								                "summary": "",
 								                "image_suggestions": []
 								            }
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								    async def process_segments(
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								        self,
 								        segments: List[Dict],
 								        existing_chapters: Optional[Dict[str, Dict]] = None
 								    ) -> Dict[str, Dict]:
 								        """
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								        异步处理对话段落，生成或更新章节
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								        Args:
 								            segments: 对话段落列表，每个包含 transcript_text
 								            existing_chapters: 已有章节字典，key 为 category
 								        Returns:
 								            更新后的章节字典
 								        """
 								        if existing_chapters is None:
 								            existing_chapters = {}
 								        # 按章节分类组织段落
 								        segments_by_category: Dict[str, List[str]] = {}
 								        for segment in segments:
 								            text = segment.get("transcript_text", "")
 								            if not text:
 								                continue
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								            # 异步分类
 								            category = await self.classify_chapter(text)
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								            if category not in segments_by_category:
 								                segments_by_category[category] = []
 								            segments_by_category[category].append(text)
 								        # 为每个类别生成或更新章节
 								        updated_chapters = existing_chapters.copy()
 								        for category, texts in segments_by_category.items():
 								            combined_text = "\n\n".join(texts)
 								            existing_content = existing_chapters.get(category, {}).get("content", "")
-												feat: 添加Redis支持和Celery任务处理

- 新增Redis服务模块用于会话状态存储和缓存
- 集成Celery用于后台任务处理
- 更新Docker Compose配置以支持开发环境
- 优化API以支持异步调用和Redis会话存储
- 更新文档以反映新的开发环境配置和使用方法

											
										
										
											2026-01-21 23:06:47 +01:00
+								            # 异步改写为书面语
 								            result = await self.rewrite_to_literary(combined_text, category, existing_content)
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
 								            # 更新章节
 								            updated_chapters[category] = {
 								                "title": result.get("title", CHAPTER_CATEGORIES.get(category, "章节")),
 								                "content": result.get("content", ""),
 								                "summary": result.get("summary", ""),
 								                "image_suggestions": result.get("image_suggestions", []),
 								                "category": category,
-												feat: 增强对话代理以检测用户阶段并更新章节排序

- 在 api/agents/conversation_agent.py 中添加 _detect_user_stage 方法，以通过关键词检测用户谈论的人生阶段。
- 在 api/agents/memory_agent.py 中更新章节排序逻辑，使用 STAGE_TO_ORDER 替代 CHAPTER_ORDER。
- 在 api/agents/state_schema.py 中添加方法以获取各阶段的填充情况。
- 在 api/agents/prompts/conversation_prompts.py 中更新对话提示，包含用户阶段检测和整体进度信息。
- 在 api/migrations/fix_chapter_order_index.sql 中添加 SQL 脚本以修复章节 order_index 的问题。
- 更新相关文档和提示以反映新功能。

											
										
										
											2026-02-13 21:45:56 +01:00
+								                "order_index": STAGE_TO_ORDER.get(category, 999)
-												添加AI代理模块

											
										
										
											2026-01-07 11:56:53 +08:00
+								            }
 								        return updated_chapters