api/app/core/config.py

"""
统一配置：所有环境变量通过此模块的 Settings 单点读取。
业务代码只允许 import settings，禁止散落 os.getenv() / load_dotenv()。

本地开发时由 api/development.sh 在启动前将 .env.development 同步为 .env（每次启动覆盖）。
Docker / 服务端由镜像与 compose 注入进程环境；此处仅固定读取工作目录下的 .env 作为默认值来源。
进程环境变量（容器 environment、export）覆盖 .env 同名项。
"""

import secrets

from pydantic import Field, field_validator
from pydantic_settings import BaseSettings, SettingsConfigDict


class Settings(BaseSettings):
    model_config = SettingsConfigDict(
        env_file=".env",
        env_file_encoding="utf-8",
        case_sensitive=False,
        extra="ignore",
    )

    # ── Database ──────────────────────────────────────────────
    database_url: str = "postgresql://postgres:postgres@localhost:5432/life_echo"
    # 启动时是否执行 Alembic（main.py lifespan）；测试或仅读场景可关
    alembic_run_on_startup: bool = True
    # True：迁移失败则进程退出（生产推荐）。False：仅打错误日志并继续（本地无 DB 时）
    alembic_startup_fail_fast: bool = False
    alembic_startup_max_retries: int = Field(default=3, ge=1, le=10)
    alembic_startup_retry_base_seconds: float = Field(default=1.0, ge=0.1, le=60.0)

    # ── Redis ─────────────────────────────────────────────────
    redis_url: str = "redis://localhost:6379/0"
    redis_session_ttl: int = 86400

    # ── Auth / JWT ────────────────────────────────────────────
    secret_key: str = Field(default_factory=lambda: secrets.token_urlsafe(32))
    algorithm: str = "HS256"
    access_token_expire_minutes: int = 120
    refresh_token_expire_days: int = 30

    # ── LLM / DeepSeek ───────────────────────────────────────
    deepseek_api_key: str = ""
    deepseek_base_url: str = "https://api.deepseek.com"
    deepseek_model: str = "deepseek-chat"
    llm_api_key: str = ""
    llm_base_url: str = ""
    llm_model: str = ""
    llm_temperature: float = 0.7
    # 空字符串：快档位与默认模型相同；分类/抽取/记忆富化等可单独指定较轻模型
    llm_fast_model: str = ""

    # ── Memory 向量（智谱 BigModel 国内 embedding-3；与 LLM/DeepSeek 密钥分离）──
    zhipu_api_key: str = ""
    embedding_base_url: str = "https://open.bigmodel.cn/api/paas/v4"
    embedding_model: str = "embedding-3"

    # ── Chat 访谈（token 上限 + 代码截断，见 reply_limits）──
    chat_interview_max_tokens: int = 380
    chat_interview_max_segments: int = 2
    chat_interview_max_chars_per_segment: int = 260
    # 访谈：用户本轮极短输入时的更紧上限（见 interview_reply_length）
    chat_interview_brief_max_tokens: int = Field(default=260, ge=64, le=2048)
    chat_interview_brief_max_chars_per_segment: int = Field(default=200, ge=32, le=2000)
    # 访谈：有新细节/情绪/长段时的展开上限
    chat_interview_expanded_max_tokens: int = Field(default=520, ge=64, le=4096)
    chat_interview_expanded_max_chars_per_segment: int = Field(
        default=380, ge=32, le=4000
    )
    # 干部/军队推断命中时，standard 档在分桶基础上小幅放宽（brief/expanded 不变）
    chat_interview_cadre_military_standard_extra_tokens: int = Field(
        default=40, ge=0, le=512
    )
    chat_interview_cadre_military_standard_extra_chars: int = Field(
        default=40, ge=0, le=2000
    )
    chat_opening_max_tokens: int = 256
    chat_profile_followup_max_tokens: int = 280
    # Redis 全量历史仅用于 turn 计数；注入 LLM 时截取最近若干轮与字符预算
    chat_history_max_pairs: int = Field(default=15, ge=1, le=500)
    chat_history_max_chars: int = Field(default=6000, ge=256, le=500_000)
    chat_era_context_enabled: bool = True
    # 访谈：每轮用 LLM 判定用户主人生阶段并更新 MemoirState.current_stage；False 时仅用关键词
    chat_stage_detection_enabled: bool = True
    chat_stage_detection_max_tokens: int = 128
    # 访谈性格：default | warm_listener | curious_guide（未知值按 default）
    chat_interview_persona: str = "default"
    # 访谈：按用户本轮话检索记忆并注入 prompt（关则不调 MemoryService.retrieve）
    chat_memory_retrieval_enabled: bool = True
    chat_memory_top_k: int = Field(default=8, ge=1, le=30)
    chat_memory_evidence_max_chars: int = Field(default=4096, ge=256, le=50_000)

    # ── Memoir 叙事忠实度检查（FidelityCheckAgent）────────────────
    memoir_fidelity_check_enabled: bool = True
    memoir_fidelity_check_max_tokens: int = 512
    # 口述归一（进入叙事 / 忠实度前；segment 原文不落库）：off | rules | llm
    memoir_oral_normalize_enabled: bool = True
    memoir_oral_normalize_mode: str = "rules"
    memoir_oral_normalize_llm_max_tokens: int = Field(default=512, ge=64, le=4096)
    memoir_oral_normalize_llm_max_input_chars: int = Field(
        default=8000, ge=64, le=50_000
    )
    # 聊天：模型消费净稿（不改变 segment 落库原文）；与 memoir 规则层共用，配置独立
    chat_input_normalize_enabled: bool = True
    chat_input_normalize_mode: str = "rules"  # off | rules | llm
    chat_input_normalize_llm_max_tokens: int = Field(default=512, ge=64, le=4096)
    chat_input_normalize_llm_max_input_chars: int = Field(
        default=8000, ge=64, le=50_000
    )

    # ── ASR ───────────────────────────────────────────────────
    asr_provider: str = "whisper"
    asr_model_size: str = "small"
    asr_device: str = "auto"
    asr_compute_type: str = "auto"
    asr_model_cache_dir: str = ""

    # ── Tencent SMS ──────────────────────────────────────────
    tencent_sms_secret_id: str = ""
    tencent_sms_secret_key: str = ""
    tencent_sms_sdk_app_id: str = ""
    tencent_sms_sign_name: str = ""
    tencent_sms_template_id: str = ""
    tencent_sms_template_param_count: int = 2

    # ── Tencent ASR / TTS（共用 Secret；与短信、COS 密钥独立）────────────────
    tencent_secret_id: str = ""
    tencent_secret_key: str = ""

    # ── TTS (openai | tencent)，与 ASR 独立：仅控制回复侧语音合成 ──
    enable_tts: bool = True
    tts_provider: str = "tencent"
    openai_api_key: str = ""
    tts_voice_type: int = 502001  # Tencent 音色 ID，见 https://cloud.tencent.com/document/product/1073/92668
    tts_codec: str = "mp3"

    # ── WeChat Pay ───────────────────────────────────────────
    wechat_pay_app_id: str = ""
    wechat_pay_mch_id: str = ""
    wechat_pay_api_v3_key: str = ""
    wechat_pay_private_key_path: str = "certs/apiclient_key.pem"
    wechat_pay_private_key: str = ""  # PEM 内容，与 private_key_path 二选一
    wechat_pay_cert_serial_no: str = ""
    wechat_pay_notify_url: str = ""
    wechat_pay_platform_public_key: str = ""
    wechat_pay_platform_public_key_path: str = ""
    wechat_pay_platform_public_key_id: str = ""

    # ── Alipay ───────────────────────────────────────────────
    alipay_app_id: str = ""
    alipay_private_key: str = ""
    alipay_public_key: str = ""
    alipay_notify_url: str = ""
    alipay_sign_type: str = "RSA2"
    alipay_under_development: str = "true"  # "1"/"true"/"yes" 视为开发中不可用

    # ── Logging ──────────────────────────────────────────────
    # 环境变量 LOG_LEVEL；控制 loguru sink 最低级别（TRACE/DEBUG/INFO/…）
    log_level: str = "INFO"
    # LOG_AGENT_VERBOSE：为 True 时额外输出 Agent 单行 INFO 摘要（耗时、规模），无需全局 DEBUG
    log_agent_verbose: bool = False
    # AGENT_LOG_MAX_CHARS：DEBUG 下记录 prompt/响应预览时的最大字符数
    agent_log_max_chars: int = Field(default=4096, ge=256, le=100_000)
    # 第三方 stdlib logging（空=自动：LOG_LEVEL 为 DEBUG/TRACE 时 Celery→INFO、httpx/httpcore→WARNING）
    celery_log_level: str = ""
    httpx_log_level: str = ""

    @field_validator("log_agent_verbose", mode="before")
    @classmethod
    def _coerce_log_agent_verbose(cls, v: object) -> bool:
        if isinstance(v, bool):
            return v
        if v is None:
            return False
        return str(v).strip().lower() in ("1", "true", "yes", "on")

    # ── Misc ─────────────────────────────────────────────────
    enable_test_subscription: int = 0
    enable_test_plan: str = ""  # "1" / "true" / "yes" 为 True
    enable_docs: bool = True

    # ── Memoir Image ─────────────────────────────────────────
    memoir_image_enabled: bool = False
    # True：图片 LLM prompt 失败时不使用英语降级模板（需产品与任务失败流确认后开启）
    image_prompt_fallback_disabled: bool = False
    memoir_image_poll_interval: int = 3
    memoir_image_max_attempts: int = 20
    memoir_image_provider: str = "liblib"
    memoir_image_style_default: str = "watercolor"
    memoir_image_size_default: str = "1280x720"
    memoir_image_download_hosts: str = ""
    # Story 正文至少多少字才创建主图 intent / 调图（0 表示不限制）
    story_image_min_body_chars: int = 400
    # generate_story_image 入队去重（Redis SET NX，秒）
    story_image_enqueue_dedup_ttl: int = Field(default=300, ge=30, le=86400)
    # 章节物化异步任务延迟入队（秒），削峰
    recompose_chapter_delay_seconds: int = Field(default=8, ge=0, le=600)
    # 与 memoir pipeline 一致的章节互斥锁 TTL（秒）
    chapter_pipeline_lock_ttl_seconds: int = Field(default=120, ge=10, le=3600)
    # Append 硬上限：canonical 字符数、版本数（超限强制 new_story）
    story_append_max_canonical_chars: int = Field(default=12000, ge=1000, le=500_000)
    story_append_max_versions: int = Field(default=20, ge=1, le=500)
    # Evidence 检索 top_k：大批次 unit 时降低检索量
    evidence_top_k_default: int = Field(default=10, ge=1, le=50)
    evidence_top_k_large_batch: int = Field(default=5, ge=1, le=50)
    evidence_large_batch_threshold: int = Field(default=3, ge=1, le=100)
    # Story/Chapter 标题在正文达到此字数后才由 LLM 生成；之前用占位符
    story_title_min_body_chars: int = Field(default=60, ge=0, le=10_000)
    # 回忆录 Celery：累计 strip 后口述字数未达此值则暂缓提交（0=关闭，仅防抖后提交）
    memoir_segment_batch_min_chars: int = Field(default=50, ge=0, le=50_000)
    # 本批首条 segment 入队起最长等待（秒），超时则提交（即使字数不足）
    memoir_segment_batch_max_wait_seconds: float = Field(
        default=60.0, ge=0.0, le=3600.0
    )

    # ── Memory 检索与富化 ─────────────────────────────────────
    # True：query 为空时仍返回 rolling 摘要 + 最近事实/时间线（无 chunk FTS）
    memory_evidence_empty_query_include_rolling: bool = False
    # False：跳过 ingest 后 LLM 富化（摘要/事实/时间线）
    memory_enrichment_enabled: bool = True
    memory_enrichment_max_chars: int = Field(default=12000, ge=1000, le=100_000)

    # ── Memory compaction（近重复 chunk 软排除；事件触发 + Redis 防抖 + 用户锁）──
    memory_compaction_enabled: bool = False
    memory_compaction_debounce_seconds: int = Field(default=105, ge=10, le=3600)
    memory_compaction_lock_ttl_seconds: int = Field(default=600, ge=60, le=7200)
    memory_compaction_chunk_similarity_threshold: float = Field(
        default=0.92, ge=0.5, le=0.999
    )
    memory_compaction_min_layers_for_exclude: int = Field(default=2, ge=1, le=3)
    memory_compaction_max_chunks_per_run: int = Field(default=200, ge=1, le=10_000)
    memory_compaction_max_excludes_per_run: int = Field(default=50, ge=1, le=1000)
    memory_compaction_max_neighbors_per_chunk: int = Field(default=25, ge=5, le=100)
    memory_compaction_text_jaccard_min: float = Field(default=0.55, ge=0.0, le=1.0)
    memory_compaction_metadata_event_year_window: int = Field(default=1, ge=0, le=50)

    # ── Liblib ───────────────────────────────────────────────
    liblib_access_key: str = ""
    liblib_secret_key: str = ""
    liblib_base_url: str = "https://openapi.liblibai.cloud"
    liblib_template_uuid: str = ""

    # ── Tencent COS ──────────────────────────────────────────
    tencent_cos_secret_id: str = ""
    tencent_cos_secret_key: str = ""
    tencent_cos_region: str = "ap-shanghai"
    tencent_cos_bucket: str = ""
    tencent_cos_base_url: str = ""
    tencent_cos_token: str = ""


settings = Settings()
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								"""
 								统一配置：所有环境变量通过此模块的 Settings 单点读取。
 								业务代码只允许 import settings，禁止散落 os.getenv() / load_dotenv()。
-												various fixes

											
										
										
											2026-03-23 13:21:07 +08:00
-												修复环境变量，UI问题

											
										
										
											2026-03-23 13:54:41 +08:00
+								本地开发时由 api/development.sh 在启动前将 .env.development 同步为 .env（每次启动覆盖）。
-												various fixes

											
										
										
											2026-03-23 13:21:07 +08:00
+								Docker / 服务端由镜像与 compose 注入进程环境；此处仅固定读取工作目录下的 .env 作为默认值来源。
 								进程环境变量（容器 environment、export）覆盖 .env 同名项。
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								"""
 								import secrets
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								from pydantic import Field, field_validator
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								from pydantic_settings import BaseSettings, SettingsConfigDict
 								class Settings(BaseSettings):
 								    model_config = SettingsConfigDict(
 								        env_file=".env",
 								        env_file_encoding="utf-8",
 								        case_sensitive=False,
 								        extra="ignore",
 								    )
 								    # ── Database ──────────────────────────────────────────────
 								    database_url: str = "postgresql://postgres:postgres@localhost:5432/life_echo"
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								    # 启动时是否执行 Alembic（main.py lifespan）；测试或仅读场景可关
 								    alembic_run_on_startup: bool = True
 								    # True：迁移失败则进程退出（生产推荐）。False：仅打错误日志并继续（本地无 DB 时）
 								    alembic_startup_fail_fast: bool = False
 								    alembic_startup_max_retries: int = Field(default=3, ge=1, le=10)
 								    alembic_startup_retry_base_seconds: float = Field(default=1.0, ge=0.1, le=60.0)
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
 								    # ── Redis ─────────────────────────────────────────────────
 								    redis_url: str = "redis://localhost:6379/0"
 								    redis_session_ttl: int = 86400
 								    # ── Auth / JWT ────────────────────────────────────────────
 								    secret_key: str = Field(default_factory=lambda: secrets.token_urlsafe(32))
 								    algorithm: str = "HS256"
 								    access_token_expire_minutes: int = 120
 								    refresh_token_expire_days: int = 30
 								    # ── LLM / DeepSeek ───────────────────────────────────────
 								    deepseek_api_key: str = ""
 								    deepseek_base_url: str = "https://api.deepseek.com"
 								    deepseek_model: str = "deepseek-chat"
 								    llm_api_key: str = ""
 								    llm_base_url: str = ""
 								    llm_model: str = ""
 								    llm_temperature: float = 0.7
-												refactor(agents): 抽取阶段常量与对话上下文；快档 LLM；图片 prompt 可禁止回退

访谈与阶段
- 新增 app/agents/stage_constants.py：集中 CHAT_STAGES、章节分类/顺序、阶段到默认 memoir 类别等，与 MemoirState 默认槽位顺序对齐；减少散落在 prompts 内的重复常量。
- 新增 app/agents/chat/prompt_context.py：以 ChatPromptContext 汇总 guided 系统提示所需字段（阶段、槽位、轮次、人设、记忆证据、回复长度模式、背景声线、职业等），统一走 get_guided_conversation_prompt。
- 大幅收敛 app/agents/chat/prompts_conversation.py；调整 prompts.py、stage_prompts.py、stage_detection.py；同步 interview_agent、profile_agent、helpers 与 state_schema，使对话侧构造提示的方式一致、可测。

回忆录流水线
- memoir/prompts.py 删除已迁至 stage_constants / 独立模板的大段常量与图片占位相关逻辑；classification / extraction / fidelity / narrative agents 与 orchest（全量历史仍可用于计数，注入模型时按轮次与字符上限截断）、image_prompt_fallback_disabled。
- dependencies 增加 get_llm_provider_fast（LRU 缓存，可与默认共用密钥与 base_url）。

任务与编排
- memoir_tasks：prepare_batches 注入 llm_fast；开启独立快档模型时打结构化日志。
- chapter_cover_tasks、story_image_tasks：与图片 prompt / JSON 工具路径或策略变更对齐（import 与行为一致）。
- story_pipeline_sync 等小处同步。

其它核心
- langchain_llm、text_normalize 随上述调用链微调。

开发者体验
- .cursor/settings.json：启用 redis-development、postman 插件。

测试
- 新增 test_image_prompt_policy：覆盖「禁止回退」等图片 prompt 策略。
- 更新 test_interview_prompts、test_interview_reply_length、test_experience_regressions、test_json_and_memory_utils，匹配新常量位置、json_utils 与对话/长度行为。

											
										
										
											2026-04-02 12:00:00 +08:00
+								    # 空字符串：快档位与默认模型相同；分类/抽取/记忆富化等可单独指定较轻模型
 								    llm_fast_model: str = ""
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
-												feat(api): 接入智谱 embedding-3（1024 维）并迁移 memory_chunks 向量列

											
										
										
											2026-03-30 13:54:35 +08:00
+								    # ── Memory 向量（智谱 BigModel 国内 embedding-3；与 LLM/DeepSeek 密钥分离）──
 								    zhipu_api_key: str = ""
 								    embedding_base_url: str = "https://open.bigmodel.cn/api/paas/v4"
 								    embedding_model: str = "embedding-3"
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								    # ── Chat 访谈（token 上限 + 代码截断，见 reply_limits）──
 								    chat_interview_max_tokens: int = 380
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								    chat_interview_max_segments: int = 2
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								    chat_interview_max_chars_per_segment: int = 260
 								    # 访谈：用户本轮极短输入时的更紧上限（见 interview_reply_length）
 								    chat_interview_brief_max_tokens: int = Field(default=260, ge=64, le=2048)
 								    chat_interview_brief_max_chars_per_segment: int = Field(default=200, ge=32, le=2000)
 								    # 访谈：有新细节/情绪/长段时的展开上限
 								    chat_interview_expanded_max_tokens: int = Field(default=520, ge=64, le=4096)
 								    chat_interview_expanded_max_chars_per_segment: int = Field(
 								        default=380, ge=32, le=4000
 								    )
 								    # 干部/军队推断命中时，standard 档在分桶基础上小幅放宽（brief/expanded 不变）
 								    chat_interview_cadre_military_standard_extra_tokens: int = Field(
 								        default=40, ge=0, le=512
 								    )
 								    chat_interview_cadre_military_standard_extra_chars: int = Field(
 								        default=40, ge=0, le=2000
 								    )
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								    chat_opening_max_tokens: int = 256
 								    chat_profile_followup_max_tokens: int = 280
-												refactor(agents): 抽取阶段常量与对话上下文；快档 LLM；图片 prompt 可禁止回退

访谈与阶段
- 新增 app/agents/stage_constants.py：集中 CHAT_STAGES、章节分类/顺序、阶段到默认 memoir 类别等，与 MemoirState 默认槽位顺序对齐；减少散落在 prompts 内的重复常量。
- 新增 app/agents/chat/prompt_context.py：以 ChatPromptContext 汇总 guided 系统提示所需字段（阶段、槽位、轮次、人设、记忆证据、回复长度模式、背景声线、职业等），统一走 get_guided_conversation_prompt。
- 大幅收敛 app/agents/chat/prompts_conversation.py；调整 prompts.py、stage_prompts.py、stage_detection.py；同步 interview_agent、profile_agent、helpers 与 state_schema，使对话侧构造提示的方式一致、可测。

回忆录流水线
- memoir/prompts.py 删除已迁至 stage_constants / 独立模板的大段常量与图片占位相关逻辑；classification / extraction / fidelity / narrative agents 与 orchest（全量历史仍可用于计数，注入模型时按轮次与字符上限截断）、image_prompt_fallback_disabled。
- dependencies 增加 get_llm_provider_fast（LRU 缓存，可与默认共用密钥与 base_url）。

任务与编排
- memoir_tasks：prepare_batches 注入 llm_fast；开启独立快档模型时打结构化日志。
- chapter_cover_tasks、story_image_tasks：与图片 prompt / JSON 工具路径或策略变更对齐（import 与行为一致）。
- story_pipeline_sync 等小处同步。

其它核心
- langchain_llm、text_normalize 随上述调用链微调。

开发者体验
- .cursor/settings.json：启用 redis-development、postman 插件。

测试
- 新增 test_image_prompt_policy：覆盖「禁止回退」等图片 prompt 策略。
- 更新 test_interview_prompts、test_interview_reply_length、test_experience_regressions、test_json_and_memory_utils，匹配新常量位置、json_utils 与对话/长度行为。

											
										
										
											2026-04-02 12:00:00 +08:00
+								    # Redis 全量历史仅用于 turn 计数；注入 LLM 时截取最近若干轮与字符预算
 								    chat_history_max_pairs: int = Field(default=15, ge=1, le=500)
 								    chat_history_max_chars: int = Field(default=6000, ge=256, le=500_000)
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								    chat_era_context_enabled: bool = True
 								    # 访谈：每轮用 LLM 判定用户主人生阶段并更新 MemoirState.current_stage；False 时仅用关键词
 								    chat_stage_detection_enabled: bool = True
 								    chat_stage_detection_max_tokens: int = 128
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								    # 访谈性格：default | warm_listener | curious_guide（未知值按 default）
 								    chat_interview_persona: str = "default"
 								    # 访谈：按用户本轮话检索记忆并注入 prompt（关则不调 MemoryService.retrieve）
 								    chat_memory_retrieval_enabled: bool = True
 								    chat_memory_top_k: int = Field(default=8, ge=1, le=30)
 								    chat_memory_evidence_max_chars: int = Field(default=4096, ge=256, le=50_000)
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
 								    # ── Memoir 叙事忠实度检查（FidelityCheckAgent）────────────────
 								    memoir_fidelity_check_enabled: bool = True
 								    memoir_fidelity_check_max_tokens: int = 512
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								    # 口述归一（进入叙事 / 忠实度前；segment 原文不落库）：off | rules | llm
 								    memoir_oral_normalize_enabled: bool = True
 								    memoir_oral_normalize_mode: str = "rules"
 								    memoir_oral_normalize_llm_max_tokens: int = Field(default=512, ge=64, le=4096)
 								    memoir_oral_normalize_llm_max_input_chars: int = Field(
 								        default=8000, ge=64, le=50_000
 								    )
 								    # 聊天：模型消费净稿（不改变 segment 落库原文）；与 memoir 规则层共用，配置独立
 								    chat_input_normalize_enabled: bool = True
 								    chat_input_normalize_mode: str = "rules"  # off | rules | llm
 								    chat_input_normalize_llm_max_tokens: int = Field(default=512, ge=64, le=4096)
 								    chat_input_normalize_llm_max_input_chars: int = Field(
 								        default=8000, ge=64, le=50_000
 								    )
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								    # ── ASR ───────────────────────────────────────────────────
 								    asr_provider: str = "whisper"
 								    asr_model_size: str = "small"
 								    asr_device: str = "auto"
 								    asr_compute_type: str = "auto"
 								    asr_model_cache_dir: str = ""
 								    # ── Tencent SMS ──────────────────────────────────────────
 								    tencent_sms_secret_id: str = ""
 								    tencent_sms_secret_key: str = ""
 								    tencent_sms_sdk_app_id: str = ""
 								    tencent_sms_sign_name: str = ""
 								    tencent_sms_template_id: str = ""
 								    tencent_sms_template_param_count: int = 2
-												various fixes

											
										
										
											2026-03-23 13:21:07 +08:00
+								    # ── Tencent ASR / TTS（共用 Secret；与短信、COS 密钥独立）────────────────
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								    tencent_secret_id: str = ""
 								    tencent_secret_key: str = ""
-												fix/various fixes

											
										
										
											2026-03-20 15:15:35 +08:00
+								    # ── TTS (openai | tencent)，与 ASR 独立：仅控制回复侧语音合成 ──
 								    enable_tts: bool = True
-												feat/ 添加app-expo三种环境切换，待测试 调整tts

											
										
										
											2026-03-19 09:58:02 +08:00
+								    tts_provider: str = "tencent"
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								    openai_api_key: str = ""
-												feat/调整tts音色，调整封面图prompt，修复对话页输入框显示逻辑，待验证封面图生成功能

											
										
										
											2026-03-19 14:14:13 +08:00
+								    tts_voice_type: int = 502001  # Tencent 音色 ID，见 https://cloud.tencent.com/document/product/1073/92668
-												feat/tts (#15)

Co-authored-by: Kevin <kevin@brighteng.org>
											
										
										
											2026-03-19 09:11:25 +08:00
+								    tts_codec: str = "mp3"
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
 								    # ── WeChat Pay ───────────────────────────────────────────
 								    wechat_pay_app_id: str = ""
 								    wechat_pay_mch_id: str = ""
 								    wechat_pay_api_v3_key: str = ""
 								    wechat_pay_private_key_path: str = "certs/apiclient_key.pem"
 								    wechat_pay_private_key: str = ""  # PEM 内容，与 private_key_path 二选一
 								    wechat_pay_cert_serial_no: str = ""
 								    wechat_pay_notify_url: str = ""
 								    wechat_pay_platform_public_key: str = ""
 								    wechat_pay_platform_public_key_path: str = ""
 								    wechat_pay_platform_public_key_id: str = ""
 								    # ── Alipay ───────────────────────────────────────────────
 								    alipay_app_id: str = ""
 								    alipay_private_key: str = ""
 								    alipay_public_key: str = ""
 								    alipay_notify_url: str = ""
 								    alipay_sign_type: str = "RSA2"
 								    alipay_under_development: str = "true"  # "1"/"true"/"yes" 视为开发中不可用
-												refactor(api,expo): 多智能体与会话收敛、回忆录兼容层移除、后端测试集大幅删减

- 对齐「多智能体收敛」与「回忆录 stories-first / markdown-first」方向：收紧运行时契约、
  删除过渡兼容路径与双轨逻辑，并同步更新客户端与文档。

- Chat：以 ChatOrchestrator 为实时编排入口；删除独立 conversation_agent，精简 prompts。
- Memoir：删除 memory_agent；MemoirOrchestrator、classification / story_route 与 prompts 收敛到
  prepare_batches + run_story_pipeline_for_category_batch 主链路。
- 将 agents 侧 processor 迁入 feature 层为 background_runner，并移除 features 下重复/过时
  processor 封装。

- 新增 history_store，强化「conversation_messages 为 DB 真源、Redis 为缓存」模型。
- 调整 models、repo、service、session_history；精简 WS message_types，重构 pipeline 与 router。

- 移除章节占位、整章再生等旧路径；章节列表与封面逻辑要求 story 关联；收紧 cover 资格与
  enqueue。
- helpers、repo、service、router、reading_segment_materialize、story_pipeline_sync、pdf_service
  等按 canonical markdown / cover_asset_id 收缩；删除 memoir_images/provider 等冗余。
- tasks：memoir_tasks、chapter_cover_tasks 等大幅瘦身；story_image_tasks 等与当前图片任务对齐。

- core：config、logging、redis、task_tracker 小幅调整。
- auth / user / payment / quota：路由或服务侧删减过时接口或逻辑（如 payment router 行数减少）。

- pyproject.toml、development.sh、.env.example / .env.production、README 等同步说明或变量。

- Alembic 0001_initial_schema 微调（与当前 schema 叙事一致的小改动）。

- 回忆录：types / mappers / api、章节页与 memoir 页与后端契约对齐；markdown-renderer 调整。
- 语音：删除 voice/player，voice-segment-store 相应精简。

- api/tests：删除 conftest 及绝大部分既有测试文件（websocket_baseline、conversation、memoir
  图片、PDF、SMS 等），属有意收缩/待按 backend-test-system 重建的信号。
- docs：新增多智能体收敛与移除兼容层计划摘要；更新 story-first 设计、backend-test-system、
  multi-agent-refactor-plan、实施总结等。

BREAKING CHANGE: 后端对外契约、回忆录章节字段与若干路由/任务行为已变更；大量 API 测试被移除，
  CI 若依赖这些用例需按新策略补测或调整流水线。

											
										
										
											2026-03-22 16:45:57 +08:00
+								    # ── Logging ──────────────────────────────────────────────
 								    # 环境变量 LOG_LEVEL；控制 loguru sink 最低级别（TRACE/DEBUG/INFO/…）
 								    log_level: str = "INFO"
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
+								    # LOG_AGENT_VERBOSE：为 True 时额外输出 Agent 单行 INFO 摘要（耗时、规模），无需全局 DEBUG
 								    log_agent_verbose: bool = False
 								    # AGENT_LOG_MAX_CHARS：DEBUG 下记录 prompt/响应预览时的最大字符数
 								    agent_log_max_chars: int = Field(default=4096, ge=256, le=100_000)
 								    # 第三方 stdlib logging（空=自动：LOG_LEVEL 为 DEBUG/TRACE 时 Celery→INFO、httpx/httpcore→WARNING）
 								    celery_log_level: str = ""
 								    httpx_log_level: str = ""
 								    @field_validator("log_agent_verbose", mode="before")
 								    @classmethod
 								    def _coerce_log_agent_verbose(cls, v: object) -> bool:
 								        if isinstance(v, bool):
 								            return v
 								        if v is None:
 								            return False
 								        return str(v).strip().lower() in ("1", "true", "yes", "on")
-												refactor(api,expo): 多智能体与会话收敛、回忆录兼容层移除、后端测试集大幅删减

- 对齐「多智能体收敛」与「回忆录 stories-first / markdown-first」方向：收紧运行时契约、
  删除过渡兼容路径与双轨逻辑，并同步更新客户端与文档。

- Chat：以 ChatOrchestrator 为实时编排入口；删除独立 conversation_agent，精简 prompts。
- Memoir：删除 memory_agent；MemoirOrchestrator、classification / story_route 与 prompts 收敛到
  prepare_batches + run_story_pipeline_for_category_batch 主链路。
- 将 agents 侧 processor 迁入 feature 层为 background_runner，并移除 features 下重复/过时
  processor 封装。

- 新增 history_store，强化「conversation_messages 为 DB 真源、Redis 为缓存」模型。
- 调整 models、repo、service、session_history；精简 WS message_types，重构 pipeline 与 router。

- 移除章节占位、整章再生等旧路径；章节列表与封面逻辑要求 story 关联；收紧 cover 资格与
  enqueue。
- helpers、repo、service、router、reading_segment_materialize、story_pipeline_sync、pdf_service
  等按 canonical markdown / cover_asset_id 收缩；删除 memoir_images/provider 等冗余。
- tasks：memoir_tasks、chapter_cover_tasks 等大幅瘦身；story_image_tasks 等与当前图片任务对齐。

- core：config、logging、redis、task_tracker 小幅调整。
- auth / user / payment / quota：路由或服务侧删减过时接口或逻辑（如 payment router 行数减少）。

- pyproject.toml、development.sh、.env.example / .env.production、README 等同步说明或变量。

- Alembic 0001_initial_schema 微调（与当前 schema 叙事一致的小改动）。

- 回忆录：types / mappers / api、章节页与 memoir 页与后端契约对齐；markdown-renderer 调整。
- 语音：删除 voice/player，voice-segment-store 相应精简。

- api/tests：删除 conftest 及绝大部分既有测试文件（websocket_baseline、conversation、memoir
  图片、PDF、SMS 等），属有意收缩/待按 backend-test-system 重建的信号。
- docs：新增多智能体收敛与移除兼容层计划摘要；更新 story-first 设计、backend-test-system、
  multi-agent-refactor-plan、实施总结等。

BREAKING CHANGE: 后端对外契约、回忆录章节字段与若干路由/任务行为已变更；大量 API 测试被移除，
  CI 若依赖这些用例需按新策略补测或调整流水线。

											
										
										
											2026-03-22 16:45:57 +08:00
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								    # ── Misc ─────────────────────────────────────────────────
 								    enable_test_subscription: int = 0
 								    enable_test_plan: str = ""  # "1" / "true" / "yes" 为 True
 								    enable_docs: bool = True
 								    # ── Memoir Image ─────────────────────────────────────────
 								    memoir_image_enabled: bool = False
-												refactor(agents): 抽取阶段常量与对话上下文；快档 LLM；图片 prompt 可禁止回退

访谈与阶段
- 新增 app/agents/stage_constants.py：集中 CHAT_STAGES、章节分类/顺序、阶段到默认 memoir 类别等，与 MemoirState 默认槽位顺序对齐；减少散落在 prompts 内的重复常量。
- 新增 app/agents/chat/prompt_context.py：以 ChatPromptContext 汇总 guided 系统提示所需字段（阶段、槽位、轮次、人设、记忆证据、回复长度模式、背景声线、职业等），统一走 get_guided_conversation_prompt。
- 大幅收敛 app/agents/chat/prompts_conversation.py；调整 prompts.py、stage_prompts.py、stage_detection.py；同步 interview_agent、profile_agent、helpers 与 state_schema，使对话侧构造提示的方式一致、可测。

回忆录流水线
- memoir/prompts.py 删除已迁至 stage_constants / 独立模板的大段常量与图片占位相关逻辑；classification / extraction / fidelity / narrative agents 与 orchest（全量历史仍可用于计数，注入模型时按轮次与字符上限截断）、image_prompt_fallback_disabled。
- dependencies 增加 get_llm_provider_fast（LRU 缓存，可与默认共用密钥与 base_url）。

任务与编排
- memoir_tasks：prepare_batches 注入 llm_fast；开启独立快档模型时打结构化日志。
- chapter_cover_tasks、story_image_tasks：与图片 prompt / JSON 工具路径或策略变更对齐（import 与行为一致）。
- story_pipeline_sync 等小处同步。

其它核心
- langchain_llm、text_normalize 随上述调用链微调。

开发者体验
- .cursor/settings.json：启用 redis-development、postman 插件。

测试
- 新增 test_image_prompt_policy：覆盖「禁止回退」等图片 prompt 策略。
- 更新 test_interview_prompts、test_interview_reply_length、test_experience_regressions、test_json_and_memory_utils，匹配新常量位置、json_utils 与对话/长度行为。

											
										
										
											2026-04-02 12:00:00 +08:00
+								    # True：图片 LLM prompt 失败时不使用英语降级模板（需产品与任务失败流确认后开启）
 								    image_prompt_fallback_disabled: bool = False
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								    memoir_image_poll_interval: int = 3
 								    memoir_image_max_attempts: int = 20
 								    memoir_image_provider: str = "liblib"
 								    memoir_image_style_default: str = "watercolor"
 								    memoir_image_size_default: str = "1280x720"
 								    memoir_image_download_hosts: str = ""
-												修复环境变量，UI问题

											
										
										
											2026-03-23 13:54:41 +08:00
+								    # Story 正文至少多少字才创建主图 intent / 调图（0 表示不限制）
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    story_image_min_body_chars: int = 400
-												feat(api): 拆分章节物化与 Story 后处理，并加固 Redis 锁与腾讯 ASR

回忆录 Story 流水线（同步）
- 同步路径仅写入 Story 与章节关联，改为 mark_chapter_dirty_sync，不再内联 compose
- 物化由 Celery recompose_chapter 异步完成；compose 不变量与异常时保留 dirty 的语义在 repo 中补充说明
- Evidence：大批次时降低 top_k；路由候选 story 携带 char_count/version_count；append 超长/版本过多时强制新开 story
- 叙事 prompt：relevant_chunks 去重，减少重复证据噪声
- 叙事回退与忠实度 gate：返回 fallback 类型并记录结构化日志（含耗时、JSON 有效性等）

Post-commit 与任务编排
- 新增 post_commit.enqueue_story_post_commit_effects：统一派发 generate_story_image（Redis 去重）、延迟 recompose_chapter、可选 memory compaction
- memoir_tasks / story_service / story_image_tasks 改为调用 post-commit 入口；主图回填后按关联章节重算并调度物化与 compacs（锁委托、Redis 单例、ASR to_thread）
- 更新 test_narrative_pipeline 以适配 _apply_narrative_fallbacks 返回值

											
										
										
											2026-03-30 11:53:04 +08:00
+								    # generate_story_image 入队去重（Redis SET NX，秒）
 								    story_image_enqueue_dedup_ttl: int = Field(default=300, ge=30, le=86400)
 								    # 章节物化异步任务延迟入队（秒），削峰
 								    recompose_chapter_delay_seconds: int = Field(default=8, ge=0, le=600)
 								    # 与 memoir pipeline 一致的章节互斥锁 TTL（秒）
 								    chapter_pipeline_lock_ttl_seconds: int = Field(default=120, ge=10, le=3600)
 								    # Append 硬上限：canonical 字符数、版本数（超限强制 new_story）
 								    story_append_max_canonical_chars: int = Field(default=12000, ge=1000, le=500_000)
 								    story_append_max_versions: int = Field(default=20, ge=1, le=500)
 								    # Evidence 检索 top_k：大批次 unit 时降低检索量
 								    evidence_top_k_default: int = Field(default=10, ge=1, le=50)
 								    evidence_top_k_large_batch: int = Field(default=5, ge=1, le=50)
 								    evidence_large_batch_threshold: int = Field(default=3, ge=1, le=100)
-												feat(memoir): 路由阶段不要求标题，按正文字数门闸延迟 LLM 标题

- 从 story 路由 prompt/校验中移除 new_story_title，改由叙事管线在正文足够长时生成
- 新增 story_title_min_body_chars；短正文使用章节类别占位标题
- CATEGORY_TO_CHAT_STAGE 对齐访谈 state.slots 的 stage 键
- 删除相对口述长度的叙事回退，仅保留 merge JSON 极端缩水类 fallback
- evidence_format：解析 object_json 并优化事实条目标点符号
- 更新 narrative / experience 相关单测

											
										
										
											2026-04-02 14:38:40 +08:00
+								    # Story/Chapter 标题在正文达到此字数后才由 LLM 生成；之前用占位符
 								    story_title_min_body_chars: int = Field(default=60, ge=0, le=10_000)
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								    # 回忆录 Celery：累计 strip 后口述字数未达此值则暂缓提交（0=关闭，仅防抖后提交）
 								    memoir_segment_batch_min_chars: int = Field(default=50, ge=0, le=50_000)
 								    # 本批首条 segment 入队起最长等待（秒），超时则提交（即使字数不足）
 								    memoir_segment_batch_max_wait_seconds: float = Field(
 								        default=60.0, ge=0.0, le=3600.0
 								    )
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    # ── Memory 检索与富化 ─────────────────────────────────────
 								    # True：query 为空时仍返回 rolling 摘要 + 最近事实/时间线（无 chunk FTS）
 								    memory_evidence_empty_query_include_rolling: bool = False
 								    # False：跳过 ingest 后 LLM 富化（摘要/事实/时间线）
 								    memory_enrichment_enabled: bool = True
 								    memory_enrichment_max_chars: int = Field(default=12000, ge=1000, le=100_000)
-												feat(api): Memory compaction 管线与调度修复，同步环境变量示例
Memory compaction（近重复 chunk 软排除）
- 新增 compaction 调度：Redis debounce、scheduler gate、增量游标；任务结束时 finalize，避免 gate 长期占用并处理运行期新 trigger。
- Celery memory_compaction_run：debounce 未到点则 retry；用户级 Redis 锁；成功路径更新游标并 finalize；异常时释放 scheduler gate 并 self.retry，避免静默卡死调度与瞬时失败不重试。
- compaction_service：多层判定 + canonical 打分；无 embedding 时停止前移游标（awaiting_embeddings）；curation details 补全 trigger 等上下文。
- ingest_transcript_sync：同步路径尽力写入 embedding，与异步 ingest 行为对齐，避免 compaction 永远扫不到无向量 chunk。
- repo：新增 update_chunk_embedding_sync。
测试
- 扩展 test_memory_compaction：调度合并、finalize、ingest embedding、无向量游标、异常路径 gate+retry 等回归用

											
										
										
											2026-03-30 10:46:35 +08:00
+								    # ── Memory compaction（近重复 chunk 软排除；事件触发 + Redis 防抖 + 用户锁）──
 								    memory_compaction_enabled: bool = False
 								    memory_compaction_debounce_seconds: int = Field(default=105, ge=10, le=3600)
 								    memory_compaction_lock_ttl_seconds: int = Field(default=600, ge=60, le=7200)
 								    memory_compaction_chunk_similarity_threshold: float = Field(
 								        default=0.92, ge=0.5, le=0.999
 								    )
 								    memory_compaction_min_layers_for_exclude: int = Field(default=2, ge=1, le=3)
 								    memory_compaction_max_chunks_per_run: int = Field(default=200, ge=1, le=10_000)
 								    memory_compaction_max_excludes_per_run: int = Field(default=50, ge=1, le=1000)
 								    memory_compaction_max_neighbors_per_chunk: int = Field(default=25, ge=5, le=100)
 								    memory_compaction_text_jaccard_min: float = Field(default=0.55, ge=0.0, le=1.0)
 								    memory_compaction_metadata_event_year_window: int = Field(default=1, ge=0, le=50)
-												Merge branch 'refactor/backend-architecture' into development

											
										
										
											2026-03-18 17:18:23 +08:00
+								    # ── Liblib ───────────────────────────────────────────────
 								    liblib_access_key: str = ""
 								    liblib_secret_key: str = ""
 								    liblib_base_url: str = "https://openapi.liblibai.cloud"
 								    liblib_template_uuid: str = ""
 								    # ── Tencent COS ──────────────────────────────────────────
 								    tencent_cos_secret_id: str = ""
 								    tencent_cos_secret_key: str = ""
 								    tencent_cos_region: str = "ap-shanghai"
 								    tencent_cos_bucket: str = ""
 								    tencent_cos_base_url: str = ""
 								    tencent_cos_token: str = ""
 								settings = Settings()