api/app/features/memory/repo.py

"""Memory repository — MemorySource, MemoryChunk, MemoryFact, TimelineEvent data access."""

import uuid
from datetime import datetime, timezone

from sqlalchemy import delete, literal, or_, select, text, tuple_
from sqlalchemy.ext.asyncio import AsyncSession
from sqlalchemy.orm import Session

from app.features.memory.models import (
    MemoryChunk,
    MemoryCurationAction,
    MemoryFact,
    MemorySource,
    MemorySummary,
    TimelineEvent,
)


def _new_id() -> str:
    return str(uuid.uuid4())


def create_source_sync(
    session: Session,
    *,
    user_id: str,
    source_type: str,
    raw_text: str | None = None,
    conversation_id: str | None = None,
    captured_at: datetime | None = None,
) -> MemorySource:
    """Create a memory source (sync). Caller must commit."""
    source = MemorySource(
        id=_new_id(),
        user_id=user_id,
        source_type=source_type,
        raw_text=raw_text,
        conversation_id=conversation_id,
        captured_at=captured_at or datetime.now(timezone.utc),
    )
    session.add(source)
    return source


async def create_source(
    db: AsyncSession,
    *,
    user_id: str,
    source_type: str,
    raw_text: str | None = None,
    conversation_id: str | None = None,
    captured_at: datetime | None = None,
) -> MemorySource:
    """Create a memory source. Caller must commit."""
    source = MemorySource(
        id=_new_id(),
        user_id=user_id,
        source_type=source_type,
        raw_text=raw_text,
        conversation_id=conversation_id,
        captured_at=captured_at or datetime.now(timezone.utc),
    )
    db.add(source)
    return source


def create_chunk_sync(
    session: Session,
    *,
    source_id: str,
    user_id: str,
    content: str,
    chunk_index: int,
) -> MemoryChunk:
    """Create a memory chunk (sync). Caller must commit."""
    chunk = MemoryChunk(
        id=_new_id(),
        source_id=source_id,
        user_id=user_id,
        content=content,
        chunk_index=chunk_index,
    )
    session.add(chunk)
    return chunk


async def create_chunk(
    db: AsyncSession,
    *,
    source_id: str,
    user_id: str,
    content: str,
    chunk_index: int,
) -> MemoryChunk:
    """Create a memory chunk. Caller must commit."""
    chunk = MemoryChunk(
        id=_new_id(),
        source_id=source_id,
        user_id=user_id,
        content=content,
        chunk_index=chunk_index,
    )
    db.add(chunk)
    return chunk


def update_chunk_fts_sync(session: Session, chunk_id: str) -> None:
    """Populate content_tsv for FTS (sync). Caller must commit."""
    session.execute(
        text(
            "UPDATE memory_chunks SET content_tsv = to_tsvector('simple', content) WHERE id = :id"
        ),
        {"id": chunk_id},
    )


def update_chunk_embedding_sync(
    session: Session, chunk_id: str, embedding: list[float]
) -> None:
    """Update chunk embedding (sync). Caller must commit."""
    chunk = session.get(MemoryChunk, chunk_id)
    if chunk:
        chunk.embedding = embedding


async def update_chunk_embedding(
    db: AsyncSession, chunk_id: str, embedding: list[float]
) -> None:
    """Update chunk embedding. Caller must commit."""
    chunk = await db.get(MemoryChunk, chunk_id)
    if chunk:
        chunk.embedding = embedding


async def update_chunk_fts(db: AsyncSession, chunk_id: str) -> None:
    """Populate content_tsv for FTS. Caller must commit."""
    await db.execute(
        text(
            "UPDATE memory_chunks SET content_tsv = to_tsvector('simple', content) WHERE id = :id"
        ),
        {"id": chunk_id},
    )


async def search_chunks_fts(
    db: AsyncSession, user_id: str, query: str, limit: int = 20
) -> list[dict]:
    """FTS search on memory_chunks. Returns list of {id, content, chunk_index}."""
    if not query or not query.strip():
        return []
    q = query.strip()
    stmt = text("""
        SELECT id, content, chunk_index
        FROM memory_chunks
        WHERE user_id = :user_id AND (is_excluded IS NOT TRUE OR is_excluded = false)
          AND content_tsv IS NOT NULL AND content_tsv @@ plainto_tsquery('simple', :q)
        ORDER BY ts_rank_cd(content_tsv, plainto_tsquery('simple', :q2)) DESC
        LIMIT :lim
    """)
    result = await db.execute(stmt, {"user_id": user_id, "q": q, "q2": q, "lim": limit})
    rows = result.mappings().all()
    return [
        {"id": r["id"], "content": r["content"], "chunk_index": r["chunk_index"]}
        for r in rows
    ]


async def get_chunks_by_ids(
    db: AsyncSession, chunk_ids: list[str]
) -> list[MemoryChunk]:
    """Fetch chunks by IDs."""
    if not chunk_ids:
        return []
    stmt = select(MemoryChunk).where(MemoryChunk.id.in_(chunk_ids))
    result = await db.execute(stmt)
    chunks = list(result.unique().scalars().all())
    order = {cid: i for i, cid in enumerate(chunk_ids)}
    return sorted(chunks, key=lambda c: order.get(c.id, 999))


async def get_facts_for_user(
    db: AsyncSession, user_id: str, limit: int = 20
) -> list[MemoryFact]:
    """Fetch recent facts for user."""
    stmt = (
        select(MemoryFact)
        .where(MemoryFact.user_id == user_id, MemoryFact.status == "confirmed")
        .order_by(MemoryFact.created_at.desc())
        .limit(limit)
    )
    result = await db.execute(stmt)
    return list(result.unique().scalars().all())


def get_facts_for_user_sync(
    session: Session, user_id: str, limit: int = 20
) -> list[MemoryFact]:
    stmt = (
        select(MemoryFact)
        .where(MemoryFact.user_id == user_id, MemoryFact.status == "confirmed")
        .order_by(MemoryFact.created_at.desc())
        .limit(limit)
    )
    return list(session.execute(stmt).unique().scalars().all())


def get_timeline_events_for_user_sync(
    session: Session, user_id: str, limit: int = 20
) -> list[TimelineEvent]:
    stmt = (
        select(TimelineEvent)
        .where(TimelineEvent.user_id == user_id)
        .order_by(
            TimelineEvent.event_year.desc().nullslast(), TimelineEvent.created_at.desc()
        )
        .limit(limit)
    )
    return list(session.execute(stmt).unique().scalars().all())


def search_chunks_fts_sync(
    session: Session, user_id: str, query: str, limit: int = 20
) -> list[dict]:
    """FTS on memory_chunks（sync，Celery）。"""
    if not query or not query.strip():
        return []
    q = query.strip()
    stmt = text("""
        SELECT id, content, chunk_index
        FROM memory_chunks
        WHERE user_id = :user_id AND (is_excluded IS NOT TRUE OR is_excluded = false)
          AND content_tsv IS NOT NULL AND content_tsv @@ plainto_tsquery('simple', :q)
        ORDER BY ts_rank_cd(content_tsv, plainto_tsquery('simple', :q2)) DESC
        LIMIT :lim
    """)
    result = session.execute(stmt, {"user_id": user_id, "q": q, "q2": q, "lim": limit})
    rows = result.mappings().all()
    return [
        {"id": r["id"], "content": r["content"], "chunk_index": r["chunk_index"]}
        for r in rows
    ]


def search_facts_for_user_sync(
    session: Session, user_id: str, query: str, limit: int = 20
) -> list[MemoryFact]:
    q = (query or "").strip()
    if not q:
        return get_facts_for_user_sync(session, user_id, limit)
    pat = f"%{q}%"
    stmt = (
        select(MemoryFact)
        .where(
            MemoryFact.user_id == user_id,
            MemoryFact.status == "confirmed",
            or_(MemoryFact.subject.ilike(pat), MemoryFact.predicate.ilike(pat)),
        )
        .order_by(MemoryFact.created_at.desc())
        .limit(limit)
    )
    rows = list(session.execute(stmt).unique().scalars().all())
    if rows:
        return rows
    return get_facts_for_user_sync(session, user_id, limit)


async def search_facts_for_user_async(
    db: AsyncSession, user_id: str, query: str, limit: int = 20
) -> list[MemoryFact]:
    q = (query or "").strip()
    if not q:
        return await get_facts_for_user(db, user_id=user_id, limit=limit)
    pat = f"%{q}%"
    stmt = (
        select(MemoryFact)
        .where(
            MemoryFact.user_id == user_id,
            MemoryFact.status == "confirmed",
            or_(MemoryFact.subject.ilike(pat), MemoryFact.predicate.ilike(pat)),
        )
        .order_by(MemoryFact.created_at.desc())
        .limit(limit)
    )
    result = await db.execute(stmt)
    rows = list(result.unique().scalars().all())
    if rows:
        return rows
    return await get_facts_for_user(db, user_id=user_id, limit=limit)


def search_timeline_events_for_user_sync(
    session: Session, user_id: str, query: str, limit: int = 20
) -> list[TimelineEvent]:
    q = (query or "").strip()
    if not q:
        return get_timeline_events_for_user_sync(session, user_id, limit)
    pat = f"%{q}%"
    stmt = (
        select(TimelineEvent)
        .where(
            TimelineEvent.user_id == user_id,
            or_(
                TimelineEvent.title.ilike(pat),
                TimelineEvent.description.ilike(pat),
            ),
        )
        .order_by(TimelineEvent.event_year.desc().nullslast())
        .limit(limit)
    )
    rows = list(session.execute(stmt).unique().scalars().all())
    if rows:
        return rows
    return get_timeline_events_for_user_sync(session, user_id, limit)


async def search_timeline_events_for_user_async(
    db: AsyncSession, user_id: str, query: str, limit: int = 20
) -> list[TimelineEvent]:
    q = (query or "").strip()
    if not q:
        return await get_timeline_events_for_user(db, user_id=user_id, limit=limit)
    pat = f"%{q}%"
    stmt = (
        select(TimelineEvent)
        .where(
            TimelineEvent.user_id == user_id,
            or_(
                TimelineEvent.title.ilike(pat),
                TimelineEvent.description.ilike(pat),
            ),
        )
        .order_by(TimelineEvent.event_year.desc().nullslast())
        .limit(limit)
    )
    result = await db.execute(stmt)
    rows = list(result.unique().scalars().all())
    if rows:
        return rows
    return await get_timeline_events_for_user(db, user_id=user_id, limit=limit)


async def search_chunks_vector(
    db: AsyncSession, user_id: str, query_embedding: list[float], limit: int = 20
) -> list[dict]:
    """Vector similarity search. Returns list of {id, content, chunk_index, distance}."""
    if not query_embedding:
        return []
    # pgvector cosine distance: 1 - cosine_similarity, lower is better
    stmt = text("""
        SELECT id, content, chunk_index,
               (embedding <=> CAST(:emb AS vector)) AS distance
        FROM memory_chunks
        WHERE user_id = :user_id AND (is_excluded IS NOT TRUE OR is_excluded = false)
          AND embedding IS NOT NULL
        ORDER BY embedding <=> CAST(:emb2 AS vector)
        LIMIT :lim
    """)
    emb_str = "[" + ",".join(str(x) for x in query_embedding) + "]"
    result = await db.execute(
        stmt,
        {"user_id": user_id, "emb": emb_str, "emb2": emb_str, "lim": limit},
    )
    rows = result.mappings().all()
    return [
        {
            "id": r["id"],
            "content": r["content"],
            "chunk_index": r["chunk_index"],
            "distance": float(r["distance"]),
        }
        for r in rows
    ]


def list_summaries_for_evidence_sync(
    session: Session, *, user_id: str, q: str, limit: int
) -> list[dict]:
    """最新 rolling + 内容匹配 query 的摘要（ILIKE）。"""
    pat = f"%{q}%"
    rolling = (
        session.execute(
            select(MemorySummary)
            .where(
                MemorySummary.user_id == user_id,
                MemorySummary.summary_type == "rolling",
            )
            .order_by(MemorySummary.updated_at.desc())
            .limit(1)
        )
        .unique()
        .scalar_one_or_none()
    )
    rows: list[MemorySummary] = []
    seen: set[str] = set()
    if rolling:
        rows.append(rolling)
        seen.add(rolling.id)
    rest = limit - len(rows)
    if rest > 0:
        stmt = (
            select(MemorySummary)
            .where(
                MemorySummary.user_id == user_id,
                MemorySummary.content.ilike(pat),
            )
            .order_by(MemorySummary.updated_at.desc())
            .limit(rest + len(seen))
        )
        for s in session.execute(stmt).unique().scalars().all():
            if s.id not in seen:
                rows.append(s)
                seen.add(s.id)
            if len(rows) >= limit:
                break
    return [
        {
            "id": s.id,
            "summary_type": s.summary_type,
            "content": s.content,
            "source_chunk_ids": s.source_chunk_ids,
        }
        for s in rows[:limit]
    ]


def retrieve_evidence_sync(
    session: Session, user_id: str, query: str, *, top_k: int = 10
) -> dict:
    """
    Sync evidence retrieval for Celery tasks.

    能力：**仅 FTS** 检索 chunks（与 `HybridRetriever` 的 FTS+向量 RRF 不同，见
    `api/docs/memory-retrieval.md`）；facts/timeline 按 query ILIKE；fallback 见 repo。
    """
    from app.features.memory.evidence import retrieve_evidence_bundle_sync

    return retrieve_evidence_bundle_sync(session, user_id, query, top_k=top_k)


async def get_timeline_events_for_user(
    db: AsyncSession, user_id: str, limit: int = 20
) -> list[TimelineEvent]:
    """Fetch timeline events for user."""
    stmt = (
        select(TimelineEvent)
        .where(TimelineEvent.user_id == user_id)
        .order_by(
            TimelineEvent.event_year.desc().nullslast(), TimelineEvent.created_at.desc()
        )
        .limit(limit)
    )
    result = await db.execute(stmt)
    return list(result.unique().scalars().all())


async def list_storage_keys_for_conversation(
    db: AsyncSession, conversation_id: str
) -> list[str]:
    """对话关联的 memory_sources 上记录的 COS object key（若有）。"""
    stmt = select(MemorySource.storage_key).where(
        MemorySource.conversation_id == conversation_id,
        MemorySource.storage_key.isnot(None),
    )
    result = await db.execute(stmt)
    return sorted({r for r in result.scalars().all() if r})


def list_chunks_for_source_sync(session: Session, source_id: str) -> list[MemoryChunk]:
    stmt = (
        select(MemoryChunk)
        .where(MemoryChunk.source_id == source_id)
        .order_by(MemoryChunk.chunk_index.asc())
    )
    return list(session.execute(stmt).unique().scalars().all())


def create_memory_summary_sync(
    session: Session,
    *,
    user_id: str,
    summary_type: str,
    content: str,
    source_chunk_ids: list[str] | None = None,
) -> MemorySummary:
    row = MemorySummary(
        id=_new_id(),
        user_id=user_id,
        summary_type=summary_type,
        content=content,
        source_chunk_ids=source_chunk_ids,
    )
    session.add(row)
    return row


async def create_memory_summary(
    db: AsyncSession,
    *,
    user_id: str,
    summary_type: str,
    content: str,
    source_chunk_ids: list[str] | None = None,
) -> MemorySummary:
    row = MemorySummary(
        id=_new_id(),
        user_id=user_id,
        summary_type=summary_type,
        content=content,
        source_chunk_ids=source_chunk_ids,
    )
    db.add(row)
    return row


def get_latest_rolling_summary_sync(
    session: Session, user_id: str
) -> MemorySummary | None:
    stmt = (
        select(MemorySummary)
        .where(
            MemorySummary.user_id == user_id,
            MemorySummary.summary_type == "rolling",
        )
        .order_by(MemorySummary.updated_at.desc())
        .limit(1)
    )
    return session.execute(stmt).unique().scalar_one_or_none()


def upsert_rolling_summary_sync(
    session: Session,
    *,
    user_id: str,
    content: str,
    source_chunk_ids: list[str] | None = None,
) -> MemorySummary:
    existing = get_latest_rolling_summary_sync(session, user_id)
    if existing:
        existing.content = content
        if source_chunk_ids is not None:
            existing.source_chunk_ids = source_chunk_ids
        return existing
    return create_memory_summary_sync(
        session,
        user_id=user_id,
        summary_type="rolling",
        content=content,
        source_chunk_ids=source_chunk_ids,
    )


def create_memory_fact_sync(
    session: Session,
    *,
    user_id: str,
    fact_type: str,
    subject: str | None,
    predicate: str | None,
    object_json: dict | None,
    confidence: float,
    source_chunk_id: str | None,
    status: str = "confirmed",
) -> MemoryFact:
    row = MemoryFact(
        id=_new_id(),
        user_id=user_id,
        fact_type=fact_type,
        subject=subject,
        predicate=predicate,
        object_json=object_json,
        confidence=confidence,
        source_chunk_id=source_chunk_id,
        status=status,
    )
    session.add(row)
    return row


async def create_memory_fact(
    db: AsyncSession,
    *,
    user_id: str,
    fact_type: str,
    subject: str | None,
    predicate: str | None,
    object_json: dict | None,
    confidence: float,
    source_chunk_id: str | None,
    status: str = "confirmed",
) -> MemoryFact:
    row = MemoryFact(
        id=_new_id(),
        user_id=user_id,
        fact_type=fact_type,
        subject=subject,
        predicate=predicate,
        object_json=object_json,
        confidence=confidence,
        source_chunk_id=source_chunk_id,
        status=status,
    )
    db.add(row)
    return row


async def get_memory_fact_for_user(
    db: AsyncSession, fact_id: str, user_id: str
) -> MemoryFact | None:
    row = await db.get(MemoryFact, fact_id)
    if row is None or row.user_id != user_id:
        return None
    return row


async def set_memory_fact_status(
    db: AsyncSession, fact_id: str, user_id: str, status: str
) -> bool:
    row = await get_memory_fact_for_user(db, fact_id, user_id)
    if row is None:
        return False
    row.status = status
    return True


def delete_timeline_events_by_memory_source_sync(
    session: Session, *, user_id: str, memory_source_id: str
) -> int:
    stmt = delete(TimelineEvent).where(
        TimelineEvent.user_id == user_id,
        TimelineEvent.memory_source_id == memory_source_id,
    )
    result = session.execute(stmt)
    return result.rowcount or 0


async def delete_timeline_events_by_memory_source(
    db: AsyncSession, *, user_id: str, memory_source_id: str
) -> int:
    stmt = delete(TimelineEvent).where(
        TimelineEvent.user_id == user_id,
        TimelineEvent.memory_source_id == memory_source_id,
    )
    result = await db.execute(stmt)
    return result.rowcount or 0


def create_timeline_event_sync(
    session: Session,
    *,
    user_id: str,
    event_year: int | None,
    event_date: str | None,
    title: str,
    description: str | None,
    person_refs: list | None = None,
    source_fact_ids: list[str] | None = None,
    memory_source_id: str | None = None,
) -> TimelineEvent:
    row = TimelineEvent(
        id=_new_id(),
        user_id=user_id,
        memory_source_id=memory_source_id,
        event_year=event_year,
        event_date=event_date,
        title=title,
        description=description,
        person_refs=person_refs,
        source_fact_ids=source_fact_ids,
    )
    session.add(row)
    return row


async def create_timeline_event(
    db: AsyncSession,
    *,
    user_id: str,
    event_year: int | None,
    event_date: str | None,
    title: str,
    description: str | None,
    person_refs: list | None = None,
    source_fact_ids: list[str] | None = None,
    memory_source_id: str | None = None,
) -> TimelineEvent:
    row = TimelineEvent(
        id=_new_id(),
        user_id=user_id,
        memory_source_id=memory_source_id,
        event_year=event_year,
        event_date=event_date,
        title=title,
        description=description,
        person_refs=person_refs,
        source_fact_ids=source_fact_ids,
    )
    db.add(row)
    return row


def create_curation_action_sync(
    session: Session,
    *,
    user_id: str,
    action_type: str,
    target_type: str,
    target_id: str,
    details: dict | None = None,
) -> MemoryCurationAction:
    row = MemoryCurationAction(
        id=_new_id(),
        user_id=user_id,
        action_type=action_type,
        target_type=target_type,
        target_id=target_id,
        details=details,
    )
    session.add(row)
    return row


async def create_curation_action(
    db: AsyncSession,
    *,
    user_id: str,
    action_type: str,
    target_type: str,
    target_id: str,
    details: dict | None = None,
) -> MemoryCurationAction:
    row = MemoryCurationAction(
        id=_new_id(),
        user_id=user_id,
        action_type=action_type,
        target_type=target_type,
        target_id=target_id,
        details=details,
    )
    db.add(row)
    return row


async def get_memory_chunk_for_user(
    db: AsyncSession, chunk_id: str, user_id: str
) -> MemoryChunk | None:
    row = await db.get(MemoryChunk, chunk_id)
    if row is None or row.user_id != user_id:
        return None
    return row


def get_memory_chunk_sync(
    session: Session, chunk_id: str, user_id: str
) -> MemoryChunk | None:
    row = session.get(MemoryChunk, chunk_id)
    if row is None or row.user_id != user_id:
        return None
    return row


def set_chunk_excluded_sync(
    session: Session, chunk_id: str, user_id: str, excluded: bool
) -> bool:
    row = get_memory_chunk_sync(session, chunk_id, user_id)
    if row is None:
        return False
    row.is_excluded = excluded
    return True


def list_incremental_chunks_for_compaction_sync(
    session: Session,
    *,
    user_id: str,
    after_cursor_ts: datetime,
    after_chunk_id: str,
    limit: int,
    candidate_chunk_ids: list[str] | None = None,
    candidate_source_ids: list[str] | None = None,
) -> list[MemoryChunk]:
    """增量 chunk：(created_at, id) 字典序大于游标；可选与候选 id/source 求交。"""
    stmt = (
        select(MemoryChunk)
        .where(
            MemoryChunk.user_id == user_id,
            tuple_(MemoryChunk.created_at, MemoryChunk.id)
            > tuple_(literal(after_cursor_ts), literal(after_chunk_id)),
            or_(MemoryChunk.is_excluded.is_(False), MemoryChunk.is_excluded.is_(None)),
        )
        .order_by(MemoryChunk.created_at.asc(), MemoryChunk.id.asc())
        .limit(limit)
    )
    if candidate_chunk_ids:
        stmt = stmt.where(MemoryChunk.id.in_(candidate_chunk_ids))
    if candidate_source_ids:
        stmt = stmt.where(MemoryChunk.source_id.in_(candidate_source_ids))
    rows = session.execute(stmt).unique().scalars().all()
    return list(rows)


def get_first_chunk_after_cursor_sync(
    session: Session,
    *,
    user_id: str,
    after_cursor_ts: datetime,
    after_chunk_id: str,
) -> MemoryChunk | None:
    """游标之后字典序第一条 chunk（含 excluded），用于空增量时推进游标。"""
    stmt = (
        select(MemoryChunk)
        .where(
            MemoryChunk.user_id == user_id,
            tuple_(MemoryChunk.created_at, MemoryChunk.id)
            > tuple_(literal(after_cursor_ts), literal(after_chunk_id)),
        )
        .order_by(MemoryChunk.created_at.asc(), MemoryChunk.id.asc())
        .limit(1)
    )
    return session.execute(stmt).scalars().first()


def search_nearest_chunks_for_compaction_sync(
    session: Session,
    *,
    user_id: str,
    chunk_id: str,
    query_embedding: list[float],
    limit: int,
) -> list[dict]:
    """
    按余弦距离取 Top-K 近邻（不含自身）。pgvector `<=>` 为 cosine distance。
    返回 dict: id, content, source_id, event_year, metadata_json, source_type,
    distance, created_at
    """
    if not query_embedding:
        return []
    stmt = text("""
        SELECT mc.id, mc.content, mc.source_id, mc.event_year, mc.metadata_json,
               ms.source_type, mc.created_at,
               (mc.embedding <=> CAST(:emb AS vector)) AS distance
        FROM memory_chunks mc
        JOIN memory_sources ms ON ms.id = mc.source_id
        WHERE mc.user_id = :user_id
          AND (mc.is_excluded IS NOT TRUE OR mc.is_excluded = false)
          AND mc.embedding IS NOT NULL
          AND mc.id != :chunk_id
        ORDER BY mc.embedding <=> CAST(:emb2 AS vector)
        LIMIT :lim
    """)
    emb_str = "[" + ",".join(str(x) for x in query_embedding) + "]"
    result = session.execute(
        stmt,
        {
            "user_id": user_id,
            "chunk_id": chunk_id,
            "emb": emb_str,
            "emb2": emb_str,
            "lim": limit,
        },
    )
    return [
        {
            "id": r["id"],
            "content": r["content"],
            "source_id": r["source_id"],
            "event_year": r["event_year"],
            "metadata_json": r["metadata_json"],
            "source_type": r["source_type"],
            "created_at": r["created_at"],
            "distance": float(r["distance"]),
        }
        for r in result.mappings().all()
    ]


async def set_chunk_excluded(
    db: AsyncSession, chunk_id: str, user_id: str, excluded: bool
) -> bool:
    row = await get_memory_chunk_for_user(db, chunk_id, user_id)
    if row is None:
        return False
    row.is_excluded = excluded
    return True


async def list_summaries_for_evidence_async(
    db: AsyncSession, *, user_id: str, q: str, limit: int
) -> list[dict]:
    if not (q or "").strip():
        return []
    pat = f"%{q.strip()}%"
    rolling_stmt = (
        select(MemorySummary)
        .where(
            MemorySummary.user_id == user_id,
            MemorySummary.summary_type == "rolling",
        )
        .order_by(MemorySummary.updated_at.desc())
        .limit(1)
    )
    r_result = await db.execute(rolling_stmt)
    rolling = r_result.unique().scalar_one_or_none()
    rows: list[MemorySummary] = []
    seen: set[str] = set()
    if rolling:
        rows.append(rolling)
        seen.add(rolling.id)
    rest = limit - len(rows)
    if rest > 0:
        stmt = (
            select(MemorySummary)
            .where(
                MemorySummary.user_id == user_id,
                MemorySummary.content.ilike(pat),
            )
            .order_by(MemorySummary.updated_at.desc())
            .limit(rest + len(seen))
        )
        o_result = await db.execute(stmt)
        for s in o_result.unique().scalars().all():
            if s.id not in seen:
                rows.append(s)
                seen.add(s.id)
            if len(rows) >= limit:
                break
    return [
        {
            "id": s.id,
            "summary_type": s.summary_type,
            "content": s.content,
            "source_chunk_ids": s.source_chunk_ids,
        }
        for s in rows[:limit]
    ]
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								"""Memory repository — MemorySource, MemoryChunk, MemoryFact, TimelineEvent data access."""
 								import uuid
 								from datetime import datetime, timezone
-												feat(api): Memory compaction 管线与调度修复，同步环境变量示例
Memory compaction（近重复 chunk 软排除）
- 新增 compaction 调度：Redis debounce、scheduler gate、增量游标；任务结束时 finalize，避免 gate 长期占用并处理运行期新 trigger。
- Celery memory_compaction_run：debounce 未到点则 retry；用户级 Redis 锁；成功路径更新游标并 finalize；异常时释放 scheduler gate 并 self.retry，避免静默卡死调度与瞬时失败不重试。
- compaction_service：多层判定 + canonical 打分；无 embedding 时停止前移游标（awaiting_embeddings）；curation details 补全 trigger 等上下文。
- ingest_transcript_sync：同步路径尽力写入 embedding，与异步 ingest 行为对齐，避免 compaction 永远扫不到无向量 chunk。
- repo：新增 update_chunk_embedding_sync。
测试
- 扩展 test_memory_compaction：调度合并、finalize、ingest embedding、无向量游标、异常路径 gate+retry 等回归用

											
										
										
											2026-03-30 10:46:35 +08:00
+								from sqlalchemy import delete, literal, or_, select, text, tuple_
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								from sqlalchemy.ext.asyncio import AsyncSession
 								from sqlalchemy.orm import Session
 								from app.features.memory.models import (
 								    MemoryChunk,
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    MemoryCurationAction,
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								    MemoryFact,
 								    MemorySource,
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    MemorySummary,
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								    TimelineEvent,
 								)
 								def _new_id() -> str:
 								    return str(uuid.uuid4())
 								def create_source_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    source_type: str,
 								    raw_text: str | None = None,
 								    conversation_id: str | None = None,
 								    captured_at: datetime | None = None,
 								) -> MemorySource:
 								    """Create a memory source (sync). Caller must commit."""
 								    source = MemorySource(
 								        id=_new_id(),
 								        user_id=user_id,
 								        source_type=source_type,
 								        raw_text=raw_text,
 								        conversation_id=conversation_id,
 								        captured_at=captured_at or datetime.now(timezone.utc),
 								    )
 								    session.add(source)
 								    return source
 								async def create_source(
 								    db: AsyncSession,
 								    *,
 								    user_id: str,
 								    source_type: str,
 								    raw_text: str | None = None,
 								    conversation_id: str | None = None,
 								    captured_at: datetime | None = None,
 								) -> MemorySource:
 								    """Create a memory source. Caller must commit."""
 								    source = MemorySource(
 								        id=_new_id(),
 								        user_id=user_id,
 								        source_type=source_type,
 								        raw_text=raw_text,
 								        conversation_id=conversation_id,
 								        captured_at=captured_at or datetime.now(timezone.utc),
 								    )
 								    db.add(source)
 								    return source
 								def create_chunk_sync(
 								    session: Session,
 								    *,
 								    source_id: str,
 								    user_id: str,
 								    content: str,
 								    chunk_index: int,
 								) -> MemoryChunk:
 								    """Create a memory chunk (sync). Caller must commit."""
 								    chunk = MemoryChunk(
 								        id=_new_id(),
 								        source_id=source_id,
 								        user_id=user_id,
 								        content=content,
 								        chunk_index=chunk_index,
 								    )
 								    session.add(chunk)
 								    return chunk
 								async def create_chunk(
 								    db: AsyncSession,
 								    *,
 								    source_id: str,
 								    user_id: str,
 								    content: str,
 								    chunk_index: int,
 								) -> MemoryChunk:
 								    """Create a memory chunk. Caller must commit."""
 								    chunk = MemoryChunk(
 								        id=_new_id(),
 								        source_id=source_id,
 								        user_id=user_id,
 								        content=content,
 								        chunk_index=chunk_index,
 								    )
 								    db.add(chunk)
 								    return chunk
 								def update_chunk_fts_sync(session: Session, chunk_id: str) -> None:
 								    """Populate content_tsv for FTS (sync). Caller must commit."""
 								    session.execute(
 								        text(
 								            "UPDATE memory_chunks SET content_tsv = to_tsvector('simple', content) WHERE id = :id"
 								        ),
 								        {"id": chunk_id},
 								    )
-												feat(api): Memory compaction 管线与调度修复，同步环境变量示例
Memory compaction（近重复 chunk 软排除）
- 新增 compaction 调度：Redis debounce、scheduler gate、增量游标；任务结束时 finalize，避免 gate 长期占用并处理运行期新 trigger。
- Celery memory_compaction_run：debounce 未到点则 retry；用户级 Redis 锁；成功路径更新游标并 finalize；异常时释放 scheduler gate 并 self.retry，避免静默卡死调度与瞬时失败不重试。
- compaction_service：多层判定 + canonical 打分；无 embedding 时停止前移游标（awaiting_embeddings）；curation details 补全 trigger 等上下文。
- ingest_transcript_sync：同步路径尽力写入 embedding，与异步 ingest 行为对齐，避免 compaction 永远扫不到无向量 chunk。
- repo：新增 update_chunk_embedding_sync。
测试
- 扩展 test_memory_compaction：调度合并、finalize、ingest embedding、无向量游标、异常路径 gate+retry 等回归用

											
										
										
											2026-03-30 10:46:35 +08:00
+								def update_chunk_embedding_sync(
 								    session: Session, chunk_id: str, embedding: list[float]
 								) -> None:
 								    """Update chunk embedding (sync). Caller must commit."""
 								    chunk = session.get(MemoryChunk, chunk_id)
 								    if chunk:
 								        chunk.embedding = embedding
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								async def update_chunk_embedding(
 								    db: AsyncSession, chunk_id: str, embedding: list[float]
 								) -> None:
 								    """Update chunk embedding. Caller must commit."""
 								    chunk = await db.get(MemoryChunk, chunk_id)
 								    if chunk:
 								        chunk.embedding = embedding
 								async def update_chunk_fts(db: AsyncSession, chunk_id: str) -> None:
 								    """Populate content_tsv for FTS. Caller must commit."""
 								    await db.execute(
 								        text(
 								            "UPDATE memory_chunks SET content_tsv = to_tsvector('simple', content) WHERE id = :id"
 								        ),
 								        {"id": chunk_id},
 								    )
 								async def search_chunks_fts(
 								    db: AsyncSession, user_id: str, query: str, limit: int = 20
 								) -> list[dict]:
 								    """FTS search on memory_chunks. Returns list of {id, content, chunk_index}."""
 								    if not query or not query.strip():
 								        return []
 								    q = query.strip()
 								    stmt = text("""
 								        SELECT id, content, chunk_index
 								        FROM memory_chunks
 								        WHERE user_id = :user_id AND (is_excluded IS NOT TRUE OR is_excluded = false)
 								          AND content_tsv IS NOT NULL AND content_tsv @@ plainto_tsquery('simple', :q)
 								        ORDER BY ts_rank_cd(content_tsv, plainto_tsquery('simple', :q2)) DESC
 								        LIMIT :lim
 								    """)
 								    result = await db.execute(stmt, {"user_id": user_id, "q": q, "q2": q, "lim": limit})
 								    rows = result.mappings().all()
 								    return [
 								        {"id": r["id"], "content": r["content"], "chunk_index": r["chunk_index"]}
 								        for r in rows
 								    ]
 								async def get_chunks_by_ids(
 								    db: AsyncSession, chunk_ids: list[str]
 								) -> list[MemoryChunk]:
 								    """Fetch chunks by IDs."""
 								    if not chunk_ids:
 								        return []
 								    stmt = select(MemoryChunk).where(MemoryChunk.id.in_(chunk_ids))
 								    result = await db.execute(stmt)
 								    chunks = list(result.unique().scalars().all())
 								    order = {cid: i for i, cid in enumerate(chunk_ids)}
 								    return sorted(chunks, key=lambda c: order.get(c.id, 999))
 								async def get_facts_for_user(
 								    db: AsyncSession, user_id: str, limit: int = 20
 								) -> list[MemoryFact]:
 								    """Fetch recent facts for user."""
 								    stmt = (
 								        select(MemoryFact)
 								        .where(MemoryFact.user_id == user_id, MemoryFact.status == "confirmed")
 								        .order_by(MemoryFact.created_at.desc())
 								        .limit(limit)
 								    )
 								    result = await db.execute(stmt)
 								    return list(result.unique().scalars().all())
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								def get_facts_for_user_sync(
 								    session: Session, user_id: str, limit: int = 20
 								) -> list[MemoryFact]:
 								    stmt = (
 								        select(MemoryFact)
 								        .where(MemoryFact.user_id == user_id, MemoryFact.status == "confirmed")
 								        .order_by(MemoryFact.created_at.desc())
 								        .limit(limit)
 								    )
 								    return list(session.execute(stmt).unique().scalars().all())
 								def get_timeline_events_for_user_sync(
 								    session: Session, user_id: str, limit: int = 20
 								) -> list[TimelineEvent]:
 								    stmt = (
 								        select(TimelineEvent)
 								        .where(TimelineEvent.user_id == user_id)
 								        .order_by(
 								            TimelineEvent.event_year.desc().nullslast(), TimelineEvent.created_at.desc()
 								        )
 								        .limit(limit)
 								    )
 								    return list(session.execute(stmt).unique().scalars().all())
 								def search_chunks_fts_sync(
 								    session: Session, user_id: str, query: str, limit: int = 20
 								) -> list[dict]:
 								    """FTS on memory_chunks（sync，Celery）。"""
 								    if not query or not query.strip():
 								        return []
 								    q = query.strip()
 								    stmt = text("""
 								        SELECT id, content, chunk_index
 								        FROM memory_chunks
 								        WHERE user_id = :user_id AND (is_excluded IS NOT TRUE OR is_excluded = false)
 								          AND content_tsv IS NOT NULL AND content_tsv @@ plainto_tsquery('simple', :q)
 								        ORDER BY ts_rank_cd(content_tsv, plainto_tsquery('simple', :q2)) DESC
 								        LIMIT :lim
 								    """)
 								    result = session.execute(stmt, {"user_id": user_id, "q": q, "q2": q, "lim": limit})
 								    rows = result.mappings().all()
 								    return [
 								        {"id": r["id"], "content": r["content"], "chunk_index": r["chunk_index"]}
 								        for r in rows
 								    ]
 								def search_facts_for_user_sync(
 								    session: Session, user_id: str, query: str, limit: int = 20
 								) -> list[MemoryFact]:
 								    q = (query or "").strip()
 								    if not q:
 								        return get_facts_for_user_sync(session, user_id, limit)
 								    pat = f"%{q}%"
 								    stmt = (
 								        select(MemoryFact)
 								        .where(
 								            MemoryFact.user_id == user_id,
 								            MemoryFact.status == "confirmed",
 								            or_(MemoryFact.subject.ilike(pat), MemoryFact.predicate.ilike(pat)),
 								        )
 								        .order_by(MemoryFact.created_at.desc())
 								        .limit(limit)
 								    )
 								    rows = list(session.execute(stmt).unique().scalars().all())
 								    if rows:
 								        return rows
 								    return get_facts_for_user_sync(session, user_id, limit)
 								async def search_facts_for_user_async(
 								    db: AsyncSession, user_id: str, query: str, limit: int = 20
 								) -> list[MemoryFact]:
 								    q = (query or "").strip()
 								    if not q:
 								        return await get_facts_for_user(db, user_id=user_id, limit=limit)
 								    pat = f"%{q}%"
 								    stmt = (
 								        select(MemoryFact)
 								        .where(
 								            MemoryFact.user_id == user_id,
 								            MemoryFact.status == "confirmed",
 								            or_(MemoryFact.subject.ilike(pat), MemoryFact.predicate.ilike(pat)),
 								        )
 								        .order_by(MemoryFact.created_at.desc())
 								        .limit(limit)
 								    )
 								    result = await db.execute(stmt)
 								    rows = list(result.unique().scalars().all())
 								    if rows:
 								        return rows
 								    return await get_facts_for_user(db, user_id=user_id, limit=limit)
 								def search_timeline_events_for_user_sync(
 								    session: Session, user_id: str, query: str, limit: int = 20
 								) -> list[TimelineEvent]:
 								    q = (query or "").strip()
 								    if not q:
 								        return get_timeline_events_for_user_sync(session, user_id, limit)
 								    pat = f"%{q}%"
 								    stmt = (
 								        select(TimelineEvent)
 								        .where(
 								            TimelineEvent.user_id == user_id,
 								            or_(
 								                TimelineEvent.title.ilike(pat),
 								                TimelineEvent.description.ilike(pat),
 								            ),
 								        )
 								        .order_by(TimelineEvent.event_year.desc().nullslast())
 								        .limit(limit)
 								    )
 								    rows = list(session.execute(stmt).unique().scalars().all())
 								    if rows:
 								        return rows
 								    return get_timeline_events_for_user_sync(session, user_id, limit)
 								async def search_timeline_events_for_user_async(
 								    db: AsyncSession, user_id: str, query: str, limit: int = 20
 								) -> list[TimelineEvent]:
 								    q = (query or "").strip()
 								    if not q:
 								        return await get_timeline_events_for_user(db, user_id=user_id, limit=limit)
 								    pat = f"%{q}%"
 								    stmt = (
 								        select(TimelineEvent)
 								        .where(
 								            TimelineEvent.user_id == user_id,
 								            or_(
 								                TimelineEvent.title.ilike(pat),
 								                TimelineEvent.description.ilike(pat),
 								            ),
 								        )
 								        .order_by(TimelineEvent.event_year.desc().nullslast())
 								        .limit(limit)
 								    )
 								    result = await db.execute(stmt)
 								    rows = list(result.unique().scalars().all())
 								    if rows:
 								        return rows
 								    return await get_timeline_events_for_user(db, user_id=user_id, limit=limit)
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								async def search_chunks_vector(
 								    db: AsyncSession, user_id: str, query_embedding: list[float], limit: int = 20
 								) -> list[dict]:
 								    """Vector similarity search. Returns list of {id, content, chunk_index, distance}."""
 								    if not query_embedding:
 								        return []
 								    # pgvector cosine distance: 1 - cosine_similarity, lower is better
 								    stmt = text("""
 								        SELECT id, content, chunk_index,
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								               (embedding <=> CAST(:emb AS vector)) AS distance
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								        FROM memory_chunks
 								        WHERE user_id = :user_id AND (is_excluded IS NOT TRUE OR is_excluded = false)
 								          AND embedding IS NOT NULL
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								        ORDER BY embedding <=> CAST(:emb2 AS vector)
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								        LIMIT :lim
 								    """)
 								    emb_str = "[" + ",".join(str(x) for x in query_embedding) + "]"
 								    result = await db.execute(
 								        stmt,
 								        {"user_id": user_id, "emb": emb_str, "emb2": emb_str, "lim": limit},
 								    )
 								    rows = result.mappings().all()
 								    return [
 								        {
 								            "id": r["id"],
 								            "content": r["content"],
 								            "chunk_index": r["chunk_index"],
 								            "distance": float(r["distance"]),
 								        }
 								        for r in rows
 								    ]
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								def list_summaries_for_evidence_sync(
 								    session: Session, *, user_id: str, q: str, limit: int
 								) -> list[dict]:
 								    """最新 rolling + 内容匹配 query 的摘要（ILIKE）。"""
 								    pat = f"%{q}%"
 								    rolling = (
 								        session.execute(
 								            select(MemorySummary)
 								            .where(
 								                MemorySummary.user_id == user_id,
 								                MemorySummary.summary_type == "rolling",
 								            )
 								            .order_by(MemorySummary.updated_at.desc())
 								            .limit(1)
 								        )
 								        .unique()
 								        .scalar_one_or_none()
 								    )
 								    rows: list[MemorySummary] = []
 								    seen: set[str] = set()
 								    if rolling:
 								        rows.append(rolling)
 								        seen.add(rolling.id)
 								    rest = limit - len(rows)
 								    if rest > 0:
 								        stmt = (
 								            select(MemorySummary)
 								            .where(
 								                MemorySummary.user_id == user_id,
 								                MemorySummary.content.ilike(pat),
 								            )
 								            .order_by(MemorySummary.updated_at.desc())
 								            .limit(rest + len(seen))
 								        )
 								        for s in session.execute(stmt).unique().scalars().all():
 								            if s.id not in seen:
 								                rows.append(s)
 								                seen.add(s.id)
 								            if len(rows) >= limit:
 								                break
 								    return [
 								        {
 								            "id": s.id,
 								            "summary_type": s.summary_type,
 								            "content": s.content,
 								            "source_chunk_ids": s.source_chunk_ids,
 								        }
 								        for s in rows[:limit]
 								    ]
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								def retrieve_evidence_sync(
 								    session: Session, user_id: str, query: str, *, top_k: int = 10
 								) -> dict:
 								    """
 								    Sync evidence retrieval for Celery tasks.
-												feat(api+app): 对话阶段化、回忆录流水线与客户端会话体验
- DB: segments 用户输入文本（Alembic 0002）
- Chat: 阶段检测/阶段提示/回复限制，编排与访谈/画像 prompts 调整
- Memoir: 忠实度检查 agent，叙事与分类等链路更新
- Core: agent 日志、Alembic 启动、LangChain/日志/配置等
- Story: time_hints；Memory 检索与相关测试
- Expo: 助手头像、会话页与消息拆分、实时会话与文案/i18n
- Docs/scripts/tests: 迁移脚本、LLM JSON/记忆检索文档、新增单测

											
										
										
											2026-03-26 12:13:36 +08:00
 								    能力：**仅 FTS** 检索 chunks（与 `HybridRetriever` 的 FTS+向量 RRF 不同，见
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    `api/docs/memory-retrieval.md`）；facts/timeline 按 query ILIKE；fallback 见 repo。
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
+								    """
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								    from app.features.memory.evidence import retrieve_evidence_bundle_sync
 								    return retrieve_evidence_bundle_sync(session, user_id, query, top_k=top_k)
-												重构回忆录为 story-first / markdown-first 架构并整合图片意图与前端 UI 修复

本次 squash merge 将 codex-story-first-image-intent 的整体改动合入 development，核心内容包括：

1. 后端数据与迁移：新增 stories、story_versions、story_image_intents、chapter_cover_intents、assets 等模型与 Alembic 迁移，建立 story-first、markdown-first、asset-first 的主数据链路。

2. 生成与任务链：引入 StoryBuilderOrchestrator、ChapterComposerOrchestrator、story_image_tasks、chapter_cover_tasks，图片生成从正文占位符改为结构化 intent -> asset -> markdown 回填。

3. 并发与一致性：为 story/chapter intent 增加 claim_token、claimed_at、attempt_count，采用数据库原子 claim 为主、Redis 锁为辅，避免重复生成、锁误删和 processing 卡死。

4. Memoir 读写路径：章节 canonical_markdown 成为正文真源，列表/详情接口补齐 markdown、cover_asset、word_count 等字段，PDF 与 asset 解析链路同步升级。

5. Memory / Retrieval：扩展 transcript ingest、chunking、evidence 检索与 story 聚合基础设施，为后续 story-first RAG 与多 agent 编排提供底座。

6. App 端体验：章节页继续走 MarkdownRenderer 阅读链，同时吸收 fix3-19 的跨平台 UI glitch 修复；更新对话页、首页、文案资源与章节列表映射逻辑。

7. 测试与文档：补充 asset resolver、story image task、章节封面派发、markdown 映射等回归测试，并加入图片占位符退役设计文档。

											
										
										
											2026-03-20 10:30:07 +08:00
 								async def get_timeline_events_for_user(
 								    db: AsyncSession, user_id: str, limit: int = 20
 								) -> list[TimelineEvent]:
 								    """Fetch timeline events for user."""
 								    stmt = (
 								        select(TimelineEvent)
 								        .where(TimelineEvent.user_id == user_id)
 								        .order_by(
 								            TimelineEvent.event_year.desc().nullslast(), TimelineEvent.created_at.desc()
 								        )
 								        .limit(limit)
 								    )
 								    result = await db.execute(stmt)
 								    return list(result.unique().scalars().all())
-												fix/various fixes

											
										
										
											2026-03-20 15:15:35 +08:00
 								async def list_storage_keys_for_conversation(
 								    db: AsyncSession, conversation_id: str
 								) -> list[str]:
 								    """对话关联的 memory_sources 上记录的 COS object key（若有）。"""
 								    stmt = select(MemorySource.storage_key).where(
 								        MemorySource.conversation_id == conversation_id,
 								        MemorySource.storage_key.isnot(None),
 								    )
 								    result = await db.execute(stmt)
 								    return sorted({r for r in result.scalars().all() if r})
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
 								def list_chunks_for_source_sync(session: Session, source_id: str) -> list[MemoryChunk]:
 								    stmt = (
 								        select(MemoryChunk)
 								        .where(MemoryChunk.source_id == source_id)
 								        .order_by(MemoryChunk.chunk_index.asc())
 								    )
 								    return list(session.execute(stmt).unique().scalars().all())
 								def create_memory_summary_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    summary_type: str,
 								    content: str,
 								    source_chunk_ids: list[str] | None = None,
 								) -> MemorySummary:
 								    row = MemorySummary(
 								        id=_new_id(),
 								        user_id=user_id,
 								        summary_type=summary_type,
 								        content=content,
 								        source_chunk_ids=source_chunk_ids,
 								    )
 								    session.add(row)
 								    return row
 								async def create_memory_summary(
 								    db: AsyncSession,
 								    *,
 								    user_id: str,
 								    summary_type: str,
 								    content: str,
 								    source_chunk_ids: list[str] | None = None,
 								) -> MemorySummary:
 								    row = MemorySummary(
 								        id=_new_id(),
 								        user_id=user_id,
 								        summary_type=summary_type,
 								        content=content,
 								        source_chunk_ids=source_chunk_ids,
 								    )
 								    db.add(row)
 								    return row
 								def get_latest_rolling_summary_sync(
 								    session: Session, user_id: str
 								) -> MemorySummary | None:
 								    stmt = (
 								        select(MemorySummary)
 								        .where(
 								            MemorySummary.user_id == user_id,
 								            MemorySummary.summary_type == "rolling",
 								        )
 								        .order_by(MemorySummary.updated_at.desc())
 								        .limit(1)
 								    )
 								    return session.execute(stmt).unique().scalar_one_or_none()
 								def upsert_rolling_summary_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    content: str,
 								    source_chunk_ids: list[str] | None = None,
 								) -> MemorySummary:
 								    existing = get_latest_rolling_summary_sync(session, user_id)
 								    if existing:
 								        existing.content = content
 								        if source_chunk_ids is not None:
 								            existing.source_chunk_ids = source_chunk_ids
 								        return existing
 								    return create_memory_summary_sync(
 								        session,
 								        user_id=user_id,
 								        summary_type="rolling",
 								        content=content,
 								        source_chunk_ids=source_chunk_ids,
 								    )
 								def create_memory_fact_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    fact_type: str,
 								    subject: str | None,
 								    predicate: str | None,
 								    object_json: dict | None,
 								    confidence: float,
 								    source_chunk_id: str | None,
 								    status: str = "confirmed",
 								) -> MemoryFact:
 								    row = MemoryFact(
 								        id=_new_id(),
 								        user_id=user_id,
 								        fact_type=fact_type,
 								        subject=subject,
 								        predicate=predicate,
 								        object_json=object_json,
 								        confidence=confidence,
 								        source_chunk_id=source_chunk_id,
 								        status=status,
 								    )
 								    session.add(row)
 								    return row
 								async def create_memory_fact(
 								    db: AsyncSession,
 								    *,
 								    user_id: str,
 								    fact_type: str,
 								    subject: str | None,
 								    predicate: str | None,
 								    object_json: dict | None,
 								    confidence: float,
 								    source_chunk_id: str | None,
 								    status: str = "confirmed",
 								) -> MemoryFact:
 								    row = MemoryFact(
 								        id=_new_id(),
 								        user_id=user_id,
 								        fact_type=fact_type,
 								        subject=subject,
 								        predicate=predicate,
 								        object_json=object_json,
 								        confidence=confidence,
 								        source_chunk_id=source_chunk_id,
 								        status=status,
 								    )
 								    db.add(row)
 								    return row
 								async def get_memory_fact_for_user(
 								    db: AsyncSession, fact_id: str, user_id: str
 								) -> MemoryFact | None:
 								    row = await db.get(MemoryFact, fact_id)
 								    if row is None or row.user_id != user_id:
 								        return None
 								    return row
 								async def set_memory_fact_status(
 								    db: AsyncSession, fact_id: str, user_id: str, status: str
 								) -> bool:
 								    row = await get_memory_fact_for_user(db, fact_id, user_id)
 								    if row is None:
 								        return False
 								    row.status = status
 								    return True
 								def delete_timeline_events_by_memory_source_sync(
 								    session: Session, *, user_id: str, memory_source_id: str
 								) -> int:
 								    stmt = delete(TimelineEvent).where(
 								        TimelineEvent.user_id == user_id,
 								        TimelineEvent.memory_source_id == memory_source_id,
 								    )
 								    result = session.execute(stmt)
 								    return result.rowcount or 0
 								async def delete_timeline_events_by_memory_source(
 								    db: AsyncSession, *, user_id: str, memory_source_id: str
 								) -> int:
 								    stmt = delete(TimelineEvent).where(
 								        TimelineEvent.user_id == user_id,
 								        TimelineEvent.memory_source_id == memory_source_id,
 								    )
 								    result = await db.execute(stmt)
 								    return result.rowcount or 0
 								def create_timeline_event_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    event_year: int | None,
 								    event_date: str | None,
 								    title: str,
 								    description: str | None,
 								    person_refs: list | None = None,
 								    source_fact_ids: list[str] | None = None,
 								    memory_source_id: str | None = None,
 								) -> TimelineEvent:
 								    row = TimelineEvent(
 								        id=_new_id(),
 								        user_id=user_id,
 								        memory_source_id=memory_source_id,
 								        event_year=event_year,
 								        event_date=event_date,
 								        title=title,
 								        description=description,
 								        person_refs=person_refs,
 								        source_fact_ids=source_fact_ids,
 								    )
 								    session.add(row)
 								    return row
 								async def create_timeline_event(
 								    db: AsyncSession,
 								    *,
 								    user_id: str,
 								    event_year: int | None,
 								    event_date: str | None,
 								    title: str,
 								    description: str | None,
 								    person_refs: list | None = None,
 								    source_fact_ids: list[str] | None = None,
 								    memory_source_id: str | None = None,
 								) -> TimelineEvent:
 								    row = TimelineEvent(
 								        id=_new_id(),
 								        user_id=user_id,
 								        memory_source_id=memory_source_id,
 								        event_year=event_year,
 								        event_date=event_date,
 								        title=title,
 								        description=description,
 								        person_refs=person_refs,
 								        source_fact_ids=source_fact_ids,
 								    )
 								    db.add(row)
 								    return row
 								def create_curation_action_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    action_type: str,
 								    target_type: str,
 								    target_id: str,
 								    details: dict | None = None,
 								) -> MemoryCurationAction:
 								    row = MemoryCurationAction(
 								        id=_new_id(),
 								        user_id=user_id,
 								        action_type=action_type,
 								        target_type=target_type,
 								        target_id=target_id,
 								        details=details,
 								    )
 								    session.add(row)
 								    return row
 								async def create_curation_action(
 								    db: AsyncSession,
 								    *,
 								    user_id: str,
 								    action_type: str,
 								    target_type: str,
 								    target_id: str,
 								    details: dict | None = None,
 								) -> MemoryCurationAction:
 								    row = MemoryCurationAction(
 								        id=_new_id(),
 								        user_id=user_id,
 								        action_type=action_type,
 								        target_type=target_type,
 								        target_id=target_id,
 								        details=details,
 								    )
 								    db.add(row)
 								    return row
 								async def get_memory_chunk_for_user(
 								    db: AsyncSession, chunk_id: str, user_id: str
 								) -> MemoryChunk | None:
 								    row = await db.get(MemoryChunk, chunk_id)
 								    if row is None or row.user_id != user_id:
 								        return None
 								    return row
-												feat(api): Memory compaction 管线与调度修复，同步环境变量示例
Memory compaction（近重复 chunk 软排除）
- 新增 compaction 调度：Redis debounce、scheduler gate、增量游标；任务结束时 finalize，避免 gate 长期占用并处理运行期新 trigger。
- Celery memory_compaction_run：debounce 未到点则 retry；用户级 Redis 锁；成功路径更新游标并 finalize；异常时释放 scheduler gate 并 self.retry，避免静默卡死调度与瞬时失败不重试。
- compaction_service：多层判定 + canonical 打分；无 embedding 时停止前移游标（awaiting_embeddings）；curation details 补全 trigger 等上下文。
- ingest_transcript_sync：同步路径尽力写入 embedding，与异步 ingest 行为对齐，避免 compaction 永远扫不到无向量 chunk。
- repo：新增 update_chunk_embedding_sync。
测试
- 扩展 test_memory_compaction：调度合并、finalize、ingest embedding、无向量游标、异常路径 gate+retry 等回归用

											
										
										
											2026-03-30 10:46:35 +08:00
+								def get_memory_chunk_sync(
 								    session: Session, chunk_id: str, user_id: str
 								) -> MemoryChunk | None:
 								    row = session.get(MemoryChunk, chunk_id)
 								    if row is None or row.user_id != user_id:
 								        return None
 								    return row
 								def set_chunk_excluded_sync(
 								    session: Session, chunk_id: str, user_id: str, excluded: bool
 								) -> bool:
 								    row = get_memory_chunk_sync(session, chunk_id, user_id)
 								    if row is None:
 								        return False
 								    row.is_excluded = excluded
 								    return True
 								def list_incremental_chunks_for_compaction_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    after_cursor_ts: datetime,
 								    after_chunk_id: str,
 								    limit: int,
 								    candidate_chunk_ids: list[str] | None = None,
 								    candidate_source_ids: list[str] | None = None,
 								) -> list[MemoryChunk]:
 								    """增量 chunk：(created_at, id) 字典序大于游标；可选与候选 id/source 求交。"""
 								    stmt = (
 								        select(MemoryChunk)
 								        .where(
 								            MemoryChunk.user_id == user_id,
 								            tuple_(MemoryChunk.created_at, MemoryChunk.id)
 								            > tuple_(literal(after_cursor_ts), literal(after_chunk_id)),
 								            or_(MemoryChunk.is_excluded.is_(False), MemoryChunk.is_excluded.is_(None)),
 								        )
 								        .order_by(MemoryChunk.created_at.asc(), MemoryChunk.id.asc())
 								        .limit(limit)
 								    )
 								    if candidate_chunk_ids:
 								        stmt = stmt.where(MemoryChunk.id.in_(candidate_chunk_ids))
 								    if candidate_source_ids:
 								        stmt = stmt.where(MemoryChunk.source_id.in_(candidate_source_ids))
 								    rows = session.execute(stmt).unique().scalars().all()
 								    return list(rows)
 								def get_first_chunk_after_cursor_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    after_cursor_ts: datetime,
 								    after_chunk_id: str,
 								) -> MemoryChunk | None:
 								    """游标之后字典序第一条 chunk（含 excluded），用于空增量时推进游标。"""
 								    stmt = (
 								        select(MemoryChunk)
 								        .where(
 								            MemoryChunk.user_id == user_id,
 								            tuple_(MemoryChunk.created_at, MemoryChunk.id)
 								            > tuple_(literal(after_cursor_ts), literal(after_chunk_id)),
 								        )
 								        .order_by(MemoryChunk.created_at.asc(), MemoryChunk.id.asc())
 								        .limit(1)
 								    )
 								    return session.execute(stmt).scalars().first()
 								def search_nearest_chunks_for_compaction_sync(
 								    session: Session,
 								    *,
 								    user_id: str,
 								    chunk_id: str,
 								    query_embedding: list[float],
 								    limit: int,
 								) -> list[dict]:
 								    """
 								    按余弦距离取 Top-K 近邻（不含自身）。pgvector `<=>` 为 cosine distance。
 								    返回 dict: id, content, source_id, event_year, metadata_json, source_type,
 								    distance, created_at
 								    """
 								    if not query_embedding:
 								        return []
 								    stmt = text("""
 								        SELECT mc.id, mc.content, mc.source_id, mc.event_year, mc.metadata_json,
 								               ms.source_type, mc.created_at,
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								               (mc.embedding <=> CAST(:emb AS vector)) AS distance
-												feat(api): Memory compaction 管线与调度修复，同步环境变量示例
Memory compaction（近重复 chunk 软排除）
- 新增 compaction 调度：Redis debounce、scheduler gate、增量游标；任务结束时 finalize，避免 gate 长期占用并处理运行期新 trigger。
- Celery memory_compaction_run：debounce 未到点则 retry；用户级 Redis 锁；成功路径更新游标并 finalize；异常时释放 scheduler gate 并 self.retry，避免静默卡死调度与瞬时失败不重试。
- compaction_service：多层判定 + canonical 打分；无 embedding 时停止前移游标（awaiting_embeddings）；curation details 补全 trigger 等上下文。
- ingest_transcript_sync：同步路径尽力写入 embedding，与异步 ingest 行为对齐，避免 compaction 永远扫不到无向量 chunk。
- repo：新增 update_chunk_embedding_sync。
测试
- 扩展 test_memory_compaction：调度合并、finalize、ingest embedding、无向量游标、异常路径 gate+retry 等回归用

											
										
										
											2026-03-30 10:46:35 +08:00
+								        FROM memory_chunks mc
 								        JOIN memory_sources ms ON ms.id = mc.source_id
 								        WHERE mc.user_id = :user_id
 								          AND (mc.is_excluded IS NOT TRUE OR mc.is_excluded = false)
 								          AND mc.embedding IS NOT NULL
 								          AND mc.id != :chunk_id
-												feat(api): 访谈人格/回复长度策略、口述归一、背景语气与输入净稿全链路

Chat 访谈
- 新增 persona 系统（default / warm_listener / curious_guide）与 background_voice 语气层
- 回复长度由 compute_reply_plan 统一决策（brief / standard / expanded），融合信息密度启发式
- 输入净稿（input_normalize）：编排层可选 rules/llm 归一用户口语后再喂模型与记忆检索
- 记忆证据注入：按用户话检索 memory evidence 并注入 prompt

Memoir 回忆录
- 口述归一（oral_normalize）：segment 原文保留，story 管线取派生净稿作叙事输入
- segment 入队批次门闸：累计字数 + 最长等待秒数，减少零碎提交
- fidelity_check / prompts / narrative_agent 微调
- Alembic 0005：清理跨章节 story 外键

Infra
- Dockerfile 加入 ffmpeg
- pyproject.toml 新增依赖并同步 uv.lock
- .env.example / .env.production 补全新配置项

Tests
- 新增 test_background_voice、test_chat_input_normalize、test_experience_regressions
- 扩展 test_interview_prompts、test_interview_reply_length、test_story_route_oral_invariant

Made-with: Cursor

											
										
										
											2026-03-31 23:55:26 +08:00
+								        ORDER BY mc.embedding <=> CAST(:emb2 AS vector)
-												feat(api): Memory compaction 管线与调度修复，同步环境变量示例
Memory compaction（近重复 chunk 软排除）
- 新增 compaction 调度：Redis debounce、scheduler gate、增量游标；任务结束时 finalize，避免 gate 长期占用并处理运行期新 trigger。
- Celery memory_compaction_run：debounce 未到点则 retry；用户级 Redis 锁；成功路径更新游标并 finalize；异常时释放 scheduler gate 并 self.retry，避免静默卡死调度与瞬时失败不重试。
- compaction_service：多层判定 + canonical 打分；无 embedding 时停止前移游标（awaiting_embeddings）；curation details 补全 trigger 等上下文。
- ingest_transcript_sync：同步路径尽力写入 embedding，与异步 ingest 行为对齐，避免 compaction 永远扫不到无向量 chunk。
- repo：新增 update_chunk_embedding_sync。
测试
- 扩展 test_memory_compaction：调度合并、finalize、ingest embedding、无向量游标、异常路径 gate+retry 等回归用

											
										
										
											2026-03-30 10:46:35 +08:00
+								        LIMIT :lim
 								    """)
 								    emb_str = "[" + ",".join(str(x) for x in query_embedding) + "]"
 								    result = session.execute(
 								        stmt,
 								        {
 								            "user_id": user_id,
 								            "chunk_id": chunk_id,
 								            "emb": emb_str,
 								            "emb2": emb_str,
 								            "lim": limit,
 								        },
 								    )
 								    return [
 								        {
 								            "id": r["id"],
 								            "content": r["content"],
 								            "source_id": r["source_id"],
 								            "event_year": r["event_year"],
 								            "metadata_json": r["metadata_json"],
 								            "source_type": r["source_type"],
 								            "created_at": r["created_at"],
 								            "distance": float(r["distance"]),
 								        }
 								        for r in result.mappings().all()
 								    ]
-												feat(memory,conversation): 记忆富化/证据包、时间线幂等字段与对话分段全链路

数据库
- 新增迁移 0003：timeline_events.memory_source_id 外键 → memory_sources，便于按 ingest 源做时间线幂等

后端 - 记忆
- 新增 ingest 后 LLM 富化（摘要/事实/时间线），可配置开关与最大字符数
- 新增证据包组装：合并 chunk、摘要、事实、时间线、故事等检索结果；支持空 query 时是否仍带 rolling 等开关
- repo/retriever/service/router/schemas/summarizer/timeline/extractor 等扩展；文档 memory-retrieval.md 更新

后端 - 对话 WS
- 增加 PING/PONG；分段 ASR 日志与空音频处理；转写失败与「无助手回复」错误提示更明确
- 助手多段回复持久化使用统一分隔符，与分段逻辑一致

后端 - Agent
- reply_limits：按 [SPLIT] 与段落拆段，并保证非空 fallback，供 WS 与 TTS 多段下发

后端 - 回忆录任务
- transcript ingest 记录 source_id；任务成功结?

											
										
										
											2026-03-27 16:01:28 +08:00
+								async def set_chunk_excluded(
 								    db: AsyncSession, chunk_id: str, user_id: str, excluded: bool
 								) -> bool:
 								    row = await get_memory_chunk_for_user(db, chunk_id, user_id)
 								    if row is None:
 								        return False
 								    row.is_excluded = excluded
 								    return True
 								async def list_summaries_for_evidence_async(
 								    db: AsyncSession, *, user_id: str, q: str, limit: int
 								) -> list[dict]:
 								    if not (q or "").strip():
 								        return []
 								    pat = f"%{q.strip()}%"
 								    rolling_stmt = (
 								        select(MemorySummary)
 								        .where(
 								            MemorySummary.user_id == user_id,
 								            MemorySummary.summary_type == "rolling",
 								        )
 								        .order_by(MemorySummary.updated_at.desc())
 								        .limit(1)
 								    )
 								    r_result = await db.execute(rolling_stmt)
 								    rolling = r_result.unique().scalar_one_or_none()
 								    rows: list[MemorySummary] = []
 								    seen: set[str] = set()
 								    if rolling:
 								        rows.append(rolling)
 								        seen.add(rolling.id)
 								    rest = limit - len(rows)
 								    if rest > 0:
 								        stmt = (
 								            select(MemorySummary)
 								            .where(
 								                MemorySummary.user_id == user_id,
 								                MemorySummary.content.ilike(pat),
 								            )
 								            .order_by(MemorySummary.updated_at.desc())
 								            .limit(rest + len(seen))
 								        )
 								        o_result = await db.execute(stmt)
 								        for s in o_result.unique().scalars().all():
 								            if s.id not in seen:
 								                rows.append(s)
 								                seen.add(s.id)
 								            if len(rows) >= limit:
 								                break
 								    return [
 								        {
 								            "id": s.id,
 								            "summary_type": s.summary_type,
 								            "content": s.content,
 								            "source_chunk_ids": s.source_chunk_ids,
 								        }
 								        for s in rows[:limit]
 								    ]