数据库与模型:新增多版迁移(章节证据快照、对话血缘、记忆事实/时间线 lineage 等),把「成稿 ↔ 对话/记忆」的溯源信息落到表结构里。 业务链路:会话与 WS、回忆录/故事流水线、记忆写入与 enrichment 等跟着接上线索与快照;新增章节证据快照与评测侧 EvalTraceService 等模块,方便组评审用的证据包。 内部评测:自动化 run 与手工 memoir 评审共用可追溯证据;rubric/ judge 相关脚本与文档有配套调整。 app-eval-web:Memoir/实验详情里能展开看证据摘要与 evidence_trace(含对话轮次 id);Vite 代理与 development.sh 注入的 API 端口与当前默认内部评测端口一致,避免改端口后页面连错服务。 工程杂项:GitHub Actions / 仓库说明有更新;各适配器与支付/配额/plan 等多处为小改动或跟随主改动的收尾;新增/扩充了?
27 lines
677 B
Python
27 lines
677 B
Python
"""评测实验 Celery 任务。"""
|
|
|
|
from __future__ import annotations
|
|
|
|
import asyncio
|
|
|
|
from celery import shared_task
|
|
|
|
from app.core.logging import get_logger
|
|
|
|
logger = get_logger(__name__)
|
|
|
|
|
|
@shared_task(
|
|
bind=True,
|
|
name="evaluation.run_experiment",
|
|
max_retries=1,
|
|
soft_time_limit=1800,
|
|
time_limit=2400,
|
|
)
|
|
def run_eval_experiment_task(self, experiment_id: str) -> None:
|
|
from app.features.evaluation.execution_service import execute_experiment_full
|
|
|
|
logger.info("evaluation task start experiment_id={}", experiment_id)
|
|
asyncio.run(execute_experiment_full(experiment_id))
|
|
logger.info("evaluation task done experiment_id={}", experiment_id)
|