- Playground · 交互测试
+ Playground · 分步测评
- 选择基线数据后点击「新建环境并重放」:每次都会新建临时测试用户与会话并完成重放;若因超时或手动停止中断,可用「继续未完成重放」在同一会话上接续(进度保存在本机)。左侧为导出快照,右侧为当前环境实际生成。
+ 三步流程:① 对话(逐轮 replay,skip_memoir,不触发记忆管线)→{" "}
+ ② 记忆(显式 memoir-submit,可选等待 Phase1)→{" "}
+ ③ 成稿(Memoir / Stories 查看异步成稿)。左侧为导出快照,右侧为当前环境实际生成。
了解更多
- 主按钮每次运行都会调用 eval-sandbox
- 再逐轮 replay。中断/Phase1 超时会写入本地草稿,可「继续未完成」同一 conversation。单轮等待 Phase1 默认最长
+ 对话阶段请求体带 skip_memoir: true 与{" "}
+ flush_memoir_after: false
+ ,与 App 主站默认管线不同,仅用于先把对话跑通。第 2 步提交后 Celery 执行 Phase1;轮询就绪默认最长{" "}
{MEMOIR_PHASE1_WAIT_MAX_MS / 60_000}
- 分钟(可用环境变量
- VITE_MEMOIR_PHASE1_WAIT_MAX_MS
- 覆盖,单位 ms)。默认每轮会等待 Phase1 后再发下一句;可关闭「等待 Phase1」做快速冒烟。左侧 AI
- 来自导出快照;右侧为当前后端生成;「清空」会同时清除可恢复草稿。自动评分需配置评审密钥。重放成功后会将会话写入「最近重放」列表。
+ 分钟(可用 VITE_MEMOIR_PHASE1_WAIT_MAX_MS{" "}
+ 覆盖)。中断时可「继续未完成重放」接续本机会话草稿。「清空」丢弃草稿与当前显示。
+
+
{pageErrors.length > 0 ? (
@@ -816,6 +989,7 @@ export default function PlaygroundPage() {
resetJudgeUi();
setDialogue([]);
setFallbackUserLines([]);
+ setWizardStep(1);
pushNotice("已清空本页显示并丢弃可恢复草稿;下次运行将重新创建临时用户。", "info");
}}
>
@@ -824,6 +998,12 @@ export default function PlaygroundPage() {
+
+
+ 步骤 1 对话重放
+
+
+
用户{" "}
@@ -859,7 +1039,7 @@ export default function PlaygroundPage() {
disabled={replayBusy || !canResumeReplay}
title={
canResumeReplay
- ? "在同一临时会话上从上次进度继续(含未完成的 Phase1 等待)"
+ ? "在同一临时会话上从上次进度继续发送用户句(本机草稿)"
: "无匹配的本地草稿时再试"
}
onClick={() => void runReplay(true)}
@@ -869,41 +1049,28 @@ export default function PlaygroundPage() {
-
-
+
+
-
轮询 {DIALOGUE_POLL_MS / 1000}s
@@ -950,6 +1123,85 @@ export default function PlaygroundPage() {