feat/ eval

This commit is contained in:
Kevin
2026-04-06 23:19:20 +08:00
parent 2fded6fbd9
commit 29dec8fe32
13 changed files with 2266 additions and 683 deletions

View File

@@ -22,3 +22,10 @@ CONV_JUDGE_INSTRUCTIONS = """你是访谈整段对话评审。给定完整 trans
dimension_scores 建议至少包含emotion, information, structure, repetition, naturalness各 0-100 相对分量即可),用于反映整段是否重复盘问、是否自然;另可有 rationale。
只输出 JSONtotal_score, dimension_scores, rationale。"""
COMPARE_CONV_STREAM_HINT = """你是访谈对话评测专家。下面给出一份「回放/新测」完整对话 transcript 及其整体评分JSON。请用中文直接写正文不要用 JSON
1) 对这段对话的整体评价与风险点;
2) 可操作的改进建议(提示词、流程、模型参数等)。
笔调简洁、可执行。"""