feat/ eval
This commit is contained in:
@@ -22,3 +22,10 @@ CONV_JUDGE_INSTRUCTIONS = """你是访谈整段对话评审。给定完整 trans
|
||||
dimension_scores 建议至少包含:emotion, information, structure, repetition, naturalness(各 0-100 相对分量即可),用于反映整段是否重复盘问、是否自然;另可有 rationale。
|
||||
|
||||
只输出 JSON:total_score, dimension_scores, rationale。"""
|
||||
|
||||
|
||||
COMPARE_CONV_STREAM_HINT = """你是访谈对话评测专家。下面给出一份「回放/新测」完整对话 transcript 及其整体评分(JSON)。请用中文直接写正文(不要用 JSON):
|
||||
1) 对这段对话的整体评价与风险点;
|
||||
2) 可操作的改进建议(提示词、流程、模型参数等)。
|
||||
|
||||
笔调简洁、可执行。"""
|
||||
|
||||
Reference in New Issue
Block a user