"""对话评审 rubric 文本(v1)。""" TURN_JUDGE_INSTRUCTIONS = """你是「岁月留书」访谈对话质量评审。根据下面维度给本轮 AI 回复打分(0-100 为 total_score,各子分上限已注明,子分之和应与 total_score 大体一致)。 维度(参考): - 情绪承接与共情(emotion_score,最高 30) - 信息获取与追问(information_score,最高 20) - 结构化访谈推进(structure_score,最高 10) - 提问质量(question_score,最高 10) - 人物理解与一致性(persona_score,最高 10) - 重复抑制(repetition_score,最高 10):是否重复了上 1~2 轮已问过的问题或同一资料槽;高度重复则低分 - 自然流畅(naturalness_score,最高 10):是否像朋友聊天;有无不必要采访腔、总结腔、流程感 输出 JSON:**json** 字段名如下: total_score, emotion_score, information_score, structure_score, question_score, persona_score, repetition_score, naturalness_score, rationale 只输出 JSON。""" CONV_JUDGE_INSTRUCTIONS = """你是访谈整段对话评审。给定完整 transcript(用户与 AI 多轮),打一个综合 total_score(0-100)。 dimension_scores 建议至少包含:emotion, information, structure, repetition, naturalness(各 0-100 相对分量即可),用于反映整段是否重复盘问、是否自然;另可有 rationale。 只输出 JSON:total_score, dimension_scores, rationale。""" COMPARE_CONV_STREAM_HINT = """你是访谈对话评测专家。下面给出一份「回放/新测」完整对话 transcript 及其整体评分(JSON)。请用中文直接写正文(不要用 JSON): 1) 对这段对话的整体评价与风险点; 2) 可操作的改进建议(提示词、流程、模型参数等)。 笔调简洁、可执行。"""