feat:

1. 建立问题库大纲，对应每个人生阶段槽位 2. 鼓励使用更生活化的交流语言共情与总结 3. 降低评审模型可能发生截断的概率 4. 成稿质量维度强化情感表达和上下文连贯性
2026-04-09 15:32:35 +08:00
parent 064ad2161d
commit e1341c6d18
49 changed files with 938 additions and 271 deletions
--- a/api/app/features/evaluation/rubrics/conversation_v1.py
+++ b/api/app/features/evaluation/rubrics/conversation_v1.py
@@ -21,8 +21,9 @@ _TURN_SCOPE = """

 _CONV_SCOPE = """
 ## 整段对话评审范围
- 在**完整 transcript**上，对 AI **多轮轨迹**做一次 holistic 评分（仍为同一 15 细项）。
- **聚合规则**：以「整段中**典型表现** + **最严重且反复出现的缺陷**」综合定档；若某维度在多轮中明显滑落，该维不得按最好一轮给满分。
+- 在输入所给的 transcript（含 `[Turn k]`）上，对 AI **多轮轨迹**做一次 holistic 评分（仍为同一 15 细项）。
+- 若正文后出现系统注入的「【评审边界——输入已为截断稿】」说明，则**只据此片段**评分：长程细项须保守，`confidence` 降低，并在 `insufficient_evidence` 声明证据范围；**禁止**臆断未展示轮次、**禁止**因未见缺陷而默认高分。
+- **聚合规则**：以**已展示轮次中**典型表现 + 最严重且反复的缺陷综合定档；若某维度在多轮中明显滑落，该维不得按最好一轮给满分。
 - 维度边界：`context_memory` 负责**重复盘问、前后矛盾追问、忽略已答信息**；`emotion_carry` 负责**情绪是否被接住**（不与采访腔混扣）；`rhythm_control` 负责**采访腔、总结腔、机械流程感**（本轮已承接情绪但仍像审讯，在此项体现）。

 """