1. 建立问题库大纲,对应每个人生阶段槽位
2. 鼓励使用更生活化的交流语言共情与总结
3. 降低评审模型可能发生截断的概率
4. 成稿质量维度强化情感表达和上下文连贯性
This commit is contained in:
yangshilin
2026-04-09 15:32:35 +08:00
parent 064ad2161d
commit e1341c6d18
49 changed files with 938 additions and 271 deletions

View File

@@ -21,8 +21,9 @@ _TURN_SCOPE = """
_CONV_SCOPE = """
## 整段对话评审范围
- 在**完整 transcript**上,对 AI **多轮轨迹**做一次 holistic 评分(仍为同一 15 细项)。
- **聚合规则**:以「整段中**典型表现** + **最严重且反复出现的缺陷**」综合定档;若某维度在多轮中明显滑落,该维不得按最好一轮给满分。
- 在输入所给的 transcript(含 `[Turn k]`上,对 AI **多轮轨迹**做一次 holistic 评分(仍为同一 15 细项)。
- 若正文后出现系统注入的「【评审边界——输入已为截断稿】」说明,则**只据此片段**评分:长程细项须保守,`confidence` 降低,并在 `insufficient_evidence` 声明证据范围;**禁止**臆断未展示轮次、**禁止**因未见缺陷而默认高分。
- **聚合规则**:以**已展示轮次中**典型表现 + 最严重且反复的缺陷综合定档;若某维度在多轮中明显滑落,该维不得按最好一轮给满分。
- 维度边界:`context_memory` 负责**重复盘问、前后矛盾追问、忽略已答信息**`emotion_carry` 负责**情绪是否被接住**(不与采访腔混扣);`rhythm_control` 负责**采访腔、总结腔、机械流程感**(本轮已承接情绪但仍像审讯,在此项体现)。
"""