life-echo/api/app/agents/chat/background_voice.py

"""
从用户档案「职业」等文本推断访谈/叙事语气维度（干部形、军队形）。
与 chat_interview_persona（温柔倾听等）正交，可叠加。
"""

from __future__ import annotations

from typing import Final, Literal

BackgroundVoice = Literal["default", "cadre", "military"]

# 军队系优先：含「军、部队」等则走军队形，避免与泛「干部」冲突。
_MILITARY_NEEDLES: Final[tuple[str, ...]] = (
    "军人",
    "军官",
    "士兵",
    "部队",
    "入伍",
    "服役",
    "退伍",
    "转业",
    "武警",
    "解放军",
    "陆军",
    "海军",
    "空军",
    "火箭军",
    "军区",
    "军营",
    "军校",
    "文职干部",
    "军队文职",
    "现役",
    "预备役",
)

# 干部/机关系（避免过短词误判：如「机关」→机关枪、「主任」→班主任）
_CADRE_NEEDLES: Final[tuple[str, ...]] = (
    "公务员",
    "党政机关",
    "党政",
    "组织部",
    "党委书记",
    "党组书记",
    "书记",
    "处长",
    "科长",
    "局长",
    "厅长",
    "部长",
    "国企",
    "事业单位",
    "干部",
    "科级",
    "处级",
    "厅级",
)


def infer_background_voice(occupation: str | None) -> BackgroundVoice:
    """
    据职业自由文本推断背景语气。军队关键词优先于干部关键词。
    无匹配或未填 → default。
    """
    if not occupation or not str(occupation).strip():
        return "default"
    t = str(occupation).strip().casefold()
    for n in _MILITARY_NEEDLES:
        if n.casefold() in t:
            return "military"
    for n in _CADRE_NEEDLES:
        if n.casefold() in t:
            return "cadre"
    return "default"


def normalize_background_voice(voice: str | None) -> BackgroundVoice:
    """调用方传入已归一化枚举或原始职业文本均可。"""
    if not voice:
        return "default"
    s = voice.strip()
    if s in ("default", "cadre", "military"):
        return s  # type: ignore[return-value]
    return infer_background_voice(s)


def get_background_voice_chat_block(voice: str | None) -> str:
    """注入访谈 guided/opening 的「背景语气」段落；default 返回空串。"""
    v = normalize_background_voice(voice)
    if v == "default":
        return ""
    if v == "military":
        return (
            "## 背景语气：军队语境（仅语气，不编造事实）\n"
            "称呼得体、句子简洁利落、条理清楚；避免网络梗与油滑套话。\n"
            "先简短接住对方，再**最多一个**具体问题；不写命令式、不做思想政治表态。\n"
            "涉及纪律、集体、任务等措辞，**仅当用户口述已出现相关事实时**自然呼应，禁止堆砌军事化辞藻或虚构经历。"
        )
    # cadre
    return (
        "## 背景语气：干部/机关语境（仅语气，不编造事实）\n"
        "稳重、有分寸，敬语适度；句子可略完整，但仍控制总字数，避免官样文章与排比空话。\n"
        "先回应对方内容，再**最多一个**具体问题；不写公文套话、不做政治评价。\n"
        "涉及职务与组织时，**不得编造**用户未提及的职级、单位与荣誉。"
    )


def get_background_voice_narrative_block(voice: str | None) -> str:
    """附在叙事系统提示后的文体补充；default 返回空串。"""
    v = normalize_background_voice(voice)
    if v == "default":
        return ""
    if v == "military":
        return (
            "## 背景文体（军队，须遵守上文事实边界）\n"
            "叙事紧凑、层次清楚；若口述已出现纪律、集体、任务等语境，可适度用书面语呼应，**禁止**堆砌口号式军事辞藻或虚构军旅细节。\n"
            "不新增军衔、单位番号、表彰等口述未出现的信息。"
        )
    return (
        "## 背景文体（干部/机关，须遵守上文事实边界）\n"
        "段落层次清晰，用语庄重自然，避免口语碎词与段子感；**不得编造**职务、荣誉、单位名称与组织细节。\n"
        "文采服务于真实内容，不写成公文或汇报腔。"
    )