From 8ddf4e16a47713f405100d828f18e78d5315bfb1 Mon Sep 17 00:00:00 2001 From: zzc <1378113190@qq.com> Date: Fri, 17 Oct 2025 16:15:29 +0800 Subject: [PATCH] chore(docs): fix LaTeX error `Missing or unrecognized delimiter for \left` --- ...275\345\257\271\351\275\220\350\256\255\347\273\203.md" | 7 +++---- 1 file changed, 3 insertions(+), 4 deletions(-) diff --git "a/LLM-tutorial/M.\344\272\272\347\261\273\345\201\217\345\245\275\345\257\271\351\275\220\350\256\255\347\273\203.md" "b/LLM-tutorial/M.\344\272\272\347\261\273\345\201\217\345\245\275\345\257\271\351\275\220\350\256\255\347\273\203.md" index 48645b8..e7373c0 100644 --- "a/LLM-tutorial/M.\344\272\272\347\261\273\345\201\217\345\245\275\345\257\271\351\275\220\350\256\255\347\273\203.md" +++ "b/LLM-tutorial/M.\344\272\272\347\261\273\345\201\217\345\245\275\345\257\271\351\275\220\350\256\255\347\273\203.md" @@ -269,12 +269,11 @@ KTO引入了前景理论(prospect theory),该理论解释了为什么人 前景理论中,Tversky & Kahneman 用以下效用方程建模了人类价值 $$ -v(z, z_{\text{ref}};\alpha, \lambda) = \left\{ - \begin{array}{ll} +v(z, z_{\text{ref}};\alpha, \lambda) = + \begin{cases} (z - z_{\text{ref}})^{\alpha} & \quad \text{if } z \geq z_{\text{ref}} \\ -\lambda(z_{\text{ref}} - z)^{\alpha} & \quad \text{if } z < z_{\text{ref}} - \end{array} -\right. + \end{cases} $$ 价值函数 $v:z \to R$ 将一个输出 $z$ 相对一个参考值 $z_{\text{ref}}$ 映射到其感知(或者说主观)价值,反应了人类相比起相同大小回报,对损失的敏感性更大