-
求教 |
Beta Was this translation helpful? Give feedback.
Replies: 2 comments 4 replies
-
以选择题为例
gen (generate) 就是以上述问题作为提示词,让默写往下续写,并从续写中提取答案为 A / B / C / D 中的哪一个 ppl (perplexity) 就是给模型 4 句话:
看模型更认同哪一句话 (混淆度 perplexity 更低),认同哪一句话,就用哪一句话对应的答案 A / B / C / D gen 和 ppl 最终都是得到 A / B / C / D 之一,与参考答案进行比较,得分或者不得分等等 |
Beta Was this translation helpful? Give feedback.
-
感谢答复。再次追问下,一个模型的ppl和gen方式对于同一套选择题的得分理论上是否应该一致?但是实际测试中,发现有不一致的场景,那么此时即使ppl得分高,ppl能代表模型能力吗? |
Beta Was this translation helpful? Give feedback.
以选择题为例
gen (generate) 就是以上述问题作为提示词,让默写往下续写,并从续写中提取答案为 A / B / C / D 中的哪一个
ppl (perplexity) 就是给模型 4 句话:
看模型更认同哪一句话 (混淆度 perplexity 更低),认同哪一句话,就用哪一句话对应的答案 A / B / C / D
gen 和 ppl 最终都是得到 A / B / C / D 之一,与参考答案进行比较,得分或者不得分等等