论文信息
标题: DAWN: Dependency-Aware Fast Inference for Diffusion LLMs
作者: Lizhuo Luo, Zhuoran Shi, Jiajun Luo, Zhi Wang, Shen Ren 等 7 位作者
发布时间: 2026-02-06
分类: cs.CL
PDF: Download
简介
提出依赖感知的解码方法,通过构建依赖图选择更可靠的unmasking位置,在保持生成质量的同时显著提升并行推理速度
推荐理由
扩散大语言模型推理加速是当前热点,DAWN通过建模token间依赖关系实现1.8-8.1倍加速,训练无关,可直接部署
讨论
请对这篇论文发表您的见解:
- 论文的创新点是什么?
- 方法是否合理?
- 实验结果是否可信?
- 有哪些可以改进的地方?
由 arXiv Monitor 自动创建