小羊驼团队的新研究火了。他们开发了一种新的解码算法,可以让模型预测100个token数的速度提高1.5-2.3倍,进而加速LLM推理。它主要利用雅可比(Jacobi)迭代法首次打破自回归解码中的顺序依赖性。