
扩散模型引领快速深度学习新潮流 英伟达与微软联手突破每秒千个令牌限制
全球首个深度思考的扩散模型诞生! 它摒弃了传统的自回归模式,成为世界上生成速度最快的模型。 对比之下,传统自回归的“打字机式”输出方式(逐个token按顺序生成)就像乌龟一样慢: 实际测试结果显示,在英伟达GPU上运行的Mercury 2扩散推理大语言模型可实现每秒1009个tokens的速度。 这一速度比GPT-5(mini版)和Claude-4.5(haiku版本)等传统模型快了五倍之多
AI资讯9 阅读
共找到 2 篇相关文章

全球首个深度思考的扩散模型诞生! 它摒弃了传统的自回归模式,成为世界上生成速度最快的模型。 对比之下,传统自回归的“打字机式”输出方式(逐个token按顺序生成)就像乌龟一样慢: 实际测试结果显示,在英伟达GPU上运行的Mercury 2扩散推理大语言模型可实现每秒1009个tokens的速度。 这一速度比GPT-5(mini版)和Claude-4.5(haiku版本)等传统模型快了五倍之多

加拿大蒙特利尔深夜时分,被誉为“AI教父”之一的世界顶级计算机科学家约书亚·本吉奥(Yoshua Bengio)再次从梦中惊醒。月色宁静的窗外映入眼帘,但他的内心却波澜起伏,难以平静。这位他亲手培育成长的人工智能(AI),如今让他夜不能寐,心怀前所未有的忧虑。曾是图灵奖得主、学术巨擘,在看到自己研发的深度学习技术如