搜索: "扩散模型"

共找到 2 篇相关文章

扩散模型引领快速深度学习新潮流英伟达与微软联手突破每秒千个令牌限制

全球首个深度思考的扩散模型诞生！它摒弃了传统的自回归模式，成为世界上生成速度最快的模型。对比之下，传统自回归的“打字机式”输出方式（逐个token按顺序生成）就像乌龟一样慢：实际测试结果显示，在英伟达GPU上运行的Mercury 2扩散推理大语言模型可实现每秒1009个tokens的速度。这一速度比GPT-5（mini版）和Claude-4.5（haiku版本）等传统模型快了五倍之多

AI资讯2026/2/269 阅读

QVGen使「超低比特率视频生成与量化」成为现实

视频生成扩散模型体积日益增大：从 2B 到 5B 再到 14B 等，效果显著提升的同时，训练和推理的成本也急剧上升。社区希望利用量化技术缩小模型规模，降低显存及计算成本，使其能在更多设备上运行并实现低成本部署。然而实际情况并不乐观：一旦使用 3/4 比特，视频生成的量化感知训练（QAT）相比图像更加难以处理且稳定性较差，画质下降幅度更大——不是轻微减少质量，而是变得无法接受。图表展示了 CogVi

科技新闻2026/2/267 阅读

搜索: "扩散模型"

扩散模型引领快速深度学习新潮流 英伟达与微软联手突破每秒千个令牌限制

QVGen使「超低比特率视频生成与量化」成为现实

扩散模型引领快速深度学习新潮流英伟达与微软联手突破每秒千个令牌限制