科技日报记者 崔爽
2月25日,在春节期间开源了Qwen3.5-397B-A17B之后,阿里巴巴继续发布了千问3.5系列模型的源代码。此次发布的三款新模型分别是Qwen3.5-35B-A3B、Qwen3.5-122B-A10B和Qwen3.5-27B,它们都采用了创新架构并经过了优化训练,在性能上超越了前一代的大规模旗舰模型。
千问3.5系列模型运用了一种混合注意力机制,并结合高稀疏的MoE架构进行设计。这些新模型基于大规模文本和视觉数据集进行了训练,以更小的参数量实现了更高的性能提升。
新发布的千问3.5系列模型可以直接部署在消费级显卡上,为开发者提供了便利性。
根据数据显示,截至当前,阿里巴巴已开源超过400个千问模型,全球下载次数已经超过10亿次,并产生了超过20万种衍生模型。此外,在春节期间开源的Qwen3.5-397B-A17B 模型已经在Hugging Face平台上占据了第一名的位置。
