搜索: "大型模型"

共找到 6 篇相关文章

ICLR 2026 | LightMem:降低大型模型的长期记忆成本

ICLR 2026 | LightMem:降低大型模型的长期记忆成本

大规模预训练模型虽然表现出色,但在处理“长对话、多轮交互和跨任务”等复杂场景时,依然面临两大挑战:其一为上下文窗口的限制,在对话持续增长的情况下容易出现信息过载;其二是中间环节的信息丢失问题,即便能容纳所有数据也不一定能有效利用。因此,引入“外部记忆系统”成为必要:将对话内容储存于长期记忆,并在需要时进行检索。然而这一方案的实际应用却带来高成本的问题:频繁调用大模型执行总结和提取、实时解决冲突以及

科技新闻1 阅读
谷歌新举措能否破解智能算法的瓶颈问题?

谷歌新举措能否破解智能算法的瓶颈问题?

新智元报道传统的人工智能模型在稀疏奖励的环境中往往难以学会分层思考,因为激励机制不足。近日,谷歌团队通过引入元控制器来操控模型内部残差流,使智能体具备了“跳跃式思维”的能力。这项研究揭示了大型模型内部可以自发形成类似人脑的层次化决策结构,为人工智能在复杂多步任务中的训练提供了新的方法。人们普遍认为,AI智能体面临的主要挑战是计算资源不足?实际上,真正的问题在于奖励过于稀疏以及路径过长。在稀疏奖励和

科技新闻0 阅读
字节Seed运用化学理念革新AI技术 将DeepSeek-R1神经网络分解为分子结构

字节Seed运用化学理念革新AI技术 将DeepSeek-R1神经网络分解为分子结构

字节Seed开始运用化学原理来研究大型模型。 深度推理像是共价键,自我反思类似氢键,而自我探索则像范德华力? 传统的长思维链推理通常将AI的思考过程视为线性结构。 实际上,在很多情况下,后续的重要结论需要返回去验证早期提出的假设。 CoT忽略了这种非线性的依赖关系。 在论文《思想的分子结构》中,字节Seed首次为大模型定义了长链思维的分子式结构。 这种分子拓扑结构里,三种键是如何相互作用的?

AI资讯10 阅读
港中文与美团合作为Agent引入「过程评分」解决稀疏奖励问题

港中文与美团合作为Agent引入「过程评分」解决稀疏奖励问题

在许多大型模型及代理的训练过程中,常见的方式是仅依据结果来判断:如果最终答案正确,则给予奖励;反之则得零分。对于简单的问答任务,这种方法尚可适用;但当涉及到需要多轮对话、搜索和编写代码等复杂过程的任务时,这种评价方式就显得过于简化了。因此,在差之毫厘的情况下与一开始就走错方向的情况之间,仅凭结果评判无法区分其优劣;训练过程中也无法识别出哪些失败更为关键,人工细粒度的评分又难以应对开放环境和多模态任

科技新闻7 阅读
中国团队开创太空计算新纪元:成功实现通用大模型的轨道部署,并计划发射两千八百颗卫星以支持亿万硅基智能设备

中国团队开创太空计算新纪元:成功实现通用大模型的轨道部署,并计划发射两千八百颗卫星以支持亿万硅基智能设备

中国团队在太空计算能力方面取得了领先地位:首次实现了通用大型模型的轨道部署,并计划通过发射2800颗卫星为数亿个硅基智能体提供服务。 一凡 发自 凹非寺 量子位 | 公众号 QbitAI 岁末年初,全球AI竞争聚焦到了最新趋势—— 太空算力。 大洋两岸,近期你追

汽车资讯8 阅读
清华发布全球首个人工智能评估标准“约束流形”, Gemini 3仅获33.6分

清华发布全球首个人工智能评估标准“约束流形”, Gemini 3仅获33.6分

新智元报道SSI-Bench是首个专注于评估模型在约束流形中空间推理能力的基准,强调真实结构和具体限制条件,通过排序任务来考察模型对三维几何与拓扑关系的理解程度,揭示了当前大模型在处理实际空间问题时严重依赖二维信息的情况,并且其表现远逊于人类。如果将一个在空间理解榜单中得分很高的多模态大型模型直接放置于现实世界环境中,它很可能会在看似简单的任务上遇到困难。

科技新闻26 阅读