
谷歌新举措能否破解智能算法的瓶颈问题?
新智元报道传统的人工智能模型在稀疏奖励的环境中往往难以学会分层思考,因为激励机制不足。近日,谷歌团队通过引入元控制器来操控模型内部残差流,使智能体具备了“跳跃式思维”的能力。这项研究揭示了大型模型内部可以自发形成类似人脑的层次化决策结构,为人工智能在复杂多步任务中的训练提供了新的方法。人们普遍认为,AI智能体面临的主要挑战是计算资源不足?实际上,真正的问题在于奖励过于稀疏以及路径过长。在稀疏奖励和
科技新闻0 阅读
共找到 1 篇相关文章

新智元报道传统的人工智能模型在稀疏奖励的环境中往往难以学会分层思考,因为激励机制不足。近日,谷歌团队通过引入元控制器来操控模型内部残差流,使智能体具备了“跳跃式思维”的能力。这项研究揭示了大型模型内部可以自发形成类似人脑的层次化决策结构,为人工智能在复杂多步任务中的训练提供了新的方法。人们普遍认为,AI智能体面临的主要挑战是计算资源不足?实际上,真正的问题在于奖励过于稀疏以及路径过长。在稀疏奖励和