
字节Seed运用化学理念革新AI技术 将DeepSeek-R1神经网络分解为分子结构
字节Seed开始运用化学原理来研究大型模型。 深度推理像是共价键,自我反思类似氢键,而自我探索则像范德华力? 传统的长思维链推理通常将AI的思考过程视为线性结构。 实际上,在很多情况下,后续的重要结论需要返回去验证早期提出的假设。 CoT忽略了这种非线性的依赖关系。 在论文《思想的分子结构》中,字节Seed首次为大模型定义了长链思维的分子式结构。 这种分子拓扑结构里,三种键是如何相互作用的?
共 23 篇文章

字节Seed开始运用化学原理来研究大型模型。 深度推理像是共价键,自我反思类似氢键,而自我探索则像范德华力? 传统的长思维链推理通常将AI的思考过程视为线性结构。 实际上,在很多情况下,后续的重要结论需要返回去验证早期提出的假设。 CoT忽略了这种非线性的依赖关系。 在论文《思想的分子结构》中,字节Seed首次为大模型定义了长链思维的分子式结构。 这种分子拓扑结构里,三种键是如何相互作用的?

Anthropic再次引起市场关注。 昨日,IBM股价大幅下跌13.15%,创下自2000年以来的最大单日跌幅,市值从约2408亿美元降至2087亿美元,缩水了超过310亿美元。这表明人工智能技术的迅速发展已经让该公司成为了新的受害者。 导致这一现象的原因是Anthropic发布了一篇博客文章,介绍了其Claude Code工具可以对使用COBOL语言的老系统进行现代化改造。而COBOL业务正是

全球首个深度思考的扩散模型诞生! 它摒弃了传统的自回归模式,成为世界上生成速度最快的模型。 对比之下,传统自回归的“打字机式”输出方式(逐个token按顺序生成)就像乌龟一样慢: 实际测试结果显示,在英伟达GPU上运行的Mercury 2扩散推理大语言模型可实现每秒1009个tokens的速度。 这一速度比GPT-5(mini版)和Claude-4.5(haiku版本)等传统模型快了五倍之多

英伟达又一次超越了自己—— 2026财年,英伟达发布了最后一个季度的财报。不出预料,依旧刷新多项纪录: 单季营收达到681亿美元(约4678亿元),同比增长73%,环比增长20%。 数据中心单季收入为623亿美元(约4280亿元),同比增长75%,环比增长22%。 全年总营收达2159亿美元(约14831亿元),同比增长65%。 这份财报无疑给资本市场带来了巨大的信心,“AI鬼故事”的阴影也一

在2025年12月之前,AI编程与之后的编程相比截然不同。 这一观点是由Vibe Coding的提出者Karpathy提出的。 要准确描述过去两个月里AI对编程的影响并不容易。这种变化不是渐进式的,而是在去年12月份发生的突然转变。 作为最积极采用AI编程技术的程序员之一,Karpathy承认,在去年12月之前,尽管Coding Agent有不错的表现,但实际上并没有多大用处。 然而从12月

Perplexity也加入了这场激烈的龙虾大战。 该公司在推特上宣布,推出了一款名为Perplexity Computer的新产品,这是一款基于浏览器的全能型通用数字助手。 据官方介绍,这款工具能够进行推理、任务分配、搜索、构建、记忆管理、编码以及项目部署和管理工作流程等操作。 它几乎涵盖了日常所需的所有场景功能。 Perplexity的首席执行官Aravind Srinivas表示,Per

中美AI同步加速:47天内30次更新,中国最强主场究竟在哪里? 2026年的AI开局没有旁观者。 在硅谷那边,从1月1日Meta发布的Llama4 Swarm到Google最新的Gemini 3.1 Pro,每两三天就有一项新技术引发行业热议。 而在中国这边,据

在32倍压缩率下性能超越现有技术25个百分点,破解长文本压缩难题 | ICLR 2026 面对高压缩率时,为什么现有的上下文压缩方法会出现性能骤降的现象?当模型将32K长度的文档压缩至1K时,为何会表现出明显的性能下降? 阿里巴巴未来生活实验室的研究团队发现,这

春节期间,“千问帮我”成为了新的年俗习惯,用户只需一句话就能轻松下单,超过400万60岁以上的老年人也体验到了这种便捷的AI服务。 大年初七(2月23日),据千问发布的数据显示,在春节期间,有近两亿次“一句话下单”的操作发生在千问平台上。平均而言,全国每十个人中

千寻智能凭借近20亿元融资和突破百亿元估值,在新一年中成为具身智能领域的焦点。 近日,千寻智能成功获得多轮融资,总额接近20亿人民币,其企业价值也已超越百亿大关。 这种多元化且全面的资本注入表明市场正在经历一场“去泡沫化”的过程——即投资者不再仅仅押注于概念性项

DeepSeek在GitHub上的连续更新让华尔街再次感受到了紧张:“DeepSeek第二时刻”即将到来。 就从十几个小时前开始,DeepSeek的GitHub仓库开始频繁地进行代码合并操作。 CNBC也对此发表了预警文章,预测纳斯达克市场可能会因为这次更新再次

中兴通讯聚焦“连接+算力”,助力具身智能行业创新与发展 近日,由中兴通讯主办、上海市计算机学会与上海交通大学计算机学院协办的“2026年具身智能机器人学术研讨会”在上海成功举办。本次大会以“人机共生,智塑未来”为主题,汇聚了清华大学、上海交通大学、复旦大学等国

黑客揭露了苹果隐藏的硬件秘密!你的MacBook中内置有加速度计和陀螺仪,即使你不曾告知售后人员电脑是否摔过,它们都能记录相关信息。 苹果官方文档没有提及这些传感器接口,但它们实际上存在于每一台MacBook之中。 亏贼! 比如轻轻晃动或转动电脑,屏幕上的数据显

Kimi在春节档赚取了相当于一年的收入!这顿“龙虾大餐”让各大厂纷纷出手抢夺。 年刚过完,Kimi就先一步将「龙虾」装入口袋。 而这一系列操作还未平息,公司的财务数据也开始飙升—— 近20天的收入已经超过了去年全年的总收入,估值也一路攀升至700亿元人民币。 (

在ICRA 2026大会上,中兴通讯发布了RealMirror平台,这是一个开放源代码的视觉语言行动平台,旨在促进具身智能的研究与应用普及。 具身智能的目标是创建能够感知、理解并操作物理环境的智能体。这一领域正推动人工智能从抽象计算向更贴近人类物理行为的方向发展

千问3.5在Hugging Face社区中位居榜首,前十名开源模型中有八款来自中国 于2月24日,全球最大的AI开放平台Hugging Face发布了最新的开源大模型排行榜,其中阿里巴巴最新发布的原生多模态模型千问3.5荣登榜首。该模型自除夕夜发布以来,迅速引起

智平方在完成七轮融资之后,又成功获得了五轮B系列融资,总金额超过十亿人民币,公司估值已经突破百亿大关。 2026年2月23日,在马年伊始之际,全球机器人基础模型领域的领军企业智平方(AI² Robotics)宣布完成了新一轮的B轮融资。此次融资规模超过了10亿元

强大编码计划现已推出!阿里云发布Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5四大开源模型 2月25日,阿里云百炼平台推出了包含Qwen3.5、GLM-5、MiniMax M2.5及Kimi K2.5这四款顶尖开源模型的API服务。这一

清华大学数学系的杰出人才张鹏川加入OpenAI! 毕业于清华大学数学系的研究员张鹏川,曾在Meta FAIR工作了3年多,并领导过SAM与Llama等多个重要项目,现已正式离职。 Sora项目的资深领导者Aditya Ramesh也向他发来了欢迎的信息。 从专注

阿里巴巴发布了三款新的中型千问3.5系列模型,定价低至每百万Token 0.2元。 在2月25日之后的开源行动中,阿里巴巴推出了Qwen3.5-35B-A3B、Qwen3.5-122B-A10B和Qwen3.5-27B三款新模型。这些模型在性能上超越了其前代产品