搜索: "约束流形"

共找到 1 篇相关文章

清华发布全球首个人工智能评估标准“约束流形”, Gemini 3仅获33.6分

清华发布全球首个人工智能评估标准“约束流形”, Gemini 3仅获33.6分

新智元报道SSI-Bench是首个专注于评估模型在约束流形中空间推理能力的基准,强调真实结构和具体限制条件,通过排序任务来考察模型对三维几何与拓扑关系的理解程度,揭示了当前大模型在处理实际空间问题时严重依赖二维信息的情况,并且其表现远逊于人类。如果将一个在空间理解榜单中得分很高的多模态大型模型直接放置于现实世界环境中,它很可能会在看似简单的任务上遇到困难。

科技新闻26 阅读