搜索: "代码大模型"

共找到 2 篇相关文章

华为推出AI编程新工具，结合智谱和DeepSeek技术，同类任务Token用量锐减30%

编程智能体的发展正逐步加快。近日，华为云推出了码道（CodeArts）代码智能体公测版，这一产品融合了代码大模型、集成开发环境（IDE）、自主开发模式等功能，并涵盖代码生成、研发知识问答、单元测试用例自动生成等AI编程技术，具备项目级代码生成、续写及关键功能支持。发布会上，华为云码道的负责人谈宗玮表示，该智能体依托于华为二十余年的研发经验以及海量代码积累，内置了需求管理、系统设计、软件开发等多个高

科技新闻2026/2/270 阅读

北京航空航天大学发布Code2Bench：推动代码大模型评估体系革新，终结单纯刷分现象

在评估大语言模型（LLM）生成代码的能力时，一个日益凸显的问题浮现出来：当这些模型在 HumanEval 和 MBPP 等经典基准测试中取得近乎饱和的成绩时，我们究竟是在衡量其真实的泛化推理能力，还是仅仅检验它们对训练数据的记忆力？目前的代码基准正面临两大核心挑战：一是数据污染的风险，二是测试严谨性的不足。前者可能使评测退化为「开卷考试」，而后者常常导致一

科技新闻2026/2/258 阅读