北航、人大和九坤投资共同撰写的论文 《Scaling Laws for Code: Every Programming Language Matters》 整理而成。 在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
本文整理自[AIGO小酒馆]分享内容话题内容:CLI的产品美学: 时代在倒退么?CLI的技术原理:Single Agent vs Multi ...
这是一款专为 Agentic Coding 打造的模型,在 LiveCodeBench V6 上拿下 84.8 分,直接超越了 Claude Sonnet 4.5。 而这个时间点也颇为微妙:就在几天前,智谱的港股招股书刚刚挂网,冲击「全球大模型第一股 ...
包括坦克大战、飞船大战、五子棋、贪吃蛇、扫雷、俄罗斯方块等 ...
效果是立竿见影的,从最初 10 个席位的谨慎试点,迅速扩展到 100 个席位,高峰期活跃率高达 70%。这种自下而上的高频使用,说明 TRAE 真正嵌入了工程师的核心工作流,而非一个可有可无的辅助插件。
如今,张宏波也在用一门重新编撰的语言,用全新的方式,向AI表达“你好”,这门语言叫做——Moonbit。他现在是粤港澳大湾区数字经济研究院(后简称:IDEA)基础软件中心首席科学家。
为了实现这一点,我们可以使用小型、紧凑的BLE或Wi-Fi板。一个很好的例子是 Indusboard ,它内置了Wi-Fi,还有加速度计和磁力计。这不仅有助于追踪移动,还提供实时方向信息。
OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文 ...
吴恩达认为,智能体的发展将会成为AI时代重要的力量,甚至比基础模型还要重要。工作之余,「吴老师」连发多篇博客,向大家介绍了AI智能体的四大设计模式。 最近在工作之余,吴恩达连续分享了很多关于智能体的见解,并定义了AI Agent的四大设计模式, ...
随着 AI 技术的进步,那边在 OpenAI 大杀四方、用 Sora 彻底革了视频的命之际,这边的微软悄然对传统用户界面“出招”,最新带来一款用于构建用户界面(UI)交互智能体的 Agent 框架——UFO,能够快速理解和执行用户的自然语言请求,它的发布也向外界展示了未来与 Windows 交互是多么的容易。