9 月 30 日,Anthropic 抛出的 Claude Sonnet 4.5,这款号称 “能连续工作 30 小时” 的大模型,不仅在编程领域刷新性能纪录,更通过长时任务处理能力的突破,重新定义了 AI 智能体的实用边界 —— 从 “辅助工具” ...
Meta FAIR最近发布的一项研究直指这个问题,他们提到:传统大语言模型在训练时,通常将代码视为一种特殊的静态文本。模型学习的是代码从左到右、从上到下的文本预测。这种方法存在一个根本性的缺陷:它只学到了代码的“静态语法 ...
如果各位读者从事涉及代码相关的工作,应该很能察觉到近两年 AI 编程能力的进化幅度,GPT-5 和 Gemini 2.5 等最新前沿大模型已经让开发者在实际任务中一定程度实现了自动化,近期发布的 Sonnet 4.5 又再次推动了这一进展。
机器之心编译作者:Han Fang、Karthik Abinav Sankararaman机器之心编辑部LLM 后训练最佳入门介绍。在大模型时代,Scaling Law 一度是 AI ...
微软发布微软智能体框架预览版,旨在帮助各级开发人员更轻松地创建和部署 AI 智能体,相关详情已在微软开发团队的官方博文中发布。 微软工程师指出,该框架是一项重要的整合成果,它将此前独立的两大项目——Semantic ...
【新智元导读】斯坦福大学研究人员提出了Paper2Agent,将静态论文转化为可交互的AI智能体,让学术成果可以直接被「调用」,为科研知识传播开辟了新模式,并为构建AI共研生态奠定基础。