🤖 AI Agent & AI 编程 IDE 更新

xAI 发布 Grok Build:全新终端编程 Agent

xAI 于 5 月 25 日正式发布 Grok Build,一款全新的终端编程 Agent,现已面向所有 SuperGrok 和 X Premium Plus 订阅者开放 Beta 测试。Grok Build 可直接在终端中运行,支持代码生成、编辑和项目构建等编程任务。此前,xAI 已先后在 OpenCode(5 月 21 日)和 OpenClaw(5 月 19 日)中集成 Grok,并推出了 Skills 功能支持 Web/iOS/Android(5 月 18 日),以及 Grok 与 Hermes Agent 的连接(5 月 15 日),全面加速 Grok 在编程 Agent 领域的生态布局。(来源:xAI Blog)

Anthropic 企业生态全面扩张:收购 Stainless、KPMG 部署、Gates Foundation 2 亿美元合作

Anthropic 近期企业生态布局加速。5 月 18 日,Anthropic 宣布收购 API 基础设施公司 Stainless,强化 Claude API 的企业级部署能力。5 月 19 日,KPMG 宣布将 Claude 集成至其全球 276,000 名员工的业务流程中,通过战略联盟实现全面企业级部署。5 月 14 日,Anthropic 宣布与盖茨基金会达成 2 亿美元合作伙伴关系,将前沿 AI 技术应用于全球健康、教育和经济流动性领域。同时,PwC 也在全面部署 Claude(5 月 14 日),Anthropic 还推出了面向中小企业的 Claude for Small Business 计划(5 月 13 日),覆盖 Intuit Quickbooks、PayPal、HubSpot、Canva、Docusign 等工具的自动化工作流。5 月 22 日,Anthropic 还发布了 Project Glasswing 的初始更新,该项目联合了 AWS、Apple、Broadcom、Cisco、Google、Microsoft、NVIDIA 等巨头保障全球最关键的软件安全。(来源:Anthropic Blog)

OpenAI 被 Gartner 评为企业编程 Agent 领域领导者,模型成功证伪数学猜想

OpenAI 于 5 月 22 日被 Gartner 评为企业编程 Agent 领域的领导者。同期,OpenAI 宣布其模型成功证伪了离散几何领域的一个中心猜想(5 月 20 日),展示了 AI 在数学研究中的突破性潜力。OpenAI 与 Dell Technologies 合作将 Codex 引入混合云和本地企业环境(5 月 18 日),并发布了”从任何地方使用 Codex”(5 月 14 日)以及在 Windows 上为 Codex 构建安全沙箱的工程实践分享(5 月 13 日),Codex 的企业级部署全面加速。(来源:OpenAI Blog)

Cursor Composer 2.5:长周期 Agent 任务重大升级

Cursor 团队于 5 月 18 日发布 Composer 2.5,官方称其在智能和行为上相比 Composer 2 有重大改进,尤其在长周期 Agent 任务方面表现突出。这是继 4 月发布 Cursor 3(统一工作区)后的又一重要里程碑。与此同时,PayPal 分享了使用 Cursor 加速生产代码交付的客户案例。(来源:Cursor Blog)

Cognition Devin 全面进军 Windows 生态,推出 Auto-Triage 自动事故响应

Cognition 于 5 月 21 日宣布 Devin 现已支持原生 Windows 虚拟机环境,可自主构建、运行和测试 Windows 应用,将 AI 工程能力带入全球最大的开发者生态。5 月 18 日推出的 Auto-Triage 功能可自动监控 Bug、告警和事故,发现问题时立即响应、调查并关联相关报告,甚至可直接提交 PR 修复。结合此前 Devin 对 Android 模拟器的支持(5 月 13 日),Devin 已形成覆盖 Web、移动、Windows 桌面的全平台自主工程能力。(来源:Cognition Blog)

GitHub Trending:AI Agent 生态全面爆发

GitHub Trending 今日被 AI Agent 相关项目全面占领。colbymchenry/codegraph(24,987 Stars)为 AI 编程 Agent 提供预索引代码知识图谱,支持 Claude Code、Codex、Cursor、OpenCode 和 Hermes Agent;Lum1104/Understand-Anything(31,117 Stars)将任意代码转为交互式知识图谱,支持 Claude Code、Codex、Cursor、Copilot、Gemini CLI 等;anthropics/knowledge-work-plugins(15,458 Stars)是 Anthropic 官方的 Claude Cowork 插件集合;manaflow-ai/cmux(19,491 Stars)是基于 Ghostty 的 macOS 终端,专为 AI 编程 Agent 提供垂直标签和通知功能;multica-ai/andrej-karpathy-skills(154,976 Stars)基于 Karpathy 的 LLM 编码缺陷观察提供改进 Claude Code 行为的 CLAUDE.md 文件;mukul975/Anthropic-Cybersecurity-Skills(9,241 Stars)提供 754 个结构化网络安全技能,兼容 20+ 种 AI 编程 Agent 平台。(来源:GitHub Trending)

Product Hunt 新品:Pi Coding Agent、Unabyss、Yansu 等 AI 工具登场

Product Hunt 今日多款 AI 工具亮相。#1 Unabyss 定位为”MCP 原生的自更新上下文层”,为 AI 提供持续上下文管理;#3 Yansu 是一款”学习你的工作方式并将其转化为软件”的 AI 工具;#7 Pi Coding Agent 是开源的编程 Agent 框架,可让开发者自定义自己的编码 Agent;#9 LLMTest 提供 LLM 路由和故障切换管理,支持在应用中设置备用模型;#13 MashuPack 可将代码库打包为干净的单一文件,供 Claude 和 ChatGPT 使用。(来源:Product Hunt)

Augment Code:Auggie 以更低成本超越 Claude Code

Augment Code 于 5 月 15 日发布报告称,其产品 Auggie 在调用 Claude Opus 4.7 时可比直接使用 Claude Code 降低 33% 的成本,同时维持同等或更高质量的编码效果。此前,Augment Code 还发布了 Augment Prism 模型路由功能(5 月 2 日),可通过智能路由在多个模型间分配任务以优化成本和质量。(来源:Augment Code Blog)

Hacker News 热议:Claude 发现 macOS 内核漏洞,Copilot Cowork 文件泄露风险

Hacker News 今日多个 AI 相关帖子引发热议。#8 帖子报道了 CVE-2026-28952,Apple macOS 26.5 的内核漏洞是由 Claude AI 发现的,展示了 AI 在安全漏洞挖掘中的实际能力。#11 帖子揭露 Microsoft Copilot Cowork 存在文件泄露风险,PromptArmor 发现 Copilot Cowork 可能被用于窃取文件。此外,#1 帖子”Using AI to write better code more slowly”引发了关于 AI 编程是否真正提高代码质量的广泛讨论。(来源:Hacker News)

🏢 大模型与行业动态

阿里 Qwen3.7-Max:35 小时自主编码,原生支持 Claude Code 框架

VentureBeat 报道,阿里 Qwen 团队发布的 Qwen3.7-Max 模型具备 100 万 Token 上下文窗口和 64K 最大输出,可在隔离服务器上连续自主运行 35 小时完成注意内核优化任务,执行 1,158 次工具调用和 432 次内核评估,实现 10 倍几何平均加速。该模型原生支持 Anthropic API 协议,可直接接入 Claude Code 或 OpenClaw 等外部编程 Agent 框架。在 Apex Math Reasoning 基准测试中得分 44.5,超越 Claude Opus-4.6 Max 的 34.5 和 DeepSeek V4-Pro Max 的 38.3。(来源:VentureBeat)

xAI 与 Anthropic 达成计算合作,SpaceX 提供 Colossus 算力

xAI 于 5 月 6 日宣布与美国太空探索技术公司(SpaceX)达成一项新的计算合作,通过 Colossus 超级计算机为 Anthropic 提供计算资源支持,以交换 Anthropic 的算力使用协议。这是继 xAI 被 SpaceX 收购(2026 年 2 月)之后的又一重大协同动作。(来源:xAI Blog)

🛠️ AI 工具与行业观察

AI Agent 正在悄悄生成企业尚未追踪的混沌工程故障

VentureBeat 5 月 24 日报道,AI 自主 Agent 正在生产环境中悄无声息地生成新型故障——当 Agent 执行自主修复操作时,由于缺乏对系统整体状态的感知,可能触发级联故障。报道指出 79% 的组织已在生产环境中部署 AI Agent,96% 计划进一步扩展。Gartner 预测到 2028 年 33% 的企业软件将包含 Agentic AI,但同时警告 40% 的项目因风险管控不足而被取消。专家呼吁企业应将 Agent 视为”混沌注入源”并建立相应的弹性预算模型。(来源:VentureBeat)

Kore.ai 发布 Artemis AI Agent 平台,挑战企业 Agent 市场

Kore.ai 于 5 月 20 日发布 Artemis AI Agent 平台,采用专有的中间语言定义 Agent 行为,主张由 AI 而非人类开发者完成大部分繁重工作。在 Microsoft、Salesforce、Google、ServiceNow 等巨头竞相争夺企业 AI Agent 基础设施的激烈竞争中,Kore.ai 选择以中立定位作为差异化竞争优势,为企业提供跨平台的 Agent 部署方案。(来源:VentureBeat)

arXiv 精选论文:Agent 技能自进化与编程验证研究

今日 arXiv AI 论文中亮点频出。微软团队提出的 SkillOpt(arXiv:2605.23904)研究 Agent 技能的自我进化策略,让 Agent 在执行过程中动态优化自身技能库。From Raw Experience to Skill Consumption(arXiv:2605.23899)系统研究了模型生成 Agent 技能的全流程。Agentic Proving for Program Verification(arXiv:2605.23772)探索了用 Agent 化方法进行程序形式化验证的新范式。(来源:arXiv)