xAI 发布 Grok Build 编程 Agent，Anthropic 与 Gates Foundation 2 亿美元合作，GitHub 上 Agent 项目爆发

🤖 AI Agent & AI 编程 IDE 更新

xAI 发布 Grok Build：全新终端编程 Agent

xAI 于 5 月 25 日正式发布 Grok Build，一款全新的终端编程 Agent，现已面向所有 SuperGrok 和 X Premium Plus 订阅者开放 Beta 测试。Grok Build 可直接在终端中运行，支持代码生成、编辑和项目构建等编程任务。此前，xAI 已先后在 OpenCode（5 月 21 日）和 OpenClaw（5 月 19 日）中集成 Grok，并推出了 Skills 功能支持 Web/iOS/Android（5 月 18 日），以及 Grok 与 Hermes Agent 的连接（5 月 15 日），全面加速 Grok 在编程 Agent 领域的生态布局。（来源：xAI Blog）

Anthropic 企业生态全面扩张：收购 Stainless、KPMG 部署、Gates Foundation 2 亿美元合作

Anthropic 近期企业生态布局加速。5 月 18 日，Anthropic 宣布收购 API 基础设施公司 Stainless，强化 Claude API 的企业级部署能力。5 月 19 日，KPMG 宣布将 Claude 集成至其全球 276,000 名员工的业务流程中，通过战略联盟实现全面企业级部署。5 月 14 日，Anthropic 宣布与盖茨基金会达成 2 亿美元合作伙伴关系，将前沿 AI 技术应用于全球健康、教育和经济流动性领域。同时，PwC 也在全面部署 Claude（5 月 14 日），Anthropic 还推出了面向中小企业的 Claude for Small Business 计划（5 月 13 日），覆盖 Intuit Quickbooks、PayPal、HubSpot、Canva、Docusign 等工具的自动化工作流。5 月 22 日，Anthropic 还发布了 Project Glasswing 的初始更新，该项目联合了 AWS、Apple、Broadcom、Cisco、Google、Microsoft、NVIDIA 等巨头保障全球最关键的软件安全。（来源：Anthropic Blog）

OpenAI 被 Gartner 评为企业编程 Agent 领域领导者，模型成功证伪数学猜想

OpenAI 于 5 月 22 日被 Gartner 评为企业编程 Agent 领域的领导者。同期，OpenAI 宣布其模型成功证伪了离散几何领域的一个中心猜想（5 月 20 日），展示了 AI 在数学研究中的突破性潜力。OpenAI 与 Dell Technologies 合作将 Codex 引入混合云和本地企业环境（5 月 18 日），并发布了”从任何地方使用 Codex”（5 月 14 日）以及在 Windows 上为 Codex 构建安全沙箱的工程实践分享（5 月 13 日），Codex 的企业级部署全面加速。（来源：OpenAI Blog）

Cursor Composer 2.5：长周期 Agent 任务重大升级

Cursor 团队于 5 月 18 日发布 Composer 2.5，官方称其在智能和行为上相比 Composer 2 有重大改进，尤其在长周期 Agent 任务方面表现突出。这是继 4 月发布 Cursor 3（统一工作区）后的又一重要里程碑。与此同时，PayPal 分享了使用 Cursor 加速生产代码交付的客户案例。（来源：Cursor Blog）

Cognition Devin 全面进军 Windows 生态，推出 Auto-Triage 自动事故响应

Cognition 于 5 月 21 日宣布 Devin 现已支持原生 Windows 虚拟机环境，可自主构建、运行和测试 Windows 应用，将 AI 工程能力带入全球最大的开发者生态。5 月 18 日推出的 Auto-Triage 功能可自动监控 Bug、告警和事故，发现问题时立即响应、调查并关联相关报告，甚至可直接提交 PR 修复。结合此前 Devin 对 Android 模拟器的支持（5 月 13 日），Devin 已形成覆盖 Web、移动、Windows 桌面的全平台自主工程能力。（来源：Cognition Blog）

GitHub Trending 今日被 AI Agent 相关项目全面占领。colbymchenry/codegraph（24,987 Stars）为 AI 编程 Agent 提供预索引代码知识图谱，支持 Claude Code、Codex、Cursor、OpenCode 和 Hermes Agent；Lum1104/Understand-Anything（31,117 Stars）将任意代码转为交互式知识图谱，支持 Claude Code、Codex、Cursor、Copilot、Gemini CLI 等；anthropics/knowledge-work-plugins（15,458 Stars）是 Anthropic 官方的 Claude Cowork 插件集合；manaflow-ai/cmux（19,491 Stars）是基于 Ghostty 的 macOS 终端，专为 AI 编程 Agent 提供垂直标签和通知功能；multica-ai/andrej-karpathy-skills（154,976 Stars）基于 Karpathy 的 LLM 编码缺陷观察提供改进 Claude Code 行为的 CLAUDE.md 文件；mukul975/Anthropic-Cybersecurity-Skills（9,241 Stars）提供 754 个结构化网络安全技能，兼容 20+ 种 AI 编程 Agent 平台。（来源：GitHub Trending）

Product Hunt 新品：Pi Coding Agent、Unabyss、Yansu 等 AI 工具登场

Product Hunt 今日多款 AI 工具亮相。#1 Unabyss 定位为”MCP 原生的自更新上下文层”，为 AI 提供持续上下文管理；#3 Yansu 是一款”学习你的工作方式并将其转化为软件”的 AI 工具；#7 Pi Coding Agent 是开源的编程 Agent 框架，可让开发者自定义自己的编码 Agent；#9 LLMTest 提供 LLM 路由和故障切换管理，支持在应用中设置备用模型；#13 MashuPack 可将代码库打包为干净的单一文件，供 Claude 和 ChatGPT 使用。（来源：Product Hunt）

Augment Code：Auggie 以更低成本超越 Claude Code

Augment Code 于 5 月 15 日发布报告称，其产品 Auggie 在调用 Claude Opus 4.7 时可比直接使用 Claude Code 降低 33% 的成本，同时维持同等或更高质量的编码效果。此前，Augment Code 还发布了 Augment Prism 模型路由功能（5 月 2 日），可通过智能路由在多个模型间分配任务以优化成本和质量。（来源：Augment Code Blog）

Hacker News 热议：Claude 发现 macOS 内核漏洞，Copilot Cowork 文件泄露风险

Hacker News 今日多个 AI 相关帖子引发热议。#8 帖子报道了 CVE-2026-28952，Apple macOS 26.5 的内核漏洞是由 Claude AI 发现的，展示了 AI 在安全漏洞挖掘中的实际能力。#11 帖子揭露 Microsoft Copilot Cowork 存在文件泄露风险，PromptArmor 发现 Copilot Cowork 可能被用于窃取文件。此外，#1 帖子”Using AI to write better code more slowly”引发了关于 AI 编程是否真正提高代码质量的广泛讨论。（来源：Hacker News）

🏢 大模型与行业动态

阿里 Qwen3.7-Max：35 小时自主编码，原生支持 Claude Code 框架

VentureBeat 报道，阿里 Qwen 团队发布的 Qwen3.7-Max 模型具备 100 万 Token 上下文窗口和 64K 最大输出，可在隔离服务器上连续自主运行 35 小时完成注意内核优化任务，执行 1,158 次工具调用和 432 次内核评估，实现 10 倍几何平均加速。该模型原生支持 Anthropic API 协议，可直接接入 Claude Code 或 OpenClaw 等外部编程 Agent 框架。在 Apex Math Reasoning 基准测试中得分 44.5，超越 Claude Opus-4.6 Max 的 34.5 和 DeepSeek V4-Pro Max 的 38.3。（来源：VentureBeat）

xAI 与 Anthropic 达成计算合作，SpaceX 提供 Colossus 算力

xAI 于 5 月 6 日宣布与美国太空探索技术公司（SpaceX）达成一项新的计算合作，通过 Colossus 超级计算机为 Anthropic 提供计算资源支持，以交换 Anthropic 的算力使用协议。这是继 xAI 被 SpaceX 收购（2026 年 2 月）之后的又一重大协同动作。（来源：xAI Blog）

🛠️ AI 工具与行业观察

AI Agent 正在悄悄生成企业尚未追踪的混沌工程故障

VentureBeat 5 月 24 日报道，AI 自主 Agent 正在生产环境中悄无声息地生成新型故障——当 Agent 执行自主修复操作时，由于缺乏对系统整体状态的感知，可能触发级联故障。报道指出 79% 的组织已在生产环境中部署 AI Agent，96% 计划进一步扩展。Gartner 预测到 2028 年 33% 的企业软件将包含 Agentic AI，但同时警告 40% 的项目因风险管控不足而被取消。专家呼吁企业应将 Agent 视为”混沌注入源”并建立相应的弹性预算模型。（来源：VentureBeat）

Kore.ai 发布 Artemis AI Agent 平台，挑战企业 Agent 市场

Kore.ai 于 5 月 20 日发布 Artemis AI Agent 平台，采用专有的中间语言定义 Agent 行为，主张由 AI 而非人类开发者完成大部分繁重工作。在 Microsoft、Salesforce、Google、ServiceNow 等巨头竞相争夺企业 AI Agent 基础设施的激烈竞争中，Kore.ai 选择以中立定位作为差异化竞争优势，为企业提供跨平台的 Agent 部署方案。（来源：VentureBeat）

arXiv 精选论文：Agent 技能自进化与编程验证研究

今日 arXiv AI 论文中亮点频出。微软团队提出的 SkillOpt（arXiv:2605.23904）研究 Agent 技能的自我进化策略，让 Agent 在执行过程中动态优化自身技能库。From Raw Experience to Skill Consumption（arXiv:2605.23899）系统研究了模型生成 Agent 技能的全流程。Agentic Proving for Program Verification（arXiv:2605.23772）探索了用 Agent 化方法进行程序形式化验证的新范式。（来源：arXiv）

xAI 发布 Grok Build 编程 Agent，Anthropic 与 Gates Foundation 2 亿美元合作，GitHub 上 Agent 项目爆发 — AI 日报 2026-05-26