🤖 AI Agent & AI 编程 IDE 更新
Anthropic 发布 Project Glasswing 最新进展,Microsoft 开始取消 Claude Code 许可证
Anthropic 发布了 Project Glasswing 的初始更新报告。该项目联合了 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA 和 Palo Alto Networks 等行业巨头,致力于保护全球最关键软件的安全。与此同时,Hacker News 上爆出 Microsoft 开始取消部分用户的 Claude Code 许可证,引发了关于 AI 编程工具企业级部署权限管理的大规模讨论,相关帖获得 307 分和 248 条评论。(来源:Anthropic Blog / Hacker News / The Verge)
AI 编程 Agent 生态爆发:从 Karpathy Skills 到 Codegraph 到 MCP 工具链
GitHub Trending 今日被 AI Agent 编程项目全面占领。Anthropic 官方推出的 anthropics/claude-plugins-official 仓库(25,842 Stars)成为 Claude Code 插件生态中心;multica-ai/andrej-karpathy-skills(148,337 Stars)基于 Karpathy 对 LLM 编码缺陷的观察,提供优化 Claude Code 行为的 CLAUDE.md 文件;colbymchenry/codegraph(17,933 Stars)为 AI 编程 Agent 提供预索引的代码知识图谱;ChromeDevTools/chrome-devtools-mcp(41,179 Stars)让 AI Agent 可直接调用 Chrome 调试工具。此外,Lum1104/Understand-Anything(19,650 Stars)可将任意代码转换为交互式知识图谱。(来源:GitHub Trending)
Cursor 发布 Composer 2.5:长周期 Agent 任务重大升级
Cursor 团队于 5 月 18 日正式发布 Composer 2.5,官方称其为”在智能和行为上相比 Composer 2 的重大改进,尤其在长周期 Agent 任务方面”。这是继 4 月 Cursor 3 统一工作区发布后的又一重要里程碑。同期,PayPal、National Australia Bank、Amplitude 等企业也分享了使用 Cursor 加速生产代码交付的案例故事。(来源:Cursor Blog)
Cognition Devin 支持 Windows 虚拟机并引入 Auto-Triage
Cognition 于 5 月 21 日宣布 Devin 现已支持原生 Windows 虚拟机环境,可构建、运行和测试 Windows 应用,将自主 AI 工程能力带到全球最大的开发者生态中。5 月 18 日,Devin 还推出了 Auto-Triage 功能,可自动监控 Bug、告警和事故,发现问题时立即响应、调查并关联相关报告,甚至可直接提交 PR。(来源:Cognition Blog)
Google Antigravity CLI 登顶 Product Hunt
Google Antigravity CLI 今日在 Product Hunt 以 #1 产品发布,口号是”直接从终端运行编码 Agent”。该工具支持多步推理、多文件编辑、工具调用和持久化历史记录,专为 SSH 会话和键盘优先工作流程优化,由 Google 团队(包括 Sundar Pichai、Josh Woodward 等)发布。(来源:Product Hunt)
xAI 推出 Grok in OpenCode,扩展编程 Agent 版图
xAI 于 5 月 21 日宣布用户可使用 SuperGrok 或 X Premium 订阅在 OpenCode 中使用 Grok 模型进行编码。此前一周,xAI 还发布了 Grok in OpenClaw(5 月 19 日)、Skills 功能(5 月 18 日)以及 Grok 与 Hermes Agent 的连接能力(5 月 15 日),加速推进 Grok 在编程 Agent 领域的落地。(来源:xAI Blog)
OpenAI 被 Gartner 评为企业编程 Agent 领导者,Codex 登陆 Dell 混合云
OpenAI 于 5 月 22 日宣布被 Gartner 评为企业编程 Agent 领域的领导者。同日,OpenAI 与 Dell Technologies 达成合作,将 Codex 引入混合云和本地企业环境(5 月 18 日)。此外,OpenAI 还发布了”从任何地方使用 Codex”(5 月 14 日)以及为 Windows 构建安全沙箱的工程分享(5 月 13 日),显示 OpenAI 在企业 Codex 部署方面的全面加速。(来源:OpenAI Blog)
🏢 大模型发布与更新
阿里 Qwen3.7-Max:35 小时自主编码,支持 Claude Code 作为运行框架
VentureBeat 独家报道,阿里 Qwen 团队发布 Qwen3.7-Max 模型,具备 100 万 Token 上下文窗口和 64K 最大输出,可在隔离服务器上连续自主运行 35 小时完成注意内核优化任务,执行 1,158 次工具调用和 432 次内核评估,实现 10.0 倍几何平均加速。该模型原生支持 Anthropic API 协议,可直接接入 Claude Code 或 OpenClaw 等工具。在 Apex Math Reasoning 基准测试中得分为 44.5,超越 Claude Opus-4.6 Max 的 34.5 和 DeepSeek V4-Pro Max 的 38.3。不过该模型为闭源付费 API 模型,仅通过中国端点提供访问。(来源:VentureBeat)
Cohere 发布 Command A+:开源企业 Agent 模型
Cohere 今日在 Product Hunt 以 #6 排名发布 Command A+,定位为”Cohere 最快最强大的语言模型,面向高性能企业 Agent 的开源模型,兼顾最大效率”。该模型支持开放权重,延续了 Cohere 在企业级开源 LLM 方向的一贯策略。(来源:Product Hunt / Cohere)
OpenAI 模型解决离散几何长期猜想
OpenAI 于 5 月 20 日宣布,其 AI 模型成功证伪了离散几何领域的一个中心猜想,展示了 AI 在数学研究中的潜力。这一成果是 AI for Science 领域的重要里程碑。(来源:OpenAI Blog)
🛠️ AI 工具产品发布
Kore.ai 发布 Artemis AI Agent 平台,挑战 Salesforce 和 ServiceNow
Kore.ai 于 5 月 21 日发布 Artemis AI Agent 平台,采用专有的中间语言定义 Agent,主张由 AI 而非人类开发者完成大部分繁重工作,在 Microsoft、Salesforce、Google、ServiceNow 等巨头竞相争夺企业 Agent 基础设施的激烈竞争中,选择中立定位作为差异化优势。(来源:VentureBeat)
Resolve AI 发布多 Agent 事故调查系统
Resolve AI 宣布推出全新多 Agent 调查系统,不再依赖单一 Agent 诊断生产故障,而是派遣一组专业化 Agent 并行追踪多个假设、相互验证结论、构建从根因到症状的完整因果链。官方称该系统将根因定位准确率提升了 2 倍以上,以应对 AI 编程热潮带来的生产系统稳定性挑战。(来源:VentureBeat)
Google 25 年来首次重新设计搜索框
VentureBeat 报道,Google 将于本周二正式推出 25 年来首次搜索框重大改版,标志着从传统的蓝色链接列表向 AI 驱动的全新搜索范式转型。这一变化将深刻影响数十亿用户的搜索习惯。(来源:VentureBeat)
Product Hunt 今日亮点:Memdex、Vibedock 与 ElevenAgents
今日 Product Hunt 上还有多个值得关注的 AI 工具:Memdex(#2)是一款 Chrome 扩展,可自动将跨 ChatGPT、Claude、Gemini 的对话加密存储在本地,并像 Grammarly 一样在下次输入时提示可复用的上下文;Vibedock(#10)允许用户从 macOS 菜单栏一键开关 Claude Code MCP 服务器,解决多 MCP 上下文膨胀问题;ElevenAgents by ElevenLabs 作为推广产品发布,主打通过 AI 语音 Agent 规模化对话交互。(来源:Product Hunt)
Anthropic 收购 Stainless,深化企业服务整合
Anthropic 于 5 月 18 日宣布收购 API 基础设施公司 Stainless,此举将加速 Claude API 的企业级部署能力。同期,Anthropic 还宣布了 KPMG 在其全球 276,000 名员工中全面部署 Claude(5 月 19 日)、与 Gates Foundation 达成 2 亿美元合作(5 月 14 日)、以及面向小企业的 Claude for Small Business 计划(5 月 13 日),企业生态建设全面提速。(来源:Anthropic Blog)
📄 最新 AI 学术论文速览
arXiv 今日亮点
来自 5 月 22 日最新提交的 arXiv AI 论文:MOSS 提出通过源码级重写实现自主 Agent 系统的自我进化;Gated DeltaNet-2 提出线性注意力中的擦除与写入解耦新机制;LCGuard 为多 Agent 系统中的安全 KV 共享设计了潜在通信防护机制;Advancing Mathematics Research with AI-Driven Formal Proof Search 展示了 AI 驱动的形式化证明搜索在数学研究中的前沿应用。(来源:arXiv)