大模型发布与更新
Anthropic 发布 Claude Opus 4.8,性能全面提升
Anthropic 于 5 月 28 日正式发布 Claude Opus 4.8,作为 Opus 系列的最新升级版本,在编程、Agent 任务和专业工作方面均有显著增强。新模型在一致性上大幅提升,能够更好地处理长期运行任务。VentureBeat 报道称,Opus 4.8 引入了 3 倍更便宜的快速模式,并在对齐安全性上接近”Mythos”级别,模型在评估环境中展现出更强的自我推理能力。(来源:Anthropic Blog / VentureBeat / Hacker News)
Anthropic 完成 $650 亿 Series H 融资,估值达 $9650 亿
Anthropic 在 5 月 28 日宣布完成 $650 亿 Series H 轮融资,投后估值高达 $9650 亿,进一步巩固其在 AI 领域的领先地位。同期,Anthropic 还宣布开设米兰办公室、任命 KiYoung Choi 为韩国代表理事,并收购了 API 基础设施公司 Stainless。(来源:Anthropic Newsroom)
Mistral AI 发布 Vibe 平台,进军工业 AI 并建设数据中心
法国 AI 公司 Mistral AI 在巴黎 AI NOW 峰会上正式发布 Vibe 平台,同时宣布进军工业 AI 领域并建设自有数据中心。CEO Arthur Mensch 透露公司目前拥有 1000 名员工,2026 年目标营收 €10 亿(约 $11.7 亿)。这一战略涉及从 GPU 集群到飞机机翼物理模拟的广泛布局,直接挑战 OpenAI 的领先地位。(来源:VentureBeat)
MiniMax 预告 M3 模型:稀疏注意力机制实现 15.6 倍长上下文加速
AI 公司 MiniMax 预告了即将推出的 M3 模型,采用全新的稀疏注意力机制,在处理海量信息时可将长上下文响应速度提升 15.6 倍,直接解决了 AI 聊天机器人面对大规模上下文时的卡顿和延迟问题。(来源:VentureBeat)
AI Agent 与 AI 编程 IDE
Cognition 融资超 $10 亿,估值达 $260 亿
Cognition(Devin 和 Windsurf 的开发商)于 5 月 27 日宣布完成新一轮融资,总额超过 $10 亿,估值达到 $260 亿。本轮由 Lux Capital、General Catalyst 和 8VC 领投。公司还宣布 Devin 即将支持 Windows 虚拟机原生运行,并发布了 Auto-Triage 功能,使 Devin 能够自动监测 Bug、警报和事故并即时响应。(来源:Cognition Blog)
Cursor 发布 Composer 2.5,长周期 Agent 任务能力大幅提升
Cursor 团队于 5 月 18 日推出 Composer 2.5,在智能和行为上较 Composer 2 有显著改进,尤其在长周期 Agent 任务上表现突出。此外,电商平台 Faire 使用 Cursor Cloud Agents 后将 PR 吞吐量翻倍。(来源:Cursor Blog)
Augment Code 发布 “Opus 4.7 价格低 33%” 对比报告
AI 编程助手 Augment Code 发布报告,展示了其 Auggie 产品在搭载 Opus 4.7 模型时,相比 Claude Code 成本低 33%,同时保持同等或更高的代码质量。Augment 还发布了 Cosmos 系统以帮助 AI 原生组织扩展事故管理流程。(来源:Augment Code Blog)
GitHub Copilot 推进 Agent 驱动开发
GitHub 工程博客发布文章”Agent-driven development in Copilot Applied Science”,展示了 Copilot 团队如何利用 Agent 驱动的开发方法来构建和优化 AI 编程助手的核心能力。(来源:GitHub Blog)
Google DeepMind 发布 AlphaEvolve:基于 Gemini 的代码 Agent
Google DeepMind 在博客中介绍了 AlphaEvolve,这是一个由 Gemini 驱动的代码 Agent,专为设计高级算法而生,展示了 AI Agent 在算法研究和工程中的新应用场景。(来源:Google DeepMind Blog)
行业趋势与重要新闻
Meta 与 Google 合作:自动化 LLM 推理策略设计,Token 使用降低 69.5%
来自 Meta 和 Google 的研究团队发布了一项新框架,能够自动化 LLM 推理策略设计,以仅 $39.90 的计算成本将 Token 使用量降低 69.5%。这一突破有望大幅降低大模型推理成本。(来源:VentureBeat)
DeepSeek 将 75% 降价永久化,冲击硅谷 Token 护城河
DeepSeek 宣布其 75% 的价格优惠将永久生效。分析认为,这一激进定价策略正在打破硅谷 AI 公司的”Token 护城河”,对 OpenAI、Anthropic 以及企业 AI 基础设施决策产生深远影响。(来源:VentureBeat)
Figma Make 推出双向 GitHub 集成,设计稿直转生产代码
Figma Make 发布了全新的双向 GitHub 集成,使设计师的视觉 AI 编辑能够直接纳入与工程提交相同的 CI 流水线、安全检查和代码审查流程,从企业治理角度看,设计师正在成为新一代”软件工程师”。(来源:VentureBeat)
Google 25 年来首次重新设计搜索框
Google 于 5 月 19 日正式宣布对其搜索框进行重新设计,这是 25 年来的首次。这一变化背后是 AI 对搜索范式深远影响的体现,传统”白色矩形 + 蓝色链接”的模式正在被 AI 驱动的搜索体验所取代。(来源:VentureBeat)
GitHub 热门趋势
ECC(Agent 性能优化框架)和 Superpowers 持续霸榜
今日 GitHub Trending 上,AI Agent 相关项目表现抢眼:ECC(Agent Harness 性能优化系统)获得 197K+ Star,Superpowers(Agent 技能框架与软件开发方法论)获得 211K+ Star,两者均支持 Claude Code、Codex、Cursor 等多个 Agent 平台。微软的 MarkItDown(文件转 Markdown 工具)也以 127K+ Star 位居前列。趋势表明 AI Agent 基础设施正成为开发者社区最关注的方向。(来源:GitHub Trending)