AI 行业重磅新闻
Anthropic 完成 $650 亿 H 轮融资,估值达 $9650 亿
Anthropic 官方宣布完成 650 亿美元的 H 轮融资,投后估值达到 9650 亿美元。这是迄今为止 AI 领域金额最大的单轮融资之一,标志着 Anthropic 继获得 Amazon、Google 等战略投资后,资本规模进一步逼近万亿美元俱乐部。与此同时,Anthropic 宣布开设米兰办公室,加速欧洲企业市场布局,并任命韩国区代表准备进入首尔市场。(来源:Anthropic Blog)
Claude Opus 4.8 正式发布:快模式降价 3 倍,支持数百并行子 Agent
Anthropic 于 5 月 28 日发布旗舰模型 Claude Opus 4.8,常规模式定价保持不变($5/$25 每百万 token),但快模式(约 2.5 倍生成速度)价格从 Opus 4.7 的 $30/$150 大幅降至 $10/$50,降幅达三分之二。Opus 4.8 在 SWE-bench Verified 上得分 88.6%,SWE-bench Pro 上 69.2%,全面超越 GPT-5.5 常规模式。更具突破性的是,Anthropic 同步推出了 Claude Code 动态工作流功能,可让模型规划任务后生成数百个并行子 Agent 协同工作,适用于数十万行代码的大型项目迁移。Anthropic 内部能力评估显示,Opus 4.8 介于 Opus 4.7 与更强但尚未公开的 Mythos Preview 之间,预计数周内将向所有客户开放 Mythos 级模型。(来源:VentureBeat / Anthropic Blog)
Mistral AI 发布 Vibe 平台,全面进军工业 AI 与自有数据中心
法国 AI 初创公司 Mistral AI 在首届 AI NOW 峰会上宣布了一系列重大举措:将旗下对话助手 Le Chat 更名为 Vibe,重新定位为统一的 Agent 平台(含 Vibe for Work 和 Vibe for Code 两种模式);推出 Mistral for Industrial Engineering,结合今年 5 月收购的 Emmi AI 的物理仿真能力,与 Airbus、BMW、ASML 达成合作,用”物理 AI”加速航空航天和汽车设计仿真(速度提升 120 倍);宣布在巴黎南部新建 10MW 推理数据中心(Q3 2026 投产)。Mistral 目前员工超 1000 人,2026 年营收目标 10 亿欧元($11.7 亿),已累计融资超 $39 亿。(来源:VentureBeat)
Cognition 获超 $10 亿融资估值 $260 亿,Devin 加速全球扩张
Cognition 官方宣布已累计融资超 10 亿美元,估值达到 260 亿美元,由 Lux Capital、General Catalyst 和 8VC 领投。与此同时,Cognition 发布 Agentic Development 规模化验证技术方案(5 月 29 日),详细介绍了在 Devin 虚拟机内构建端到端测试能力的经验。Devin 还新增了 Windows VM 原生支持,允许在 Windows 生态中自主构建、运行和测试应用,标志着 AI 编程 Agent 正式进入企业级 Windows 开发环境。(来源:Cognition Blog)
AI 研究新突破
MeMo 记忆模型:知识存储与推理分离,性能跃升 26%
研究人员推出 MeMo(Memory Model),一种全新的记忆框架,将 AI 知识存储与推理能力彻底解耦。团队无需重新训练即可更换底层 LLM,性能仍能提升 26%。这一架构有望大幅降低企业持续更新 AI 系统的维护成本,使得模型升级不再受制于记忆系统的重新训练。(来源:VentureBeat)
Meta 与 Google 联合框架:自动设计 LLM 推理策略,Token 用量减少 69.5%
Meta 和 Google 的研究人员合作提出了一种新框架,能够自动为 LLM 设计最优推理策略。该系统通过自动化搜索优化,在不降低任务性能的前提下将 Token 消耗量削减 69.5%,而整个优化仅需 $39.90 的计算成本。该成果为推理优化开辟了全新方向——让 AI 为自己的推理策略”编程”。(来源:VentureBeat)
开源模型新进展:1-Bit Bonsai 4B 本地图像生成与 VoxCPM2 多语言语音合成
Hacker News 热门项目 1-Bit Bonsai Image 以仅 4B 参数实现本地设备上的高质量图像生成,获得 267 分高热度讨论,代表了小模型在端侧图像生成方向的重要突破。与此同时,清华大学 OpenBMB 团队的 VoxCPM2 项目今日在 GitHub Trending 获得 635 颗星(总星数 23,512),实现了无需 Tokenizer 的多语言语音生成、创意语音设计和真实感语音克隆功能。(来源:Hacker News / GitHub Trending)
AI Agent 与 AI 编程 IDE 更新
Workday Sana:AI Agent 的真正瓶颈是权限而非模型性能
Workday 在 Sana 平台上推出了一套解决 AI Agent 权限治理的方案,将其现有的人事与财务记录系统作为 Agent 的治理层。Workday 总裁 Gerrit Kazmaier 指出,客户在自行拼凑 AI 解决方案时常常丢失安全模型的丰富性。Sana 使用 Google Gemini 作为对话层,但认证和授权完全基于 Workday 的身份与安全模型,审计轨迹也保留在客户系统中。业内专家表示,在没有系统级权限管控的情况下运行 AI Agent,只会”陷入混乱”。(来源:VentureBeat)
AI Agent 进入”重建时代”,可靠性成企业首要挑战
VentureBeat 报道指出,随着企业 AI Agent 进入生产阶段,组织正面临日益严重的可靠性问题。长期运行的 AI 工作流必须承受崩溃、保持状态、从故障中恢复、管理推理成本,并在多个 API 和企业系统间协调。大量团队发现,仅靠 LLM 性能提升并不能决定 Agent 在生产中的成败,架构层面的可靠性设计才是关键。(来源:VentureBeat)
Cursor Composer 2.5 发布,长周期 Agent 任务显著提升
Cursor 团队于 5 月 18 日发布 Composer 2.5,在长周期 Agent 任务能力上实现大幅改进。案例显示,电商平台 Faire 使用 Cursor Cloud Agents 后 PR 吞吐量翻倍。Cursor 还发布了 Compound Engineering 官方插件规范,EveryInc 的 compound-engineering-plugin 项目在 GitHub Trending 上获 251 星(总星数 18,697),支持 Claude Code、Codex、Cursor 等多种 AI 编程工具。(来源:Cursor Blog / GitHub Trending)
GitHub Trending 热门 Agent 工具链持续升温
revfactory/harness 项目今日获得 323 星(总星数 4,591),作为一种元技能框架,可设计领域特定的 Agent 团队并定义专业化 Agent 角色。此外,nesquena/hermes-webui 项目(9,959 星,今日 357 星)为 Hermes Agent 提供了 Web 界面和移动端访问能力。微软的 markitdown 工具(134,931 星,今日 2,798 星)持续引领文件转 Markdown 赛道。(来源:GitHub Trending)
AI 应用与行业实践
Pinterest 削减 AI 成本 90%:剥离前沿模型视觉层
Pinterest CTO Matt Madrigal 分享了 Pinterest 的 AI 成本优化实践:通过剥离 Qwen3-VL 模型的视觉层,将 API 调用成本削减 90%。对于拥有 6.2 亿用户的平台来说,直接调用前沿模型 API 的成本完全不可行。Pinterest 的实践为其他大规模互联网平台提供了在保持功能前提下大幅降低推理成本的参考路径。(来源:VentureBeat)
Google 搜索框 25 年来首次重新设计,AI 搜索全面融合
Google 在 I/O 大会上宣布了对搜索框的彻底重新设计:从简单的关键词输入框转变为动态、AI 驱动的多模态对话入口,支持文本、图像、PDF、视频甚至 Chrome 标签页拖入作为输入。同时 Google 将 AI Overviews 与 AI Mode 合并为统一的搜索体验。AI Mode 上线一年已突破 10 亿月活用户,搜索查询量创历史新高。CEO Sundar Pichai 表示 AI 功能并未蚕食搜索量,反而让用户使用了更多搜索。(来源:VentureBeat)
ChatGPT for Google Sheets 被发现存在数据泄露与钓鱼漏洞
安全研究公司 PromptArmor 披露,ChatGPT for Google Sheets 插件存在严重安全隐患,可被利用进行数据泄露和钓鱼攻击。该漏洞在 Hacker News 上获得 102 分讨论,引发了关于 AI 插件安全权限控制的广泛关注,尤其是在企业环境中使用 AI 工具处理敏感数据时的风险管控。(来源:Hacker News)