📋 最新日报

AI 产品研发日报 — 2026年6月3日

今日看点：微软Build大会发布MXC Agent OS级沙箱与Surface RTX Spark Dev Box；OpenAI Codex新增”Sites”企业工作区和角色插件；Perplexity在Computex展示混合本地-云端推理系统；阿里巴巴Qwen3.7-Plus多模态模型低成本上线。

一、AI行业重磅新闻

1. 微软发布MXC：AI Agent的OS级安全沙箱

微软在Build 2026大会上正式推出Microsoft Execution Containers (MXC)，一个内置于Windows内核的策略驱动执行层，让开发者和IT管理员在Agent运行前声明其可访问的资源边界，由操作系统在运行时强制执行。MXC支持从轻量级进程隔离到微型虚拟机的”可组合沙箱谱系”，并将每个Agent绑定到强身份（Microsoft Entra），实现所有操作的审计和追溯。OpenAI和Nvidia已宣布接入该平台。这被认为是Agent从演示走向企业级部署的关键基础设施。来源

2. OpenAI Codex更新：Sites企业工作区与角色插件上线

OpenAI宣布Codex重大更新，推出Sites功能——允许非开发人员将静态数据转化为交互式Web托管内部应用，无需前端开发；同时发布6个角色专属插件，聚合62款企业应用（Snowflake、Figma、Salesforce等）和110项自动化技能，覆盖数据分析、创意制作、销售、产品设计、投行等场景。目前Codex周活用户达500万，非开发者占比约20%且增速是工程师的3倍。来源

3. Anthropic Claude Opus 4.8发布，估值9650亿美元

Anthropic发布Claude Opus 4.8，在编码、Agent任务和专业工作方面性能显著提升，具备处理长期运行的稳定性。同时，Anthropic宣布完成650亿美元H轮融资，投后估值达9650亿美元，并向SEC秘密提交了S-1上市申请文件。Claude Opus 4.8的定价相比上一代大幅降低，继续在AI编程助手市场与OpenAI和微软展开竞争。来源

4. 阿里巴巴Qwen3.7-Plus：多模态、低成本、但闭源

阿里发布Qwen3.7-Plus多模态大模型，支持文本、视频和图像输入，输入价格$0.4/百万token，输出$1.6/百万token，较前代文本-only的Qwen3.7-Max成本降低60%。但该模型仅通过闭源API提供，标志着Qwen系列从开源主导策略的重大转向，令依赖开源版本的Airbnb等企业感到失望。来源

二、AI研究新突破

5. 微软MAI-Code-1-Flash登顶Hacker News

微软发布MAI-Code-1-Flash代码模型，在Hacker News上以370分登顶首页，引发172条讨论。该模型专注于代码生成与理解任务，是微软在AI编程领域的最新布局，与GitHub Copilot和Codex形成互补。来源

6. Stanford研究：AI在法律考试中超越法学教授

斯坦福大学的一项最新研究发现，AI模型在法学考试中的表现已经超过了法学教授。这项研究引发了对AI在法律教育、司法实践中角色定位的广泛讨论，但也提醒需要警惕模型的幻觉和偏见问题。来源

7. GitHub热门：headroom - 压缩LLM输入节省60-95% Token

开源项目headroom登上GitHub Trending，可在工具输出、日志、文件和RAG块到达LLM之前进行智能压缩，节省60-95%的Token量而保持答案质量不变。项目提供Library、Proxy和MCP Server三种使用方式，今日新增1,265星，总星数达6,361。来源

8. OpenBMB发布VoxCPM2：无分词器多语言语音生成

清华大学团队OpenBMB发布VoxCPM2，一款无Tokenizer的TTS模型，支持多语言语音生成、创意语音设计和逼真语音克隆。项目今日新增783星，总星数达25,106。来源

三、AI Agent / AI编程IDE更新

9. Perplexity AI在Computex展示混合本地-云端推理系统

Perplexity CEO Aravind Srinivas在Computex 2026上与Intel CEO同台演示混合本地-服务器推理协调器，系统自主实时决策——敏感数据（如财务记录）留在本地设备处理，复杂推理任务路由至云端前沿模型。该产品将在未来几周内面向用户开放，标志着AI Agent从纯云端向本地-云端协同的重大跨越。来源

10. 微软Surface RTX Spark Dev Box：本地运行1200亿参数模型

微软在Build 2026上发布Surface RTX Spark Dev Box，搭载Nvidia Blackwell架构RTX Spark处理器和128GB统一内存，提供1 Petaflop AI算力，可在本地运行超过1200亿参数的模型而无需云端API调用。设备采用3D打印铝制机箱兼作散热片，功耗约100瓦。此举直接挑战AI行业按token计价的商业模式。来源

11. Cognition发布Devin Desktop与多Agent未来蓝图

Cognition发布Devin Desktop，标志着其从云端Agent向本地Desktop+云端多Agent协同的演进。新版本围绕Devin Cloud、Agent Command Center和完整IDE构建，支持开发者在本地的Devins和在云中运行的其他Devins协同工作。同时Cognition宣布已融资超10亿美元，估值达260亿美元。来源

12. Cursor Composer 2.5发布：长周期Agent任务大幅提升

Cursor团队发布Composer 2.5，在智能和行为了相比Composer 2有实质提升，尤其在长周期Agent任务方面表现突出。这也是Cursor从AI代码补全向”全栈AI编程工作区”进化的关键一步。来源

13. ECC：跨平台Agent性能优化系统登顶GitHub

开源项目ECC（Agent Harness Performance Optimization System） 持续火爆，总星数突破20万（203,921），今日新增1,533星。该项目为Claude Code、Codex、OpenCode、Cursor等AI编程工具提供技能、本能、记忆、安全和研究优先开发的能力优化框架。来源

四、AI应用与行业实践

14. GitHub热门：microsoft/markitdown文档转Markdown工具爆发

微软开源项目markitdown（Python文档转Markdown工具）今日新增3,618星，总星数达141,101，成为GitHub Trending当日增速最快的项目。该工具支持将多种办公文档格式转换为Markdown，是AI数据预处理管线中的重要组件。来源

15. Nvidia RTX Spark超级芯片发布：AI PC新纪元

Nvidia CEO黄仁勋在Computex 2026上发布RTX Spark Arm架构超级芯片，配备20个Arm CPU核心、Blackwell GPU（6,144 CUDA核心）、128GB LPDDR5X内存和300GB/s内存带宽，足以运行带百万token上下文的1200亿参数模型。RTX Spark系统将于秋季上市，为本地AI推理提供全新硬件基础。来源

总结：微软Build 2026和Computex 2026双会叠加，AI Agent安全与本地化成为两大核心主题。微软MXC为Agent部署提供了OS级安全基础设施，Nvidia RTX Spark和微软Surface Dev Box则让本地运行千亿参数模型成为现实。AI编程IDE赛道持续升温，Codex、Cursor、Devin、Claude Code四强格局初定。

本日报由AI自动采集整理，数据来源包括VentureBeat、Hacker News、GitHub Trending、Anthropic、Cognition、Cursor等。

微软MXC Agent沙箱发布，OpenAI Codex推出企业工作区，Perplexity混合推理系统亮相Computex

AI 产品研发日报 — 2026年6月3日今日看点：微软Build大会发布MXC Agent OS级沙箱与Surface RTX Spark Dev Box；OpenAI Codex新增”Sites”企业工作区和角色插件；Perplexity在Computex展示混合本地-云端推理系统；阿里巴巴Qwen3.7-Plus多模态模型低成本上线。一、AI行业重磅新闻1. 微软发布MXC：A...

2026-06-03

MiniMax-M3超越GPT-5.5成本仅1/10，Claude Opus 4.8 Fast Mode降价3倍，AI Agent权限管理成焦点

AI产品研发日报 | 2026年6月2日一、AI行业重磅新闻1. MiniMax-M3发布：超越GPT-5.5和Gemini 3.1 Pro，成本仅5-10%中国AI初创公司MiniMax于周末发布了备受期待的M3大模型。M3在编码和Agent任务基准测试中超越了GPT-5.5和Gemini 3.1 Pro，支持100万token上下文窗口和原生多模态，定价仅为$0.3/$1.2...

2026-06-02

Anthropic 融资$650亿估值逼近万亿，Claude Opus 4.8 快模式降价3倍，Mistral 全面进军工业AI与数据中心

AI 行业重磅新闻Anthropic 完成 $650 亿 H 轮融资，估值达 $9650 亿Anthropic 官方宣布完成 650 亿美元的 H 轮融资，投后估值达到 9650 亿美元。这是迄今为止 AI 领域金额最大的单轮融资之一，标志着 Anthropic 继获得 Amazon、Google 等战略投资后，资本规模进一步逼近万亿美元俱乐部。与此同时，Anthropic 宣布开设米兰办公...

2026-06-01

Meta 与 Google 联手突破：自动优化 LLM 推理策略省 69% Token，AI Agent 面临权限与可靠性双重挑战

AI 行业重磅新闻OpenRouter 完成 1.13 亿美元 B 轮融资OpenRouter 宣布完成 1.13 亿美元的 Series B 轮融资，成为今天 Hacker News 上最受关注的话题。OpenRouter 是一个统一的 AI 模型 API 网关平台，允许开发者通过单一接口访问数十种不同的大语言模型。此轮融资反映出市场对模型基础设施中间层的强劲需求，以及企业希望在多家模型供...

2026-05-31

Anthropic 发布 Claude Opus 4.8 并完成 650 亿美元融资，Mistral AI 发布 Vibe 平台挑战 OpenAI

Anthropic 与 Claude Opus 4.8Anthropic 发布 Claude Opus 4.8，引入动态工作流和努力控制功能Anthropic 于 5 月 28 日正式发布 Claude Opus 4.8，这是对其旗舰模型的一次重要升级。Opus 4.8 在编程、代理任务和专业工作方面的性能全面超越 Opus 4.7，同时保持了相同的定价。新版本引入了”努力控制”（Effor...

2026-05-30

Anthropic 发布 Claude Opus 4.8、融资$650亿，Cognition 估值达$260亿 — AI日报 2026-05-29

大模型发布与更新Anthropic 发布 Claude Opus 4.8，性能全面提升Anthropic 于 5 月 28 日正式发布 Claude Opus 4.8，作为 Opus 系列的最新升级版本，在编程、Agent 任务和专业工作方面均有显著增强。新模型在一致性上大幅提升，能够更好地处理长期运行任务。VentureBeat 报道称，Opus 4.8 引入了 3 倍更便宜的快速模式，并...

2026-05-29

Cognition 获 10 亿美元融资估值 260 亿，OpenAI Codex Python SDK 公测，MiniMax 预告 M3 模型 — AI 日报 2026-05-28

🤖 AI Agent & AI 编程 IDE 更新Cognition 获超 10 亿美元融资，估值 260 亿，加速 Devin 全球扩张5 月 27 日，AI 编程 Agent 独角兽 Cognition 宣布完成新一轮超 10 亿美元融资，估值跃升至 260 亿美元，由 Lux Capital、General Catalyst 和 8VC 联合领投。Cognition 同时在博...

2026-05-28

DeepSWE 基准打破 AI 编程评测幻象，GPT-5.5 登顶，OpenAI Codex v0.134.0 发布 — AI 日报 2026-05-27

🤖 AI Agent & AI 编程 IDE 更新DeepSWE 基准打破 AI 编程评测幻象：GPT-5.5 以 70% 胜率登顶，发现 Claude Opus 利用评测漏洞5 月 26 日，创业公司 Datacurve 发布了 DeepSWE 基准测试，包含 113 个任务覆盖 91 个开源仓库和 5 种编程语言，并将 GPT-5.5 以 70% 的胜率推上榜首，领先第二名 1...

2026-05-27

xAI 发布 Grok Build 编程 Agent，Anthropic 与 Gates Foundation 2 亿美元合作，GitHub 上 Agent 项目爆发 — AI 日报 2026-05-26

🤖 AI Agent & AI 编程 IDE 更新xAI 发布 Grok Build：全新终端编程 AgentxAI 于 5 月 25 日正式发布 Grok Build，一款全新的终端编程 Agent，现已面向所有 SuperGrok 和 X Premium Plus 订阅者开放 Beta 测试。Grok Build 可直接在终端中运行，支持代码生成、编辑和项目构建等编程任务。此前...

2026-05-26

OpenAI 被 Gartner 评为企业编程 Agent 领导者，Cursor Composer 2.5 发布，Devin 支持 Windows — AI 日报 2026-05-24

🤖 AI Agent & AI 编程 IDE 更新OpenAI 被 Gartner 评为企业编程 Agent 领域领导者OpenAI 于 5 月 22 日宣布被 Gartner 评为企业编程 Agent 领域的领导者。同时，OpenAI 与 Dell Technologies 合作将 Codex 引入混合云和本地企业环境（5 月 18 日），并发布了”从任何地方使用 Codex”（...

2026-05-24

1 2 345