📋 最新日报

AI 产品研发日报 — 2026年6月3日

今日看点:微软Build大会发布MXC Agent OS级沙箱与Surface RTX Spark Dev Box;OpenAI Codex新增”Sites”企业工作区和角色插件;Perplexity在Computex展示混合本地-云端推理系统;阿里巴巴Qwen3.7-Plus多模态模型低成本上线。


一、AI行业重磅新闻

1. 微软发布MXC:AI Agent的OS级安全沙箱

微软在Build 2026大会上正式推出Microsoft Execution Containers (MXC),一个内置于Windows内核的策略驱动执行层,让开发者和IT管理员在Agent运行前声明其可访问的资源边界,由操作系统在运行时强制执行。MXC支持从轻量级进程隔离到微型虚拟机的”可组合沙箱谱系”,并将每个Agent绑定到强身份(Microsoft Entra),实现所有操作的审计和追溯。OpenAI和Nvidia已宣布接入该平台。这被认为是Agent从演示走向企业级部署的关键基础设施。来源

2. OpenAI Codex更新:Sites企业工作区与角色插件上线

OpenAI宣布Codex重大更新,推出Sites功能——允许非开发人员将静态数据转化为交互式Web托管内部应用,无需前端开发;同时发布6个角色专属插件,聚合62款企业应用(Snowflake、Figma、Salesforce等)和110项自动化技能,覆盖数据分析、创意制作、销售、产品设计、投行等场景。目前Codex周活用户达500万,非开发者占比约20%且增速是工程师的3倍。来源

3. Anthropic Claude Opus 4.8发布,估值9650亿美元

Anthropic发布Claude Opus 4.8,在编码、Agent任务和专业工作方面性能显著提升,具备处理长期运行的稳定性。同时,Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元,并向SEC秘密提交了S-1上市申请文件。Claude Opus 4.8的定价相比上一代大幅降低,继续在AI编程助手市场与OpenAI和微软展开竞争。来源

4. 阿里巴巴Qwen3.7-Plus:多模态、低成本、但闭源

阿里发布Qwen3.7-Plus多模态大模型,支持文本、视频和图像输入,输入价格$0.4/百万token,输出$1.6/百万token,较前代文本-only的Qwen3.7-Max成本降低60%。但该模型仅通过闭源API提供,标志着Qwen系列从开源主导策略的重大转向,令依赖开源版本的Airbnb等企业感到失望。来源


二、AI研究新突破

5. 微软MAI-Code-1-Flash登顶Hacker News

微软发布MAI-Code-1-Flash代码模型,在Hacker News上以370分登顶首页,引发172条讨论。该模型专注于代码生成与理解任务,是微软在AI编程领域的最新布局,与GitHub Copilot和Codex形成互补。来源

6. Stanford研究:AI在法律考试中超越法学教授

斯坦福大学的一项最新研究发现,AI模型在法学考试中的表现已经超过了法学教授。这项研究引发了对AI在法律教育、司法实践中角色定位的广泛讨论,但也提醒需要警惕模型的幻觉和偏见问题。来源

7. GitHub热门:headroom - 压缩LLM输入节省60-95% Token

开源项目headroom登上GitHub Trending,可在工具输出、日志、文件和RAG块到达LLM之前进行智能压缩,节省60-95%的Token量而保持答案质量不变。项目提供Library、Proxy和MCP Server三种使用方式,今日新增1,265星,总星数达6,361。来源

8. OpenBMB发布VoxCPM2:无分词器多语言语音生成

清华大学团队OpenBMB发布VoxCPM2,一款无Tokenizer的TTS模型,支持多语言语音生成、创意语音设计和逼真语音克隆。项目今日新增783星,总星数达25,106。来源


三、AI Agent / AI编程IDE更新

9. Perplexity AI在Computex展示混合本地-云端推理系统

Perplexity CEO Aravind Srinivas在Computex 2026上与Intel CEO同台演示混合本地-服务器推理协调器,系统自主实时决策——敏感数据(如财务记录)留在本地设备处理,复杂推理任务路由至云端前沿模型。该产品将在未来几周内面向用户开放,标志着AI Agent从纯云端向本地-云端协同的重大跨越。来源

10. 微软Surface RTX Spark Dev Box:本地运行1200亿参数模型

微软在Build 2026上发布Surface RTX Spark Dev Box,搭载Nvidia Blackwell架构RTX Spark处理器和128GB统一内存,提供1 Petaflop AI算力,可在本地运行超过1200亿参数的模型而无需云端API调用。设备采用3D打印铝制机箱兼作散热片,功耗约100瓦。此举直接挑战AI行业按token计价的商业模式。来源

11. Cognition发布Devin Desktop与多Agent未来蓝图

Cognition发布Devin Desktop,标志着其从云端Agent向本地Desktop+云端多Agent协同的演进。新版本围绕Devin Cloud、Agent Command Center和完整IDE构建,支持开发者在本地的Devins和在云中运行的其他Devins协同工作。同时Cognition宣布已融资超10亿美元,估值达260亿美元。来源

12. Cursor Composer 2.5发布:长周期Agent任务大幅提升

Cursor团队发布Composer 2.5,在智能和行为了相比Composer 2有实质提升,尤其在长周期Agent任务方面表现突出。这也是Cursor从AI代码补全向”全栈AI编程工作区”进化的关键一步。来源

13. ECC:跨平台Agent性能优化系统登顶GitHub

开源项目ECC(Agent Harness Performance Optimization System) 持续火爆,总星数突破20万(203,921),今日新增1,533星。该项目为Claude Code、Codex、OpenCode、Cursor等AI编程工具提供技能、本能、记忆、安全和研究优先开发的能力优化框架。来源


四、AI应用与行业实践

14. GitHub热门:microsoft/markitdown文档转Markdown工具爆发

微软开源项目markitdown(Python文档转Markdown工具)今日新增3,618星,总星数达141,101,成为GitHub Trending当日增速最快的项目。该工具支持将多种办公文档格式转换为Markdown,是AI数据预处理管线中的重要组件。来源

15. Nvidia RTX Spark超级芯片发布:AI PC新纪元

Nvidia CEO黄仁勋在Computex 2026上发布RTX Spark Arm架构超级芯片,配备20个Arm CPU核心、Blackwell GPU(6,144 CUDA核心)、128GB LPDDR5X内存和300GB/s内存带宽,足以运行带百万token上下文的1200亿参数模型。RTX Spark系统将于秋季上市,为本地AI推理提供全新硬件基础。来源


总结:微软Build 2026和Computex 2026双会叠加,AI Agent安全与本地化成为两大核心主题。微软MXC为Agent部署提供了OS级安全基础设施,Nvidia RTX Spark和微软Surface Dev Box则让本地运行千亿参数模型成为现实。AI编程IDE赛道持续升温,Codex、Cursor、Devin、Claude Code四强格局初定。

本日报由AI自动采集整理,数据来源包括VentureBeat、Hacker News、GitHub Trending、Anthropic、Cognition、Cursor等。

微软MXC Agent沙箱发布,OpenAI Codex推出企业工作区,Perplexity混合推理系统亮相Computex

AI 产品研发日报 — 2026年6月3日 今日看点:微软Build大会发布MXC Agent OS级沙箱与Surface RTX Spark Dev Box;OpenAI Codex新增”Sites”企业工作区和角色插件;Perplexity在Computex展示混合本地-云端推理系统;阿里巴巴Qwen3.7-Plus多模态模型低成本上线。 一、AI行业重磅新闻1. 微软发布MXC:A...

AI日报

MiniMax-M3超越GPT-5.5成本仅1/10,Claude Opus 4.8 Fast Mode降价3倍,AI Agent权限管理成焦点

AI产品研发日报 | 2026年6月2日 一、AI行业重磅新闻1. MiniMax-M3发布:超越GPT-5.5和Gemini 3.1 Pro,成本仅5-10%中国AI初创公司MiniMax于周末发布了备受期待的M3大模型。M3在编码和Agent任务基准测试中超越了GPT-5.5和Gemini 3.1 Pro,支持100万token上下文窗口和原生多模态,定价仅为$0.3/$1.2...

AI日报

Anthropic 融资$650亿估值逼近万亿,Claude Opus 4.8 快模式降价3倍,Mistral 全面进军工业AI与数据中心

AI 行业重磅新闻Anthropic 完成 $650 亿 H 轮融资,估值达 $9650 亿Anthropic 官方宣布完成 650 亿美元的 H 轮融资,投后估值达到 9650 亿美元。这是迄今为止 AI 领域金额最大的单轮融资之一,标志着 Anthropic 继获得 Amazon、Google 等战略投资后,资本规模进一步逼近万亿美元俱乐部。与此同时,Anthropic 宣布开设米兰办公...

AI日报

Meta 与 Google 联手突破:自动优化 LLM 推理策略省 69% Token,AI Agent 面临权限与可靠性双重挑战

AI 行业重磅新闻OpenRouter 完成 1.13 亿美元 B 轮融资OpenRouter 宣布完成 1.13 亿美元的 Series B 轮融资,成为今天 Hacker News 上最受关注的话题。OpenRouter 是一个统一的 AI 模型 API 网关平台,允许开发者通过单一接口访问数十种不同的大语言模型。此轮融资反映出市场对模型基础设施中间层的强劲需求,以及企业希望在多家模型供...

AI日报

Anthropic 发布 Claude Opus 4.8 并完成 650 亿美元融资,Mistral AI 发布 Vibe 平台挑战 OpenAI

Anthropic 与 Claude Opus 4.8Anthropic 发布 Claude Opus 4.8,引入动态工作流和努力控制功能Anthropic 于 5 月 28 日正式发布 Claude Opus 4.8,这是对其旗舰模型的一次重要升级。Opus 4.8 在编程、代理任务和专业工作方面的性能全面超越 Opus 4.7,同时保持了相同的定价。新版本引入了”努力控制”(Effor...

AI日报

Anthropic 发布 Claude Opus 4.8、融资$650亿,Cognition 估值达$260亿 — AI日报 2026-05-29

大模型发布与更新Anthropic 发布 Claude Opus 4.8,性能全面提升Anthropic 于 5 月 28 日正式发布 Claude Opus 4.8,作为 Opus 系列的最新升级版本,在编程、Agent 任务和专业工作方面均有显著增强。新模型在一致性上大幅提升,能够更好地处理长期运行任务。VentureBeat 报道称,Opus 4.8 引入了 3 倍更便宜的快速模式,并...

AI日报

Cognition 获 10 亿美元融资估值 260 亿,OpenAI Codex Python SDK 公测,MiniMax 预告 M3 模型 — AI 日报 2026-05-28

🤖 AI Agent & AI 编程 IDE 更新Cognition 获超 10 亿美元融资,估值 260 亿,加速 Devin 全球扩张5 月 27 日,AI 编程 Agent 独角兽 Cognition 宣布完成新一轮超 10 亿美元融资,估值跃升至 260 亿美元,由 Lux Capital、General Catalyst 和 8VC 联合领投。Cognition 同时在博...

AI日报

DeepSWE 基准打破 AI 编程评测幻象,GPT-5.5 登顶,OpenAI Codex v0.134.0 发布 — AI 日报 2026-05-27

🤖 AI Agent & AI 编程 IDE 更新DeepSWE 基准打破 AI 编程评测幻象:GPT-5.5 以 70% 胜率登顶,发现 Claude Opus 利用评测漏洞5 月 26 日,创业公司 Datacurve 发布了 DeepSWE 基准测试,包含 113 个任务覆盖 91 个开源仓库和 5 种编程语言,并将 GPT-5.5 以 70% 的胜率推上榜首,领先第二名 1...

AI日报

xAI 发布 Grok Build 编程 Agent,Anthropic 与 Gates Foundation 2 亿美元合作,GitHub 上 Agent 项目爆发 — AI 日报 2026-05-26

🤖 AI Agent & AI 编程 IDE 更新xAI 发布 Grok Build:全新终端编程 AgentxAI 于 5 月 25 日正式发布 Grok Build,一款全新的终端编程 Agent,现已面向所有 SuperGrok 和 X Premium Plus 订阅者开放 Beta 测试。Grok Build 可直接在终端中运行,支持代码生成、编辑和项目构建等编程任务。此前...

AI日报

OpenAI 被 Gartner 评为企业编程 Agent 领导者,Cursor Composer 2.5 发布,Devin 支持 Windows — AI 日报 2026-05-24

🤖 AI Agent & AI 编程 IDE 更新OpenAI 被 Gartner 评为企业编程 Agent 领域领导者OpenAI 于 5 月 22 日宣布被 Gartner 评为企业编程 Agent 领域的领导者。同时,OpenAI 与 Dell Technologies 合作将 Codex 引入混合云和本地企业环境(5 月 18 日),并发布了”从任何地方使用 Codex”(...

AI日报
12345