AI产品研发日报 | 2026年6月2日

一、AI行业重磅新闻

1. MiniMax-M3发布：超越GPT-5.5和Gemini 3.1 Pro，成本仅5-10%

中国AI初创公司MiniMax于周末发布了备受期待的M3大模型。M3在编码和Agent任务基准测试中超越了GPT-5.5和Gemini 3.1 Pro，支持100万token上下文窗口和原生多模态，定价仅为$0.3/$1.20每百万token（促销价），即使在正价$0.6/$2.40下也仅为美国主流闭源模型的8-20%。MiniMax宣布将在10天内发布开放权重版本，允许企业免费下载和定制。

阅读全文

2. Anthropic发布Claude Opus 4.8：Fast Mode降价3倍，支持数百并行子Agent

Anthropic发布了Claude Opus 4.8，保持原价$5/$25每百万token不变的同时，Fast Mode价格从$30/$150降至$10/$50（降低3倍），使高吞吐推理可用于延迟敏感的生产工作负载。新模型还支持衍生数百个并行子Agent执行代码库级任务。Fast Mode已在Claude Code中通过/fast命令可用。

阅读全文

3. OpenAI前沿模型和Codex正式登陆AWS

OpenAI宣布其前沿模型和Codex现在可通过AWS使用，Hacker News上获得257 points和92条评论的热烈讨论。此举标志着OpenAI在云渠道分发上的重大战略转变，使企业客户能通过熟悉的AWS基础设施调用最先进的AI模型。

查看讨论

4. Anthropic秘密提交S-1文件，启动IPO进程

Anthropic已向SEC机密提交了S-1草案文件，在Hacker News上获得489 points的极高关注度。这是AI领域最受关注的IPO之一，Anthropic目前估值超600亿美元。与此同时，Economist刊文讨论”股市能否消化Anthropic、SpaceX和OpenAI”的体量（342 points）。

5. Alphabet宣布800亿美元股权融资扩建AI基础设施

Alphabet宣布进行800亿美元的股权融资，以扩建AI基础设施和计算能力。这是科技行业史上最大规模的融资之一，反映了AI算力军备竞赛的白热化程度。Hacker News上获得182 points。

二、AI研究新突破

6. MeMo记忆模型：无需重训练即可升级LLM，性能跃升26%

研究者提出了一种名为MeMo的新型记忆框架，将AI知识存储与推理过程分离。团队可以在不重新训练LLM的情况下升级模型，只需替换记忆模块即可实现26%的性能提升。该方法为企业的模型迭代提供了更灵活、更低成本的路径。

阅读全文

7. Meta和Google联合研究：自动化推理策略设计，Token用量削减69.5%

来自Meta和Google的研究团队提出了一种新框架，通过自动化设计LLM推理策略，在仅花费$39.90计算成本的情况下将Token使用量削减69.5%。该框架使模型能自动选择最优的推理路径，对降低大规模Agent部署的推理成本具有重要意义。

阅读全文

8. DeepSeek V4 Pro永久降价75%，硅谷Token护城河被打破

DeepSeek宣布V4 Pro永久降价75%，比Claude Sonnet或GPT-5.5-Med便宜7倍（输入）/17倍（输出）。V4 Flash更是比Claude Haiku便宜10-25倍。两款模型均为MIT开源许可证，使企业能完全自主部署。V4 Pro在SWE-bench上达到80.6%，MMLU-Pro上达到87.5分。Uber透露其2026年Claude Code和Cursor预算在前四个月即已耗尽，凸显了Token成本危机。

阅读全文

三、AI Agent / AI编程IDE更新

9. Cursor发布Composer 2.5：长期Agent任务能力大幅提升

Cursor团队发布了Composer 2.5，相比Composer 2在长期Agent任务上有显著改进。新版本采用25倍以上的合成任务进行训练，引入了带文本反馈的定向强化学习、分片Muon优化等创新技术。Composer 2.5基于Kimi K2.5开源检查点构建，Cursor正与SpaceXAI合作训练更大规模模型（10倍计算量）。

阅读全文

10. AI Agent进入”重建时代”：企业直面可靠性问题

VentureBeat分析指出，随着企业AI Agent进入生产环境，团队发现LLM性能本身并不能决定Agent在线上环境中的成败。长时间运行的AI工作流必须处理崩溃恢复、状态保持、推理成本管理和跨API、工具、企业系统的协调。Temporal等时序基础设施公司正成为这一重建浪潮的关键支撑。

阅读全文

11. Workday发布Sana：AI Agent瓶颈不在模型，而在权限管理

Workday总裁Gerrit Kazmaier指出，企业AI Agent的最大瓶颈不是模型性能，而是权限管理。Workday将Sana Agent系统（3月推出）扩展到Google Gemini Enterprise，通过系统记录层治理Agent权限。Sana Self-Service Agent使用Gemini作为会话界面，通过Workday的身份和安全模型进行认证和授权，确保Agent仅在用户当前权限范围内行动。

阅读全文

12. Compound Engineering Plugin登顶GitHub趋势：统一AI编程工具链

EveryInc的Compound Engineering Plugin在GitHub上获得19,246 stars（今日+417），成为AI编程工具链的明星项目。该插件支持Claude Code、Codex、Cursor等主流AI编程IDE，为开发者提供统一的复合工程工作流。

查看项目

四、AI应用与行业实践

13. Pinterest削减AI成本90%：移除Qwen3-VL视觉层，自建Embeddings

Pinterest CTO Matt Madrigal分享了如何为620万月活用户优化AI成本——团队”移除”了Qwen3-VL的视觉编码层，用自有的多模态Embeddings替代。这种方法使AI成本降低90%，同时准确率提升30%。核心创新在于其”品味图谱”（Taste Graph），通过用户Embedding动态捕捉用户偏好变化，驱动个性化推荐。

阅读全文

14. GitHub热门AI项目一览

microsoft/markitdown (139,806 stars, +3,034/天) — 文件和Office文档转Markdown的Python工具，AI数据预处理利器
TauricResearch/TradingAgents (82,084 stars) — 多Agent LLM金融交易框架
supermemoryai/supermemory (24,256 stars, +647/天) — AI时代的超快速可扩展记忆引擎API
p-e-w/heretic (23,182 stars, +249/天) — 语言模型自动审查移除工具

编者按：今日AI领域最大看点是中国模型MiniMax-M3以1/10的成本实现对GPT-5.5和Gemini 3.1 Pro的全面超越，加上DeepSeek V4 Pro永久降价75%，全球模型价格战已进入白热化阶段。Anthropic的Opus 4.8以Fast Mode降价3倍回应竞争压力，并推进IPO进程。在Agent层面，Cursor Composer 2.5的发布和Workday Sana的权限管理方案标志着AI编程和企业Agent正从”能不能做”进入”做得好不好”的新阶段。

MiniMax-M3超越GPT-5.5成本仅1/10，Claude Opus 4.8 Fast Mode降价3倍，AI Agent权限管理成焦点

AI产品研发日报 | 2026年6月2日

一、AI行业重磅新闻

1. MiniMax-M3发布：超越GPT-5.5和Gemini 3.1 Pro，成本仅5-10%

2. Anthropic发布Claude Opus 4.8：Fast Mode降价3倍，支持数百并行子Agent

3. OpenAI前沿模型和Codex正式登陆AWS

4. Anthropic秘密提交S-1文件，启动IPO进程

5. Alphabet宣布800亿美元股权融资扩建AI基础设施

二、AI研究新突破

6. MeMo记忆模型：无需重训练即可升级LLM，性能跃升26%

7. Meta和Google联合研究：自动化推理策略设计，Token用量削减69.5%

8. DeepSeek V4 Pro永久降价75%，硅谷Token护城河被打破

三、AI Agent / AI编程IDE更新

9. Cursor发布Composer 2.5：长期Agent任务能力大幅提升

10. AI Agent进入”重建时代”：企业直面可靠性问题

11. Workday发布Sana：AI Agent瓶颈不在模型，而在权限管理

12. Compound Engineering Plugin登顶GitHub趋势：统一AI编程工具链

四、AI应用与行业实践

13. Pinterest削减AI成本90%：移除Qwen3-VL视觉层，自建Embeddings

14. GitHub热门AI项目一览