AI产品研发日报 | 2026-06-04

今日看点：Google开源Gemma 4 12B多模态模型本地运行16GB笔记本；微软Build大会连发MXC Agent沙箱、Surface RTX Spark Dev Box；OpenAI Codex推出Sites和角色插件向企业市场扩张；Perplexity AI展示混合本地-云端推理系统

📰 AI行业重磅新闻

Google搜索框25年来首次重新设计，AI Overviews与AI Mode全面合并

Google近日宣布对其搜索框进行重大改版，这是自1999年以来的首次界面革新。新搜索框动态扩展以支持更长的对话式查询，并可直接接受图片、PDF、视频和Chrome标签页等多模态输入。AI Overviews与AI Mode功能合并为统一搜索流，用户无需再手动选择传统搜索或AI模式。据Google透露，AI Mode月活已超10亿，季度查询量持续翻倍。这一变革标志着Google搜索从关键词入口全面转向AI对话式交互。

阅读全文

Anthropic推出Claude Opus 4.8，编码和Agent任务能力大幅增强

Anthropic于5月28日发布Claude Opus 4.8，在编码、Agent任务和专业工作场景中性能显著提升，尤其增强了处理长时间运行任务的一致性。与此同时，Anthropic以9650亿美元估值完成650亿美元H轮融资，并已向SEC秘密提交S-1文件准备IPO。此外，Anthropic还宣布推出Claude合作伙伴网络的服务通道和合作伙伴中心，进一步拓展企业生态。

阅读全文

微软推出Surface RTX Spark Dev Box，本地运行120B参数大模型

微软在Build 2026大会上发布Surface RTX Spark Dev Box，搭载Nvidia Blackwell架构RTX Spark处理器和128GB统一内存，可提供1 petaflop AI算力。开发者可在桌面端运行超1200亿参数的AI模型，无需支付云端API费用。该设备采用3D打印铝制外壳兼作散热器，功耗约100W，预计今年晚些时候在美国上市。微软此举直接挑战了AI行业按token计费的云服务经济模式。

阅读全文

🔬 AI研究新突破

Google开源Gemma 4 12B：无编码器统一多模态模型，16GB笔记本可本地运行

Google发布Gemma 4 12B开源模型（Apache 2.0许可），采用创新的无编码器（Encoder-Free）统一架构，将原始音频波形和视觉补丁直接映射到LLM嵌入空间，无需传统多模态编码器。该模型仅需16GB显存即可在企业笔记本上本地运行，支持256K token上下文窗口、原生函数调用和逐步推理模式。在多个基准测试中接近其26B MoE模型的性能。目前已可在Hugging Face和Kaggle下载。

阅读全文

阿里发布Qwen3.7-Plus：多模态输入仅$0.4/$1.6每百万token，但转向闭源

阿里巴巴发布Qwen3.7-Plus多模态大模型，支持文本、视频和图像输入，输入/输出价格为$0.4/$1.6每百万token，成本比前代Qwen3.7-Max降低60%。然而该模型仅通过闭源API和Qwen Chat提供，标志着Qwen系列从开源主策略的重大转向，令依赖其开源模型的Airbnb等美国企业感到失望。尽管如此，其在多模态任务上的性价比仍具竞争力。

阅读全文

🤖 AI Agent / AI编程IDE更新

OpenAI Codex重大更新：推出Sites和角色插件，打造企业工作空间

OpenAI宣布Codex平台重大更新，推出三大新功能：Annotations（标注）实现精准局部编辑而不必重写整个文档；Sites（站点）让用户可将数据快速生成交互式Web应用并通过安全链接分享；六个角色插件（数据分析、创意制作、销售、产品设计等）集成62款企业应用（Snowflake、Figma、Salesforce等）和110项自动化技能。目前Codex周活用户达500万，其中非开发者占比约20%，增速是工程师的3倍。

阅读全文

微软发布MXC：操作系统级AI Agent沙箱，OpenAI和Nvidia已接入

微软在Build大会上发布MXC（Microsoft Execution Containers），这是一套内置于Windows系统的策略驱动执行层，允许开发者和管理员声明AI Agent的访问权限，在运行时由OS内核强制执行隔离。MXC支持从轻量级进程隔离到微虚拟机、Linux容器乃至Windows 365云实例的”可组合沙箱谱系”。每个Agent绑定强身份（Entra认证），所有操作可审计。该特性已获GitHub Copilot CLI采用，OpenAI和Nvidia也已接入，有望解决企业部署AI Agent的最大安全障碍。

阅读全文

Cursor发布Composer 2.5：长周期Agent任务能力大幅提升

Cursor团队发布Composer 2.5，在智能和行为方面较Composer 2有显著进步，尤其在长周期（long-horizon）Agent任务上表现出色。该版本聚焦于提升AI编码助手在处理复杂、多步骤开发任务时的连贯性和准确性，进一步巩固Cursor在AI编程IDE领域的领先地位。

阅读全文

Perplexity AI发布混合本地-云端推理系统，自动决策任务执行位置

Perplexity AI在Computex 2026上展示全球首个混合本地-服务器推理编排器，可自动实时决定AI工作负载在本地还是云端执行。CEO Aravind Srinivas与Intel CEO同台演示，本地Intel Core Ultra Series 3芯片自动识别敏感数据保留本地处理，复杂推理任务路由至云端。该系统将在未来数周内上线。同时Nvidia在Computex发布RTX Spark超级芯片（20核ARM CPU + Blackwell GPU），为AI PC提供高达128GB统一内存，进一步推动边缘AI计算。

阅读全文

🛠️ AI应用与行业实践

GitHub热门：headroom —— 压缩LLM输入token减少60-95%

GitHub今日热门项目headroom（9,677★，今日新增3,530★），可将工具输出、日志、文件和RAG块在送达LLM前压缩60-95% token量而保持相同答案质量。提供Python库、代理和MCP Server三种使用方式，为AI应用开发者提供降低API成本的有效方案。

项目地址

GitHub热门：ECC —— Agent性能优化系统，支持主流AI编程工具

ECC（205,721★，今日新增2,141★）是一个Agent性能优化系统，为Claude Code、Codex、OpenCode、Cursor等AI编程工具提供技能、直觉、记忆、安全等增强功能，采用研究优先的开发方法，成为AI Agent开发者的重要基础设施。

项目地址

GitHub热门：microsoft/markitdown —— 文档转Markdown转换工具

微软开源项目markitdown（142,843★，今日新增1,984★），提供将文件和办公文档转换为Markdown格式的Python工具，简化AI应用中的文档预处理管道，深受开发者社区欢迎。

项目地址

Uber设置$1,500/月AI使用上限，为AI工具企业定价提供参考

Hacker News热门讨论：Uber为员工设定每月$1,500的AI工具使用上限，引发了关于企业AI工具定价模型的广泛讨论。Simon Willison分析认为，这为AI工具的企业级定价策略提供了重要参考信号——当企业开始设定硬性预算上限时，意味着AI工具已从实验阶段进入制度化阶段。该讨论获得347分和441条评论。

讨论页面

封面图使用 /images/covers/ai-cover.svg

本日报由AI自动采集整理，基于VentureBeat、Hacker News、GitHub Trending、Anthropic Blog、Cursor Blog、Google DeepMind Blog等来源。

Gemma 4 12B 本地运行开源多模态模型 | 微软MXC Agent沙箱发布 | OpenAI Codex推出企业工作空间 | Google搜索25年来首次大改

AI产品研发日报 | 2026-06-04

📰 AI行业重磅新闻

Google搜索框25年来首次重新设计，AI Overviews与AI Mode全面合并

Anthropic推出Claude Opus 4.8，编码和Agent任务能力大幅增强

微软推出Surface RTX Spark Dev Box，本地运行120B参数大模型

🔬 AI研究新突破

Google开源Gemma 4 12B：无编码器统一多模态模型，16GB笔记本可本地运行

阿里发布Qwen3.7-Plus：多模态输入仅$0.4/$1.6每百万token，但转向闭源

🤖 AI Agent / AI编程IDE更新

OpenAI Codex重大更新：推出Sites和角色插件，打造企业工作空间

微软发布MXC：操作系统级AI Agent沙箱，OpenAI和Nvidia已接入

Cursor发布Composer 2.5：长周期Agent任务能力大幅提升

Perplexity AI发布混合本地-云端推理系统，自动决策任务执行位置

🛠️ AI应用与行业实践

GitHub热门：headroom —— 压缩LLM输入token减少60-95%

GitHub热门：ECC —— Agent性能优化系统，支持主流AI编程工具

GitHub热门：microsoft/markitdown —— 文档转Markdown转换工具

Uber设置$1,500/月AI使用上限，为AI工具企业定价提供参考