概览
要闻
模型发布
- SpaceXAI 发布 Grok Imagine Video 1.5:API 及移动端全面可用 ↗
#3 - Ai2 发布开源 3D 运动预测模型 MolmoMotion ↗
#4 - HappyOyster 1.0 模型升级新增冒险与导演模式 ↗
#5 - 中国电信6款星辰语音大模型上线模力方舟 ↗
#6
开发生态
- Vercel 推出 eve:文件系统优先的开源 Agent 框架 ↗
#7 - GitHub Copilot 桌面应用正式发布 ↗
#8 - Firecrawl 免 API key 开放免费试用,已上线 MCP 及 API ↗
#9 - Exa 推出高性价比 Web 研究 API Exa Agent ↗
#10 - OpenRouter推出Cost Simulator成本估算工具 ↗
#11
产品应用
- Anthropic 更新 Claude Design:支持设计系统导入与代码同步 ↗
#12 - Databricks 团队开源 Omnigent,支持多 Agent 实时协作与调度 ↗
#13 - 微信支付推出 AI 专属卡 支持授权 Agent 代付款 ↗
#14
技术与洞察
- OpenAI 展示 GPT-5.4 在药物化学中的近自主实验能力 ↗
#15 - OpenAI推出生命科学评测基准LifeSciBench ↗
#16 - Google 开源 Agentic Resource Discovery 规范 ↗
#17 - Cloudflare 发布 The Cloudflare One stack 赋能 Agent 部署 ↗
#18
行业动态
- G7峰会商业领袖与各国政要探讨AI断供风险拟设信任伙伴计划 ↗
#19 - Transformer 作者 Noam Shazeer 宣布加入 OpenAI ↗
#20 - OpenAI 投资 60 万美元支持 Rust Foundation ↗
#21 - 广东上线试运行全国首个省级政务智能中枢“湾擎” ↗
#22 - Odyssey 完成3.1亿美元B轮融资 估值达14.5亿美元 ↗
#23
前瞻与传闻
OpenAI 推出 ChatGPT 计划任务功能,将在 14 天内下线 Pulse #1
OpenAI 官方宣布,正在向
ChatGPT的 Web端 和 移动端 用户推出全新的“计划任务”功能。该功能现已面向 Go、Plus、Pro、Business 和 Enterprise 用户开放,支持定时提醒与循环任务,同时现有的Pulse功能将在 14 天 内下线。
OpenAI 官方宣布,正在向 ChatGPT 推出重新设计的 “计划任务” 功能,现已面向 Web 端和移动端的 Go、Plus、Pro、Business 和 Enterprise 用户逐步开放。
用户可通过侧边栏全新的 Scheduled 页面集中管理任务,设定具体时间或时段来发送提醒、处理重复工作或监控变化。任务运行频率被限制为每小时最多一次。
官方表示,全新的系统将在未来 14 天内取代现有的主动任务功能 Pulse。用户可迁移至新系统获取每日简报。

相关链接:
Codex团队修复容量超载问题并发放双重重置 #2
Codex 团队修复了导致部分用户遭遇**"model at capacity"高错误率的问题,并为所有
计划用户执行了一次完全使用次数**重置和一次可储存日后使用的banked reset。
Codex 团队成员 Tibo 确认,部分 Codex 用户此前遭遇 "model at capacity" 高错误率问题,该问题已被修复。
团队随后执行了一次 "双重重置":一次面向所有计划用户的完全使用次数重置,以及一次存入重置存储库、供用户自行选择时机使用的 banked reset。
用户将同时获得本次全局重置和 banked reset 两项。

相关链接:
SpaceXAI 发布 Grok Imagine Video 1.5:API 及移动端全面可用 #3
SpaceXAI 宣布正式发布视频模型 Grok Imagine Video 1.5 及
Video 1.5 Fast。相比上一代,新模型在音频同步、运动连贯性和物理效果上均有显著提升,相关模型已上线API和面向消费者的网页及移动端。
SpaceXAI 官方宣布正式推出视频生成模型 Grok Imagine Video 1.5 和 Video 1.5 Fast。
相比上一代,新模型在 音频同步、运动连贯性 和 物理效果 上均有显著提升。
其中,Video 1.5 Fast 生成 6 秒 720p 视频的时间从 40 多秒 降至约 25 秒。
目前,Imagine Video 1.5 已在 SpaceXAI API 中结束预览并全面可用。
而 Video 1.5 Fast 则面向消费者在 grok.com、iOS 和 Android 应用上推出。
此外,官方计划在未来几天内为 Grok Imagine 推出 Projects、多 Agent 并行生成 以及 媒体库搜索 等新功能。

相关链接:
- https://x.ai/news/grok-imagine-video-1-5
- https://docs.x.ai/developers/model-capabilities/video/generation
Ai2 发布开源 3D 运动预测模型 MolmoMotion #4
Ai2 发布并开源了基于
Molmo 2的 3D 运动预测模型MolmoMotion。该模型结合视觉历史、物体查询点与语言指令预测 3D 轨迹,同步开源了MolmoMotion-1M数据集与PointMotionBench基准。
Ai2 发布并开源了基于 Molmo 2 视觉语言骨干的 3D 运动预测模型 MolmoMotion,同步释出包含 116 万 条视频的 MolmoMotion-1M 数据集与 PointMotionBench 基准。
该模型能够根据视觉历史、查询点及语言指令预测物体的未来 3D 轨迹。
官方称其在机器人抓放规划测试中显著提升了成功率,并能作为引导信号提升图生视频的准确性。
目前模型提供了预测离散坐标的自回归(AR)变体和生成连续轨迹的流匹配(FM)变体。
权重及相关资源已在 Hugging Face 等平台以 Apache License 2.0 协议开放下载。

相关链接:
- https://molmomotion.github.io/
- https://huggingface.co/blog/allenai/molmomotion
- https://huggingface.co/collections/allenai/molmomotion
HappyOyster 1.0 模型升级新增冒险与导演模式 #5
阿里巴巴宣布升级其实时交互模型
HappyOyster 1.0,新增Adventure和Directing模式。官方称,该模型现支持更丰富的环境交互与可回溯故事情节。
阿里巴巴宣布升级了实时交互模型 HappyOyster 1.0,引入了 Adventure 和 Directing 两种新模式。
官方表示,该增强模型目前提供更丰富的环境交互、扩展的玩家控制以及可回溯的故事情节。
这些功能更新将为游戏、互动剧、直播和文化旅游领域带来新的发展机遇。

相关链接:
中国电信6款星辰语音大模型上线模力方舟 #6
中国电信宣布 6 款
星辰语音大模型上线模力方舟平台,向公有云开发者开放API调用,支持中英及60种方言混合识别与5种方言实时合成。
中国电信星辰通用人工智能实验室将6款星辰语音大模型主力模型上线至开源中国旗下模力方舟平台,正式向公有云开发者提供多方言语音服务。
此次上线的模型包含2款ASR模型和4款TTS模型。ASR模型采用单一架构支持中英文及60种方言混合识别。TTS模型覆盖非实时、实时及双向流式合成,其中一款支持5种方言实时合成。
官方称,该系列模型目前已在真实生产场景中规模化落地,月调用量超4亿次。开发者可通过标准API在模力方舟平台低门槛调用上述能力。

相关链接:
Vercel 推出 eve:文件系统优先的开源 Agent 框架 #7
Vercel 发布开源 Agent 框架
eve,现处公开预览,该框架将每个 Agent 定义为文件目录,内置持久化执行、沙箱计算和审批等能力。
Vercel 发布开源 Agent 框架 eve,以 npm 包形式提供,采用 Apache-2.0 许可证,目前处于公开预览阶段。
该框架采用 "文件系统优先" 设计,每个 Agent 即磁盘上的一个目录,目录中每个文件对应一项能力。最小可运行的 Agent 仅需两个文件——一个配置模型,一个编写指令。
框架内置六项生产级能力,包括持久化执行、沙箱计算、人在环中审批、安全连接、多渠道以及追踪与评估。
Vercel 官方称已在生产环境中运行超过 100 个基于 eve 的 Agent。
开发者可通过 npx eve@latest init 快速启动项目,并通过 vercel deploy 部署至生产环境。

相关链接:
GitHub Copilot 桌面应用正式发布 #8
GitHub 官方宣布
GitHub Copilot桌面应用正式发布,支持 macOS、Windows 和 Linux 系统。该应用主打 Agent 驱动开发,支持跨代码库运行并行会话。
GitHub 官方宣布其桌面端应用 GitHub Copilot app 现已正式发布(GA)。
该应用原生构建于 GitHub,专为 Agent 驱动开发设计。
用户可以从 issue、PR 或提示词开启会话,并在不同分支或代码库中运行并行会话。
自技术预览版以来,该应用新增了可视化双向操作界面 Canvases、云端周期性任务调度,以及通过 MCP servers 自带模型和外部工具的能力。
该应用同时支持与 VS Code 无缝切换且不丢失上下文。
目前该应用支持三大主流桌面系统。
但若要在 Copilot Business 或 Enterprise 套餐中使用,组织或企业管理员必须在策略设置中启用 Copilot CLI。

相关链接:
Firecrawl 免 API key 开放免费试用,已上线 MCP 及 API #9
Firecrawl 官方宣布,即日起用户无需
API key即可免费体验网页搜索、爬取及MCP、CLI和API上线。
Firecrawl 官方宣布,即日起开放免 API key 的免费试用。
用户无需任何设置即可使用其 MCP、CLI 和 API 端点,进行网页搜索、爬取、交互以及将 PDF 解析为 Markdown。
官方表示,用户可以先开始使用,仅在需要扩展规模时才需要进行注册。
不过,多位社区用户反馈称,尚未在文档中找到关于该项免费试用的具体速率限制说明。

相关链接:
Exa 推出高性价比 Web 研究 API Exa Agent #10
Exa 推出 Web研究API Exa Agent。它混合高性价比模型与
token高效技术,大幅降低成本与延迟。该 API 现已全面开放。
Exa 正式发布 Exa Agent,这是一个面向深度研究、列表构建和实体丰富的 Web 研究 API。
官方称,该 API 通过混合多种高性价比模型并应用 token 高效技术,在 WideSearch 等基准测试中表现出最佳性价比,成本不到 GPT 5.5 和 Opus 的一半。
该 API 提供从 0.012 美元 到 1.00 美元 不等的五档定价,支持结构化输出,现已全面开放。

相关链接:
OpenRouter推出Cost Simulator成本估算工具 #11
OpenRouter官方推出Cost Simulator实验室工具,可基于用户实际流量数据与端点中位数定价,估算使用不同
模型时的成本节省,目前已开放试用。
OpenRouter 通过官方社交账号宣布,在其实验室项目中推出了一款名为 Cost Simulator 的简单工具。
该工具的核心功能是结合用户的实际流量数据,使用端点中位数定价,来估算用户在切换到不同模型后可能实现的成本节省。
官方在发布时提供了试用入口,用户可以直接体验。

相关链接:
Anthropic 更新 Claude Design:支持设计系统导入与代码同步 #12
Anthropic 更新了
Claude Design,使其能够在跨项目中严格遵循导入的设计系统,并支持与 Claude Code 进行双向同步。新版本引入了精细化的画布编辑控件,并将使用额度与其他 claude 产品共享。
Anthropic 更新了 Claude Design,引入多项新功能以提升设计与代码的协同效率。
本次更新核心内容包括:一是支持导入设计系统,Claude 会基于真实组件构建并在输出前自动对照检查,团队管理员可锁定标准系统以保合规。
二是实现与 Claude Code 的双向同步,开发者可通过相关命令直接拉取设计、移交项目或将代码转换为原型,无需基于截图重建。
三是升级了画布精细化布局控件并修复数百个稳定性问题。
四是使用额度与 Claude Chat、Claude Code 等工具共享,官方称平均 token 消耗减少且错误率下降。
五是支持导出至 PDF 和 PowerPoint,并集成 Adobe、Canva 等第三方工具。

相关链接:
- https://claude.com/blog/claude-design-stays-on-brand-for-daily-work
- https://x.com/claudeai/status/2067325887909884315
Databricks 团队开源 Omnigent,支持多 Agent 实时协作与调度 #13
Databricks 开源 AI Agent 框架
OmnigentAlpha版本。该框架提供了一个统一的meta-harness编排层,允许用户在单个实时会话中协同调度Claude Code、Codex等多种 Agent,支持多模型辩论、跨设备同步及移动端控制。
Omnigent 是一款基于 Apache 2.0 协议的开源 AI Agent 框架与 meta-harness,目前处于 Alpha 阶段。
它允许用户在一个共享会话中编排并监督多个 AI Agent,如 Claude Code、Codex、Cursor 和 Pi,无需重写代码即可切换底层 harness。
该框架甚至能配置“监督 Agent”让不同模型相互审查代码或进行辩论。
它支持通过 API key、订阅或第三方兼容网关接入模型,并在 Linux 和 macOS 上强制执行系统级沙箱隔离与细粒度权限策略。
用户可通过终端、浏览器或 macOS 桌面端 App 进行操作,且会话数据能实时同步至手机等移动设备。
同时,该框架支持多人实时协作与云端沙箱运行。

相关链接:
微信支付推出 AI 专属卡 支持授权 Agent 代付款 #14
微信支付正式发布 AI 专属卡。目前该功能已在
Mac端WorkBuddy上线,支持用户通过Agent下单支付,其消费与主账户隔离,且每笔订单均需用户本人授权确认。
微信支付发布了 AI 专属卡,允许用户在与 Agent 的对话中提出消费需求,由 Agent 协助完成下单和支付。
目前该功能已在 Mac 端 WorkBuddy 中开放,用户可将客户端升级至 5.1.1 版本进行体验。
在安全机制上,AI 专属卡 与用户的微信支付主账户完全隔离。
卡内额度由用户自定义并支持随时调整,且每一笔订单都必须经过用户本人的最终授权确认。

相关链接:
OpenAI 展示 GPT-5.4 在药物化学中的近自主实验能力 #15
OpenAI 与 Molecule.one 合作,将
GPT-5.4连接到名为Maria的Agent,该系统在 三个月 内独立运行 上万次 实验,近乎自主地改进了药物化学中的Chan-Lam偶联反应。官方补充,目前该系统尚未具备完全独立运行能力,其泛化效果仍有待独立实验室验证。
OpenAI 与 Molecule.one 合作,将 GPT-5.4 连接到名为 Maria 的化学 Agent 及高通量实验室中,以改进药物化学中的 Chan-Lam 偶联反应。
系统在约 三个月 内独立审查文献、提出假设并运行了 10,080 次实验,发现使用温和氧化剂 TEMPO 可使近 90% 的测试底物产率显著提升。
人类化学家在此过程中进行了指导、提案筛选以及手工复现验证。
目前该结果仅为早期阶段,系统尚未具备完全端到端的独立运行能力,其能否泛化到其他反应仍有待独立实验室验证。

相关链接:
- https://openai.com/index/ai-chemist-improves-reaction/
- https://x.com/OpenAI/status/2067293745075442171
OpenAI推出生命科学评测基准LifeSciBench #16
OpenAI发布了名为
LifeSciBench的基准测试,旨在评估AI系统处理真实世界生命科学研究任务的能力。据官方数据,GPT-Rosalind表现超越了GPT-5.5。
OpenAI 发布了名为 LifeSciBench 的基准测试,旨在评估 AI 系统 处理真实世界生命科学研究任务的能力。
该基准由 173 名 科学家参与开发,包含涵盖七个生物研究工作流的 750 个 任务,且多数需要多步推理。
官方数据显示,GPT-Rosalind 在此基准上的整体通过率提升至 36.1%,但处理复杂科学图表的能力仍较薄弱。

相关链接:
Google 开源 Agentic Resource Discovery 规范 #17
Google 正式推出并开源了
Agentic Resource Discovery开放规范。该规范利用Catalogs目录和Registries搜索引擎,帮助Agent跨平台发现并验证所需的AI工具,兼容MCP与OpenAPI协议。
Google 宣布推出 Agentic Resource Discovery (ARD) 开放规范,用于在网络中发布、发现和验证 AI 能力。
该架构包含由组织域名托管的 Catalogs 和用作搜索引擎的 Registries。它支持通过加密信任元数据在连接前验证发布者身份。
该系统兼容 MCP 和 OpenAPI 等多种原生协议。ARD 规范基于 Apache 2.0 许可开源,现已可用。
该规范将在未来几个月内获得 Gemini Enterprise Agent Platform 的原生支持。

相关链接:
- https://developers.googleblog.com/announcing-the-agentic-resource-discovery-specification/
- https://github.com/ards-project/ard-spec
Cloudflare 发布 The Cloudflare One stack 赋能 Agent 部署 #18
Cloudflare 发布了 The Cloudflare One stack。这是一套
Agent skills库,旨在为任何AI Agent提供规划、部署和管理Zero Trust环境所需的知识,并支持从旧安全供应商进行迁移。
Cloudflare 官方宣布推出 The Cloudflare One stack,这是一个允许任何 AI Agent 配置、部署和管理 Zero Trust 环境的技能集合。
该堆栈包含 cloudflare-one 和 cloudflare-one-migration 两个轻量级技能文件,涵盖了利用 Cloudflare Access 保护网络与数据安全,以及从 Zscaler 和 Palo Alto Networks 等供应商进行迁移的详细指导。
客户和合作伙伴现已可在 Cloudflare Skills 仓库中获取并使用该堆栈。
当其与 Cloudflare code mode MCP server 结合使用时,Agent 可获得与 Cloudflare API 交互的类型化接口,从而直接查询账户、检查配置并执行更改。
未来,Cloudflare 计划随着产品的演进继续扩展该堆栈,以支持更多迁移来源和高级故障排除工作流。

相关链接:
G7峰会商业领袖与各国政要探讨AI断供风险拟设信任伙伴计划 #19
据媒体报道,在近期的 G7 峰会上,多国政要与 Sam Altman、Dario Amodei、Demis Hassabis 等前沿
AI领域的商业领袖同台讨论建立“信任伙伴”计划,以保障非美国家获取前沿模型。
据媒体报道,在近期举行的 G7 峰会上,前沿 AI 领域的商业领袖与各国政要同台讨论了 AI 安全与地缘政治问题。
参加此次会议的 AI 企业高管及代表包括 Sam Altman、Dario Amodei、Demis Hassabis 等人。
多国领导人对美国随时可能切断其 AI 访问权限表达担忧。
此前 美国政府 以国家安全为由,阻止了 Anthropic 最新 Mythos 5 和 Fable 5 模型的出口。
作为应对,G7 领导人讨论建立一项 “信任伙伴” 计划,以允许非美国家在建立更强防御的前提下继续获取这些模型。
同时据媒体报道,Anthropic CEO Amodei 在会上探讨了由美国主导、将 中国 排除在外的 AI 技术与芯片出口联盟。

相关链接:
- https://techcrunch.com/2026/06/17/world-leaders-want-american-ai-they-just-dont-want-america-to-be-able-to-turn-it-off
- https://www.reuters.com/legal/litigation/g7-leaders-vow-closer-ties-ai-they-hash-out-trusted-partners-scheme-2026-06-17
Transformer 作者 Noam Shazeer 宣布加入 OpenAI #20
Transformer 架构奠基论文的共同作者、Gemini 前技术联合负责人 Noam Shazeer 在社交媒体上宣布将离开 Google 加入 OpenAI。
据报道,Transformer 架构奠基论文 《Attention Is All You Need》 共同作者、Google DeepMind 前研究员兼 Gemini 技术联合负责人 Noam Shazeer 将离开 Google 加入 OpenAI。
值得注意的是,Shazeer 曾在 2024 年 随 Character.AI 与 Google 的非独家技术授权及人才回流交易重返 Google。
该交易据称价值约 27 亿美元。

相关链接:
OpenAI 投资 60 万美元支持 Rust Foundation #21
OpenAI 宣布向 Rust Foundation 承诺 60 万美元,包含
Platinum会员资格以及对Rust生态系统维护者工作的额外支持。
OpenAI 宣布向 Rust Foundation 承诺 60 万美元,其中包括 Platinum 会员资格与对 Rust 生态系统维护者工作的额外支持。
Charlie Marsh 表示,Rust 通过 Codex 等项目对 OpenAI 越来越重要。
长期社区成员 @predrag 将加入 Rust Foundation 董事会担任 OpenAI 代表。
相关链接:
广东上线试运行全国首个省级政务智能中枢“湾擎” #22
据报道,全国首个省级政务智能中枢 湾擎 上线试运行,并预发布政务版
AI Agent湾擎·WorkBuddy。该产品即将在广东省直单位开展试点,后续面向全省公务员开放。
据媒体报道,广东省政务服务和数据管理局打造的全国首个省级政务智能中枢平台 “湾擎” 上线试运行,同时预发布基于 腾讯 自研产品打造的政务版 AI Agent “湾擎·WorkBuddy”。
该 Agent 定位于可直接交付成果的办公智能体,覆盖 公文辅助、材料校核 和 政策检索 等六大场景,依托 沙箱隔离技术 实现数据不出域。
该产品目前即将在 广东省直多个单位 开展试点,后续将面向 广东全省公务员 持续铺开。

相关链接:
Odyssey 完成3.1亿美元B轮融资 估值达14.5亿美元 #23
世界模型初创公司Odyssey宣布完成 3.1 亿美元 B 轮融资,估值达 14.5 亿美元。该轮融资由
Natural Capital领投,Amazon、AMD等参投。
据媒体报道,世界模型初创公司 Odyssey 官方宣布完成 3.1 亿美元 B 轮融资,估值达到 14.5 亿美元,使其累计融资额升至 3.37 亿美元。
该轮由 Natural Capital 领投,Amazon、AMD Ventures、GV 及与 CIA 有关联的 IQT 等机构参投,并吸引了 Google 首席科学家 Jeff Dean 等多位知名个人投资者。
Odyssey 专注于开发模拟物理规律和空间关系的 “世界模型”,应用场景涵盖 游戏开发 和 机器人 等领域。
此外,该公司将与 Amazon 深入合作,使用 AWS 作为首选云服务提供商,并将其模型优化以在 Trainium 芯片上运行。
相关链接:
传美国政府暂缓拉黑 DeepSeek,微软探索引入其模型降本 #24
据路透社报道,美政府暂缓将 DeepSeek 等上百家公司列入实体清单。同时,消息称 微软 正探索使用
DeepSeek模型,以降低Copilot Cowork的推理成本。
据路透社报道,美国政府已暂缓将中国 AI 初创公司 DeepSeek、存储芯片制造商长鑫存储以及上百家被标记为国家安全风险的公司列入实体清单,试图避免加剧与北京的紧张关系。
与此同时,据媒体报道,在刚全面上线并转为按使用量计费的 Copilot Cowork 中,微软正在探索使用微调版的 DeepSeek V4 或其他开源模型,以替代成本高昂的 Anthropic 和 OpenAI 模型。
相关链接:
- https://www.reuters.com/world/china/us-holds-off-blacklisting-chinas-deepseek-more-than-100-firms-deemed-security-2026-06-17/
- https://www.theinformation.com/briefings/microsoft-mulls-using-deepseek-copilot-cowork
美国政府限制 Anthropic 模型,要求彻底阻断 jailbreak #25
据媒体报道,特朗普政府正限制 Anthropic 重新发布最新模型
Fable 5,要求必须确保其防护措施无法被绕过。安全专家称这在技术上无法实现,而 Anthropic 员工则指责该限制为政治性针对。
据报道,美国政府官员向媒体表示,如果 Anthropic 希望重新发布前沿模型 Fable 5,必须确保该模型的 guardrails 不能被绕过,但安全专家认为这根本无法实现。
还有报道称,Anthropic 员工指责特朗普政府的这一限制措施为政治性针对。
此事引发了业界对于闭源模型供应链风险及政策不可预测性的担忧。
相关链接:
- https://www.wired.com/story/the-white-house-wants-anthropic-to-block-all-jailbreaks-that-may-not-be-possible/
- https://thein.fo/3Q8jvtz
提示:内容由AI辅助创作,可能存在幻觉和错误。
