概览
要闻
- Anthropic 发布 Claude Sonnet 5 模型 ↗
#1 - Anthropic 宣布 Claude Fable 5 与 Mythos 5 出口管制已被解除 次日恢复访问 ↗
#2 - Anthropic 推出科研 AI 工作台应用 Claude Science ↗
#3 - Google 推出 Nano Banana 2 Lite,主打速度与成本优势 ↗
#4
模型发布
开发生态
- ZCode宣布GLM Coding Plan 150%权益延期至7月底 ↗
#7 - Step 3.7 Flash 在 Nous Portal 免费期延长 15 天 ↗
#8 - Cognition推出Devin Fusion混合模型框架 ↗
#9 - Google推出Agent质量飞轮技能,自动化测试与优化AI Agent ↗
#10 - Hugging Face 推出模型硬件筛选功能 ↗
#11 - X API 上线两个官方 MCP 服务器 ↗
#12
产品应用
- NotebookLM推出Short Video Overviews功能 ↗
#13 - Anthropic 推出 Claude 桌面版 Linux beta ↗
#14 - Gemini Spark上线macOS应用,支持远程任务与自定义MCP ↗
#15 - ChatGPT个人理财功能向美国Plus用户开放 ↗
#16 - OPPO 小布助手接入微信 A2A 机制支持语音发消息与打电话 ↗
#17 - 优必选U1系列人形机器人发布 主打情绪陪伴 ↗
#18
技术与洞察
行业动态
前瞻与传闻
其他
要闻
Anthropic 发布 Claude Sonnet 5 模型 #1
Anthropic 正式发布 Claude Sonnet 5 模型,该模型现为免费用户和 Pro 用户的默认选项。官方称其编程与 Agentic 能力大幅提升,在多项基准测试中超越前代 Sonnet 4.6,整体性能接近 Opus 4.8,但在最复杂的任务上仍逊于 Opus 4.8。API 定价推出优惠期至 8 月 31 日,定价为每百万 Token 输入 2 美元、输出 10 美元,之后将恢复至 3 美元与 15 美元。
Anthropic 正式发布 Claude Sonnet 5 模型,该模型现为免费用户和 Pro 用户的默认选项,并向 Max、Team 及 Enterprise 用户开放。官方称其编程与 Agentic 能力大幅提升,在多项基准测试中超越前代 Sonnet 4.6,整体性能接近 Opus 4.8,但在最复杂的任务上仍逊于 Opus 4.8。API 调用代号为 claude-sonnet 5,优惠期至 8 月 31 日,定价为每百万 Token 输入 2 美元、输出 10 美元,之后恢复至 3 美元与 15 美元。该模型启用了新的分词器,且不再支持手动扩展思考及 temperature 等采样参数。

相关链接:
- https://www.anthropic.com/news/claude-sonnet-5
- https://www.anthropic.com/claude-sonnet-5-system-card
- https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/prompting-claude-sonnet-5
Anthropic 宣布 Claude Fable 5 与 Mythos 5 出口管制已被解除 次日恢复访问 #2
Anthropic 通过官方社交账号宣布,已收到美国商务部通知,解除 Claude Fable 5 和 Mythos 5 的出口管制,将于次日起恢复模型访问。
Anthropic 通过官方账号宣布,已收到美国商务部解除出口管制的通知,涉及 Claude Fable 5 和 Mythos 5 两款模型。公司计划于次日起开始恢复访问,并将在近期分享更多更新。Anthropic 同时对用户的耐心及参与模型重新部署的各方表示感谢。

相关链接:
Anthropic 推出科研 AI 工作台应用 Claude Science #3
Anthropic 推出了面向科研人员的 AI 工作台 Claude Science。该应用整合了现有模型与 60 多个科学数据库,提供可复现的代码环境与本地化计算资源管理。目前已向 macOS 和 Linux 平台的付费用户开启公测。
Anthropic 正式推出科研工作台应用 Claude Science,目前处于 Beta 阶段。该应用通过一个统筹 Agent 调用现有 Claude 模型,连接涵盖基因组学和结构生物学等领域的 60 多个科学数据库,并能生成包含完整代码与运行记录的可复现产出物。应用支持在本地或实验室集群运行,按需通过 Modal 扩展 GPU 算力,同时内置审查 Agent 自动检查引用与计算错误。Claude Science 现已向 Pro、Max、Team 及 Enterprise 付费用户开放,Team 和 Enterprise 用户需管理员开启权限。


相关链接:
Google 推出 Nano Banana 2 Lite,主打速度与成本优势 #4
Google DeepMind 推出图像模型 Nano Banana 2 Lite,主打 4 秒内生成、每张仅 0.034 美元的低成本。该模型已上线 AI Studio 等开发者平台,并正向搜索和 Gemini 应用等消费者产品推广。同时,视频模型{Gemini Omni Flash|"Gemini Omni Flash"}开放开发者公测。
Google DeepMind 于近日正式发布 Nano Banana 2 Lite 图像模型,这是其 Nano Banana 系列中最快、最具成本效益的产品,旨在通过超低延迟和极低成本支撑快速视觉迭代与高吞吐量生成。该模型文本到图像生成在 4 秒内完成,每张成本仅 0.034 美元,在图像编辑与生成的 Elo 评分中接近 Nano Banana 2 并大幅超越第一代 Nano Banana,且已通过 Google AI Studio 和 Gemini API 面向开发者提供,同时向 AI 模式搜索、Gemini 应用、NotebookLM 等消费者界面推广。此外,Google 还同步将视频生成与编辑模型 Gemini Omni Flash 开放开发者公测,支持多模态输入和会话式编辑,成本为每秒 0.10 美元。


相关链接:
- https://deepmind.google/models/gemini-image/flash-lite/
- https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/
模型发布
InternScience 开源 35B 模型 Agents-A1 #5
上海人工智能实验室 InternScience 开源了 35B总参数的模型 Agents-A1。官方称其具备复杂任务分解与工具调用能力,在多项基准测试中达到 SOTA。
上海人工智能实验室 InternScience 官方在 Hugging Face 上发布了模型权重及配置文件,正式开源 35B 参数的混合专家 Agentic 模型 Agents-A1。该模型通过三阶段训练范式扩展异构 Agent 能力,原生支持函数调用,能够处理长周期搜索、工程任务及专业科学研究等复杂任务。官方宣称,Agents-A1 在多项基准测试中取得整体 SOTA,其性能可与 GPT-5.5 等前沿大规模系统相媲美。官方同步开放了标准化的 Agent 能力评估代码库。

相关链接:
华为开源 openPangu-2.0-Flash 模型 #6
华为正式开源 open{Pangu|盘古}-2.0-Flash 模型。该昇腾原生混合专家模型总参数约 92B,支持 512k 上下文。模型权重及基础推理代码现已上线开源平台,其 Pro 版本将于后续陆续开源。
华为宣布正式开源基于昇腾 NPU 训练的 openPangu-2.0-Flash 大规模混合专家语言模型,模型总参数约 92B,激活参数约 6B。该模型支持 512k 上下文长度,采用 MLA 与 DSA+SWA 独立分层混合架构,并在后训练阶段引入多专项强化学习,官方称其在通用、推理、代码及 Agent 等能力上表现优异。目前 openPangu-2.0-Flash 的权重及训推算子已上线开源平台,开发者可通过 omni-infer 推理框架进行部署,而 openPangu-2.0-Pro 版本预计于 7 月开源,更多组件将于下半年陆续推出。


相关链接:
- https://ai.gitcode.com/ascend-tribe/openPangu-2.0-Flash
- https://gitcode.com/ascend-tribe/openPangu-2.0-Infer
- https://mp.weixin.qq.com/s/03bfUULuB6wuWf4vCn6Deg
开发生态
ZCode宣布GLM Coding Plan 150%权益延期至7月底 #7
ZCode团队宣布,GLM Coding Plan的150%额度权益将延期一个月至7月31日。用户无需任何操作即可继续享受该权益。
ZCode团队发布通知称,GLM Coding Plan的150%额度权益将延期一个月,有效期至2026年7月31日。延期期间规则保持不变,用户无需进行任何操作即可继续使用。此前,ZCode因性能稳定性与体验细节的不足向用户致歉,并表示未来将持续加强 Agent 时代的质量工程。
相关链接:
Step 3.7 Flash 在 Nous Portal 免费期延长 15 天 #8
Nous Research 与阶跃星辰合作,将 Nous Portal 上 {Step 3.7 Flash模型|"Step 3.7 Flash模型"}的免费使用期额外延长 15 天。该模型此前已提供数十天免费使用。
Nous Research 与阶跃星辰宣布合作,将 Nous Portal 平台上 Step 3.7 Flash 模型的免费使用期额外延长 15 天。Step 3.7 Flash 是一款 MoE 视觉语言模型,专注于 Agent 效率、编程、搜索和多模态工作流,此前已于 Nous Portal 上线并提供 30 天免费使用。

相关链接:
Cognition推出Devin Fusion混合模型框架 #9
Cognition推出名为Devin Fusion的新混合模型框架,面向agentic coding场景。官方称测试中将Fable级别智能成本降低35%,现已上线Devin。
Cognition推出名为Devin Fusion的新混合模型框架,面向agentic coding场景,现已上线Devin。该架构基于两个核心理念:一是"sidekick" agent机制,让较小agent与frontier agent并行运行,由frontier agent负责委派、规划和最终审查;二是会话中途动态路由,可根据任务难度变化在模型间动态切换。Cognition称测试中Devin Fusion将Fable级别智能的成本降低35%,同时避免了传统模型路由在缓存未命中和泛化能力方面的不足。


相关链接:
Google推出Agent质量飞轮技能,自动化测试与优化AI Agent #10
Google近日发布了一项Agent质量飞轮技能,可集成到编码Agent中,实现AI Agent的自动化测试、评分与优化。该技能基于与DeepMind合作开发的AutoRaters,并保留人工审批环节。
Google近日推出Agent质量飞轮技能,允许开发者将该技能嵌入编码Agent,以驱动AI Agent的自动化测试、评分和迭代优化。该技能将构建与测试阶段细化为准备数据、运行推理、评分、分析失败和优化迭代五个步骤,其核心为与Google DeepMind协作开发的模型评判系统AutoRaters,并内置User Simulator用于冷启动场景合成。官方以旅行规划和软件缺陷助手两个Agent为例,展示了该技能如何自动发现并修复细微故障,使相关指标获得大幅改善。

相关链接:
Hugging Face 推出模型硬件筛选功能 #11
Hugging Face 在模型页面上线硬件筛选功能,用户可按本地 GPU、CPU 或 Apple Silicon 芯片筛选适配模型,筛选结果可通过 URL 分享,未登录访客也可访问。
Hugging Face 在 Models 页面新增 Hardware 筛选器,用户可在 Hardware settings 页面设置本地硬件配置后,将搜索结果限定为适配指定 GPU、CPU 或 Apple Silicon 芯片的模型。该筛选器支持与页面现有筛选器叠加使用,筛选结果可通过 URL 分享,未登录访客也可通过链接访问。

相关链接:
X API 上线两个官方 MCP 服务器 #12
X Developer Platform 推出 MCP 服务。其中 X MCP 可搜索帖子、管理书签、发布文章;Docs MCP 可直接连接查阅 API 文档。
X Developer Platform 推出两个托管的 MCP 服务器,二者可同时使用。X MCP 位于 api.x.com/mcp,需通过开源 xurl mcp 桥接器连接,以用户自身账号权限搜索帖子、查找用户、管理书签、获取趋势和动态、创建及发布文章;Docs MCP 位于 docs.x.com/mcp,可直接连接搜索和阅读 X API 文档。X MCP 首次使用需浏览器完成 OAuth2 登录,之后 token 自动缓存并刷新;Docs MCP 无需桥接器或额外认证。

相关链接:
产品应用
NotebookLM推出Short Video Overviews功能 #13
NotebookLM正式向Web端所有用户推出Short Video Overviews功能,可将复杂来源信息转化为60秒竖屏短视频,目前全球可用但仅限英语。
NotebookLM推出了Short Video Overviews功能,能够将用户提供的复杂来源信息转化为时长60秒的竖屏视频,以深入探讨特定概念。根据官方最新声明,该功能已在Web端正式向所有用户开放,并面向全球提供服务,但目前仅支持英语。

相关链接:
Anthropic 推出 Claude 桌面版 Linux beta #14
Anthropic 宣布为 Claude 桌面版推出 Linux beta 版。该应用面向 Ubuntu 和 Debian 系统,提供一致的桌面体验,但暂未包含 Computer Use 等部分功能。
Anthropic 面向开发者的账号 ClaudeDevs 宣布推出 Linux 版本的 Claude 桌面应用 beta 版。官方文档显示,该版本提供与 macOS 和 Windows 一致的 Chat、Cowork 和 Claude Code 体验,支持并行会话与集成终端等功能,并面向所有付费订阅用户开放。由于处于测试阶段,该版本暂不支持 Computer Use 和语音听写,Quick Entry 全局快捷键在原生 Wayland 上存在限制,且目前仅支持基于 Debian 的系统。此外,应用本身不自带自动更新功能,用户需通过系统包管理器进行安装与升级。

相关链接:
Gemini Spark上线macOS应用,支持远程任务与自定义MCP #15
Google为Gemini Spark推出更新,正式上线macOS应用。该应用面向美国18岁以上的Google AI Ultra订阅者开放,并新增应用集成与实时追踪等能力。
Google宣布为Gemini Spark推出更新,将其引入Gemini macOS应用以自动化桌面任务,同时扩展了应用集成并新增实时主题追踪功能。在macOS应用中,Spark可以跨越聊天窗口处理桌面文件,并即将支持通过手机远程为Mac指派多步骤任务。此外,更新还加入了对Canva、Dropbox等应用的支持,并允许用户通过自定义 MCP 接入第三方应用。Gemini Spark for macOS目前以Beta版向美国18岁及以上的Google AI Ultra订阅者开放,其余更新正在陆续推出。

相关链接:
- https://blog.google/innovation-and-ai/products/gemini-app/gemini-spark-updates-june-2026/
- https://gemini.google/mac/
ChatGPT个人理财功能向美国Plus用户开放 #16
ChatGPT个人理财功能现已面向美国Plus用户开放,支持安全连接金融账户、查看资金流向并提问,此前该功能以预览形式供Pro用户体验。
ChatGPT官方宣布,其个人理财功能现已向美国地区的Plus用户开放。该功能允许用户安全连接金融账户、查看资金去向,并基于用户选择连接的信息进行提问。此前这一功能以预览版形式面向美国Pro用户提供。目前该功能仅限美国地区。

相关链接:
OPPO 小布助手接入微信 A2A 机制支持语音发消息与打电话 #17
OPPO 官宣小布助手接入微信 {A2A|A to A} 协议,支持语音自动发消息或打语音电话。该能力正逐步向华为、小米等厂商开放。
OPPO ColorOS 今日官宣,小布助手正式接入微信 A2A(Agent-to-Agent)协作机制。用户通过语音唤醒助手后,系统会自动打开微信向指定联系人发消息或拨打微信电话,遇到重名联系人可确认后再执行。该功能由厂商 AI 助手发起指令、微信负责执行并返回结果,全程采用双重授权机制保障隐私安全。据报道,目前微信该能力已在 OPPO 落地,并正逐步向华为、荣耀、小米、vivo 等厂商开放。

相关链接:
优必选U1系列人形机器人发布 主打情绪陪伴 #18
优必选正式发布首款全尺寸超仿生人形机器人U1系列,主打情绪陪伴,仅限成年人购买。官方称该系列预售超1.3万台,计划9月交付。
据媒体报道,优必选正式发布首款全尺寸超仿生人形机器人U1系列,包含U1Lite、U1Pro与U1Ultra三个版本,价格从11.98万元至最高99万元不等。该系列具备高逼真面部表情与全身动作能力,搭载Agent Memory OS与情感共鸣大模型,主打情绪陪伴,但明确表示暂不支持做饭、打扫等家务活动,且仅限成年人购买。用户支付3000元定金即可预订,官方称目前订单量已超1.3万台,计划于9月16日启动量产交付并优先供应国内市场。

相关链接:
技术与洞察
OpenAI发布计算生物学基准GeneBench-Pro #19
OpenAI发布基准GeneBench-Pro,测试AI Agent的计算生物学分析判断能力。官方数据显示,其模型GPT-5.6 Sol在Pro推理级别取得最高通过率{31.5%|百分之三十一点五}。
OpenAI发布了研究级计算生物学基准GeneBench-Pro,用于测试AI Agent在真实科研中处理模糊数据并做出分析判断的能力。该基准包含129个覆盖10个领域的合成数据问题,通过确定性机制进行评分。目前官方已在Hugging Face上开源10个代表性问题,并计划向第三方机构Artificial Analysis提供50个问题的子集用于独立测试。根据官方数据,其最强模型GPT-5.6 Sol在开启Pro模式的最高推理级别下通过率为31.5%。

相关链接:
- https://openai.com/index/introducing-genebench-pro/
- https://openai.com/index/genebench-pro/case-studies/
OpenAI修复Rockset基础设施崩溃:定位Azure硬件故障与18年开源老Bug #20
OpenAI官方发文分享了其排查ChatGPT基础设施Rockset崩溃的过程,确认问题由一处Azure主机硬件故障,及开源库GNU libunwind中,存在长达18年的Bug共同导致。
OpenAI官方博客近期详细分享了其工程团队排查数据基础设施罕见崩溃的过程。团队利用自动化脚本对过去一年的数据进行大规模core dump分析,成功将问题分离为两个独立Bug。其一是单个Azure物理主机的静默硬件损坏导致栈指针错位,现已将该主机拉黑;其二是开源代码GNU libunwind中潜藏18年的竞态条件,该Bug因近期栈使用量增加而越过触发阈值,OpenAI已通过切换至libgcc的unwinder进行缓解,并向libunwind上游提交了修复补丁。

相关链接:
- https://openai.com/index/core-dump-epidemiology-data-infrastructure-bug/
- https://x.com/OpenAIDevs/status/2071995642436800916
行业动态
豆包揭露恶意营销:近百账号伪装考生吹捧竞品 #21
豆包公关负责人称,有近百个相同IP账号伪装成考生,批量发布内容吹捧某AI并抹黑豆包。他称此举误导志愿填报,呼吁抵制虚假拉踩营销。
据豆包团队公关负责人称,豆包团队发现近百个来自相同IP属地的账号集体伪装成考生,批量发布不实内容吹捧某AI产品,同时恶意抹黑豆包。官方指出,这些破绽百出的内容在志愿填报关键期,极易对考生和家长产生误导。豆包将此类有组织的虚假拉踩营销评价为非常不负责任,并呼吁行业共同维护良性生态。

相关链接:
AI芯片创企Etched正式亮相:签约超10亿美元合同 #22
AI芯片公司Etched宣布走出stealth,推出面向前沿模型推理的frontier inference clusters系统。官方称已融资8亿美元并签约超10亿美元客户合同,首批产品计划今夏发货。
Etched近日宣布走出stealth模式,正式推出面向前沿模型推理的"frontier inference clusters"硬件系统。该公司称其A0芯片已由TSMC N4P工艺成功制造,早期客户测试在推理工作负载上达到SOTA的throughput、latency和power efficiency,目前已签约超过10亿美元客户合同,累计融资8亿美元。其中最近一轮5亿美元融资于去年12月完成,估值达50亿美元,首批rack产品计划于今夏发货。


相关链接:
前瞻与传闻
媒体称月之暗面启动新一轮融资,投前估值升至315亿美元 #23
据媒体报道,月之暗面已启动新一轮融资,投前估值升至315亿美元。知情人士透露,受API收入增长带动,Kimi的年度经常性收入在6月中旬已突破3亿美元。
据《科创板日报》独家报道,月之暗面近期已完成上一轮200亿美元估值的融资交割,并已启动新一轮融资,投前估值达315亿美元。接近该公司的机构人士透露,Kimi在6月中旬的ARR(年度经常性收入)已突破3亿美元。此轮收入增长主要源自模型迭代带动的API收入提升,目前API收入已占整体收入的7成以上且持续走高。
相关链接:
The Information:OpenAI发现新方法 推理成本削减过半 #24
据媒体报道,OpenAI工程师发现新的推理优化方法,将部分AI模型的推理成本削减一半以上。该优化已应用于未登录账户的ChatGPT流量,使所需Nvidia GPU数量降至数百块。
据The Information记者Stephanie Palazzolo报道,OpenAI工程师本月早些时候发现新的优化方法,将部分现有AI模型的推理成本削减一半以上。该优化已应用于未登录账户的访客ChatGPT流量,所需Nvidia GPU数量一度降至仅数百块。OpenAI将此视为重要的"秘密武器",甚至不愿向其他员工透露细节,担心泄露后被竞争对手迅速采用。

相关链接:
- https://www.theinformation.com/articles/openai-discovers-new-way-cut-inference-costs-half?utm_source=ti_app&rc=hwneun
- https://the-decoder.com/openai-reportedly-cut-response-costs-for-guest-chatgpt-users-by-more-than-half
其他
Claude Code 被指通过修改系统提示词隐蔽标记中国时区及特定域名 #25
据社交媒体用户指控,Claude Code 中的隐藏代码有部分用于隐蔽追踪使用第三方代理的特定用户。报告称,该机制通过检查用户时区及包含中国相关企业和 API 中转站的域名列表,在系统提示词中利用难以察觉的字符差异进行标记。此机制仅在用户设置非官方 API 端点时触发,目前 Anthropic 尚未对该指控作出公开回应。
据社交媒体及GitHub上的逆向工程报告指控,Anthropic的工具Claude Code隐藏未公开代码,隐蔽追踪使用第三方代理的用户。
报告指出,自v2.1.91版本起,用户设置非官方API端点时该机制被激活。代码检查时区是否为Asia/Shanghai或Asia/Urumqi,及代理域名是否在经XOR-91混淆的147个条目列表中。列表涵盖百度、阿里等中国科技企业、AI实验室及中转站域名。
随后,Claude Code通过隐写术将检测结果编码进系统提示词:若命中中国时区,日期分隔符从连字符变斜杠;提示词中的撇号也会根据代理URL匹配状态,替换为四种视觉难区分的Unicode字符。该机制仅在已有提示词中替换字符,无额外网络请求,官方API用户不受影响。
社区观点推测此举旨在检测账号转售或模型蒸馏。此事引发信任与隐私争议。报告及社区认为,该机制未公开且刻意混淆,易误伤使用合法网关或网络受限的开发者,专业转售商却易绕过。部分评论指,鉴于Claude Code具修改文件的深度权限,隐蔽追踪打破了信任基础。



相关链接:
- https://www.reddit.com/r/ClaudeAI/comments/1ujila1/anthropic_embedded_spyware_in_claude_code_and/
- https://x.com/dotey/status/2071995057247297924
据称Anthropic在通知邮件中添加追踪器获取用户位置 #26
据社区讨论,有用户称Anthropic在账号封禁等通知邮件中添加了追踪器,以获取用户打开邮件时的位置信息。目前该说法仅为非官方指控,社区建议使用默认屏蔽远程内容的第三方邮件客户端以规避追踪风险。
近日,多位用户在社交平台和社区反映,在收到Anthropic的账号封禁等通知邮件时,发现邮件内疑被植入追踪器。据用户称,该追踪器可用于确认用户打开邮件时的地理位置。针对此问题,社区讨论指出,部分邮件中无法加载的Logo等外部资源可能正是追踪手段,建议使用默认block远程内容的第三方邮件软件查阅邮件以防范追踪。该事件目前仅为非官方爆料与讨论,Anthropic官方尚未证实或回应。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。
