概览
要闻
- DeepSeek V4正式版计划7月中旬上线,API将启用峰谷定价
#1 - 美团发布并开源 1.6 万亿参数 LongCat-2.0 模型 ↗
#2 - Codex 团队宣布重置用量限制并修复消耗过快问题 ↗
#3
开发生态
- Cline 推出 ClinePass 订阅,首月 1.99 美元起可用 GLM 5.2 ↗
#4 - OpenAI为Codex推出权限配置文件功能 ↗
#5 - Anthropic 推出自托管的 Claude apps gateway ↗
#6 - Claude Code 下版本 Subagents 将默认后台运行,已小范围推出 ↗
#7 - Cursor发布iOS应用,支持手机启动和远程控制编程Agent ↗
#8 - OpenClaw 发布 iOS 与 Android 原生应用 ↗
#9 - Google AI Studio 分享应用可附带完整聊天记录 ↗
#10
模型发布
- Meta 发布 Brain2Qwerty v2 实现非侵入式脑磁信号实时句子解码 ↗
#11 - 美国 National Design Studio 开源 14.7MB 浏览器端 PII 脱敏模型 Rampart ↗
#12
产品应用
技术与洞察
行业动态
- 三星与SK公布超9000亿美元AI与半导体投资计划 ↗
#17 - 豆包否认内测社交功能,称仅与飞书办公协同 ↗
#18 - 月之暗面称未授权第三方参与融资,警告老股转让欺诈 ↗
#19 - Arena年化营收突破1亿美元 ↗
#20 - Claude模型全面接入Microsoft Foundry平台 ↗
#21
前瞻与传闻
要闻
DeepSeek V4正式版计划7月中旬上线,API将启用峰谷定价 #1
DeepSeek 向用户发布邮件,宣布 DeepSeek V4正式版计划于7月中旬上线,将带来更多功能优化和性能提升。正式版发布后,API将引入峰谷定价,现行价格为“平时价格”,每日9:00至12:00和14:00至18:00为高峰时段,高峰时段价格为平时两倍。
DeepSeek 向用户发布邮件宣布,计划于7月中旬上线 DeepSeek V4 正式版,将带来更多功能优化和性能提升。正式版发布后还将调整API定价引入峰谷机制,每日9:00至12:00和14:00至18:00为高峰时段,届时deepseek-v4-pro与deepseek-v4-flash模型价格将翻倍。调整涉及输入(含缓存命中与未命中)和输出费用,官方将提前24小时邮件通知用户,用户可选择退出并申请退款。


美团发布并开源 1.6 万亿参数 LongCat-2.0 模型 #2
美团龙猫团队正式发布并开源了总参数量达1.6万亿,激活参数480亿的{MoE语言模型|"MoE语言模型"} LongCat-2.0。官方称该模型在国产算力芯片上完成了预训练,支持 100 万上下文,在编程与智能体任务上表现强劲。现已通过 LongCat API 开放平台上线了限时抢购的资源包和 API 按量计费服务。
美团龙猫发布并开源LongCat-2.0模型,这是一款总参数1.6万亿、每个token激活约480亿参数的MoE语言模型,官方称其预训练在5万余张国产算力芯片上完成,且在训练和部署中未使用NVIDIA或AMD GPU,官方称验证了国产平台大规模前沿训练的能力。该模型引入LongCat稀疏注意力与N-gram Embedding等架构创新,并通过多教师在线蒸馏(MOPD)强化Agent、推理与交互三大能力。LongCat-2.0已上线并提供API接入,新用户认证送1000万tokens,Token套餐9.9元/月含5000万tokens、399元/月含10亿tokens,Cache命中免计费;按量付费API限时优惠价分别为输入缓存命中0.04元、未命中2元、输出8元每百万tokens。



相关链接:
- https://longcat.chat/blog/longcat-2.0/
- https://github.com/meituan-longcat/LongCat-2.0
- https://longcat.chat/platform/product
Codex 团队宣布重置用量限制并修复消耗过快问题 #3
Codex 团队于北京时间6月30日早上约8点宣布,即将完全重置 Codex 的用量限制,并在未来24小时内向用户的用量池额外增加一次手动重置额度。此前有用户报告用量消耗过快,团队调查后确认是由 Auto-review 过于主动及后台建议重试频繁等多个小问题叠加导致,目前已撤销相关改动并在各平台部署了热修复。
Codex 团队于北京时间6月30日早上约8点宣布,将在未来一小时内完全重置用户的用量限制,并在未来24小时内额外提供一次重置额度。此前有用户报告用量消耗异常,团队调查发现,Auto-review 过于主动、某项改动触发过多 subagent 工作以及后台建议在失败后重试频繁是导致消耗过快的原因。目前,团队已撤销相关改动并修复了建议调度、重复生成和重试行为,同时纠正了用量报告错误,如 Auto-review 被误标为 GPT-5.4 用量的问题。所有热修复现已部署至 CLI、桌面应用和后端,新的用量数据将更清晰且实际消耗会降低。


相关链接:
开发生态
Cline 推出 ClinePass 订阅,首月 1.99 美元起可用 GLM 5.2 #4
Cline 推出 ClinePass 订阅服务,开发者现可在订购该订阅直接使用 GLM 5.2 等一批精选开放权重模型。标准月费 9.99 美元,当前通过命令行注册的用户可享首月 1.99 美元优惠。
Cline 正式推出 ClinePass 订阅计划,为开发者提供一组可在 Cline IDE 和命令行工具中直接使用的精选开放权重模型。该订阅标准月费为 9.99 美元,限时首月优惠价为 4.99 美元;若通过 npm i -g cline 注册,首月可低至 1.99 美元,官方宣称配额可达普通 API 速率限制的 2 至 5 倍。首批包含的模型 GLM 5.2、Kimi K2.7 Code、DeepSeek V4 Pro 等。订阅用户可获得 API 密钥,通过兼容 OpenAI 的接口在其他编码 Agent 中调用这些模型,并可在账户中随时取消续费。


相关链接:
OpenAI为Codex推出权限配置文件功能 #5
OpenAI为Codex推出处于Beta阶段的权限配置文件功能,替代了旧版沙箱模式。该功能通过可继承的配置策略,精细控制文件读写与网络访问权限。其内置只读、工作区写入和完全访问三种模式,由操作系统强制实施。
OpenAI正式发布了Codex的权限配置文件功能(Beta),让用户通过可复用、可继承的配置策略管理本地命令执行时的文件系统与网络权限。该功能允许在配置文件中定义路径级别的读、写、拒绝规则,并可配合域名白名单与Unix Socket访问控制,由操作系统层面的沙箱机制强制实施。内置只读、工作区写入和完全访问三种配置文件,并支持自定义配置与企业级管理,当前已在macOS、Linux、WSL及Windows上可用。

相关链接:
Anthropic 推出自托管的 Claude apps gateway #6
Anthropic 官方现已推出自托管的 Claude apps gateway,支持企业 SSO、集中策略与支出上限,可将 Claude Code 路由至 Amazon Bedrock 和 Google Cloud。
Anthropic 官方现已推出 Claude apps gateway,这是一款旨在将 Claude Code 连接到 Amazon Bedrock 和 Google Cloud 的自托管控制平面。它作为单个无状态容器部署,提供企业 SSO 登录、集中强制策略、基于角色的访问控制、每用户成本归因以及支出上限设置,并支持在提供商之间进行可选的故障转移。该网关目前可用,除非配置为使用 Claude API,否则不会将推理流量或使用数据发送给 Anthropic。
相关链接:
Claude Code 下版本 Subagents 将默认后台运行,已小范围推出 #7
Claude Code 团队成员 Boris Cherny 称,下个版本将使 subagents 默认后台运行,该特性已向少量用户逐步推出。用户可在 subagents 后台任务执行时继续对话。
Claude Code 开发者 Boris Cherny 宣布,Claude Code 下一个版本将把 subagents 默认设定为后台运行,用户在触发后台任务后仍可与主 agent 继续对话,只需提出要求即可将 agent 切至前台。该能力在过去一周已向小部分用户逐步推送,目前支持将 subagents 的权限请求转发至主界面,也能通过方向键加回车直接向特定 subagent 发消息;单独的终端标签页界面即将推出,若启用 agent teams 则可提前体验。

相关链接:
Cursor发布iOS应用,支持手机启动和远程控制编程Agent #8
Cursor正式发布iOS应用,并向所有付费用户开放公开测试,可从App Store下载。用户可手机启动云端Agent或远程控制桌面Agent,通过锁屏实时动态和推送通知掌握状态,查看演示、{代码差异|"代码差异"}并{合并PR|"合并Pull Request"}。
近日,Cursor面向所有付费用户推出了iOS移动应用的公开测试版,现已可通过App Store下载。该应用允许用户通过手机启动云端常驻编程Agent,或远程控制运行在电脑上的Agent,并能在手机上查看Agent产生的演示、日志和代码差异,甚至直接在应用内合并Pull Request。同时,应用支持Live Activities与推送通知来实时跟踪Agent状态,应用内的Composer 2.5功能则有限时七五折优惠,持续至7月5日。

相关链接:
OpenClaw 发布 iOS 与 Android 原生应用 #9
OpenClaw 官方宣布发布 iOS 和 Android 原生移动应用。这两款应用作为{自托管 AI Agent Gateway|"自托管 AI Agent Gateway"} 的伴随节点,能将手机硬件接入用户的个人 Agent 网络。
OpenClaw 发布了 iOS 和 Android 原生应用,将其作为自托管 AI Agent Gateway 的伴随节点。手机节点通过 WebSocket 连接到运行于 macOS、Linux 或 Windows (WSL2) 上的 Gateway 进程,为 Agent 提供相机、位置、语音及 Canvas 渲染等设备硬件能力。两款应用均非独立客户端,必须配合已运行的 Gateway 使用,且配对请求需在 Gateway 端显式批准;涉及隐私的相机、屏幕捕获等命令默认关闭,需用户手动配置允许列表。

相关链接:
- https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132
- https://play.google.com/store/apps/details?id=ai.openclaw.app
Google AI Studio 分享应用可附带完整聊天记录 #10
Google AI Studio 近日更新,用户在分享应用时可以选择通过一个开关包含完整的聊天历史,方便接收方查看创建时的所有提示和对话。
Google AI Studio 官方近日宣布,用户在该平台分享应用时可以通过一个简单的切换开关选择附带完整的聊天历史记录。启用该选项后,接收方不仅获得应用本身,还能查看构建过程中用户与模型之间的所有提示和来回对话,了解确切的工作流程,以便团队成员学习或审阅应用的构建过程。这项功能目前已正式上线,所有用户均可使用。

相关链接:
模型发布
Meta 发布 Brain2Qwerty v2 实现非侵入式脑磁信号实时句子解码 #11
Meta AI 近日公布了其非侵入式“脑-文本”解码研究的新成果 Brain2Qwerty v2。该系统基于端到端深度学习,能够从脑磁图信号实时解码完整句子,官方称单词准确率达 61%,并已开源训练代码与数据集。
Meta 宣布发布 Nature Neuroscience v2 版本,该版本实现了从脑磁图信号端到端实时解码完整句子。据官方介绍,v2 的平均单词准确率为 61%,最佳被试达到 78%,其通过端到端深度学习处理原始脑信号并微调大语言模型以利用语义上下文,性能较此前非侵入式方法约 8% 的准确率提升显著。Meta 已开源 v1 和 v2 全部训练代码,合作方 BCBL 则开放了 v1 数据集,但目前系统仍依赖昂贵的脑磁图设备与磁屏蔽环境,仅在健康被试上验证,尚未在脑损伤患者中测试。

相关链接:
- https://ai.meta.com/blog/brain2qwerty-brain-ai-human-communication/
- https://huggingface.co/datasets/bcbl190626/SpanishBCBL
美国 National Design Studio 开源 14.7MB 浏览器端 PII 脱敏模型 Rampart #12
美国 National Design Studio 发布了一款仅 14.7MB 的开源模型 Rampart,能在浏览器内自动脱敏用户输入的姓名、地址等个人信息,再将内容发送给 AI 助手。该模型支持七种语言,但不包括中文。
美国国家设计工作室(National Design Studio,NDS)近日正式开源了 Rampart,一个完全在浏览器端运行的个人信息(PII)脱敏系统。该系统由一个基于正则表达式的确定性规则引擎与一个轻量级机器学习模型组合而成,能在用户键入消息后、发送给任何服务器前,实时检测并替换姓名、社会安全号码、地址、电话号码等 17 类实体,官方公布的专用词召回率达 98.42%。Rampart 以 alpha 版本发布,采用 CC BY 4.0 许可,支持英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语七种拉丁语言。
相关链接:
产品应用
Gemini应用向美国用户推出基于个人偏好和照片的免费图像生成 #13
Google Gemini向美国用户免费开放 personalized image 生成功能,该能力将Personal Intelligence与Nano Banana模型及Google Photos连接,使Gemini可从用户连接的应用中理解偏好与生活细节,从而生成贴合个人品味和实际形象的图像。
Google宣布,即日起所有符合条件的美国用户可在Gemini应用中免费体验personalized image生成。该功能将Personal Intelligence与Nano Banana模型及Google Photos连接,使Gemini能够从Google应用(如Gmail、Google Photos、YouTube和Search)中了解用户的偏好和兴趣。上述功能采用主动选择接入机制,用户可在设置中随时连接或断开其Google应用,以控制Gemini所能访问的信息。

相关链接:
- https://blog.google/innovation-and-ai/products/gemini-app/personal-intelligence-nano-banana-us-expansion/
- https://support.google.com/gemini/answer/14286560
ComfyUI 推出 Comfy MCP 公开测试版 #14
ComfyUI 推出 Comfy MCP 公开测试版,官方称其为首个面向生产流水线的 MCP。该工具支持将 Claude、Codex、Hermes等 Agent 接入 ComfyUI 生态系统,用户可通过自然语言运行工作流,需注册 Comfy 账户使用。
ComfyUI 官方宣布推出 Comfy MCP 公开测试版,称其为首个面向生产流水线构建的 MCP。该工具允许用户通过 Claude、Codex、Hermes、Cursor 等 Agent 以自然语言构建、编辑和运行 ComfyUI 工作流,搜索模型与节点,共享工作流链接供 Agent 执行,并对已保存工作流更换输入重新运行,全程无需手动操作节点或配备 GPU。ComfyUI 同时启用了 Comfy CLI 测试版和 Comfy Skill 代码库,该 MCP 目前仍处于 Beta 阶段,使用需注册 Comfy 账户。

相关链接:
技术与洞察
小红书发文介绍大模型推理引擎 RedKnot #15
小红书发文推出长文本推理引擎 RedKnot,通过解耦注意力头提升效率。官方论文称其最高带来3.54倍首字延迟加速,论文已公开。
小红书引擎架构部 AI Infra 团队发文介绍了大模型长文本推理引擎 RedKnot 及其相关论文,指出不同注意力头对上下文的需求不同。RedKnot 通过头分类稀疏、稀疏 FFN 和 SegPagedAttention 三个机制,将 KV Cache 沿注意力头维度解耦,从而提升存储与计算效率。官方论文数据显示,该引擎最高可带来 3.54 倍的首字延迟加速和 7.8 倍的单卡并发提升,并在预填充阶段削减最高 79.5% 的算力。目前该项目已在 GitHub 建立开源仓库,但暂未上传代码。

相关链接:
- https://mp.weixin.qq.com/s/qRrZvL0aZzYI82djFSrLug
- https://github.com/rednote-machine-learning/RedKnot
- https://arxiv.org/abs/2606.06256
智谱创始人唐杰发文谈AI时代:认知位居格局与技术之上 #16
智谱创始人唐杰近日在微博发文分享AI时代的思考,认为认知大于格局与技术,管理地位下降。他表示技术迭代极快,追赶节奏已从“每隔几年等里程碑”变为“每隔几天追新东西”,一旦停下就面临一夜落后。
近日,智谱创始人唐杰通过个人微博发表其对AI时代的系统思考,提出认知 > 格局 > 技术 > 管理的排序。他指出,管理在AI环境中因扁平化、去中层而改变,不懂技术便无法有效管理;技术迭代的密度和烈度前所未有,落后不再渐进,而可能瞬间发生。同时,格局决定天花板,AI时代靠想象力和布局,抄近路已无可能。而认知最为关键:AI的本质是技术快速进步,OpenAI与Anthropic的拉锯即是例证,停下来打磨产品或思考商业模式就会被颠覆。他最后强调,实现AGI需要极度热衷、深厚积累和纯粹团队,传统计算机科学的资历已被拉平,唯有快速迭代认知、具备超前思维的个体才能生存。

相关链接:
行业动态
三星与SK公布超9000亿美元AI与半导体投资计划 #17
韩国三星和SK集团公布韩国本土中长期投资计划,分别投入2655万亿和2100万亿韩元,用于建设半导体工厂与AI数据中心。这些项目仍处规划阶段。
Samsung 与 SK 集团分别公布大规模投资计划,Samsung 宣布未来十年投资约 2655 万亿韩元,SK 集团宣布中长期投资 2100 万亿韩元,两项计划均覆盖半导体制造与 AI 数据中心建设。韩国政府同步公布了涵盖半导体、AI 数据中心和 Physical AI 的国家投资框架,其中内存芯片部分涉及在西南部建设四座新内存 Fab 的 5180 亿美元投入及中部地区 520 亿美元 HBM 封装中心,AI 数据中心部分计划由 SK、GS 和 Naver 等企业至 2035 年累计投入约 3560 亿美元。
相关链接:
- https://www.chosun.com/english/industry-en/2026/06/29/7KRYAY372FDINL5C5RO4VVCRF4/
- https://news.samsung.com/kr/%EC%82%BC%EC%84%B1-%EB%AF%B8%EB%9E%98-%EC%84%B1%EC%9E%A5-%EC%9C%84%ED%95%B4-2655%EC%A1%B0%EC%9B%90-%ED%88%AC%EC%9E%90
豆包否认内测社交功能,称仅与飞书办公协同 #18
据用户分享,豆包近期出现类似即时通讯的对话页、可添加飞书好友等功能。豆包官方回应否认内测社交功能,称仅为办公场景与飞书协同。
有用户发现豆包应用中新增类似IM的“对话”页,支持添加飞书及豆包好友,豆包账号还可登录飞书网页版。豆包官方对此回应称,没有内测社交功能的计划,上述功能属于与飞书的办公协同尝试;飞书用户协议已明确双方账号互通与数据共享规则。
相关链接:
月之暗面称未授权第三方参与融资,警告老股转让欺诈 #19
月之暗面发布声明澄清,该公司未授权任何第三方机构处理其融资与股权转让事宜,所有融资活动均由公司直接负责。声明强调,任何未经公司批准的老股转让均属无效,并提醒投资者警惕通过非官方渠道传播的所谓投资份额。
月之暗面针对市场上出现的多起假借其名义的不实融资及股权交易信息发表严正声明。官方表示,公司所有融资活动仅由公司直接负责,未聘用或授权任何第三方机构或个人作为融资顾问。公司还明确,其老股转让必须经内部批准方可进行,凡未经批准的交易一律无效。新股融资方面,额度分配均以实际资金到账为确认依据,未向任何机构或个人预先承诺或锁定额度,也不会要求出具资产证明。

相关链接:
Arena年化营收突破1亿美元 #20
AI评估平台Arena宣布商业化仅八个月,年化营收便突破一亿美元。该平台依托千万用户盲测生成模型排行榜,并按用量向企业收取深度分析费用。
AI模型竞技场Arena联合创始人兼CEO Anastasios Angelopoulos宣布,其年化营收已突破1亿美元,商业化AI评估产品上线仅八个月。该平台以免费众包AI模型排行榜闻名,月均超千万用户通过盲测两个模型的回答进行投票。Arena的收入实际按用量向模型实验室和企业收取深度分析费用,并非传统经常性收入;公司累计融资2.5亿美元、估值17亿美元。

相关链接:
- https://arena.ai/leaderboard
- https://news.lmarena.ai/ai-evaluations/
- https://techcrunch.com/2026/06/29/arena-the-ai-leaderboard-everyone-uses-is-now-a-100m-business/
Claude模型全面接入Microsoft Foundry平台 #21
Anthropic宣布,Claude模型现已全面接入由Azure托管的Microsoft Foundry平台。首发提供Claude Opus 4.8和Haiku 4.5,直接整合现有的Azure身份验证、治理控制与计费体系。
官方宣布,Claude模型现已在由Azure托管的Microsoft Foundry中全面可用(GA)。首发在Messages API中提供Claude Opus 4.8和Claude Haiku 4.5,支持prompt caching和extended thinking功能,适用于编码、Agentic工作和复杂推理。模型在用户的Azure环境中运行,由Anthropic担任数据处理者,并提供包含美国数据区在内的推理位置选择。符合条件的Microsoft企业协议客户可将Claude使用量计入Azure承诺额度的抵扣。
相关链接:
前瞻与传闻
OpenAI 预告 Codex 新硬件 携手 Work Louder 推出 #22
OpenAI 预告将于7月15日发布一款 Codex 相关新硬件。根据提供的视频,OpenAI 将与外设厂商 Work Louder 合作推出一款方形的专为 Codex 打造的宏键盘。
OpenAI Developers 官方账号在 X 平台发布视频预告,称“Your favorite Codex shortcuts are getting an upgrade.”,并宣布产品将于 July 15th. 发布。根据提供的视频,OpenAI 将与外设厂商 Work Louder 合作推出一款方形的专为 Codex 打造的宏键盘。


相关链接:
社区发现疑似 GPT 5.6 Sol 灰度方法 测试结果存随机性 #23
据社区消息称,OpenAI 正在 Codex 中对部分用户灰度 GPT-5.6 模型,可通过在 Codex 中选择 gpt-5.5 模型并以 xhigh 推理运行特定 Juice 测试提示来验证,若返回 128 则可能已被灰度。不过,该测试方法被指存在随机性。
社区发现 OpenAI 或正通过 Codex 平台小范围灰度测试新的 GPT-5.6-sol 模型。据社区消息,用户可在 Codex App 或 CLI 端,选择 gpt-5.5 模型并将思考强度设为 xhigh,运行一段包含 Juice 测试指令的 XML 代码,根据返回的 Juice 数值来判断是否已被灰度路由至新模型。多个社区用户发布了测试结果,反馈不一,部分用户多次测试结果出现波动,有分析指出该方法存在随机性,也有人直言未感知到新模型带来的体验提升。

相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。
