AI 早报 2026-06-19 — DeepSeek 正式上线识图模式、Codex 推出录制功能

DeepSeek 正式上线识图模式,OpenAI Codex 推出 Record & Replay 功能支持录制操作生成 Skill,Claude Code 也同步上线 Artifacts 功能。此外,GPT-5.5 Instant 医疗表现亮眼,多家厂商发布新模型与工具更新。

AI早报人工智能AI行业动态要闻开发生态产品应用模型发布技术与洞察行业动态前瞻与传闻DeepSeekopenai
查看原文

概览

要闻

  • DeepSeek 正式上线识图模式 #1
  • Codex 上线 Record & Replay 功能,录制操作即可生成可复用 Skill #2
  • Claude Code 推出 Artifacts 功能 #3

开发生态

  • 阶跃星辰推出新版 Step Plan 订阅方案并开放限时免费体验 #4
  • Step 3.7 Flash 模型在 Cline 平台开放一个月免费使用 #5
  • Codex 重置额度后引发热议:可用额度疑似大幅下调 #6
  • Gemini CLI 个人版账户正式停止服务 #7

产品应用

  • 腾讯推出Agent专属邮箱服务Agently Mail #8
  • OpenAI 称 GPT-5.5 Instant 健康评估表现超越医生回复 #9
  • ChatGPT 全平台更新:新增发音指导与世界杯赛事追踪 #10
  • 月之暗面 Kimi Work 升级:上线自主工作模式及 6 月福利 #11
  • Perplexity 推出 Brain 记忆系统,支持 Agent 夜间自我改进 #12

模型发布

  • 火山引擎上线豆包实时语音模型3.0 API服务并开启邀测 #13
  • 阿里 ATH-Token Foundry 联合人大开源科学大模型 LOGOS #14
  • Boogu 团队推出多模态图像模型系列 Boogu-Image-0.1 #15
  • Poolside 宣布开源 Laguna M.1:基于 Apache 2.0 的 225B MoE 模型 #16

技术与洞察

  • OpenAI研究表明少量有益数据即可广泛提升模型对齐效果 #17
  • Anthropic 称 Claude Opus 4.7 机器人任务速度远超人类 #18
  • 智谱创始人称中国将于今年出现Mythos级模型 #19
  • Artificial Analysis发布AA-Briefcase知识工作基准 #20

行业动态

  • 前白宫AI顾问Dean Ball将加入OpenAI #21
  • Midjourney 进军医疗硬件,将推出超声波全身扫描服务 #22

前瞻与传闻

  • 消息称阿里千问将推出“千问输入法”独立APP #23

要闻

DeepSeek 正式上线识图模式 #1

DeepSeek 员工陈小康宣布 DeepSeek识图模式已在网页端和 App 上线。据社区反馈,该功能或已全量推送。此事也引发了社区用户关于 DeepSeek 新模型的遐想。

DeepSeek 员工陈小康宣布,DeepSeek 的“Vision”识图模式现已在网页端和 App 端上线。陈小康邀请用户测试该图像识别功能,并建议用户同时体验其纯文本处理能力。据社区用户反馈,该功能目前可能正在逐步扩大推送,尚未获得的用户需等待一段时间或尝试刷新网页及更新 App。在社区讨论中,有用户猜测这是否预示着 4.1 版本的到来,但这仅为非官方推测。

相关链接:


Codex 上线 Record & Replay 功能,录制操作即可生成可复用 Skill #2

OpenAI 为 Codex 推出 Record & Replay 功能,用户在 Mac 上演示一遍重复操作,即可生成可复用的 Skill。该功能需先开启 Computer Use,目前仅限 macOS 端。

OpenAI 在 Codex 桌面端 26.616 版本中上线了 Record & Replay 功能。该功能允许用户在 Mac 上录制一遍重复性工作流程,Codex 会分析操作过程并生成包含触发条件、所需输入、执行步骤和验证结果的可检查、可编辑的 Skill。重播时,用户开新对话并告知 Codex 使用该 Skill,提供新的参数,Codex 即可结合 Computer Use、浏览器操作和已连接的 plugin 完成任务。官方称这是可选功能,正在向特定市场推出,目前仅限 macOS,不支持欧洲经济区、英国和瑞士,使用前必须开启 Computer Use。

相关链接:


Claude Code 推出 Artifacts 功能 #3

Claude Code 推出 Artifacts 功能,可将工作过程生成实时更新并支持团队分享的交互式网页。目前该功能以 Beta 版向 Claude Team 和 Enterprise 组织开放。

Anthropic 官方宣布,Claude Code 正式推出 Artifacts 功能。该功能能利用完整会话上下文,将工作进度转化为可实时更新的网页,支持团队成员查看最新版本并回溯历史。Artifacts 默认私有,分享范围仅限同组织内的认证成员,且无法公开。官方称其内部测试中最高频的场景是调试,此外也可用于 PR 走查、代码审计等。目前该功能以 Beta 形式向 Claude Team 和 Enterprise 计划开放,支持通过 CLI 和桌面应用生成,个人用户暂不可用。

相关链接:


开发生态

阶跃星辰推出新版 Step Plan 订阅方案并开放限时免费体验 #4

阶跃星辰开放平台上线新版 Step Plan 订阅方案,计费模式从按次数改为基于 Credits 的 Token 计费。同时推出 Step Plan 限时免费体验活动,最高获 120 天免费时长。

阶跃星辰开放平台针对 Agent 与 Coding 场景调整 Step Plan 订阅为基于 Credits 计费。该方案集成了 Step 3.7 Flash 等旗舰模型、多模态能力及 MCP 工具,并通过智能路由在性能与成本间动态平衡。目前平台已开放面向新老用户的限时免费体验,最高可获 120 天免费时长。旧版套餐在存续期内保持不变。

相关链接:


Step 3.7 Flash 模型在 Cline 平台开放一个月免费使用 #5

StepFun 与 Cline 达成合作,其 Step 3.7 Flash 模型在一个月内面向 Cline 用户免费提供。

StepFun 与 Cline 官方宣布达成合作,将在未来一个月内于 Cline 平台免费提供 Step 3.7 Flash 模型。Cline 官方称该模型击败了 Gemini 和 DeepSeek 的 flash 模型,在 SWE Bench 基准测试上接近前沿性能,具备开放权重和 256k 上下文窗口。开发者可通过命令 npm i -g cline 安装运行后,输入 /model 选择该模型用于 Agentic 编码工作流。

相关链接:


Codex 重置额度后引发热议:可用额度疑似大幅下调 #6

据社区用户反映,Codex 在近日重置额度后可用额度出现明显下降,且部分用户反馈更新后模型上下文窗口缩小,自动压缩功能失效。以上均为用户体验反馈,未获得官方确认或解释。

2026 年 6 月 18 日,据多个社区用户反映,Codex 在完成额度重置后出现了明显的可用额度下调及性能限制。此外,部分用户反馈在近日更新后,模型上下文窗口疑似变小,且原有的自动压缩功能失效,导致新会话频繁触发空间不足的错误提示。

相关链接:


Gemini CLI 个人版账户正式停止服务 #7

Gemini CLI 官方宣布正式过渡至 Antigravity CLI,个人账户已停止服务,企业用户不受影响。

Gemini CLI 官方账号宣布,个人账户已正式从 Gemini CLI 过渡至全新的 Antigravity CLI。Google AI Pro、Google AI Ultra 及免费层个人账户的请求服务已全面停止。拥有 Gemini Code Assist 许可证的企业用户和使用 API 密钥认证的用户完全不受此次过渡影响。


产品应用

腾讯推出Agent专属邮箱服务Agently Mail #8

QQ邮箱团队推出了 Agently Mail,这是一款正在内测的、专为 Agent 打造的专属邮箱服务。该服务与个人邮箱隔离,原生适配 Agent,用户可通过 Agently Mail CLI 接入,目前支持微信扫码登录。

Agently Mail 由 QQ 邮箱团队推出,域名为 agent.qq.com,目前正在内测中。其定位是与个人邮箱隔离、原生适配 Agent 的专属邮箱服务,旨在帮助用户安全、高效地使用 Agent 收发邮件。用户需安装并配置 Agently Mail CLI 才能让 Agent 一键接入,授权即同意相关服务协议与隐私保护指引。据社区用户反馈,一个用户可以创建多个邮箱地址,疑似也可以将一个邮箱地址授权给多个 Agent 使用,但服务存在额度限制。

相关链接:


OpenAI 称 GPT-5.5 Instant 健康评估表现超越医生回复 #9

OpenAI 宣布,GPT-5.5 Instant 模型在健康问答上获得重大提升。官方称其表现已与 Thinking 模型相当,能更好地识别紧急就医需求,目前已向 ChatGPT 所有免费用户开放。

OpenAI 官方宣布,ChatGPT 中的 GPT-5.5 Instant 模型在健康和身心健康领域的表现取得显著提升。官方称,该模型能更好地识别何时可能需要紧急就医、询问相关背景并解释不确定性,其在最具挑战性的健康评估中的表现已达到与前沿 Thinking 模型相当的水平,且各维度评分超过了医生撰写的回复。该改进目前已面向所有 ChatGPT 免费用户开放(受限额约束)。此进展得益于一个由 60 个国家、260 多名医生组成的全球网络进行的审查与评估。

相关链接:


ChatGPT 全平台更新:新增发音指导与世界杯赛事追踪 #10

OpenAI 更新了 Web、iOS 及 Android 版 ChatGPT,新增支持超 60 种语言的发音指导与世界杯赛事追踪功能,并允许用户自定义 ChatGPT 使用连接应用前的权限询问机制。

OpenAI 近期更新了 Web、iOS 和 Android 平台的 ChatGPT 应用体验,共带来三项新功能。首先,ChatGPT 新增了发音指导功能,支持超过 60 种语言,能够在对话中以文本和音频形式提供单词发音指导。其次,应用内加入了世界杯更新功能,允许用户通过对话形式查询赛事日程、对阵、球队、球员及赛事预测等信息。最后,ChatGPT 增加了应用权限控制选项,用户可根据需求自定义应用在调用已连接应用时的询问时机。

相关链接:


月之暗面 Kimi Work 升级:上线自主工作模式及 6 月福利 #11

月之暗面 Kimi Work 电脑客户端近期上线「目标模式」与「插件中心」。新增功能支持 Agent 连续 24 小时自主工作,并能连接飞书、Notion 等外部应用。6 月期间,电脑端 Work 模式所有任务额度均享消耗减半的限时优惠。

月之暗面旗下电脑客户端的 Kimi Work(Beta 版)近期升级,新增「目标模式」与「插件中心」两项功能。其中「目标模式」支持 Agent 在无需人工干预下自主循环连续工作 24 小时以推进长线任务;「插件中心」则允许用户接入百度网盘、钉钉、飞书及 Notion 等常用办公与设计软件。目前上述功能面向 Mac 与 Windows 电脑客户端开放,官方同步推出仅限电脑端 Work 模式的 6 月额度消耗减半限时福利。

相关链接:


Perplexity 推出 Brain 记忆系统,支持 Agent 夜间自我改进 #12

Perplexity 为其 Agent 产品 Computer 推出名为 Brain 的自我改进记忆系统,目前已向 Max 和 Enterprise Max 订阅用户开放。

Perplexity 官方宣布为其 Agent 产品 Computer 推出一款名为 Brain 的自我改进记忆系统。与传统关注用户偏好的记忆模型不同,Brain 主要记录 Agent 的工作过程,并在夜间审查上下文图以进行自我学习,从而减少模型调用并提升输出质量。根据官方提供的早期测试数据,该系统可使任务正确率提升 25%,但目前尚无独立基准测试。该功能正以 Research Preview 形式向 Max 和 Enterprise Max 订阅者推出。

相关链接:


模型发布

火山引擎上线豆包实时语音模型3.0 API服务并开启邀测 #13

火山引擎正式上线豆包实时语音模型3.0的 API 服务并开启邀测。官方称该原生全双工端到端语音模型支持在实时交互中调用工具完成任务,且对话流畅度提升12%。

火山引擎正式上线豆包实时语音模型3.0的 API 服务,目前处于邀测阶段。作为原生全双工端到端语音大模型,该模型支持持续倾听并自行判断对话节奏,还能在交互中调用用户自定义工具完成任务。根据官方提供的数据,该模型具备抗干扰与动态判停能力,复杂场景下的抢话比例下降了40%,整体对话流畅度提升12%。该服务主要面向汽车智能座舱、AI智能硬件终端以及智能呼叫中心等企业级应用场景。

相关链接:


阿里 ATH-Token Foundry 联合人大开源科学大模型 LOGOS #14

阿里 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院正式开源了首个统一科学大模型 LOGOS。官方称,该模型基于纯序列范式,在无需 3D 坐标的条件下,于六大代表性科学任务上匹配或超越了领域专用方法。

阿里 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院正式开源了首个统一科学大模型 LOGOS。LOGOS 是一个基于统一“科学语法”的多领域科学生成基础模型,通过共享词表将蛋白质、小分子等异构对象转化为离散 Token 序列。官方称,LOGOS-1B 仅用约 1/56 的参数量即在多个任务上超越 NatureLM,并在逆合成预测、口袋位点识别等具体任务中打破了传统对 3D 结构数据的依赖。目前,该模型的权重、推理代码与技术报告已完全开源。

相关链接:


Boogu 团队推出多模态图像模型系列 Boogu-Image-0.1 #15

一个名为 Boogu 团队近日开源了 Boogu-Image-0.1 图像生成与编辑模型系列。官方称该系列在训练数据量较以往少一个数量级的情况下,文生图及图像编辑能力依然可媲美顶级闭源模型,目前相关权重已以 Apache-2.0 协议面向研究用途开放。

Boogu Team 发布并开源了参数量为 10B 的 Boogu-Image-0.1 统一图像生成与编辑模型家族。该系列涵盖 Base、Turbo、Edit 等多个变体,支持高质量文生图、快速生成及中英双语文字渲染,官方称其在多项基准测试中达到顶尖开源水平。该模型采用了 double stream mmdit 架构、Qwen3-VL-8B 作为 text encoder 以及 FLUX.1 VAE。模型目前以 Apache-2.0 协议开源,但官方明确指出其仅供研究使用,且在复杂姿势、图生图细节及世界知识方面仍存在已知局限。

相关链接:


Poolside 宣布开源 Laguna M.1:基于 Apache 2.0 的 225B MoE 模型 #16

Poolside 发布并开源模型 Laguna M.1。作为一款拥有 225B 参数的 MoE 架构模型,它支持 256K 上下文,专为 Agent 编码与长程任务设计。开发者目前可自由下载运行该模型的 Base 及训练后版本。

Poolside 宣布正式开源 Laguna M.1 模型的全量权重。该模型采用 Mixture-of-Experts 架构,总参数量 225B,单 token 激活 23B 参数,并支持原生思维推理功能。官方数据显示,Laguna M.1 在 SWE-bench Verified 和 Terminal-Bench 2.0 等编码评测中具备强劲竞争力,性能可比肩 DeepSeek-V4 Flash 等前沿模型。目前,该模型已获得 vLLM、SGLang 和 TensorRT-LLM 的上游支持,并可通过官方提供的 Agent 工具 pool 进行部署。

相关链接:


技术与洞察

OpenAI研究表明少量有益数据即可广泛提升模型对齐效果 #17

OpenAI发布了一项关于模型对齐的最新研究。官方称,通过在强化学习中引入少量针对诚实和公平等有益特征的训练数据,模型能在跨领域评估中表现出更广泛的对齐效果,且在对抗性测试下更难被诱导产生有害行为。

OpenAI在其 Alignment Research Blog 上发布了题为《迈向广泛且持久有益模型的强化学习》的最新研究。官方构建了涵盖健康、科学等12个领域的现实对话数据集,通过在标准强化学习中混入少量旨在提升诚实和可纠正性等特征的数据进行训练。官方称,该模型在53项内部及外部对齐评估中有44项得到改善,不仅展现出跨领域的对齐泛化能力,在对抗性提示词测试中也表现出更强的持久性。

相关链接:


Anthropic 称 Claude Opus 4.7 机器人任务速度远超人类 #18

Anthropic 官方公布“Project Fetch”机器人项目测试结果,在无人协助下,Claude Opus 4.7 控制四足机器人完成特定任务的速度比最快的人类团队快约 20 倍,但仍未能完成精确移动沙滩球等物理操控。

Anthropic 官方发布了“Project Fetch”项目第二阶段的实验结果,评估了模型自主控制现成四足机器人的能力。测试显示,在 Claude Code 中全自主运行的 Claude Opus 4.7,连接传感器、编写控制程序等任务的速度远超人类团队,在四项核心任务上比此前最快的团队快约 18.9 倍,且生成的代码量大幅减少。不过该模型目前仍无法精确控制机器人移动沙滩球,官方表示这意味着大模型尚未完全解决机器人技术,但可能正进入物理 Agentic AI 的早期阶段。

相关链接:


智谱创始人称中国将于今年出现Mythos级模型 #19

据社交媒体讨论,关于中国何时推出Mythos级别模型的预测中,Elon Musk参与讨论称"Probably Q1"。智谱创始人唐杰回复称"won’t take that long"。

博主Teortaxes在社交媒体表示,GLM 5.2目前与前沿模型存在约7个月差距,整体约处于Opus 4.7-4.8水平,据此预测中国将在2026年11至12月达到完整的"Fable"级别。Elon Musk参与讨论称"可能在Q1"。对此,智谱创始人的唐杰回复称"不需要那么久"。Elon Musk回应称在benchmark上确实如此,但以真正有用性衡量即使Q1也非常出色,并指出Anthropic正确专注于最大化有用智能,这不体现在benchmark中但体现在收入上。

相关链接:


Artificial Analysis发布AA-Briefcase知识工作基准 #20

评测机构Artificial Analysis发布AA-Briefcase知识工作基准,跨4个多周项目场景共91项任务评估模型的Agent能力,Claude Fable 5以1587 Elo居首但目前不可用。

Artificial Analysis发布名为AA-Briefcase的前沿知识工作评估基准,通过4个多周项目场景和91项任务,结合规则检查与成对评分评测模型的Agent知识工作能力。官方数据显示,Claude Fable 5以1587 Elo排名第一,Claude Opus 4.8 (max)和GLM-5.2 (max)分列第二和第三,但Claude Fable 5目前不可用。官方称GLM-5.2 (max)在开源权重模型中领跑,得分比Claude Opus 4.8 (max)低约90 Elo但成本不到其25%。

相关链接:


行业动态

前白宫AI顾问Dean Ball将加入OpenAI #21

前白宫AI政策顾问Dean W. Ball宣布将于7月6日加入OpenAI,担任新设立的Strategic Futures团队负责人并向首席战略官Jason Kwon汇报。该团队将专注于制定公司的前沿AI政策与内部治理。

AI学者Dean W. Ball宣布将于7月6日加入OpenAI,领导新成立的Strategic Futures团队,直接向首席战略官Jason Kwon汇报。Ball此前曾协助特朗普政府制定早期的AI政策,他领导的新团队将负责制定OpenAI的前沿AI政策和内部治理,重点关注灾难性风险、递归自我改进及前沿实验室与政府的关系等议题。

相关链接:


Midjourney 进军医疗硬件,将推出超声波全身扫描服务 #22

Midjourney 宣布成立医疗部门 Midjourney Medical,计划2027年在旧金山开设水疗式超声波扫描中心,用户踩入浅水池约60秒即可完成全身3D扫描,官方称比 MRI 快近100倍。

Midjourney 通过官方社交账号宣布成立新部门 Midjourney Medical。根据社区转发对公告的描述,该部门计划在旧金山开设结合水疗体验的扫描中心,用户踩入装有约50万个超声波传感器的浅水池,约60秒即可生成人体内部3D地图,全程无磁铁、无辐射、无造影剂。官方称扫描速度比传统 MRI 快近100倍,首家门店预计2027年开业,但目前该技术的实际效果尚未得到独立验证。

相关链接:


前瞻与传闻

消息称阿里千问将推出“千问输入法”独立APP #23

据媒体“读佳”报道,千问团队计划推出名为“千问输入法”的独立APP。该产品目前已开发完成,即将择日上线各大应用商店。

据媒体“读佳”从多方获知的消息,阿里千问团队计划推出名为“千问输入法”的独立APP。目前该产品已开发完成,预计将在未来上线各大应用商店。据报道,该应用的AI功能与键盘设计将更贴合手机端操作,与PC端的千问语音输入法组件有所区别。此举主要为填补千问在移动端AI输入法赛道的空白。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误


查看网页全文 · 查看 Markdown