AI 早报 2026-06-24 — 字节跳动发布豆包大模型 2.1 与 Seedance 2.5、Claude Tag 上线 Slack

概览

要闻

字节跳动发布豆包大模型2.1系列 ↗ #1
字节跳动发布 Seedance 2.5：支持 30 秒视频直出与局部编辑 ↗ #2
Anthropic 推出 Claude Tag，让 Claude 以团队成员身份常驻 Slack ↗ #3

模型发布

字节跳动发布音频生成模型 Doubao-Seed-Audio 1.0 ↗ #4
字节跳动发布 Seedance 2.0 升级支持原生 4K 及 10-bit 直出 ↗ #5
字节跳动发布豆包图像模型 Seedream 5.0 Pro 将于近期上线 ↗ #6
即梦AI上线SeedMusic 1.0 Preview模型 ↗ #7
Mistral AI 发布 Mistral OCR 4 模型支持输出结构化数据与自托管 ↗ #8
Krea 宣布开放 12B 参数图像生成模型 Krea 2 Raw 与 Turbo 的权重 ↗ #9
Catnip AI 发布 22B 实时音视频模型 MaineCoon ↗ #10

开发生态

Hermes Agent 支持 /learn 自动生成可复用技能 ↗ #11
Qoder 上线全系产品夜间折扣 ↗ #12
IBM Research 推出开源 Agent 框架 CUGA ↗ #13
小米开源全屋智能方案 Miloco 2.0 ↗ #14

产品应用

Meta 推出 299 美元无 Ray-Ban 品牌智能眼镜 ↗ #15

行业动态

Hermes Agent 与 OpenClaw 创始人爆发公开争端 #16
AI推理独角兽Baseten完成15亿美元F轮融资 ↗ #17

前瞻与传闻

企业微信启动AI Agent“大圆”内测 ↗ #18

要闻

字节跳动发布豆包大模型2.1系列 `#1`

字节跳动发布面向真实生产力场景的Seed {2.1|二点一}系列模型，包含Seed-2.1-pro与Seed-2.1-turbo，以及聚焦Coding和Agent场景的快速迭代模型Seed-{Evolving|"Evolving"}。该系列模型上下文窗口为256K，支持多模态输入。官方称在通用Agent与代码交付能力上全面提升。目前，该系列模型API已全量上线火山方舟，{TRAE|"TRAE"} Work中国版已面向全量用户免费开放体验，{TRAE|"TRAE"} IDE中暂仅向高级付费用户开放，豆包在非快速模式中上线了 Seed 2.1 Turbo。

字节跳动Seed团队正式发布豆包大模型2.1系列，涵盖旗舰模型Doubao-Seed-2.1-pro与规模化调用模型Doubao-Seed-2.1-turbo，还进一步推出进一步推出 Doubao-Seed-Evolving，聚焦 Coding 和 Agent 场景，以每月2~4次的速度快速迭代。该系列模型上下文窗口为256K，支持多模态输入。官方称2.1系列在通用Agent任务交付、企业级代码工程端到端Coding以及多模态理解能力上均有显著提升，并在GDPval、Terminal Bench 2.1等多项基准测试中取得领先成绩。目前该系列模型API已全量上线火山方舟。TRAE Work中国版已向全量用户免费开放。因资源有限，目前TRAE IDE暂仅向速通Ultra与优速通Express用户开放体验。豆包目前在非快速模式中上线了 Seed 2.1 Turbo。

相关链接：

字节跳动发布 Seedance 2.5：支持 30 秒视频直出与局部编辑 `#2`

字节跳动发布豆包视频生成模型Seedance 2.5，计划七月初上线。该模型支持30秒单段原生视频直出，无需后期拼接。它能接收50个全模态素材联合输入，提升复杂创作的可控性。此外，该模型支持局部视频编辑，能在保持画面一致的前提下灵活修改。

字节跳动发布了豆包视频生成模型 Seedance 2.5，并宣布该模型将于七月初正式上线。该模型实现了 30 秒单段原生视频直出，支持多达 50 个全模态素材的联合输入，能显著提升复杂创作任务的可控性。此外，Seedance 2.5 具备灵活的视频二次编辑能力，支持在保持画面一致性的前提下进行局部调整，适用于广告电商等需要素材高效迭代的场景。

相关链接：

https://mp.weixin.qq.com/s/Vnv68cHAWfcX2CnszWR6Qg

Anthropic 推出 Claude Tag，让 Claude 以团队成员身份常驻 Slack `#3`

Anthropic 推出 Claude Tag，让 Claude 作为常驻 Slack 频道的 Agent 参与团队协作。用户只需在频道内@它分配任务，Claude 就会自主拆解，并完成跨越数小时的异步工作。该功能现已向 Claude Enterprise 和 Team 客户开放 beta 测试。

Anthropic 推出 Claude Tag，这是一种让 Claude 以团队成员身份加入 Slack 频道的协作方式，团队成员 @Claude 即可分配任务，Claude 会将任务拆解为多个阶段并逐步完成后在 Slack 线程中交付结果。它支持多人共享同一 Claude 上下文、持续学习频道信息、在 ambient 模式下主动推送提醒，并可自主安排跨越数小时或数天的异步任务；官方称其内部产品团队已有 65% 的代码由 Claude Tag 生成。该功能目前以 beta 形式向 Claude Enterprise 和 Team 客户开放，底层模型为 Opus 4.8，将替代现有的 Claude in Slack 应用，管理员有 30 天迁移窗口。

相关链接：

模型发布

字节跳动发布音频生成模型 Doubao-Seed-Audio 1.0 `#4`

字节跳动发布音频生成模型 {Doubao|豆包}-Seed-Audio {1.0|一点零}。该模型支持0样本多模态输入，能直接生成包含多角色对白、情绪语气及环境音效的成片级音频。目前，火山方舟已开启该模型的API邀测，个人用户可在体验中心获得三十分钟额度进行体验。

字节跳动正式发布豆包音频生成模型1.0。该模型支持0样本多模态输入，能够在单条指令中编排多角色对白、情绪语气、背景音乐与环境音效，直接生成无需后期混音的成片级音频。同时，模型实现了音色与风格解耦，并能在长时生成中保持多角色音色一致。目前，火山方舟已开启该模型的API邀测，个人用户可在体验中心获得30分钟额度，模型后续还将上线剪映、即梦及番茄等产品。

相关链接：

https://mp.weixin.qq.com/s/iL0uyUjOMUEfudeuDP6wQQ

字节跳动发布 Seedance 2.0 升级支持原生 4K 及 10-bit 直出 `#5`

字节跳动发布并开放豆包视频模型Seedance 2.0的原生4K版API。官方称其为行业首发支持原生4K 10-bit{高位深|"高位深"}直出，全面提升了视频的色彩、动态及细节表现。

字节跳动火山引擎正式开放豆包视频生成模型 Seedance 2.0 的原生 4K 版 API。官方称该版本为行业首个支持 10-bit 高位深原生直出的模型，能从源头保留更多局部细节，在动态画面和色彩表现上实现全面提升。目前该能力已通过火山引擎正式开放调用，主要面向专业影视制作等生产场景，以帮助缩短后期制作周期。

相关链接：

字节跳动发布豆包图像模型 Seedream 5.0 Pro 将于近期上线 `#6`

字节跳动发布豆包图像创作模型 Seedream 5.0 Pro，升级交互编辑、多图层分离等四大核心能力，支持高密度信息表达。该模型预计将在近期正式上线。

字节跳动推出了豆包图像创作模型 Seedream 5.0 Pro。该模型围绕交互式精准编辑、多图层分离、高密度信息表达及原生多语种文字生成实现了全面升级。它支持通过草图、线稿或交互式框选进行精准修改，并允许用户对画面元素进行任意粒度的独立分层编辑，不仅能生成高信息密度的专业图表，还原生支持十余种语言。目前该模型已正式亮相，预计将在近期正式上线。

相关链接：

https://mp.weixin.qq.com/s/Vnv68cHAWfcX2CnszWR6Qg

即梦AI上线SeedMusic 1.0 Preview模型 `#7`

即梦AI宣布上线首个Seed音乐模型SeedMusic 1.0 Preview。官方称其具备{强提示词遵循力|"强提示词遵循力"}与专业混音效果，现已开放网页版及App体验。

即梦AI官方宣布，首个Seed音乐模型SeedMusic 1.0 Preview现已上线。官方称该模型具备行业顶尖的提示词遵循力，能够提供专业混音效果与真实乐器音色，并针对中文语境实现了清晰的发音。目前，该模型已在即梦网页版及App开放体验。

相关链接：

https://weibo.com/7902366905/R5jNrhwjY?pagetype=detail

Mistral AI 发布 Mistral OCR 4 模型支持输出结构化数据与自托管 `#8`

Mistral AI 发布了 Mistral OCR 4 模型，支持提取文本并输出包含边界框和分块分类的结构化数据，覆盖 170 种语言。官方称其性能领先，在 OlmOCRBench 测试中取得 85.20 的最高分。该模型现已通过 API 及多个云平台开放。

Mistral AI 正式发布 Mistral OCR 4 模型，该模型不仅提取文档文本，还为每个内容块提供边界框、类型分类以及内联置信度分数。官方称，在覆盖 12 种以上语言的 600 多份真实文档盲测中，独立标注员对 OCR 4 的偏好胜率平均达到 72%，并在公开的 OlmOCRBench 测试中取得 85.20 的最高分。目前，用户可通过 API、Mistral Studio、Amazon SageMaker 和 Microsoft Foundry 使用该模型，即将登陆 Snowflake Parse Document，企业客户还可选择在单一容器中进行自托管部署。

相关链接：

Krea 宣布开放 12B 参数图像生成模型 Krea 2 Raw 与 Turbo 的权重 `#9`

Krea 宣布开放 Krea 2 文本生成图像模型权重，包括 Krea 2 Raw 和 Krea 2 Turbo 两个版本，模型基于 120 亿参数，权重已可在 Hugging Face 下载。

Krea 官方宣布开放 Krea 2 文本生成图像模型权重，包含 Krea 2 Raw 和 Krea 2 Turbo 两个版本，均基于 120 亿参数 Diffusion Transformer 架构，由 Krea.ai, Inc. 开发，权重已上传至 Hugging Face 平台。其中 Krea 2 Raw 为来自中间训练阶段的未蒸馏基础版本，适合微调与后训练；Krea 2 Turbo 为蒸馏和后训练版本，可在消费级硬件上快速生成 2K 原生分辨率图像。官方提出的核心理念为"在 Raw 上训练，用 Turbo 生成"，模型采用 Krea 2 Community License，官方称该许可灵活，允许个人和小型公司商业使用。

相关链接：

Catnip AI 发布 22B 实时音视频模型 MaineCoon `#10`

Catnip AI 发布了 22B 实时音视频模型 MaineCoon。官方称其为首个流原生 {T2AV|Text-to-Audio-Visual} 模型，它接收文本后不到一秒即可生成首帧，支持连续生成超十分钟的稳定音视频内容。目前，相关代码与体验入口已公开。

Catnip AI 团队发布了 22B 参数的实时自回归音视基础模型 MaineCoon，并同步公开了相关代码、技术博客与体验平台。官方称其为首个流原生 T2AV 模型，它在接收文本后可在 1 秒内生成首帧并持续产出音视频流；配合其 Agentic 推理框架，该模型能够维持超过 10 分钟的稳定连贯生成。官方数据显示，该模型在单张 H100 GPU 上的端到端生成速度约为此前同类系统的 7 倍，并在团队推出的 SocialVideo-Bench 中取得最高分。

相关链接：

开发生态

Hermes Agent 支持 /learn 自动生成可复用技能 `#11`

Hermes Agent 上线 /learn 命令。用户提供代码、PDF 或网页链接等任意参考材料，Agent 即可自动提炼并生成可验证的复用技能，该功能现已适配命令行、TUI 与仪表板等多端。

Nous Research 官方宣布 Hermes Agent 推出 /learn 命令，支持将各类已有资料转化为无需手写 SKILL.md 的可复用技能。用户只需向其提供本地目录、在线网页、过往会话或粘贴的操作笔记等任意材料，Agent 便会利用现有工具收集信息，并按照内部规范生成技能。该功能在 CLI、Messaging Gateway、TUI 和仪表板中的运行逻辑保持一致，适用于本地、Docker 或远程等所有后端环境。此外，若用户开启了写入批准门控，生成技能的保存过程将受到该权限的严格限制。

相关链接：

Qoder 上线全系产品夜间折扣 `#12`

Qoder 宣布为其全系产品上线夜间折扣机制。即日起，每晚指定时段内，Pro Trial 及以上用户使用 Qwen3.7 系列模型执行任务，可自动享受最低 2 折的计费优惠，且模型能力保持不变。

Qoder 宣布为其全系产品上线夜间折扣机制，覆盖中国版、国际版、个人版与 Teams 版。在每晚 22:00 至次日 08:00（北京时间），用户选用 Qwen3.7-Max 的 Credits 倍率降至 0.1×（相当于 2 折），选用 Qwen3.7-Plus 降至 0.04×（相当于 4 折），折扣期间模型能力完全相同。该政策无需报名兑换，对 Pro Trial、Pro 和 Teams 用户自动生效，且暂无结束时间。需注意的是，夜间折扣消耗的是用户原有的月度 Credits 额度，非额外赠送，且部分本地运行的产品需保持设备唤醒状态才能执行任务。

相关链接：

https://mp.weixin.qq.com/s/eSi-XbY1dFRoQ-vnvwR8nA

IBM Research 推出开源 Agent 框架 CUGA `#13`

IBM Research 发布开源企业级 Agent Harness “CUGA”。该框架内置了状态管理、长程规划与自我纠错能力，官方称其已在 AppWorld 和 WebArena 基准测试中登顶。

IBM Research 推出开源 Agent Harness “CUGA”，以接管 Agent 开发中的底层编排工作。开发者仅需定义工具列表和提示词，CUGA 即可自动处理状态管理、长程规划与自我纠错。官方称该框架已在 AppWorld 和 WebArena 基准测试中名列第一，目前已在 GitHub 开放源码，并通过 pip install cuga 提供。

相关链接：

小米开源全屋智能方案 Miloco 2.0 `#14`

小米开源全屋智能方案Miloco 2.0，以米家摄像头为感知入口，依托自研MiMo大模型与Agent，在OpenClaw平台主动联动全屋设备，目前支持macOS与Linux。

小米在 GitHub 开源了全屋智能 AI 方案 Miloco 2.0。该方案重构为 OpenClaw 插件，以米家摄像头为感知入口，依托自研 MiMo 大模型新增了通用常识、身份识别、家庭记忆、家庭任务、主动智能及家庭面板六大核心特性。系统能够识别家庭成员与危险隐患，基于沉淀的记忆自主拆解并执行复杂的家庭任务。该项目暂不支持原生 Windows，且由于日常感知与 Agent 依赖云端大模型，使用过程中将持续产生 API 调用费用。

相关链接：

https://github.com/XiaoMi/xiaomi-miloco

产品应用

Meta 推出 299 美元无 Ray-Ban 品牌智能眼镜 `#15`

Meta 与 EssilorLuxottica 合作推出去除 Ray-Ban 品牌的全新 Meta Glasses 智能眼镜，起售价 299 美元。该系列首发搭载由 Muse Spark 驱动的 Meta AI，现已在全球多国上架销售。

Meta 与 EssilorLuxottica 推出全新的 Meta Glasses 智能眼镜，起售价定为 299 美元，据媒体报道这比此前的 Ray-Ban Meta Gen 2 便宜约 80 美元。新系列包含三种框型及 26 种款式，出厂首发搭载由 Muse Spark 模型驱动的 Meta AI，并采用可调节鼻托与镜腿设计。该产品即日起在美国、英国、加拿大及澳大利亚等全球多国发售，支持处方镜片。

相关链接：

https://www.meta.com/blog/introducing-meta-glasses-a-range-of-new-styles-from-meta-and-essilorluxottica-starting-at-299/

行业动态

Hermes Agent 与 OpenClaw 创始人爆发公开争端 `#16`

Hermes Agent 与 OpenClaw 创始人近日爆发公开争端。起因是 OpenClaw 创始人暗指竞品受风投控制，Hermes Agent 创始人 Teknium 随后激烈反击，嘲讽对方从被风投资助的“非营利”组织OpenAI赚取高额工资，双方就资金与安全性各执一词。

近日，OpenClaw 创始人 Peter Steinberger 发文称其创立了非营利组织，并暗指竞争对手依赖风投资金且带有其他目的，同时指责对方复制功能但缺乏安全加固。Hermes Agent 创始人 Teknium 对此强烈反击，认为该言论是对其组织的恶意影射，并嘲讽对方依靠被风投资助的“非营利”组织OpenAI发放高薪的“非营利”模式。此次争端引发了社区对两款 Agent 产品在安全性与稳定性的广泛讨论。事件起因疑似为 Teknium 宣布 Hermes Agent 达成了 20 万 GitHub Star 的里程碑。

AI推理独角兽Baseten完成15亿美元F轮融资 `#17`

据媒体报道，美国AI基础设施独角兽Baseten宣布完成15亿美元F轮融资，投后估值达130亿美元，资金将用于扩大算力基础设施。

据媒体报道，美国旧金山AI推理基础设施独角兽Baseten宣布完成15亿美元F轮融资，对应投后估值为130亿美元，这是其18个月内第四轮融资。本轮融资由Altimeter Capital等多家风投机构领投，Baseten计划将新资金用于扩大算力基础设施、软件研发和团队招聘。该公司主要为企业部署开源或定制AI模型提供全套系统软件，官方称其过去一年营收同比增长约20倍，客户使用其平台后推理成本通常可降低40%以上。

相关链接：

https://zhidx.com/p/568412.html

前瞻与传闻

企业微信启动AI Agent“大圆”内测 `#18`

据媒体报道，企业微信启动代号“大圆”的AI Agent内测。该助理支持移动端左滑唤起，能结合工作流数据自动回复用户诉求，目前部分功能正处于灰度测试中。

据媒体报道，企业微信启动代号“大圆”的AI Agent内测。该产品定位为长在工作流里的AI助理，用户在移动端左滑即可唤起，它能自动理解当前界面及问题，并基于群聊、文档、会议、邮件等数据给出回复。同时，该产品正在灰度测试“服务总结”功能，可自动提炼客户需求并推送跟进建议，管理侧也能自动生成数据分析仪表盘。

相关链接：

https://www.ithome.com/0/967/576.htm

提示：内容由AI辅助创作，可能存在幻觉和错误。

查看网页全文 · 查看 Markdown

AI 早报 2026-06-24 — 字节跳动发布豆包大模型 2.1 与 Seedance 2.5、Claude Tag 上线 Slack

概览

要闻

模型发布

开发生态

产品应用

行业动态

前瞻与传闻

要闻

字节跳动发布豆包大模型2.1系列 #1

字节跳动发布 Seedance 2.5：支持 30 秒视频直出与局部编辑 #2

Anthropic 推出 Claude Tag，让 Claude 以团队成员身份常驻 Slack #3

模型发布

字节跳动发布音频生成模型 Doubao-Seed-Audio 1.0 #4

字节跳动发布 Seedance 2.0 升级支持原生 4K 及 10-bit 直出 #5

字节跳动发布豆包图像模型 Seedream 5.0 Pro 将于近期上线 #6

即梦AI上线SeedMusic 1.0 Preview模型 #7

Mistral AI 发布 Mistral OCR 4 模型 支持输出结构化数据与自托管 #8

Krea 宣布开放 12B 参数图像生成模型 Krea 2 Raw 与 Turbo 的权重 #9

Catnip AI 发布 22B 实时音视频模型 MaineCoon #10

开发生态

Hermes Agent 支持 /learn 自动生成可复用技能 #11

Qoder 上线全系产品夜间折扣 #12

IBM Research 推出开源 Agent 框架 CUGA #13

小米开源全屋智能方案 Miloco 2.0 #14

产品应用

Meta 推出 299 美元无 Ray-Ban 品牌智能眼镜 #15

行业动态

Hermes Agent 与 OpenClaw 创始人爆发公开争端 #16

AI推理独角兽Baseten完成15亿美元F轮融资 #17

前瞻与传闻

企业微信启动AI Agent“大圆”内测 #18

字节跳动发布豆包大模型2.1系列 `#1`

字节跳动发布 Seedance 2.5：支持 30 秒视频直出与局部编辑 `#2`

Anthropic 推出 Claude Tag，让 Claude 以团队成员身份常驻 Slack `#3`

字节跳动发布音频生成模型 Doubao-Seed-Audio 1.0 `#4`

字节跳动发布 Seedance 2.0 升级支持原生 4K 及 10-bit 直出 `#5`

字节跳动发布豆包图像模型 Seedream 5.0 Pro 将于近期上线 `#6`

即梦AI上线SeedMusic 1.0 Preview模型 `#7`

Mistral AI 发布 Mistral OCR 4 模型支持输出结构化数据与自托管 `#8`

Krea 宣布开放 12B 参数图像生成模型 Krea 2 Raw 与 Turbo 的权重 `#9`

Catnip AI 发布 22B 实时音视频模型 MaineCoon `#10`

Hermes Agent 支持 /learn 自动生成可复用技能 `#11`

Qoder 上线全系产品夜间折扣 `#12`

IBM Research 推出开源 Agent 框架 CUGA `#13`

小米开源全屋智能方案 Miloco 2.0 `#14`

Meta 推出 299 美元无 Ray-Ban 品牌智能眼镜 `#15`

Hermes Agent 与 OpenClaw 创始人爆发公开争端 `#16`

AI推理独角兽Baseten完成15亿美元F轮融资 `#17`

企业微信启动AI Agent“大圆”内测 `#18`