概览
要闻
- 字节跳动发布豆包大模型2.1系列 ↗
#1 - 字节跳动发布 Seedance 2.5:支持 30 秒视频直出与局部编辑 ↗
#2 - Anthropic 推出 Claude Tag,让 Claude 以团队成员身份常驻 Slack ↗
#3
模型发布
- 字节跳动发布音频生成模型 Doubao-Seed-Audio 1.0 ↗
#4 - 字节跳动发布 Seedance 2.0 升级支持原生 4K 及 10-bit 直出 ↗
#5 - 字节跳动发布豆包图像模型 Seedream 5.0 Pro 将于近期上线 ↗
#6 - 即梦AI上线SeedMusic 1.0 Preview模型 ↗
#7 - Mistral AI 发布 Mistral OCR 4 模型 支持输出结构化数据与自托管 ↗
#8 - Krea 宣布开放 12B 参数图像生成模型 Krea 2 Raw 与 Turbo 的权重 ↗
#9 - Catnip AI 发布 22B 实时音视频模型 MaineCoon ↗
#10
开发生态
- Hermes Agent 支持 /learn 自动生成可复用技能 ↗
#11 - Qoder 上线全系产品夜间折扣 ↗
#12 - IBM Research 推出开源 Agent 框架 CUGA ↗
#13 - 小米开源全屋智能方案 Miloco 2.0 ↗
#14
产品应用
- Meta 推出 299 美元无 Ray-Ban 品牌智能眼镜 ↗
#15
行业动态
- Hermes Agent 与 OpenClaw 创始人爆发公开争端
#16 - AI推理独角兽Baseten完成15亿美元F轮融资 ↗
#17
前瞻与传闻
- 企业微信启动AI Agent“大圆”内测 ↗
#18
要闻
字节跳动发布豆包大模型2.1系列 #1
字节跳动发布面向真实生产力场景的Seed {2.1|二点一}系列模型,包含Seed-2.1-pro与Seed-2.1-turbo,以及聚焦Coding和Agent场景的快速迭代模型Seed-{Evolving|"Evolving"}。该系列模型上下文窗口为256K,支持多模态输入。官方称在通用Agent与代码交付能力上全面提升。目前,该系列模型API已全量上线火山方舟,{TRAE|"TRAE"} Work中国版已面向全量用户免费开放体验,{TRAE|"TRAE"} IDE中暂仅向高级付费用户开放,豆包在非快速模式中上线了 Seed 2.1 Turbo。
字节跳动Seed团队正式发布豆包大模型2.1系列,涵盖旗舰模型Doubao-Seed-2.1-pro与规模化调用模型Doubao-Seed-2.1-turbo,还进一步推出进一步推出 Doubao-Seed-Evolving,聚焦 Coding 和 Agent 场景,以每月2~4次的速度快速迭代。该系列模型上下文窗口为256K,支持多模态输入。官方称2.1系列在通用Agent任务交付、企业级代码工程端到端Coding以及多模态理解能力上均有显著提升,并在GDPval、Terminal Bench 2.1等多项基准测试中取得领先成绩。目前该系列模型API已全量上线火山方舟。TRAE Work中国版已向全量用户免费开放。因资源有限,目前TRAE IDE暂仅向速通Ultra与优速通Express用户开放体验。豆包目前在非快速模式中上线了 Seed 2.1 Turbo。




相关链接:
字节跳动发布 Seedance 2.5:支持 30 秒视频直出与局部编辑 #2
字节跳动发布豆包视频生成模型Seedance 2.5,计划七月初上线。该模型支持30秒单段原生视频直出,无需后期拼接。它能接收50个全模态素材联合输入,提升复杂创作的可控性。此外,该模型支持局部视频编辑,能在保持画面一致的前提下灵活修改。
字节跳动发布了豆包视频生成模型 Seedance 2.5,并宣布该模型将于七月初正式上线。该模型实现了 30 秒单段原生视频直出,支持多达 50 个全模态素材的联合输入,能显著提升复杂创作任务的可控性。此外,Seedance 2.5 具备灵活的视频二次编辑能力,支持在保持画面一致性的前提下进行局部调整,适用于广告电商等需要素材高效迭代的场景。

相关链接:
Anthropic 推出 Claude Tag,让 Claude 以团队成员身份常驻 Slack #3
Anthropic 推出 Claude Tag,让 Claude 作为常驻 Slack 频道的 Agent 参与团队协作。用户只需在频道内@它分配任务,Claude 就会自主拆解,并完成跨越数小时的异步工作。该功能现已向 Claude Enterprise 和 Team 客户开放 beta 测试。
Anthropic 推出 Claude Tag,这是一种让 Claude 以团队成员身份加入 Slack 频道的协作方式,团队成员 @Claude 即可分配任务,Claude 会将任务拆解为多个阶段并逐步完成后在 Slack 线程中交付结果。它支持多人共享同一 Claude 上下文、持续学习频道信息、在 ambient 模式下主动推送提醒,并可自主安排跨越数小时或数天的异步任务;官方称其内部产品团队已有 65% 的代码由 Claude Tag 生成。该功能目前以 beta 形式向 Claude Enterprise 和 Team 客户开放,底层模型为 Opus 4.8,将替代现有的 Claude in Slack 应用,管理员有 30 天迁移窗口。

相关链接:
- https://www.anthropic.com/news/introducing-claude-tag
- https://claude.com/blog/agent-identity-access-model
- https://www.claude.com/docs/claude-tag/overview
- https://www.claude.com/product/tag
模型发布
字节跳动发布音频生成模型 Doubao-Seed-Audio 1.0 #4
字节跳动发布音频生成模型 {Doubao|豆包}-Seed-Audio {1.0|一点零}。该模型支持0样本多模态输入,能直接生成包含多角色对白、情绪语气及环境音效的成片级音频。目前,火山方舟已开启该模型的API邀测,个人用户可在体验中心获得三十分钟额度进行体验。
字节跳动正式发布豆包音频生成模型1.0。该模型支持0样本多模态输入,能够在单条指令中编排多角色对白、情绪语气、背景音乐与环境音效,直接生成无需后期混音的成片级音频。同时,模型实现了音色与风格解耦,并能在长时生成中保持多角色音色一致。目前,火山方舟已开启该模型的API邀测,个人用户可在体验中心获得30分钟额度,模型后续还将上线剪映、即梦及番茄等产品。


相关链接:
字节跳动发布 Seedance 2.0 升级支持原生 4K 及 10-bit 直出 #5
字节跳动发布并开放豆包视频模型Seedance 2.0的原生4K版API。官方称其为行业首发支持原生4K 10-bit{高位深|"高位深"}直出,全面提升了视频的色彩、动态及细节表现。
字节跳动火山引擎正式开放豆包视频生成模型 Seedance 2.0 的原生 4K 版 API。官方称该版本为行业首个支持 10-bit 高位深原生直出的模型,能从源头保留更多局部细节,在动态画面和色彩表现上实现全面提升。目前该能力已通过火山引擎正式开放调用,主要面向专业影视制作等生产场景,以帮助缩短后期制作周期。

相关链接:
字节跳动发布豆包图像模型 Seedream 5.0 Pro 将于近期上线 #6
字节跳动发布豆包图像创作模型 Seedream 5.0 Pro,升级交互编辑、多图层分离等四大核心能力,支持高密度信息表达。该模型预计将在近期正式上线。
字节跳动推出了豆包图像创作模型 Seedream 5.0 Pro。该模型围绕交互式精准编辑、多图层分离、高密度信息表达及原生多语种文字生成实现了全面升级。它支持通过草图、线稿或交互式框选进行精准修改,并允许用户对画面元素进行任意粒度的独立分层编辑,不仅能生成高信息密度的专业图表,还原生支持十余种语言。目前该模型已正式亮相,预计将在近期正式上线。

相关链接:
即梦AI上线SeedMusic 1.0 Preview模型 #7
即梦AI宣布上线首个Seed音乐模型SeedMusic 1.0 Preview。官方称其具备{强提示词遵循力|"强提示词遵循力"}与专业混音效果,现已开放网页版及App体验。
即梦AI官方宣布,首个Seed音乐模型SeedMusic 1.0 Preview现已上线。官方称该模型具备行业顶尖的提示词遵循力,能够提供专业混音效果与真实乐器音色,并针对中文语境实现了清晰的发音。目前,该模型已在即梦网页版及App开放体验。

相关链接:
Mistral AI 发布 Mistral OCR 4 模型 支持输出结构化数据与自托管 #8
Mistral AI 发布了 Mistral OCR 4 模型,支持提取文本并输出包含边界框和分块分类的结构化数据,覆盖 170 种语言。官方称其性能领先,在 OlmOCRBench 测试中取得 85.20 的最高分。该模型现已通过 API 及多个云平台开放。
Mistral AI 正式发布 Mistral OCR 4 模型,该模型不仅提取文档文本,还为每个内容块提供边界框、类型分类以及内联置信度分数。官方称,在覆盖 12 种以上语言的 600 多份真实文档盲测中,独立标注员对 OCR 4 的偏好胜率平均达到 72%,并在公开的 OlmOCRBench 测试中取得 85.20 的最高分。目前,用户可通过 API、Mistral Studio、Amazon SageMaker 和 Microsoft Foundry 使用该模型,即将登陆 Snowflake Parse Document,企业客户还可选择在单一容器中进行自托管部署。


相关链接:
Krea 宣布开放 12B 参数图像生成模型 Krea 2 Raw 与 Turbo 的权重 #9
Krea 宣布开放 Krea 2 文本生成图像模型权重,包括 Krea 2 Raw 和 Krea 2 Turbo 两个版本,模型基于 120 亿参数,权重已可在 Hugging Face 下载。
Krea 官方宣布开放 Krea 2 文本生成图像模型权重,包含 Krea 2 Raw 和 Krea 2 Turbo 两个版本,均基于 120 亿参数 Diffusion Transformer 架构,由 Krea.ai, Inc. 开发,权重已上传至 Hugging Face 平台。其中 Krea 2 Raw 为来自中间训练阶段的未蒸馏基础版本,适合微调与后训练;Krea 2 Turbo 为蒸馏和后训练版本,可在消费级硬件上快速生成 2K 原生分辨率图像。官方提出的核心理念为"在 Raw 上训练,用 Turbo 生成",模型采用 Krea 2 Community License,官方称该许可灵活,允许个人和小型公司商业使用。


相关链接:
- https://www.krea.ai/blog/krea-2-technical-report
- https://huggingface.co/krea/Krea-2-Turbo
- https://huggingface.co/krea/Krea-2-Raw
- https://github.com/krea-ai/krea-2
Catnip AI 发布 22B 实时音视频模型 MaineCoon #10
Catnip AI 发布了 22B 实时音视频模型 MaineCoon。官方称其为首个流原生 {T2AV|Text-to-Audio-Visual} 模型,它接收文本后不到一秒即可生成首帧,支持连续生成超十分钟的稳定音视频内容。目前,相关代码与体验入口已公开。
Catnip AI 团队发布了 22B 参数的实时自回归音视基础模型 MaineCoon,并同步公开了相关代码、技术博客与体验平台。官方称其为首个流原生 T2AV 模型,它在接收文本后可在 1 秒内生成首帧并持续产出音视频流;配合其 Agentic 推理框架,该模型能够维持超过 10 分钟的稳定连贯生成。官方数据显示,该模型在单张 H100 GPU 上的端到端生成速度约为此前同类系统的 7 倍,并在团队推出的 SocialVideo-Bench 中取得最高分。

相关链接:
开发生态
Hermes Agent 支持 /learn 自动生成可复用技能 #11
Hermes Agent 上线 /learn 命令。用户提供代码、PDF 或网页链接等任意参考材料,Agent 即可自动提炼并生成可验证的复用技能,该功能现已适配命令行、TUI 与仪表板等多端。
Nous Research 官方宣布 Hermes Agent 推出 /learn 命令,支持将各类已有资料转化为无需手写 SKILL.md 的可复用技能。用户只需向其提供本地目录、在线网页、过往会话或粘贴的操作笔记等任意材料,Agent 便会利用现有工具收集信息,并按照内部规范生成技能。该功能在 CLI、Messaging Gateway、TUI 和仪表板中的运行逻辑保持一致,适用于本地、Docker 或远程等所有后端环境。此外,若用户开启了写入批准门控,生成技能的保存过程将受到该权限的严格限制。

相关链接:
- https://hermes-agent.nousresearch.com/docs/user-guide/features/skills
- https://x.com/NousResearch/status/2069526242236182697
Qoder 上线全系产品夜间折扣 #12
Qoder 宣布为其全系产品上线夜间折扣机制。即日起,每晚指定时段内,Pro Trial 及以上用户使用 Qwen3.7 系列模型执行任务,可自动享受最低 2 折的计费优惠,且模型能力保持不变。
Qoder 宣布为其全系产品上线夜间折扣机制,覆盖中国版、国际版、个人版与 Teams 版。在每晚 22:00 至次日 08:00(北京时间),用户选用 Qwen3.7-Max 的 Credits 倍率降至 0.1×(相当于 2 折),选用 Qwen3.7-Plus 降至 0.04×(相当于 4 折),折扣期间模型能力完全相同。该政策无需报名兑换,对 Pro Trial、Pro 和 Teams 用户自动生效,且暂无结束时间。需注意的是,夜间折扣消耗的是用户原有的月度 Credits 额度,非额外赠送,且部分本地运行的产品需保持设备唤醒状态才能执行任务。

相关链接:
IBM Research 推出开源 Agent 框架 CUGA #13
IBM Research 发布开源企业级 Agent Harness “CUGA”。该框架内置了状态管理、长程规划与自我纠错能力,官方称其已在 AppWorld 和 WebArena 基准测试中登顶。
IBM Research 推出开源 Agent Harness “CUGA”,以接管 Agent 开发中的底层编排工作。开发者仅需定义工具列表和提示词,CUGA 即可自动处理状态管理、长程规划与自我纠错。官方称该框架已在 AppWorld 和 WebArena 基准测试中名列第一,目前已在 GitHub 开放源码,并通过 pip install cuga 提供。

相关链接:
小米开源全屋智能方案 Miloco 2.0 #14
小米开源全屋智能方案Miloco 2.0,以米家摄像头为感知入口,依托自研MiMo大模型与Agent,在OpenClaw平台主动联动全屋设备,目前支持macOS与Linux。
小米在 GitHub 开源了全屋智能 AI 方案 Miloco 2.0。该方案重构为 OpenClaw 插件,以米家摄像头为感知入口,依托自研 MiMo 大模型新增了通用常识、身份识别、家庭记忆、家庭任务、主动智能及家庭面板六大核心特性。系统能够识别家庭成员与危险隐患,基于沉淀的记忆自主拆解并执行复杂的家庭任务。该项目暂不支持原生 Windows,且由于日常感知与 Agent 依赖云端大模型,使用过程中将持续产生 API 调用费用。
相关链接:
产品应用
Meta 推出 299 美元无 Ray-Ban 品牌智能眼镜 #15
Meta 与 EssilorLuxottica 合作推出去除 Ray-Ban 品牌的全新 Meta Glasses 智能眼镜,起售价 299 美元。该系列首发搭载由 Muse Spark 驱动的 Meta AI,现已在全球多国上架销售。
Meta 与 EssilorLuxottica 推出全新的 Meta Glasses 智能眼镜,起售价定为 299 美元,据媒体报道这比此前的 Ray-Ban Meta Gen 2 便宜约 80 美元。新系列包含三种框型及 26 种款式,出厂首发搭载由 Muse Spark 模型驱动的 Meta AI,并采用可调节鼻托与镜腿设计。该产品即日起在美国、英国、加拿大及澳大利亚等全球多国发售,支持处方镜片。

相关链接:
行业动态
Hermes Agent 与 OpenClaw 创始人爆发公开争端 #16
Hermes Agent 与 OpenClaw 创始人近日爆发公开争端。起因是 OpenClaw 创始人暗指竞品受风投控制,Hermes Agent 创始人 Teknium 随后激烈反击,嘲讽对方从被风投资助的“非营利”组织OpenAI赚取高额工资,双方就资金与安全性各执一词。
近日,OpenClaw 创始人 Peter Steinberger 发文称其创立了非营利组织,并暗指竞争对手依赖风投资金且带有其他目的,同时指责对方复制功能但缺乏安全加固。Hermes Agent 创始人 Teknium 对此强烈反击,认为该言论是对其组织的恶意影射,并嘲讽对方依靠被风投资助的“非营利”组织OpenAI发放高薪的“非营利”模式。此次争端引发了社区对两款 Agent 产品在安全性与稳定性的广泛讨论。事件起因疑似为 Teknium 宣布 Hermes Agent 达成了 20 万 GitHub Star 的里程碑。


AI推理独角兽Baseten完成15亿美元F轮融资 #17
据媒体报道,美国AI基础设施独角兽Baseten宣布完成15亿美元F轮融资,投后估值达130亿美元,资金将用于扩大算力基础设施。
据媒体报道,美国旧金山AI推理基础设施独角兽Baseten宣布完成15亿美元F轮融资,对应投后估值为130亿美元,这是其18个月内第四轮融资。本轮融资由Altimeter Capital等多家风投机构领投,Baseten计划将新资金用于扩大算力基础设施、软件研发和团队招聘。该公司主要为企业部署开源或定制AI模型提供全套系统软件,官方称其过去一年营收同比增长约20倍,客户使用其平台后推理成本通常可降低40%以上。
相关链接:
前瞻与传闻
企业微信启动AI Agent“大圆”内测 #18
据媒体报道,企业微信启动代号“大圆”的AI Agent内测。该助理支持移动端左滑唤起,能结合工作流数据自动回复用户诉求,目前部分功能正处于灰度测试中。
据媒体报道,企业微信启动代号“大圆”的AI Agent内测。该产品定位为长在工作流里的AI助理,用户在移动端左滑即可唤起,它能自动理解当前界面及问题,并基于群聊、文档、会议、邮件等数据给出回复。同时,该产品正在灰度测试“服务总结”功能,可自动提炼客户需求并推送跟进建议,管理侧也能自动生成数据分析仪表盘。
相关链接:
提示:内容由AI辅助创作,可能存在幻觉和错误。
