行业分类:
加载中...
头条分类:
加载中...
清华唐杰正面硬刚马斯克:中国AI达到Fable水平,还要更快
新智元报道 【新智元导读】硅谷教父Marc Andreessen亲自转发唐杰的回应,附上「Interesting」。这件事彻底出圈了。中国AI大佬正面硬刚马斯克的预测,意味着什么?或许,美国把一切都搞反了。 Anthropic的Fable 5,何时能被追上? 马斯克在X上只回了2个单词——「Probably Q1.」(可能明年第一季度。) 中国AI,大概明年第一季度,就能追上Anthropic最顶尖的Fable级别。 然后,清华大学教授、智谱AI创始人唐杰,秒回:「Won‘t take that long.」(不用等那么久。) 你正走在一条浓雾弥漫的赛道上,原本以为领先对手几公里。结果一回头,你才发现对方的呼吸声已经喷到了你的脖子上。 这就是马斯克现在的感受。 谁能想到,中国AI的领军人物之一直接「掀了桌子」。 紧接着,z.ai官方账号也回以三个「记笔记」的表情。 这种姿态,不是在谦虚,而是在叫牌。 它在向世界宣告:2027?太慢了。我们的表针,拨在2026,甚至更早。 中国AI大佬正面硬刚马斯克 今年就达到Fable级别! 时间往前拨六天。 6月12日,美国商务部突然出手:宣布对Anthropic旗下的Fable 5和Mythos 5实施全球出口管制,向中国用户直接关门。 封了。 结果,仅仅24小时后,智谱AI发布了GLM-5.2。 在Code Arena中,超越Claude Opus 4.7/4.8(Thinking),直逼Claude Fable 5。 在BridgeBench推理榜上, GLM 5.2拿下全球第一——推理分数42.8,击败被封锁的Fable 5。 速度300 tokens/秒,成本是美国前沿模型的1/10,全权重开源,全球任意下载。 BridgeBench官方直言,GLM 5.2是他们测试过的最好的中文开源模型。 GLM 5.2用实力证明: 「You cannot export control your way out of open source. The ban didn't slow China down.」 (你无法通过出口管制来摆脱开源。禁令并没有拖慢中国的脚步。) 正是这个背景下,技术博主@teortaxesTex发出了那条引爆讨论的分析帖: 中国AI和美国前沿之间,现在大概只剩7个月代差了。 那照这个速度,什么时候追上Fable? 马斯克公开预测中国AI模型将在2027年第一季度(即明年年初)达到Anthropic旗下最顶尖的Fable/Mythos级水平。 这意味着,Anthropic CEO的节奏被打乱,他所说的「好结局」要求到2028年实现「12到24个月的差距」。 具体来说:这至少意味着到2028年1月,中国最优秀的模型最多只能达到美国2027年1月最优秀模型的水平。 针对这一预测,智谱AI官方及清华大学唐杰教授迅速作出回应,暗示这一突破甚至可能会来得更快。 即便如此,马斯克仍吹捧Anthropic: 即便在跑分上看,中国AI在明年首季的跨越都将极其令人惊艳。 但从「实际落地价值和创造营收」的真正实用性来看,Anthropic优势更大。 不禁让人怀疑马斯克是否被Claude洗脑? 硅谷投资大佬Marc Andreessen也进场,转发回应,附上「Interesting」。 硅谷教父亲自盖章,这件事就算彻底出圈了。 美国出口管制,限制不了开源AI 美国出口管制的逻辑是:限制前沿AI模型的获取,以防止对手使用它们。 问题在于,这一逻辑成立的前提是,相关模型没有可比的替代品。 但这个假设在48小时内就被打破了。 有三点让「你无法通过出口管制摆脱开源」这一论点在此刻尤为尖锐: 开源权重可自由流通。 对封闭API的出口管制是可以执行的。 但对开源权重的出口管制则完全是另一个问题——权重存在于多个司法管辖区的服务器上,无需开源AI的介入即可被重新分发。 开放与闭源模型之间的性能差距可能是暂时的,而开源平台的战略优势却显得越来越持久。 能力差距已经缩小。 一年前,美国的前沿模型还有显著的质量领先优势。 Stanford AI Index 2026报道: 到今年3月,美国顶尖模型领先2.7%,这一差距在过去一年中虽有波动,但始终保持在个位数以内。 如今,GLM-5.2在至少一个主要推理基准上击败了Fable 5。 过去认为长时程、复杂逻辑代码任务(Long-horizon agentic coding)是闭源实验室的专利,但智谱的突破证明:开源/权重开放模型已经具备了深度的「行动力」。 AI能力「护城河」的价值已经缩水。 价格信号正对美国实验室不利。 GLM-5.2以十分之一的成本和300 tok/s的速度,并不是一个「安慰奖」,这是「绝招」:对于很大一部分工作负载来说,它是更好的产品。禁令反而促使开发者加速转向他们原本可能忽略的替代方案。 Uber CTO透露公司2026年AI编码工具预算仅4个月就耗尽,主因就是Claude Code采用激增。 据报道。Microsoft取消大量内部Claude Code许可,转向自有GitHub Copilot。 多家企业实施token限额、从订阅转向按量付费或「token最小化」策略: 开源模型正遵循Christensen颠覆创新路径——成本优势(常低90%)+ 定制化 + 数据主权,快速侵蚀闭源在规模化部署中的优势,重演历史上的Linux、Android等颠覆案例。 更不用说,美国的AI巨头的「末日论」和对算力的垄断,似乎正在得罪几乎所有人:超大规模云厂商、半导体公司、生态系统伙伴、客户、政府机构,甚至部分公众。 它们的资产负债表和现金流也不足以支撑其目标规模的增长和基础设施建设,迫使它们反复向投资者和资本市场寻求越来越大规模的融资。 那么,那个让许多人奉它们为必然赢家、视其为所到之处皆构成生存威胁的护城河,到底是什么? 大家都以为闭源的AI巨头是终局赢家,但实际上,他们可能只是为真正的行业巨头和效率型实验室开路的先锋。 也许,美国把一切都搞反了——一边把每一个现有巨头都当作面临生存威胁,一边又把前沿模型公司奉为AI时代必然的赢家,认为它们理应享有天价估值和最大份额的战利品。
超越SONIC!人形机器人“小脑”的GPT时刻来了,还有史上最大动捕数据,整整20亿帧
编辑|Panda、泽南 当人形机器人仍停留在「见过才会、练过才行」的样本拟合阶段,难以应对新动作、新指令与分布外任务时,银河通用最新发布全球首个小脑 GPT 基模 AstraBrain‑WBC 0.5,全球首个成功验证运动控制 Scaling Law。 银河通用团队用史上最大、整整 20 亿帧的动捕数据,训练出了全球首个人形机器人全身实时运控基座大模型,该模型零样本泛化全新动作,成功率从 MLP 架构的 76.89% 跃至 92.58%,推理延迟仅 0.39ms,效果超越英伟达 SONIC,甚至比目前业内主流 TWIST 系统速度提升至五倍。首次实现领域外分布(OOD)数据的泛化能力,这一研究成果堪比大模型的 GPT-1 时刻,填补人形机器人通用小脑研究的行业空白。 这个工作还被全面开源了出来。 论文标题:Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking 论文地址:arxiv.org/abs/2606.03985 代码地址:https://github.com/GalaxyGeneralRobotics/Humanoid-GPT/ 这项研究的出发点其实很纯粹:把数据堆到原来同类研究的 200 倍以上,换一个 GPT 风格的 Transformer 架构,然后看看 Scaling Law 到底管不管用? 结论很直接:管用,而且很管用。 银河通用率先迈进了这片无人区,用对底层运控能力的突破树立了行业的新标杆。 数据说话:Scaling Law 在人形机器人上成立! Scaling Law 到底在物理世界管不管用?AstraBrain-WBC 0.5 证明它管用了,有三组数据为证! 第一组:架构和规模的双重 Scaling ,效果叠加 研究团队在标准的 AMASS 测试集(训练时未见过的动作子集)上,系统比较了不同架构和不同数据量的组合。同样使用 200 万帧训练,MLP 的追踪成功率(SR)为 76.89%,TCN 为 81.48%,而 AstraBrain-WBC 0.5-S 已经达到 83.26%——架构换代本身就带来了提升。 更关键的变化发生在数据规模扩大之后:随着训练帧数从 200 万增至 20 亿,AstraBrain-WBC 0.5-B 的 SR 从 88.27% 进一步升至 90.43%;最大规格的 AstraBrain-WBC 0.5-L 在 20 亿帧训练下最终达到 92.58%。 骨干网络架构比较与 Scaling 的影响。 同等数据量(20 亿帧)下,论文给出了一个直接对比:即便是表现最好的 TCN 大参数版本,其关键点位置误差(MPKPE)为 56.15mm,而参数量更小的 AstraBrain-WBC 0.5-S 已经达到 43.25mm,领先幅度超过 30%。MLP 和 TCN 并非无法从更多数据中获益,而是获益的边际在递减;Transformer 的训练损失曲线则持续下降,没有出现饱和。 第二组:数据规模消融,幂律曲线清晰可见 固定模型规格(Humanoid-GPT-B),只改变训练数据量,零样本 MPJPE 的变化轨迹如下: 很明显可以看出:数据每扩大 10 倍,误差持续下降,没有出现拐点。这条曲线正是 Scaling Law 在人形机器人运动控制上留下的第一个清晰印记。 第三组:真机验证,仿真结论在真实硬件上复现 研究团队将 AstraBrain-WBC 0.5 部署于宇树 G1 机器人上,用四段完全未见过的舞蹈动作做零样本追踪测试,并与 GMT、TWIST、Any2Track 三款当前最强的开源追踪器在相同协议下对比。 AstraBrain-WBC 0.5 展现出了此前人形机器人运控系统难以兼顾的四项核心能力:更高自由度的全身协同控制,更高动态的运动能力,毫秒级实时响应,更高的鲁棒性。 以 MPJPE(关节位置误差)作为衡量标准,Humanoid-GPT-B 在四段动作中均低于或持平所有对比方法。须知,这些动作直接来自网络视频的运动重定向,没有任何专项数据补充,也没有经过微调。 在四种未见过的舞蹈动作上的真实世界跟踪准确度 工程部署层面同样没有拖后腿。经过 TensorRT 编译和 C++ 流水线优化后,AstraBrain-WBC 0.5 的平均推理延迟降至 0.39 毫秒,控制回路维持在 50Hz 实时频率;与对比系统 TWIST(均值 2.79 毫秒)相比,推理速度提升约 5 倍。规模更大的模型,反而跑得更快,这得益于针对因果注意力和 MLP 融合算子的专项内核优化。 不同优化方法的推理延迟比较 未来,机器人训练不再需要从零开始构建动作能力,可以直接基于 AstraBrain-WBC 0.5 进行二次开发与能力扩展。这将大幅降低机器人训练门槛。 那么,AstraBrain-WBC 0.5 是如何做到的? AstraBrain-WBC 0.5 做到了三件事 具体而言,AstraBrain-WBC 0.5 系统性地回答了三个问题: 动作数据能不能扩到十亿级? 控制模型能不能像 GPT 一样随数据增长继续变强? 规模变大之后,训练还能不能稳定、可部署? AstraBrain-WBC 0.5 概况。该系统包含三个阶段:(a) 数据整理与处理,(b) 基于关键点奖励在集群上训练采用 PPO 算法的运动专家模型,(c) 通过并行 DAgger 监督将全部专家模型蒸馏为单一基于 Transformer 的 generalist 策略。由此生成的 AstraBrain-WBC 0.5 能够将未见过的或在线重定向的运动作为参考输入,并以完全零样本的方式进行跟踪。 第一件事:把数据堆到 20 亿帧 研究团队汇总了人类运动捕捉领域几乎所有主流开源数据集,包括 AMASS、LAFAN1、Motion-X++、PHUMA、MotionMillion,并补充了超过一千小时的大规模自采动作数据。 相比传统动作数据集中大量重复的行走、站立等高频动作,新数据集覆盖日常动作、舞蹈、快速转向、跌倒恢复、协作搬运等多种长尾场景,再经过严格筛选、分割和增广,得到 20 亿帧经过重定向处理的 G1 机器人关节运动数据。 这是此前同类训练集规模的 200 倍以上。 AstraBrain-WBC 0.5 的数据分布情况 然而数据量本身还不够。大规模数据集有一个隐患:常见动作会把不常见动作「淹没」,模型只学会了中间那些平平无奇的步伐,对高难度动作依然无能为力。 为此,团队设计了一种叫做「谐波运动嵌入(Harmonic Motion Embedding / HME)」的表示学习工具,从每条运动序列中提取各关节的振动频率和幅度特征,并据此将所有数据聚类成约 300 个风格各异的动作簇,实现了多样性感知的均衡采样。 在 HME 嵌入空间中,数据集多样性的比较,可见银河通用团队整理的数据集在 HME 空间里的 log-volume 比 AMASS 大约高 4-5 倍。 实验证明,两者缺一不可:数据多样但分布不均衡,模型仍会过拟合常见动作;分布均衡但多样性不够,能力上限就被数据的覆盖范围卡死。研究团队将这一洞察称为「Diversity and Balance」原则,这也是此前所有运动数据集从未系统考量过的维度。 也就是说,AstraBrain-WBC 0.5 不是简单把数据「堆大」,而是在做一件更难的事:让大规模动作数据变得可度量、可划分、可训练。 第二件事:用对架构 过去的运动追踪器大多使用 MLP 或 TCN(时序卷积网络)。这些架构的问题在于,它们对序列历史的建模能力有限,而且到了一定规模后增加参数几乎不再带来收益。 AstraBrain-WBC 0.5 转向了 GPT 风格的因果 Transformer 架构。这可不是「跟风 LLM」,其背后有一条严密的技术逻辑。 运动追踪本质上是一个在线序列决策问题:机器人在每个时刻需要根据当前状态和历史轨迹,预测出下一帧的关节指令。这个问题天然有时序依赖——你现在迈出的这一步,和上一秒的重心、速度、姿态都强相关。 MLP 的致命伤正在这里:它每次只能「看」一个时刻的状态切片,对更长的历史序列只能靠拼接输入来临时凑数,建模能力从根本上就受限了。 Transformer 的自注意力机制则不同。它可以让模型在序列中的每个位置同时「回望」此前任意长度的历史,捕捉到「当前动作与 32 帧前的某个特定姿态」之间的关联。这类长程依赖关系,正是连贯、流畅的全身运动所必需的。 但还有一个关键约束:机器人控制是实时的,不能看到未来。这就是「因果(Causal)」的来源:AstraBrain-WBC 0.5 在注意力层加入了时序因果掩码,严格限制模型只能利用当前帧及之前的历史,推理时不依赖任何前瞻信息。 这使得同一个模型在训练时是并行处理整段序列(效率高),在推理时是逐帧自回归预测(延迟低),两种模式天然统一,没有结构上的割裂。 还有一个被容易忽视的优势:训练效率的质变。 AstraBrain-WBC 0.5 的蒸馏阶段采用 DAgger 框架,每次迭代需要对整条运动序列中的所有历史时刻同时施加监督信号。MLP 每次只能处理单个时间步,想覆盖一条长序列得循环 N 次;Transformer 一次前向计算就能处理整段序列的所有位置,训练吞吐量直接拉开数量级差距。在 20 亿帧的数据规模下,这是能否在合理时间和计算成本内完成训练的关键。 论文中的消融实验也验证了「历史长度」的价值:序列长度从 4 帧增至 64 帧,追踪成功率持续提升;团队最终选定 32 帧作为默认配置,在性能与计算开销之间取得平衡。这本身就是对「长程时序建模能力真的有用」的直接证明。 第三件事:专家蒸馏的流水线 直接用一个模型训完 20 亿帧是不现实的。团队的做法是「先分后合」:在 300 个运动族群上各自训练 PPO 强化学习专家策略(约 384 个专家),每个专家只负责自己那个风格的动作,因此都能高保真地完成族群内的动作;再用 DAgger 蒸馏框架,让单个 Transformer 模型同时向所有专家学习,最终压缩为一个统一的通用策略。 专家数量本身也经过了系统的消融验证。簇数太少(如 128 个)意味着每个专家负责的动作风格过于混杂,单个专家的追踪质量会下降,蒸馏出来的通才也相应变弱;但簇数太多(如 1024 个)则会让相邻专家之间的监督信号互相矛盾,反而给学生模型带来混乱。实验表明,约 384 个专家是当前数据规模下多样性、专家质量和训练成本的最优平衡点。 整个训练过程耗费约 15000 GPU 小时,其中 75% 用于专家训练(RTX 4090),25% 用于 Transformer 蒸馏(H100)。 一旦蒸馏完成,部署时只需要这一个通才模型,384 个专家就可以「功成身退」,不再需要保留。 AstraBrain-WBC 0.5 与相关工作的比较 最终形成的 AstraBrain-WBC 0.5 模型参数规模达到 8040 万级别,已经接近 GPT-1 时代的大语言模型规模。 为什么是银河通用? AstraBrain-WBC 0.5 背后的工业主体是银河通用机器人(Galbot)。 银河通用成立于 2023 年 5 月,总部位于北京。公司从创立之初便将研发重点放在具身智能「大脑」和泛化操作能力上,而非优先追求双足运动能力。其代表产品 Galbot G1 采用双臂、折叠腿和全向轮底盘设计,被业内概括为「大脑优先、身体务实」的技术路线。 从融资节奏来看,银河通用走得并不慢。2025 年 12 月,银河通用完成超过 3 亿美元融资,中国移动链长基金、中金资本、央视融媒体基金等机构参与投资,公司估值超过 30 亿美元。2026 年 3 月,公司再次完成 25 亿元融资,投资方包括国家人工智能产业基金等机构。这也是国家人工智能产业基金首次投资具身智能企业。 商业化方面,银河通用是国内较早推动具身智能机器人规模落地的企业之一,其机器人已进入零售、制造、仓储物流等多个场景。 银河通用在即时零售领域推出了人形机器人自主运营零售仓方案,并已在全国数十家即时零售仓实现规模化部署。依托端到端具身智能模型,机器人能够在数千种 SKU 的复杂环境中自主完成识别、分拣、抓取和打包等流程。 该公司还与美团买药等合作伙伴推动人形机器人智慧药房(智慧药仓)落地,机器人可在包含约 5000 种药品 SKU 的环境中完成自主拣选与打包。目前相关方案已在北京、上海、广州、深圳、杭州等城市部署,并实现 7×24 小时持续稳定运行。 2026 年马年春晚,银河通用成为中央广播电视总台《2026 年春节联欢晚会》指定具身大模型机器人,为公众展示了其具身智能技术与机器人产品能力。现场,Galbot 机器人在沈腾、马丽身边全自主完成盘核桃、叠衣服、货架取物等任务,所有动作由「银河星脑」实时决策,而非预设程序——这是对机器人泛化能力的一次高曝光度公开验证。参阅《沈腾:春晚谁家机器人?除夕夜就扒拉活来了》。 「银河星脑(AstraBrain)」是银河通用自主研发的全身全手端到端具身大模型,也是理解 AstraBrain-WBC 0.5 战略意义的关键背景。 银河星脑采用三层类脑架构:「大脑」负责多模态感知与任务规划,「小脑」负责全身运动协同与实时控制,「神经控制」则处理末端灵巧操作与力反馈。业界多数方案将这三层割裂开发,模块之间存在信息损耗,导致响应迟滞和泛化能力弱;银河星脑的目标是打通全链路、实现端到端统一建模。 银河星脑 AstraBrain 框架 正如近日在 2026 智源大会主题演讲中,银河通用机器人创始人王鹤博士所言:「银河通用推出的 AstraBrain(银河星脑),目标就是做一个通用人形机器人的基座:既有大脑、又有小脑,中间通过脑桥连接,让更快的小脑与相对较慢的大脑实现异步同步。人脑中的脑桥实际上分为三路、有上传也有下载,我们的架构充分参考了人类大脑的结构,目标就是实现完全通用。」 AstraBrain-WBC 0.5 是这套架构小脑能力的展现:一旦小脑具备了跨场景零样本泛化的能力,银河星脑整体的通用性和迁移效率就能随之提升。 顺带一提,AstraBrain-WBC 0.5 论文(Humanoid-GPT)已被 CVPR 2026 接收。 「小脑」之争,这一局定了什么? 在业界,把 Scaling Law 套用到运动控制层方面,AstraBrain-WBC 0.5 不是第一个尝试。此前 SONIC 已经将训练帧数推至 1 亿,但其依然采用 MLP 架构,而实验表明在那个规模上 MLP 已经开始饱和。 AstraBrain-WBC 0.5 的贡献在于系统性地证明:MLP 的瓶颈并非数据少,而是架构本身的扩展性限制。换用 Transformer,一切才真正打开。 随着数据规模扩展至 20 亿帧、模型参数持续增长,模型的性能得以持续提升。人形机器人运动控制或许正迈向「基础模型时代」:如果说过去的机器人是在学习单个技能,AstraBrain-WBC 0.5 则更像是在学习整个人类动作世界。 这个结论对整个产业有直接的战略含义。 当前人形机器人行业的技术路线大致可分为两派:一派更加侧重突破运动控制和硬件;另一派则更加强调大模型驱动的泛化能力。 AstraBrain-WBC 0.5 让后者的主张有了更坚实的技术支撑:如果运动「小脑」本身就可以成为基础模型,那「大脑」与「小脑」之间的边界就会变得模糊,两者可以共同受益于 Scaling Law 的红利。 行业里已有一个共识:2026 年是具身智能的交付元年,企业的竞争重点正从「我的机器人能做到」转向「我的机器人能可靠地、规模化地做到」。在这个语境下,运动控制层的泛化能力,直接决定了一款机器人能否用同一套软件栈适配不同车间、不同家庭、不同任务。这是规模化落地的前提,也是商业壁垒真正形成的地方。 当然,AstraBrain-WBC 0.5 也有局限:它还是纯运动追踪模型,不具备对物体、环境的语义理解。论文作者在结语中明确提出,下一步方向是与视觉-语言-动作(VLA)模型对接,加入视觉、触觉和语言多模态信息,迈向通用具身基础模型(Embodied Foundation Model)。 银河通用已经走出了突破性的一步,后续的棋局,正在展开。
奥特曼押注2028:让AI学会造AI
新智元报道 【新智元导读】秘密提交IPO文件的同一天,OpenAI没急着谈上市时间,反而立下三大目标:造自动化AI研究员、加速经济、让全球人手一个个人AGI。 近期,OpenAI官宣进入第三阶段。 OpenAI CEO奥特曼在X上发布了OpenAI的最新计划。 该计划来自他和首席科学家Jakub Pachocki在OpenAI官网联名发布的一篇博客,标题是《造福所有人:我们的计划(Built to benefit everyone: our plan)》。 https://openai.com/index/built-to-benefit-everyone-our-plan/ 这一篇最新路线图,重新定义了OpenAI未来几年要干的事。 它总结了OpenAI发展历程中走过的三个阶段。 第一阶段,做通往AGI的研究;第二阶段,把研究变成产品,看人们怎么用;第三阶段,AI普惠。这正是OpenAI当前所处的阶段。 博客中写道:「经济正在围绕AI重新成形,核心问题变成了怎么让先进AI足够便宜、足够安全、足够好用,让每个人和每个组织都能从中受益。」 在这一阶段,OpenAI立了三个目标: 第一,造一个「自动化AI研究员(automated AI researcher)」; 第二,加速经济; 第三,给地球上每个人一个「个人AGI(personal AGI)」。 三个目标汇成一条主线:先让AI学会做研究,再用它加速整个社会,最后把发展的成果落到每个人身上。 在这个新的路线图中,OpenAI还特别提到了一个时间点:2028年3月。 到那个时间点,它相信AI系统可能已经在和自家研究员一起,完成相当一部分研究工作。 发布时机,也耐人寻味。 就在这份愿景书抛出的同一天,OpenAI保密提交了IPO草案文件。一个通往公开市场的资本动作,和一份公开的愿景声明同时落地,很难说只是巧合。 其实这套打法,OpenAI早已驾轻就熟。 去年完成重组时,它就打出了《Built to benefit everyone》的旗号,这一回递交IPO,下面又多了一个路线图。 每逢商业或组织结构上的关键一步,OpenAI总要同步抛出一份宏大叙事。 撇开IPO不谈,OpenAI这一次立下了第三阶段的三大目标,它们对于普通人意味着什么,才是更值得我们关注的地方。 自动化AI研究员 让AI去造AI 「自动化AI研究员」,听起来有点抽象,它是干什么的,和我们有什么关系? 这个名词,并不是第一次从这份路线图里冒出来。 早在2025年10月底,OpenAI完成重组的同一天,奥特曼和和Pachocki就在一场公开直播中谈到过这条路线,随后TechCrunch等媒体进行了报道。 这次新路线图,等于把过去大半年的零散表态,正式收拢成一份纲领。 在那场直播上,Pachocki这样描述这个系统:能自主推进较大的研究项目,不只是答题,也不只是写代码。 今年3月,他又接受MIT科技评论独家专访,把这个目标定为OpenAI未来几年的「北极星」,他说OpenAI快要造出能像人一样长时间、连贯工作的模型,将来「你等于在一个数据中心里,放进了一整个研究实验室」。 OpenAI首席研究官Mark Chen(左)与首席科学家Jakub Pachocki(右),「自动化AI研究员」或将从他们手里诞生。 这件事的意义是什么? 以前是人写代码、调用AI。现在OpenAI想反过来,让AI自己跑实验、自己找错、自己迭代,实现「递归自我改进(recursive self-improvement)」。 这个想法并不新鲜。 早在1966年,数学家古德(I.J. Good)就预言:一台超级智能机器能设计出更好的机器,由此触发一场「智能爆炸(intelligence explosion)」,把人类智力远远甩在身后。 把「做研究」这件事本身交给AI,正是这条链路的起点。谁先迈出这一步,谁就握住了技术进步的方向盘。 OpenAI为这条路标出了两个阶段。 2026年9月,先造一个「研究实习生」,能在有限时间里独立啃下几个小课题;2028年3月,再升级成能长期、独立推进完整研究项目的「正式AI研究员」。 Pachocki点破了关键:实习生和正式研究员的区别并非聪明程度,而是「能自主工作多长的时间跨度」。 而这并非科幻里那种一夜觉醒、自己改写自己的超级智能,更像把研究流程一段段拆开自动化:AI帮人写代码、调参数、筛方案,人则退到上面去编排这些智能体。 这条路线上,DeepMind的AlphaEvolve就是现成的例子:这个会自动改进算法的编码智能体,反过来被用去优化训练它自己那批模型的流程。 AI改进AI,已经从PPT走进了实验室,这也是OpenAI在2028年3月这个日期背后,真正押注的东西。 从发模型 到给每个人发AGI 第二个和第三个目标,落点与普通人更为密切。 加速经济,OpenAI的说法是用AI加速科学、生产力和经济增长,同时尽量让收益被广泛分享。它特意强调,每个人都该在AI创造的繁荣里,分到有意义的一份。 这并非临时起意。 早在今年4月,OpenAI就发过一份《智能时代的工业政策(Industrial Policy for the Intelligence Age)》,公开了自己对于AI时代「怎么分蛋糕」的蓝图,提出要「将人类放在首位」。 OpenAI 4月发布工业政策,提出通过公共财富基金和短工作周,共享AI繁荣 其中两条意见最为具体。 一是设立「公共财富基金(public wealth fund)」,由政府和AI公司共同注资,基金再投向AI增长,把回报作为「AI红利」直接分给每个公民; 二是试点每周32小时、四天工作制,把AI省下的效率折算成更短的工时,且工资不减。 加速经济,更多是从宏观着眼,而个人AGI则是将这个宏观愿景具体落在的每个人身上。 个人AGI,是让地球上每个人,都能按自己的方式用上一个AGI:帮你看懂一张医疗账单,学一门新技能,开一家小店,照顾年迈的父母,或者把一个想法变成真东西。 这有点像电力革命对人类社会的影响。 OpenAI把镜头拉回1920年代的美国乡村,电线还没拉进来的时候,打水、洗衣、靠冰块储存食物,太阳一落山一天就结束了。 直到电来了之后,普通人的生活才被真正改写。而AI也该像电一样,走进每个人的日常生活。 全面自动化,并不是我们的追求 在博客中,OpenAI还提到:全面自动化一切,并非我们想要的未来,因为那样的未来既空虚,又危险。 它提出了一个反直觉的逻辑:AI越强,人反而越重要。设定方向、做取舍、扛责任,这些方面人的重要性将愈发凸显,「决定什么事值得做,长期看会是人最关键的角色。」 OpenAI同时呼吁,未来可能需要建立一个国际协调机制,在安全、对齐和社会韧性跟不上AI发展速度的时候,放慢前沿AI的开发。 早在2023年,OpenAI就提过应该有一个类似国际原子能机构的组织,来管超级智能。 就在上周,Anthropic也公开表示,AI进步太快,前沿实验室可能需要放慢甚至暂停,好让社会结构和对齐研究跟上。 Anthropic负责人Marina Favaro与Jack Clark撰文称,世界需要建立一种可验证的协调机制,让前沿AI开发在必要时具备放慢或临时暂停的选项。 AI能力越跑越快,两家手握全球顶尖模型的实验室不约而同把安全摆上了台面。 为前沿AI研究预留一脚刹车,正在从少数人的讨论,进入头部实验室的公开议程,逐渐变成一种行业共识。 IPO微妙时刻 发布新路线图 这份路线图,为什么挑在这个时间点发出? 据Bloomberg等媒体报道,就在发布这篇文章的同一天,OpenAI确认已经秘密递交了IPO申请。 选择这个时机发布,背后用意不言而喻。 按照OpenAI自身的说法,它目前正处在「让先进AI普惠」的第三阶段,这一阶段它反复强调的一句话是:先进AI的使用应当被广泛分配。集中的权力让社会变脆弱,分散的权力让社会更有韧性、更自由。 换句话说:AGI的命题,已经从「能不能造出来」,悄悄变成了「造出来之后,归谁」。 在这份路线图中,OpenAI并没有给出具体的AGI时间表,而是将重点放在了AI普惠和安全上,同时它也提到AGI的终点并非「全面自动化一切」,人仍然居于核心和关键位置。 关于AGI哪年到来,如今连造它的人都没有定论。 马斯克押2026年;Anthropic CEO Dario Amodei认为「强大AI」最快2027年就到;DeepMind的Demis Hassabis则在今年3月说最快可能在2030年前后,届时「会有一个能深度理解你周遭一切的系统」出现。 综合以上大佬的说法,未来5年中的任何一年AGI都有可能降临。 回到OpenAI的新计划,假如到了2028年3月,它的AI系统已经能与自家研究员协同完成相当一部分研究,这个时候人类的地位仍然不可或缺。 也许比起AGI究竟何时到来,另一个问题更为重要:当机器开始替人做研究、替人加速整个世界时,人类还能不能守住最核心的职责,把好方向盘。
我把昨晚的梦输入AI,它居然直接把我拉进去玩儿了一把?
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 先说个事儿,我昨天做了个挺好玩儿的梦:踩着滑板在城市大道上飞!驰! 醒过来还意犹未尽,结果没想到AI不光帮我还原了画面,还把我拉进梦里玩了一把。 我踩着滑板往前冲,换方向、加速、跳跃、甚至秀了个Ollie(豚跳)~ 自动播放 属实给我整精神了,AI啥时候会干的这事?? 不卖关子了,这是HappyOyster 1.0(快乐生蚝)实现的,阿里ATH推出的可实时构建和交互的开放式世界模型产品。 看到世界模型四个字,可能有朋友好奇:这和我之前玩的Sora那些有啥区别?不都是AI生成画面嘛? 嗯……还真不是一回事。 咱先简单聊两句行业现状啊,过去这一年多,AI视频赛道卷得确实热闹,各种产品轮番上场,画面精度一个比一个高,看着确实挺惊艳。 但用多了就会发现一个共性问题:它们都是「单程票」。 你写一段描述,模型渲染出一段视频,生成完,就完了,然后你就只能看,更不能跟画面里的角色互动。 而且时间一拉长,画面大概率就会崩坏,比如角色前一秒拿着剑后一秒空手了,走两步脸都换了一张。 这也是为啥市面上AI视频基本都是短片段,不是不想做长,是长了真绷不住啊…… 说白了,当前文生视频的天花板,就是一段好看但不可更改的影像素材; 而HappyOyster 1.0做的是一件完全不同的事—— 打造一个完整可演绎、可探索、可互动的数字世界。 画面生成出来的那一刻,体验才刚开始。你可以一边看一边下指令,世界实时反馈并持续演化。 就好像以前你是观众,现在你成了世界的…主人。 那这只快乐生蚝到底有多快乐呢??下面就继续实打实测一波! 世界是活的,你就是主角 HappyOyster 1.0主打两大核心模式:Adventure(世界探索)和Directing(实时导演)。 Adventure是「用动作探索,世界即刻延展」的开放漫游模式,你亲自下场当主角; Directing是「用镜头叙事,故事随心掌控」的导播执导模式,你站在世界之上当导演。 一个管“身体”,一个管“脑子”,覆盖了两种截然不同的创作和体验诉求。 咱先来体验Adventure模式。 我丢了一张吉卜力风格的草原图进去,画面生成的一瞬间直接把我拉了进去,整个画面是活的,在等我操作。 那我就不客气了,直接动手! 1.0版本新增了一套很丰富的交互按键,有加速、下蹲、攻击、跳跃,操作手感跟你玩的3A大作相当接近。 我按了一下前冲,少年迈腿就跑起来;按攻击键,少年开始挥剑;再按跳跃,少年腾空而起,落地那一刻角色屈膝动作,镜头有个上升和下坠的变化,这细节属实拉满了。 关键是,这些全都不是预先做好的动画素材,是模型根据你的操作实时推演出来的。 为啥这么说呢?因为同一个场景我反复试了好几次,每次动作角度不一样,角色的姿态也不一样。 而且模型有个很聪明的设定,它会根据场景内容自动匹配可玩的交互方式。 比如我这个画面里有马车,世界就会解锁骑马互动彩蛋。少年走到马车旁,触发对应操作指令,就能直接上马骑行!! 自动播放 如果创建的世界里有汽车,那么就会自动匹配开关车灯、鸣笛的玩法,主打一个「画面有什么,就能玩什么」。 自动播放 而且探索过程中还能随时截屏留存画面,也能保存世界,一键对外分享链接,别人点进来就能看到你创建的完整世界。 意思是,方便发朋友圈了(doge)。 如果说Adventure是让你下场当主角,那Directing就更过瘾了,直接让你当导演。 Directing支持多模态参考,@一张图片就能锁定角色外观,咱直接就是一个POV恋爱互动先安排上! 我给她设定了一个近景特写镜头,全程第一视角对视,然后随手打了几条互动指令,效果be like: 自动播放 好好好,AI生视频这下都吃上自助餐了,我狂吃! 而且1.0版本在Directing模式上做了几个相当重磅的升级,体验完之后我只想说:这才是创作者的终极玩具! 我先用一条prompt启动了一段剧情: 在舞台上,两个人面对面激烈争吵。 看了大概二十秒之后,我觉得剧情可以转折了。 于是我输入了一条新指令: 他们突然释怀了,紧紧拥抱在一起。 接收到新指令后,两个角色的表情开始缓和,身体从对抗姿态慢慢转向靠近,最后紧紧拥抱在一起。 自动播放 而且,整个过程中,不光是场景,两个角色的脸、衣服、体态、发型完全没有变!! 好戏还没完—— 1.0另外杀手锏功能是回溯和剧情分支。 比如,我可以直接回退到争吵的那个节点,换条完全不同的指令,画面就会重新演化。 或者从同一个节点续写,设计出A、B两条完全不同的故事线。 等等,这不就是创作者梦寐以求的平行宇宙嘛!!! 而且所有这些操作都是流式生成的,即说即演,不用等渲染。你随时插话,剧情随时响应,这对内容行业来说,属实是黑科技啊…… 更贴心的是,官方还写了份体验指南放在网页上,教你怎么创建更好的世界~ 为什么能让世界动起来? 上面体验了这么多,估计有朋友已经按捺不住了: 这玩意儿到底是怎么做到的?跟文生视频在技术上有啥区别? 咱先把最根本的概念差异说清楚: 文生视频的工作方式是文本→视频的单向条件映射,你输入一段描述,模型一次性离线渲染出一段固定的像素序列。 世界模型学的则是一套完全不同的东西,是当前状态+用户动作→下一个状态的转移规律。 △图片AI生成 这就要求模型必须同时具备三重能力:物理规律的隐式建模、长程因果链路的追踪、外部干预的即时响应。 首先要说的就是闭环世界状态建模。 要让一个世界持续运行,最朴素的思路是记住所有历史画面,每生成新一帧,就回头看前面所有帧来保持连贯性。 但问题是,这么干计算量会指数级膨胀,时间一长直接寄。 HappyOyster 1.0在这里把世界状态压缩成隐状态摘要(Latent State),在生成链路上递归传递,支撑长程一致性。 就像接力跑一样,跑下一棒之前,上一棒把「关于现在世界的一切」写成一张纸条递过去,一棒一棒往后传。 每生成新的一帧,模型只需要拿到上一帧的那张纸条加上你新发出的指令,就能推演出下一帧。 所以几分钟下来世界不会乱、因果关系不会断。 而且1.0版本因为这个纸条可以被存档,所以暂停、回溯、分支叙事这些功能就自然而然实现了。本质上就是在某个时间点把纸条存一份副本,想从哪继续就从哪继续。 一个架构设计,直接把产品的交互想象空间整个撑开了。 △图片AI生成 第二项核心技术,是内生一致性,解决了生成画面里角色频繁换脸的痛点。 文生视频最头疼的问题就是主体漂移,人物走几步脸就变了,衣服颜色也跟着跑偏。 HappyOyster 1.0以持久的参考表征参与全程注意力来解这个问题。通俗点说,就是给每个角色、物品、场景元素都发了一张「身份卡」。 不管镜头怎么切、角色怎么转身、被其他物体遮挡多久再出现,模型每次生成新画面时都会对着身份卡检查,保证角色不变样不变形。 还有开放因果动作空间,打通动作与语言的表达逻辑。 很多交互式系统的做法是预定义一个动作集,比如能跳、能跑,但只能做这些。 HappyOyster 1.0把动作指令和自然语言放进了同一个语义接口。 比如,你说骑上那匹马,模型就自己推演出上马的完整动作序列和马开始跑的物理反馈。 动作空间是开放的,语言本身就是遥控器,不需要任何人工预设,模型自己就能推演因果。 最后说说长时序音视频协同。 HappyOyster 1.0的音频和视频是在同一个世界状态下联合解码生成的,不是先出画面再配音。 这意味着脚步声跟着你走、雨声跟着天气变、打击音效跟着攻击动作来,真正做到了声画物理合规。 这四大技术一起协同发力,这个世界才能真正活起来。 不过技术做得好不好,光靠体验感受还不够,得有量化标准来衡量。 但世界模型作为一个新兴领域,目前行业里还缺乏一套针对“世界逻辑”的系统性评测基准。 针对这个痛点,HappyOyster团队正在牵头与南京大学共建世界模型评测基准,这也说明,HappyOyster不只是在做产品,更承担起定义赛道标准的责任。 谁能第一个吃到这只生蚝? 从传统文生视频生成一段固定影像,到世界模型搭建可进入、可操控、持续自主运转的完整数字空间,HappyOyster 1.0正是这条全新路线的落地先行者。 它把AI的生成能力从单向输变成了双向实时交互。 而且,一旦世界模型走通了这条路,很多行业的想象空间就变大了。 比如说游戏行业,不用搭建庞大的美术资产库、配置复杂的物理引擎,给HappyOyster 1.0丢一张概念图,很快就能跑出一个具备物理反馈和NPC交互的可玩场景。 在内容生成赛道上,如果一个剧本能分叉出十条故事线,观众自己选走向,那就可能催生一个全新的互动内容业态。 除此之外,文旅景区做虚拟漫游、博物馆做沉浸式历史还原……都可以用HappyOyster 1.0进行沉浸式体验。 现在,HappyOyster 1.0已经正式上线,用手机号注册就能玩!此外,API计划在近期开放。接下来无论是游戏创作、短剧生成、文娱体验,还是数字人直播、虚拟陪伴,都可以用上世界模型,给用户带来全新的交互体验。 这意味着人人都有机会亲手搭建、操控自己的专属虚拟世界,想想就「狠」带劲! 阿里这次属实是打开了大家的想象力,以后谁还满足于只看视频啊……
GPT发AI原创新成果了
听雨 发自 凹非寺 量子位 | 公众号 QbitAI 啥?药物研发也能「全自动」了? 最近,OpenAI和Molecule.one联合发布了一个新成果: GPT-5.4在近乎自主的条件下,改进了药物合成里一个常用反应。 而且还提出了一个化学家都觉得意外的方案。 AI震惊人类,这也不是头一回了哈。 不过终于是震惊到化学领域了。 这次出主意、定方案、决定下一步该试什么的,是 AI。 动手做实验、把关、亲手复现的,还是人。 Molecule.one的CTO Stanisław Jastrzębski表示,这是有机化学领域首个AI近乎自主完成的发现。 GPT-5.4跑通药物自主研发 合成一直是药物发现的一个大瓶颈。 做小分子药,绕不开有机合成。一个反应好不好用,关键看它能不能在各种不同的原料上稳定地搭出同一种化学键。 要是产率太低、副产物太多,化学家可能就得放弃一个本来很有希望的分子,或者花大力气另找路线。 说到底,科学家只能去测那些自己造得出来的分子。 这次GPT-5.4改进的,是Chan–Lam偶联。 这是化学家常用来搭碳氮键的一个反应,而碳氮键在药物里到处都是。 麻烦在于,这个反应不是对所有分子都好使,尤其是拿伯磺酰胺和硼酸去偶联,历来产率都很低。 偏偏磺酰胺这一族又很重要,抗癌药、抗菌药、利尿剂里都有它的身影。 所以如果能把这个又难又有用的反应做得更可靠,就等于给药化学家多开了一条造分子的路。 那么,OpenAI是怎么做的呢? 他们把GPT-5.4接到了Molecule.one的Maria身上。 Maria是一套化学AI agent,后面连着一个能自动跑实验的高通量实验室。 研究团队给系统下了个很开放的目标:去改进某一类重要反应。 至于怎么改、改哪个,全部自己看着办。 于是!系统就开始自己跑了。 它生成研究方案、设计并执行实验、分析实验数据,再据此提出下一轮该做什么。 自动播放 那么,人负责干什么呢? 科学家写了引导和打分用的prompt,让GPT-5.4生成并排序了数千个研究方案,然后从系统排名最高的一小撮里,挑了四个真正送进实验室。 Maria再把选中的高层计划翻译成详细的实验指令,跑出成千上万次高通量实验,分析原始数据,把结构化结果回传给GPT-5.4。 四个方案里,编号OAI-M1-03提出了一个最意想不到的解法。 GPT-5.4自己认定,伯磺酰胺是个又难又有价值的底物类别,然后提出: 用TEMPO这类温和的氧化剂当添加剂,也许能改善这个反应。 这个建议一出来,连人类化学家都震惊了。 而在随后的测试中,十种氧化剂里也正是TEMPO跑了出来。 后续实验里系统还发现,TEMPO可以换成便宜得多的类似物4-hydroxy-TEMPO,性能几乎不打折。 By the way,这整个过程里人类做的最大一次干预,是叫停了用DMSO当溶剂。 因为化学家担心它会和用作对照的强氧化剂起反应。 可以放心,这种活,目前还是得人盯着。 效果如何 有了AI的加持,效果怎么样呢? OpenAI表示,在优化后的条件下,所测试的硼酸里有88%产率提升,磺酰胺里有83%提升。 平均产率从16.6%涨到25.2%,产率超过30%的反应占比,从15.6%提到了37.5%。 但更加惊人的是AI的实验量,两轮下来Maria一共跑了10080个反应。 这比一个化学家每天做三个、连做十年还要多。 此外,人类化学家还手工验证了其中一批代表性反应。 结果发现,14对底物里有11对产率确实提高了,其中八对涨了两倍以上。 整个实验过程历时三个月,从3月4日的第一个prompt,到6月4日把OAI-M1-03的结果交给外部专家。 其中有2个半月在做实验,最后半个多月是人类化学家撰写结果。 虽然这是一个早期案例,不过足以说明当下的前沿模型已经能够支持大部分的科学研究: 包括审查研究、提出假设、设计实验、解释数据,以及发现人类专家可以验证的成果。 但OpenAI表示,这还不算AI全自动药物研发。 他们明确把这套流程描述为「近乎自主」而不是「完全自主」,理由是人类化学家始终在做重要决策。 模型负责提出关键的研究想法,人则提供高层引导和判断、纠正实验细节、帮着备料配试剂,还亲手重复了关键实验。 在整个过程中,人的判断仍然是不可或缺的。 不过…AI虽然还没法独自跑完一个研究,但它已经能决定下一步试什么。 那么,AI实现药物全自动研发,还远吗?
G7惊魂2.5小时!奥特曼笑坐,达里奥“受审”
新智元报道 【新智元导读】G7峰会惊变AI战场!特朗普一纸禁令掐断盟友AI命脉,全球巨头齐聚法国饭桌。奥特曼笑坐总统身旁,Dario Amodei却被隔离对面「受审」。2.5小时闭门午餐,一场没有硝烟的科技冷战正在上演! 2026年6月17日,法国依云小镇。 本来,这里是以矿泉水闻名的世外桃源。 然而,正在这里召开的G7首脑峰会,让两个半小时的工作午宴,变成一场充满硝烟的全球AI博弈场! 这次的G7峰会,法国总统马克龙做东,七国领导人齐聚一堂。但与往年不同,全球AI领域的掌门人,这次也出场了。 名单包括:OpenAI的Sam Altman,Anthropic的Dario Amodei,Google DeepMind的Demis Hassabis,还有Mistral的Arthur Mensch。 表面上看,议程非常温和:探讨AI如何驱动经济增长,如何保护青少年免受AI的负面影响。 但每一位巨头都心知肚明,这场午宴的真正潜台词只有一个——AI顶级模型的生杀大权,究竟谁说了算? 就在几天前,华盛顿的一道连环夺命call震碎全球科技圈的平静,今天下达这道死命令的操盘手特朗普,正大马金刀地坐在餐桌中央。 在他的两侧,是风头正劲、笑容可掬的奥特曼和哈萨比斯。 而在桌子的正对面,法国总统马克龙的身边,则坐着神色铁青、如同「被训斥的小学生」一样的Dario Amodei。 一场顶级大戏,就在这短短2.5小时内,被彻底撕开了遮羞布。 一张耐人寻味的座次表 座位就是态度,座位就是权力。 这场午宴的座位安排,已经说明了一切。 美国总统特朗普稳坐主位,气场全开。 他的左膀右臂——商务部长Howard Lutnick和财政部长Scott Bessent分立一侧。这两人,正是上周对Anthropic祭出出口禁令的幕后推手。 紧挨着特朗普坐着的,是科技界的两位新晋「红人」。 首先是奥特曼,他神态轻松,在席间频频与特朗普微笑互动。 OpenAI近期刚刚内测了专为网络安全打造的 GPT-5.5 Cyber,紧紧跟国家利益捆绑。 哈萨比斯同样坐在特朗普身侧,神情自若。 而桌子的另一头,气氛则十分凝重。 Anthropic CEO Dario Amodei被远远地「放逐」到了特朗普的对立面。 他的身边是东道主法国总统马克龙。所有人都看到,Dario的表情紧绷、局促,活像在听候发落的犯错学生。 Dario的反击! Dario当然不会坐以待毙。 据悉,他在发言中主动向特朗普示好,甚至公开呼吁建立一个「由美国领导的AI国际联盟」,为AI制定规则和标准。 几个合作方向如下: 1.对前沿模型实施「结构化访问控制」; 2.芯片和关键核心零部件的贸易管控; 3.在网络、生物恐怖主义和情报领域,各国情报机构与AI厂商深度共建。 加拿大总理卡尼当场表示赞同:美国可以领导这个AI联盟。 而另一边,奥特曼则显得更加具有全球战略家的风范。 他没有像Dario那样急迫地兜售芯片管控,而是提出要建立一个类似「国际金融稳定委员会(FSB)」的国际多边论坛。 我们需要一个能够制定全球公认测试标准的国际论坛,提供公正的风险分析。但至关重要的一点是,我们绝对不能让这项技术的风险,导致权力出现不当的过度集中。 奥特曼的这番话看似公允,实则高级。 他借着反对权力过度集中的旗号,既安抚了紧张的欧洲领导人,又巧妙地将OpenAI包装成了代表全球主流秩序的「合规模范」,顺便还给老对手Anthropic上了一点眼药。 房间里的大象 「特朗普政府和Anthropic之间的这场矛盾,就像房间里的大象。」一位在场人士这样说。 房间里的大象,就是刚刚被切断的Fable 5和Mythos 5。 每个人心里都清楚,真正要谈的,是谁有资格用AI,谁说了算。 马克龙的愤怒:你们今晚能关掉AI,明晚就能关掉我们的电闸 午宴中,最感到如鲠在喉的,莫过于马克龙这位东道主。 马克龙把G7安排在依云,本是想展现欧洲在AI规范和儿童安全领域的领导力。 但他万万没想到,特朗普带着「出口禁令」,直接来砸场子了。 欧洲领导人原本打算在这顿饭上表达不满。毕竟,华盛顿事先没有任何通知,突然就切断了盟友的AI命脉。 欧洲外交官们在会前就放出风声:这次午餐是欧洲「确保自己声音被听到」的第一个机会。 但真到了桌上,没有人直接掀桌子。 午宴结束后,面对记者的长枪短炮,马克龙终于忍不住开火了。 他承认美国做出的是「强有力的决定」,但他们不能把盟友当敌人。 「如果这些美国公司今天可以因为一纸命令,一夜之间掐断开关,那我们绝不会去购买它们的任何模型。」 英国AI大臣卡Kanishka Narayan也表达了担忧:「在辩论国家安全和技术主权的未来时,确保持续获得AI能力是至关重要的。」言下之意,英国也不想随时被美国断供。 而坐在餐桌下首的Mistral AI的CEO,则成为了欧洲全村的希望。 如果欧洲没有自己的Mistral,在谈判桌上,马克龙连摔杯子的底气都没有。 谁是赢家? 至于特朗普本人呢? 他显然对巨头们的争宠和欧洲人的愤怒甘之如饴。 记者会上,当被问及与Anthropic的谈判进展时,他重复了两次:「进行得很好,我想进行得很好。」 比起具体的模型安全,特朗普更关心的是实在的经济利益。 他在会后疯狂炫耀美国在AI领域的吸金能力: 「我们进行了一场伟大的AI会议,所有最顶级的人都在这里。正如你们所知,我们在国内正在建造数量惊人的工厂,而我们在美国建造的AI数据中心和工厂,将是世界上最大、最大的!」 在特朗普眼里,无论是Anthropic还是OpenAI,只要你们的算力长在美国的土地上,你们的CEO在面对白宫时就必须随叫随到。 最后,一个重磅消息:Anthropic发言人确认,Amodei将在G7结束后前往旧金山,与欧盟委员会和欧盟网络部门会面。 「此次访问是我们与欧盟、各盟友民主国家以及重要国际机构持续沟通的一部分,旨在就前沿AI对网络安全的影响及国际合作机遇展开深入交流。」 显然,Amodei还在努力。
华硕员工暴躁式宣传笔记本走红!现场猛砸、泼水、踩屏幕
快科技6月19日消息,华硕日本团队为宣传ExpertBook商务笔记本的坚固可靠性,在展场以一系列暴力方式现场折磨产品,相关视频在社交平台一天内累计播放超356万次。 ExpertBook是华硕专为商务场景打造的产品线,定位类似联想ThinkPad,全系通过美军MIL-STD-810H军规耐用性测试,涵盖跌落、扭转、转轴、键盘和面板等极端工况。 华硕官方曾对ExpertBook进行过一系列严苛的物理极限测试,但这次日本团队把实验室里的测试搬到了公众面前,用最直观的方式让消费者亲眼见证产品承受能力。 演示中最具反差感的一幕是“不小心关屏”测试,工作人员在键盘上放置坚硬异物后,嘴上平静说着“万一不小心”,却以极快速度将屏幕猛力拍下。 正常情况下屏幕早已碎裂,但ExpertBook打开后玻璃和液晶面板均无损伤,显示正常。 防泼水演示同样夸张,工作人员将一瓶瓶矿泉水直接倒在键盘上,期间对观众大喊“非常感谢您”,犹如模拟在咖啡厅被泼水的夸张戏码。 更硬核的测试是邀请观众参与,直接脱下鞋子踩在整台笔记本上,不仅踩键盘面,连屏幕也直接踩过,以凸显整机抗重压能力。 此外笔记本转轴和机身具备高强度韧性,可180度摊平,只抓住屏幕一角让整个机身明显弯曲也不会损坏。 不少网友被工作人员言行不一的暴躁反差逗笑,有人评论“嘴上说不小心,手上的力气比谁都大”,也有人赞赏这种真枪实弹的演示方式比任何参数表都有说服力。
AI的终极商业模式会是“健身房”?
文 | 吴怼怼 豆包戳破了一个幻觉 晚点一篇关于豆包、Seedance 和 AI 商业化的报道,把一个行业里越来越难回避的问题摆到了台前:AI 到底怎么赚钱? 截至上半年,每天2 亿多人使用的豆包,日收入不足百万元,主要来自电商佣金;而到了今年 5 月,豆包应用每天消耗的算力成本可能已经达到数千万元。文字聊天本身不算贵,但一旦进入推理、图片识别、语音聊天、视频聊天等多模态功能,成本会陡然上升。 这还没有计算训练模型所需的智算中心投入。一座大型智算中心往往需要数万张AI 芯片,还要配套供电、网络、散热、运维和数据中心基础设施。也就是说,AI 更像软件、云计算、电力、半导体和重资产制造业的混合体。 类似的变化也出现在其他大厂身上。 腾讯已经把WorkBuddy 企业版、政务版等智能体开发平台推到更重要的位置。元宝的战略能级反而降下来了。相比一个聊天入口,这些产品更接近企业生产力工具、开发者工具和MaaS 平台,面向的是有预算、有组织流程、有明确效率诉求的 B 端客户。 微软也在重新计算AI 的账本。过去 Copilot 更像一个标准化订阅产品,但当企业 Agent 开始持续调用模型、执行任务、消耗推理资源,“每人每月固定价格”的模式就开始变得吃力。微软已经在部分 Copilot 和 Agent 服务中推进按量计费,让企业基于实际使用量付费,并通过预算和成本管理来控制账单。 Anthropic走得更直接。Claude Enterprise 的 usage-based 企业计划,已经从单纯订阅转向“席位费 + 用量费”的混合模式:企业先为用户席位付费,真正的模型使用量则按 token 单独计费。 这也是这轮AI 浪潮和移动互联网最大的不同。 过去做App,可以先免费、先 DAU、先时长、先占入口,再靠广告、电商、会员、游戏、金融和生活服务慢慢变现。今日头条、抖音、小红书、快手,都是这个逻辑的产物。内容分发的边际成本相对较低,用户多刷一小时,平台并不会按比例多烧掉一小时的高价 GPU。 但AI 不一样。AI 是每一次交互都要消耗算力的产品。用户越活跃,成本越真实;上下文越长,显存越紧张;输出越复杂,GPU 占用时间越长;一旦进入图片、语音、视频和 Agent,成本结构就更像工业生产,而不是互联网流量分发。 这意味着,AI的第一性原理不是“流量”,而是“算力”。 豆包的问题,不是没有用户。恰恰相反,它的问题是用户太多,但商业化还没有跟上。两亿日活说明需求真实存在,但需求不等于收入,收入不等于利润。如果大量用户免费聊天、免费生成、免费调用多模态能力,而平台无法把这些使用转化成足够高的收入,那么规模本身就会变成成本负担。 这就是所谓的“移动互联网式AI 叙事”的幻觉:过去我们相信,先有用户,后有商业化。但 AI 时代,用户增长和成本增长高度绑定。一个 AI 产品不能只讲 DAU、时长和下载量,还必须回答一个更朴素的问题:每一次调用到底花了多少钱?这些成本最后由谁买单? 从这个角度看,豆包和Seedance 的差别就变得非常清楚。 豆包是面向大众的通用AI 助手,用户规模庞大,但付费理由不够强。普通用户当然会觉得 AI 好用,可以问问题、写东西、陪聊、查资料、生成图片。但这些价值很碎,很难稳定变成月费。尤其在中国市场,用户已经被免费内容、免费小说、免费视频、免费会议软件和免费工具教育了很多年。让大众为“更聪明一点的数字服务”持续付费,本来就很难。 Seedance则不同。它面对的是生产者,是短剧公司、漫剧公司、广告公司、内容制作团队。它不是让普通用户为“好玩”付钱,而是帮助原本就有预算的行业降低成本、提高效率。以前一段视频需要人画分镜、做动画、跑后期,现在 AI 可以承担一部分生产流程。客户算账很直接:如果 AI 生成的视频足够可用,并且比人便宜、比旧流程快,那就值得付费。 所以,AI商业化的关键不是 C 端还是 B 端,而是有没有明确的付费理由。 AI编程为什么更容易收费?因为它直接面对程序员、研发团队和软件公司。AI 可以缩短开发时间,提高代码产出,替代一部分重复劳动。企业不是为“聊天”付费,而是为更快交付软件付费。 AI视频为什么有机会?因为它直接嵌入了内容生产预算。短剧公司、广告公司、游戏公司、影视团队本来就要花钱买制作能力,AI 只要能把成本降下来,就能拿走一部分预算。 AI客服、AI 法务、AI 投研、AI 设计、AI 销售线索、AI 数据分析,也是同一个逻辑。 每一次对话,背后都是一张电费单 这也解释了为什么现在看起来最赚钱的是“卖铲子”的公司。 芯片、云、数据中心、电力、散热、网络,是AI 时代最先确定受益的环节。不管最后是 OpenAI、Anthropic、Google、字节、阿里,还是某个新的应用公司获胜,它们都必须训练模型、部署推理、购买或租用算力。卖铲子的人站在最上游,不需要判断谁挖到金子,只要大家继续挖,就有人买铲子。 这就是英伟达和云厂商最强的地方。 但如果因此判断“AI最终只有卖铲子的赚钱”,可能又过于悲观。更准确的说法是:卖铲子的先赚钱,基础模型层高度集中,下游应用要死掉一大批,但真正嵌入工作流、掌握付费场景的应用仍然有机会。 AI的终极商业模式,可能不是单一模式,而是三种模式的混合。 第一种,是C 端的“健身房模式”。 健身房会员制的核心,是大多数人交了钱但不常去,少数高频用户被低频用户补贴。AI订阅也有类似逻辑。轻度用户每月问几次、生成几张图,平台赚钱;重度用户天天写代码、跑 Agent、做视频、读长文档,平台亏钱。 AI 订阅的理想用户,是“愿意为能力付费,但不会把额度用穿”的用户。 这和健身房最喜欢的用户一模一样:办了年卡,偶尔来几次,还觉得自己拥有了健康生活方式。 问题是,AI 最有价值的用户,往往恰恰是最高频、最高成本的用户。程序员、设计师、短剧公司、投研人员、内容团队,越觉得 AI 有用,越会高强度使用。于是平台就不能再靠“健身房式会员”糊弄过去,必须转向用量计费或结果计费。 所以,AI订阅真正赌的是:用户愿意付费,但不要用得太狠。 这也是为什么纯粹的无限量订阅很难长期成立。AI的边际成本太清楚了,每一次 token、每一张图、每一秒视频、每一次深度研究,都能换算成 GPU 时间、电费、显存、调度和折旧。如果重度用户大量涌入,订阅模型就会被打穿。 订阅不是终局,额度才是账本 因此,未来C 端 AI 更可能变成“会员 + 额度 + 超额包”。普通聊天接近无限,高级模型有次数限制,图片和视频生成用点数,深度研究按次数,代码 Agent 按任务量。用户看到的是会员、点数、创作额度、深度研究次数;平台内部计算的则是 token、GPU 秒、推理成本和单位毛利。 第二种,是B 端的“云服务模式”。 云服务的商业模式,本质上是云厂商先重资产建设数据中心、服务器、芯片、网络和基础软件,然后把这些资源切成标准化能力,按需租给企业。企业不用自己建机房、买服务器、招运维,而是按计算、存储、数据库、带宽和API 调用付费。 B端 AI 很像云服务。模型 API、MaaS 平台、企业 Agent、知识库、AI 编程、AI 视频生成,本质上都是把“智能能力”变成一种可计量资源。企业用了多少 token、多少上下文、多少图片识别、多少语音转写、多少视频秒数、多少 Agent 执行时间,就对应多少成本。 但AI 又比传统云更复杂。云服务卖的是资源,AI 最好卖的是结果。 企业客户关心的是:客服成本有没有下降,代码交付有没有变快,广告素材有没有变多,视频生产有没有更便宜,投研报告有没有更高效,法务审查有没有减少人力。 所以,最好的B 端 AI 商业模式是:后台像云一样按资源结算,前台像 SaaS 或行业工具一样按价值收费。 企业为结果付费 对客户说的是:我帮你处理了一千个客服会话,生成了一百条广告素材,完成了一段可运行代码,做完了一份投研报告。 对公司内部算的是:这些任务消耗了多少token、多少 GPU 秒、多少失败重试、多少工程调度成本。 第三种,是“结果收费模式”。 AI最终不是卖模型,也不是卖 token,而是卖可验证的业务结果。 如果一个AI 应用只是把用户请求转发给上游模型,它本质上是在帮上游卖 token,自己很难留下利润。真正能赚钱的下游,必须把 token 封装成工作流,把算力变成结果,把结果变成账单。 Codex、Claude code、Cursor这类 AI 编程工具,重构了开发者写代码的界面。微软把 Copilot 嵌入 Office,字节把 AI 嵌入广告投放、剪映、短剧制作和电商商家工具,也是在卖生产工具。 这才是AI 应用层真正的机会:不是再做一个“我也能聊天”的 App,而是成为某个行业工作流的一部分。 这里就要回到token。 token是什么?它不是 GPU 本身,而是模型处理信息的基本计量单位。输入 token 是模型读进去的内容,输出 token 是模型生成出来的内容。token 越多,通常意味着模型要读得更多、算得更久、生成得更多,最后就会转化成 GPU 计算量、显存占用、推理时间、电力、散热和系统调度成本。 token像 AI 时代的电表。用户看到的是问答、图片、视频和代码,平台后台看到的是 token、GPU 秒和单位任务毛利。 GPU则像发电厂和工厂设备。它不是被 token 一点点“磨没”的,但长期高负载运行会带来电力消耗、热损耗、显存压力、硬件老化和会计折旧。 更关键的是,AI GPU 的寿命不只是物理寿命,而是经济寿命。卡还没坏,但新一代芯片性能更强、能耗更低,旧卡的单位 token 成本过高,就会被迫退到低端任务,甚至经济报废。 这就是AI 基建周期里最大的变量。 铲子先赚钱,淘金者还在算账 短期看,卖铲子的人最确定。芯片、云、数据中心、电力、散热都会继续受益。基础模型公司会继续烧钱争夺门票。下游应用则会经历残酷筛选。 中期看,市场会越来越关心ROI。大厂的资本开支能不能转化成真实收入?企业 AI 的收入增速能不能追上算力投入?GPU 云价格会不会下跌?数据中心利用率够不够高?折旧年限到底该按传统服务器算,还是按更短的技术周期算? 长期看,基础模型层会高度集中,但应用层不会消失。真正的赢家会出现在三个地方:掌握算力入口的基础设施公司,掌握企业工作流的软件公司,以及能把 AI 直接转化成业务结果的垂直应用公司。 最后的问题:谁来买单? 所以,AI的终极商业模式究竟是什么? 答案可能是: C端像健身房,用订阅、额度和沉没成本管理用户; B 端像云服务,用 token、调用量、年框合同和企业锁定收费; 高阶应用像SaaS 和外包服务的结合,用 AI 完成具体任务,再按结果收钱。 订阅可以当入口,但不能当终局。 AI行业正在进入“谁能把算力变成现金流”的阶段。 过去一年,大家讲的是参数、榜单、DAU、下载量和多模态能力。接下来更重要的会是:单位推理成本、token毛利、企业续费率、任务成功率、客户预算来源、工作流嵌入深度和可验证 ROI。 创造价值和捕获利润,是两回事。 AI会提高社会效率,但提高效率的人未必能赚到钱。 AI 会重塑很多行业,但不是每个 AI 应用都能成为公司。 AI 会成为基础设施,但基础设施的生意,最终一定要回到一个非常朴素的问题: 这一轮烧掉的算力,最后到底由谁买单?
苹果A21 Pro或将独享台积电改良版2nm N2P制程 标准版保持N2工艺
据台湾《工商时报》报道,台积电略微改良的 2nm N2P 制程今年将率先被高通和联发科采用,两家公司希望借此在今年晚些时候的新品上抢占相对于苹果的技术优势。不过消息称,苹果预计会在明年的 A21 Pro 芯片上同样导入 N2P 制程,以保持与Android阵营旗舰芯片的竞争力,但这一先进工艺仅会用在 Pro 版本上,标准版 A21 仍将停留在较早的 2nm N2 节点。 面向基础款 iPhone 20 的 A21 标准版,预计会继续采用台积电 2nm N2 制程,该工艺也被认为将用于前一代的 A20 和 A20 Pro,从而在一定程度上摊薄开发与生产成本。在晶圆成本持续攀升、存储器供应吃紧且价格高企的背景下,苹果即便身为市值数万亿美元的科技巨头,也不得不在高端制程导入节奏上做出取舍,以避免利润率被进一步侵蚀。 从性能层面来看,N2 与 N2P 之间并非“代际飞跃”。报道援引业内信息称,在相同频率下,N2P 相较 N2 的性能提升大约只有 5%,并不会立刻在终端体验上拉开巨大差距。加之苹果在芯片架构设计上的积累深厚,即便沿用 N2 制程,也可以通过架构优化和能效调校弥补一部分制程差距,而不必完全依赖最先进的光刻工艺来换取性能。 以 A19 Pro 为例,该芯片上的四个能效核心在架构优化后,可以在“零额外功耗”的前提下实现最高约 29% 的性能提升,显示出苹果在微架构层面的深度挖潜能力。由此推测,苹果在 A21 标准版上完全有可能通过类似的架构改进,将制程不升级所带来的影响控制在相对可接受的范围之内。 另一方面,为维持在高端市场的话语权,苹果仍有动力将 A21 Pro 迁移到 N2P 制程,以在核心数、频率和能效比等方面与采用相同工艺的高通、联发科旗舰芯片正面竞争。随着时间推移,N2P 量产工艺的成熟度提升,台积电晶圆成本有望逐步回落,也会在一定程度上缓解苹果在高端制程上的成本压力。 苹果计划在 2028 年让 A22 Pro 率先导入台积电 1.4nm 制程,这将是苹果第一次跨入亚 2nm 时代,不过目前尚未有标准版 A22 是否同步升级的线索,A21 系列也并未被纳入这一规划讨论。从 A21 到 A22 的路线图可以看出,苹果似乎在旗舰 Pro 芯片上优先引入最新制程,再视成本与市场反馈决定是否下放到标准款型号。 需要指出的是,《工商时报》在相关爆料上的准确度记录并非总是完美无缺,因此消息本身仍存在不确定性,后续走向还有待更多渠道印证。报道本身也强调,读者应对这一系列关于 A21 与 A22 制程规划的传闻持保留态度,静待后续产业链和苹果官方的进一步消息。
智能家居终于“智能”了!有记忆、能认人的“贾维斯”,小米先交卷了
智东西 作者 | 云鹏 编辑 | 漠影 刚刚,国产版“贾维斯”,真的进家了! 辛苦一天,深夜推开家门,耳边响起:“加班辛苦了,早点休息,有需要随时叫我!” 当我在厨房一边煎牛排一边分心刷世界杯短视频忘记时间,语音提示随之响起:“油温即将过高,距离最佳关火时间预计还有20秒!” 出差在外,孩子在家看平板、电视,系统自动开始计时,到预定时长自动关机并给我手机上发来提醒; AI摄像头看到父母在家忘记按时吃药,系统根据家庭档案中病史及时判断,通过音箱播报提醒吃药。 AI大管家不仅懂我的生活作息、知我的健康状况,会主动关心我,随时感知我在各类场景的状态,甚至还给全家人建立了专属档案。 今天,这样的体验,已经有机会成为现实。 就在昨天,小米正式发布并开源了Xiaomi Miloco 2.0,一套面向未来的全屋智能AI开源方案。直观来看,小米给Agent时代的智能家居装上了新的“AI大脑”,把超级AI管家带进了智能家居生态中。 客观来看,这也是目前业内第一个能够实现AI主动服务、有家庭记忆的智能家居解决方案。 ▲Xiaomi Miloco 2.0 GitHub首页 当前,以各类Claw为代表的Agent(智能体)成为AI赛道的核心焦点,其在生产力提效方面作用显著。然而在“AI进家”这一关键场景,仍然缺乏一个关键系统,把基于大模型、通用性极强、多模态交互能力极强的各类Claw与智能家居设备生态彻底打通、连接起来,让Agent可以真正“懂家”。 Xiaomi Miloco 2.0,就是这样一个核心系统,可以化作Agent的“眼睛、耳朵、记忆”,各类米家设备作为全模态感知入口,Miloco 2.0通过视觉、声音、环境感知实现全屋理解,将用户需求传达给Agent,真正完成AI在家庭场景提供服务的闭环,而所有用户数据都保存在端侧,原始数据与Agent完全隔离,数据完全由用户掌控,隐私安全问题得到妥善解决。 这背后不仅是小米大模型底层能力的升级,更是一套系统级全屋智能AI框架的成熟。Xiaomi Miloco 2.0真正成为了一个有记忆、能认人,还能流畅执行复杂任务的AI智能管家,全屋智能在Agent时代的拐点,已经来了。 一、四项核心能力升级,给家庭配上超级AI大管家,如何颠覆体验? 智能家居并非新概念,在Agent与Miloco 2.0智能系统的加持下,我们到底能够获得怎样的颠覆性体验?从多个官方演示视频中我们能清楚地看到:当Agent真正懂家、懂你后,家居场景所迸发出的AI应用价值空间是巨大的。 纵观此次小米开源的Miloco 2.0,多模态感知、主动智能、持续任务和家庭记忆是其四个最核心的功能升级。 在多模态感知方面,案例视频中的“水烧开无人时主动提醒”令人印象深刻,从摄像头+传感器判断水烧开、检测人不在厨房,到最终通过距离用户最近到音箱播放语音提示,整个流程自然高效、符合逻辑。 从单一视觉升级到多模态感知,系统能同时处理空间内的画面变化、人物变化、声音语调、温度等多维数据,感知更为精准和立体。 在主动智能方面,当摄像头感知到主人回家,会结合家庭记忆进行判断,发现到家时间晚于平均,推测主人可能加班了,因此主动给予慰问。 从规则驱动到主动智能,系统凭借大模型强大的常识推理能力,主动观察用户场景状态,基于用户的日常作息与设备使用习惯,自主进行判断并主动提供服务。 持续任务也是非常实用的一项升级,当系统收到生日提醒指令后,就会主动编排家中可以用到的设备,比如各类灯、电视、音箱,生成生日惊喜方案,随后就开始持续“待命”,当系统监测到家人归来,就会调动设备执行编排好的方案。 从单点执行到长期任务,相比传统的“一句话一执行”,AI真正可以实现随时在线、多时段持续跟踪。 最后一项核心升级是家庭记忆功能,这也是贯穿许多能力的一项基础功能升级。 正如演示视频中所展示的,当摄像头识别到有人书房落座,就会根据其身份回溯家庭记忆,根据其喜好调整灯光,比如男主人喜欢在阅读电脑时用明亮暖光,女主人则喜欢在写笔记时用柔和的中性光。 摄像头识别到女主人坐姿不佳的时候,也会根据家庭记忆联想到她腰部不适的病史,并即时提醒注意坐姿,在识别到女主人运动的时候,也会即时提醒她动作幅度要注意,避免腰部过度用力。 从宽泛上下文理解到专属家庭记忆,AI直接“精准识别家庭成员身份信息”, 将通用常识知识与长期沉淀下来的专属“家庭档案”进行结合,针对性匹配其专属、个性化的智能服务。 从多模态感知、主动服务、持续任务到家庭记忆,这四大核心功能的升级,可以说构成了次世代智能家居体验的“基石”,而这些能力的持续迭代将带来巨大的应用空间,许多新场景亟待被发掘: 当AI综合摄像头、手环、声音传感器等各类设备指标察觉到你情绪低落时,就会主动为你播放一些轻松舒缓的常听曲目,并主动尝试与你聊天为你缓解压力,AI成为知你懂你的贴心朋友; 家中长辈从起床、吃饭、吃药到休息,在家中的状态时刻被摄像头以及各类传感器综合追踪感知,按需及时提醒,仿佛有一个24小时贴身健康管家; 小长假全家旅行前手忙脚乱,AI细心地根据家庭档案,把爷爷要吃的药、奶奶要带的护腰都提醒到位,并且根据家庭档案中孩子的身高,细心提醒家长不要忘了在旅游景点买全票,AI成为懂你全家的超级大管家。 所有的一切,理论上都在Xiaomi Miloco的能力范围之内,未来都有可能成为现实。 总体来看,在Miloco 2.0的加持下,曾经对家庭场景是一片“盲区”的Agent,终于可以借助新的眼睛、耳朵和各类感知能力,去懂用户、懂用户的家,懂用户在家的一系列复杂状态和需求,进而提供真正主动有温度的智能服务。 Agent时代的智能家居体验,被彻底革新。 二、深度拆解Miloco架构:让Agent真正“懂家”,掐紧隐私安全底线 通过这一系列出色的AI场景体验我们不难看到,Miloco 2.0的开源直接将智能家居的AI生态协同体验带到了一个新的高度,而今天距离Miloco 1.0正式开源仅仅过去7个月。 如果说1.0解决了AI与设备的联动,搭好了框架,那么2.0则真正实现了全屋智能的“Agent化”。 从架构上来看,端侧Miloco 2.0系统与主AI Agent之间实现了高效的协同配合: Miloco部署在本地,利用米家设备作为入口,调用云端的omni(全模态)感知大模型进行视觉、声音、环境的全屋理解与身份识别,把感知、处理后的关键结构化信息发送给主Agent,随后主Agent调用云端大模型模型进行全局任务规划与决策,规划出执行步骤后,再向Miloco发起调用,最终Miloco联动全屋米家智能设备完成AI服务的闭环。 值得一提的是,想要实现这一套看似极为超前的“次世代智能家居AI体验”,门槛已经大大降低,普通小白用户也可以很轻松的上手体验,完成部署。 你最少只需要: ·一台能跑OpenClaw的电脑(跨平台支持Mac/Windows/Linux); ·一个绑定了家里米家设备的小米账号; ·一台米家摄像头作为视觉感知入口; ·一个多模态大模型的API Key(当然小米官方推荐的是其自家的MiMo) 目前Miloco 2.0已经接入了Agent圈受众最为广泛的OpenClaw,根据官方信息,后续Miloco也会陆续适配更多Claw类产品。 对于用户来说,Miloco 2.0已经做了大量优化简化,你只需要给OpenClaw发送指令,它会自动帮你完成环境准备、绑定账号和模型,全程几乎不需要更多操作,可以说极大地拉近了AI前沿技术与消费级场景的距离。 虽然部署上大幅简化,但在用户最关心的安全方面,Miloco却一点都没省: 所有摄像头、各类传感器收集的原始数据“用完即弃”,数据完全本地保存,绝不留存云端,随时可清空,即便忘记,30天后也会自动清理。用户还可以给摄像头设黑名单、给家庭设白名单,可以说数据完全由用户掌控。 值得一提的是,这些原始数据与OpenClaw完全隔离,Agent能获取的信息只有Miloco系统判断完所给出的“发生了什么”的语义结果。 安全这道“底线”,小米狠狠掐住,不留任何风险。 三、抢先用AI Agent变革智能家居,下一个十年小米能否继续领跑赛道? 在今天的Agent时代,小米有望重新定义智能家居发展的新范式和方向。从Miloco 1.0到今天的2.0,AI时代、大模型和Agent加持下的智能家居到底要怎么做、如何跑通,小米已经交出了一份蓝本式的答卷。 而这份答卷的背后,是小米近年来AI实力的飞速增长。 小米旗舰大模型MiMo-V2.5-Pro在通用智能体能力、复杂软件工程以及长任务等维度上都达到了全球顶尖Agent模型水平,在Artificial Analysis大模型综合智能榜单上,Xiaomi MiMo-V2.5-Pro综合智能指数位列全球开源大模型并列第一。小米MiMo大模型也是此次Miloco 2.0的智能核心。 根据全球AI模型监测平台OpenRouter 6月10日数据,小米MiMo-V2.5模型单周调用量达到了2.19万亿,位列全球第二,仅次于DeepSeek。 而就在最近,小米MiMo团队与推理系统团队TileRT联合宣布,Xiaomi MiMo-V2.5-Pro的UltraSpeed模式已实现万亿参数(1T)旗舰模型输出速度首次突破1000 tokens/s,实现10倍速度提升只需要3倍价格。 在“人车家全生态”战略下,AI是小米核心攻坚的技术领域,未来三年的计划投入约600亿元。这次Miloco 2.0的落地、与OpenClaw的强力结合,无疑是小米在“AI x 家”这个场景中迈出的关键一步。 小米在AI领域的技术实力已不容小觑。 与此同时,我们也看到,小米这家公司做“把Agent与智能家居结合”这件事时,展现出了行业其他厂商难以望其项背的“生态护城河”优势。 回望过去十几年,小米一直是智能家居赛道的生态王者,十年前,米家基于过硬的产品力、远超行业的统一互联体验,定义了智能家居领域的“互联互通时代”,而互联体验也一直都是小米生态的王牌之一。 当前小米生态中的AIoT设备连接数量已经接近12亿,小米有着全球独一无二的庞大用户生态,这样的IoT基座提供了极其丰富的硬件生态,让Miloco的成长天然有着最肥沃的土壤。 客观来说这是小米在AI领域几乎“不可复制”的生态护城河。 今天,Miloco 2.0到开源并不是一次简单的软件迭代,而是全屋智能向“系统级Agent”方向进化的一次关键技术迭代。领跑智能家居的下个十年,小米已经冲在了行业最前面。 相信在不久的将来,当十多亿设备真正接入AI时,智能家居领域真正的“GPT时刻”,或许就会到来。 结语:Agent加速进家,AI家居时代来了 智能家居发展了十几年,如果说此前的变化类似“线性积累”,那么Agent时代所带来的剧变可能会是一次“指数级爆发”,AI彻底突破了我们的想象空间,Agent、大模型与全屋智能设备协同联动,碰撞出新的玩法,大开脑洞。 而这一切的实现,都离不开类似小米这样的底层技术生态支撑者,唯有从硬件、系统、模型到应用生态的全面协同打通,才能让Agent进家有真正好的体验。 此次Miloco 2.0的开源,也必然会显著降低三方硬件厂商和开发者切入全屋Agent的门槛,吸引更多开发者加入到小米Miloco生态中,这也会进一步加速智能家居行业向Agent时代的全面进化。 展望未来,“贾维斯”式的超级AI管家必然会加速走进每一个普通用户家中,并且是以更亲民的价格和更低的部署门槛。“你不用顾家,家会顾你”不再是一句“玩笑话”,而是会成为看得见摸得到、享受得到的现实体验。
宝马将停产所有国产纯电车型?知情人士回应
6月19日消息,近日,网传宝马将于7月起全面停产i3、i5、iX1等全系国产纯电车型。 针对市场传闻,一名接近宝马官方人士向《中国经营报》表示,此次停产系品牌基于市场节奏与产品周期的常规产能调整,并非退出国产纯电市场。 据知情人士透露,本次现有国产纯电车型生产调整,核心目的是集中产能、资源,全力铺垫BMW新世代车型国产落地工作。全新新世代车型将在整车技术、智能座舱、自动驾驶及用户出行体验上实现全方位迭代升级,精准适配中国新能源市场消费升级趋势。 上述知情人士表示,此次产能与产品调整不会影响在售车主及购车用户的全生命周期售后、维保等配套服务,用户原有权益保持不变。 另据每日经济新闻报道,一位接近宝马的知情人士表示,上述车型的生产调整属于正常的EOP(End of Production)流程,主要是为了切换产线迎接新世代车型,但这并不意味着消费者无法购买上述车型,市场供应仍然充足。 公开信息显示,自2023年起,宝马国内交付量连续三年下行,2023年全年交付82.5万辆,2024年交付71.45万辆,同比下滑13.4%;2025年交付量降至62.55万辆,同比再跌12.5%;进入2026年一季度,宝马在华交付14.4万辆,同比下滑10%。 新能源板块差距更为明显,当前宝马在华新能源车型整体渗透率仅6.6%,而2025年国内乘用车市场新能源全年渗透率已达到54.1%,二者存在巨大断层。 细分到三款待停产车型,市场表现同样疲软,i3曾是品牌纯电销量支柱,但终端长期8万元以上大幅优惠,利润持续承压;i5上市后市场反响冷淡,iX1则持续被自主品牌紧凑型纯电SUV分流客源,三款车型长期处于亏损销售状态。
苹果计划涨价:欲购iPhone,必承其贵
热闹的 WWDC 26 已经结束,我们是时候把目光转向真正的「科技春晚」了—— 9 月份的三台 iPhone,可以说是近年来期待程度最高、信息最密集、争议也最大的一代了 图|9to5Mac 更重要的是,无论苹果新 CEO 约翰·特努斯能够拿出什么样的产品,都无法避开一个残酷的现实: 今年的 iPhone 无疑是最强的一代,同时也是最贵的一代。苹果真正的挑战不一定来自供应链,也可能来自消费者的钱包。 昨天《华尔街日报》对蒂姆·库克进行了一次专访。库克这样对记者 Rolf Winkler 表示: 我们一直努力消化(供应链)传导过来的涨价,也尽量避免波及到消费者,但形势正在变得不可持续。 We're doing our best to mitigate the huge increases that are being passed to us, and we've been trying to shield our customers from the increases, but the situation has become unsustainable. 库克的表态总结起来,其实就是一句话: …不幸的是,价格上涨是无法避免的。 The main point is unfortunately price increases are unavoidable. 图|华尔街日报 9 月:最强的 Pro,最贵的折叠 如果 WWDC 前后的几轮最新爆料属实,那么今年 9 月的 iPhone 18 Pro 系列与折叠屏 iPhone Ultra,将会是一次非常激进的更新。 对于直板 Pro 来说,我们可以用一句话描述今年产品策略: 在安卓影像旗舰的高售价难以为继的时候,抛出一套来自苹果的影像解决方案,进一步封锁安卓的高端空间。 图|Macworld 换言之,今年 iPhone 18 Pro 和 iPhone 18 Pro Max 的升级重点仍然落在影像系统上。 根据多方爆料,苹果有望给 iPhone 18 Pro 系列的主摄引入可变光圈。 与之相辅相成的,就是专业相机模式虽然没在 iOS 27 首版上线,但根据预测仍然有希望在正式版中加入。 图|彭博社 另一方面,这也意味着 iPhone Pro 不只是延续曾经「让普通人拍好」的逻辑了。 而是终于开始尝试在专业控制和创作自由度上,进一步向专业相机靠拢。 考虑到 App Store 里面数不胜数的专业相机 app,我们必须给出一个很残酷的评价: iOS 相机如果新增了专业模式,比任何安卓影像 Ultra 都更能吸引普通用户尝试专业摄影。 至于外观方面,从一些工厂和 CAD 泄露来看,iPhone 18 Pro 系列的整体外观变化不大。 由于依然是铝合金包裹玻璃背板的设计,iPhone 17 Pro 系列易磕碰的缺点可能也会继承下去: 图|YouTube @fpt. 有意思的是,一些爆料指出 iPhone 18 Pro 系列的相机平台(plateau)会变得更厚,甚至镜头本身也更突出,可能代表着传感器面积的升级。 不过整体来看,苹果今年的硬件资源还是集中在相机系统上,完全重做机身恐怕要等到二十周年的 iPhone 20 了: 图|X @Saurav_DJ47 续航方面,则没有什么值得惊喜的消息。 iPhone 18 Pro 预计仍为 eSIM 与实体 SIM 版本共存,国行大概率会保持双实体卡的配置,两个版本电池容量增幅都不会超过 10%。 如果发布会上宣传了续航提升,更多肯定还是靠 2nm 制程以及 iOS 27 优化,而不是更大的电池。 图|YouTube @fpt. 而 9 月最大的变数,则是 iPhone Ultra。 对于这台全世界等待了六七年的苹果折叠屏,现在的问题并不是信息太少,而是信息太多—— 各种预测都有各自的口径,从「遥遥落后」到「外星科技」都有,让人很难理性地考虑是否购买。 图|YouTube @fpt. 目前能够交叉印证的是,折叠屏 iPhone Ultra 肯定是一台「横向折叠」手机,内屏长宽比约为 1:1.41 的横向宽屏: 图|YouTube @fpt. 同时从 iOS 27 新增的「左上角飞入」通知动画猜测,iPhone Ultra 有可能会采用内屏左上角挖孔的方案: 图|Macworld 屏幕尺寸方面,目前的主流预测集中在 7.8 英寸内屏和 5.5 英寸外屏,展开尺寸略小于 iPad mini 7。 此外,A20 Pro 处理器、C2 基带、新工艺的 VC 均热板等等都是爆料中的常客。 陪伴 iPhone 快十年的 Face ID 则会让位于 Touch ID 的文艺复兴,并且和相机控制按钮整合在一起: 图|Notebookcheck 单侧机身厚度薄至 5mm 以下的另一个结果,就是 iPhone Ultra 完全不是一个主打影像的产品。 和 iPhone Air 的取舍相同,iPhone Ultra 大概率会是个「Pro 级主摄」加「标准版超广角」的组合: 图|YouTube @fpt. 目前唯一可以确定的是,iPhone Ultra 未必是「功能最全」的 iPhone,但大概率是形态最激进、价格最高、也最能重塑产品线定位的一款。 4 月:升级的 Air ,不变的 18 如果说 9 月的 Pro 系列和 Ultra 代表苹果最昂贵、最激进的旗舰方向,那么预计 2027 Q1 登场的 iPhone Air 2、iPhone 18 标准版与 iPhone 18e,就是苹果重整主流市场的一次关键调整。 按照目前多方爆料,苹果未来几年会延续这种将 Pro 和标准版拆开发布的节奏—— 也就是将秋季发布会留给 Pro、Pro Max 与折叠屏 Ultra,标准版、e 系列和其他机型则转向次年春季。 图|PhoneArena 这也意味着 iPhone 延续了十多年「秋季大戏」模式,正在被更清晰的「高端与主流双周期」所取代。 其中比较值得关注的,是高开低走的 iPhone Air 2。 根据彭博社最新报道称,第二代 iPhone Air 内部代号 V62,已进入了后期测试阶段,发布时间将从原本的秋季调整到明年春天。 图|X @AppleTrack iPhone Air 2 不会有非常激进的外观调整,而是在现有超薄设计的基础上填补上一代的核心短板:影像和续航。 目前 iPhone Air 的主要争议之一,就是标价八千多,却只有单颗后镜头,在影像能力上显著弱于标准版。 传闻中 iPhone Air 2 考虑加入超广角镜头,就是直对「轻薄有余、功能不足」的正面回应。 同时,双摄至少能让 Air 系列更像是个能日用的主力机,而非单纯展示工业设计的概念产品。 图|zeera wireless 续航则是另一道难题。 由于机身厚度限制,双摄会进一步挤占主板空间,iPhone Air 2 肯定不会简单粗暴地扩大电池,而是从芯片和系统优化两方面入手。 有信源称 iPhone Air 2 将使用特殊调优过的 A20 Pro 处理器,与 Pro 系列的差别不只是砍掉核心,而是在芯片设计初期就针对能耗比做针对性调整。 图|iFixit 虽然从成本角度考虑,这样的操作不是很苹果,但如果传闻属实,那 iPhone Air 2 无疑是个比初代 Air「更香」的选择。 相比之下,iPhone 18 标准版和 iPhone 18e 无疑是苹果 2027 年的「基本盘」,在硬件设计和规格参数上和前代几乎不会有明显差别。 总之,iPhone 18 标准版就是苹果在面对无法避免的涨价潮时,用于稳定主要换机群体的那块压舱石。 而 iPhone 18e 则继续承担入门机型,最大的升级点除了 A20 处理器之外,还可能是灵动岛。 图|AppleMagazine 一句话概括——未来两三年,苹果的 iPhone 产品线会形成一个更加明确的分层: 秋季展示技术高度,春季承接主流销量;Ultra 负责展示技术,Pro 负责专业影像,Air 负责轻薄时尚,标准版负责均衡体验,e 系列继续在价格入口「稳稳接住你」。 同时有观点指出:iPhone Ultra 与 iPhone 18 Pro 系列将通过自身涨价的方式,以换取明年初的标准版和 18e 价格不变。 这个论断虽然缺乏依据,但强势如苹果,在内存涨价的潮水中被迫退让也同样是事实—— 图|YouTube @WSJ News 除了蒂姆·库克在接受《华尔街日报》专访时指出的「涨价无可避免」之外,知名半导体行业分析师 Jukan 也发推表示: 连英伟达都因为缺货将(Vera Rubin 用的)SOCAMM2 内存砍半,我不认为苹果也能弄到足够的内存,苹果未来可能会直接动用账上现金、以预付款的方式向供应商锁定产能,维持零部件供应和 iPhone 出货量。 在这种背景下,明年的 iPhone Air 2、iPhone 18 和 iPhone 18e 未必是最强的一代 iPhone,却可能是最能决定苹果销量结构的一代。 只是当 Ultra 与 Pro 推高旗舰价格后,这些春季发布的「相对主流」iPhone,还能继续便宜到哪里呢? 作者|马扶摇 编辑|肖钦鹏
瑞典呼吁欧盟阻止FSD推广,除非特斯拉禁用“超速”功能
IT之家 6 月 19 日消息,据路透社 18 日报道,瑞典交通管理局建议,除非特斯拉取消 FSD(监督版)的超速功能,否则应反对其在欧盟的全面推广。 报道援引瑞典交通管理局信中的话说,FSD 可以无视道路限速,特斯拉如果不移除这项功能,欧盟就不应批准 FSD 上路。 瑞典交通管理局已将信函提交给欧盟机动车技术委员会。委员会定于 6 月 30 日再次讨论 FSD,并将在日后表决是否允许这项技术在欧盟全面推广。 特斯拉目前已在部分欧洲国家获得 FSD 使用许可。据IT之家了解,驾驶员保持监督时,FSD 可以控制车辆在城市道路和高速公路上行驶。欧盟全面放行 FSD 将有助于特斯拉提振欧洲销量。目前,中国纯电汽车品牌正在欧洲市场给特斯拉带来越来越大的竞争压力。 特斯拉没有回应置评请求。特斯拉用户手册提醒驾驶员,不应完全依赖系统判断限速,必须根据交通和道路状况以安全速度驾驶。 不过,FSD 提供“速度偏移”功能,驾驶员可以自行设定超出道路限速的幅度。 FSD 通过摄像头和地图数据识别限速。在美国,FSD 允许车辆超过法定限速,并提供“树懒”“舒缓”“标准”“急速”和“疯狂麦克斯”等不同驾驶模式。欧洲版 FSD 没有这些模式,而是提供“基于路况的最高车速”和“速度偏移”功能。前者会根据交通流量调整车速,后者则允许车辆超过法定限速。 芬兰和挪威等北欧国家也对超速功能表示担忧。另一方面,继荷兰之后,立陶宛、爱沙尼亚、丹麦和比利时最近已经批准 FSD。 FSD 要在欧盟全面获批,必须得到 27 个成员国中至少 15 个国家支持,而且支持国家的人口总数必须达到欧盟人口的 65% 以上。
无法软件修复:苹果A12/A13芯片曝新漏洞,影响iPhone 11系列等
IT之家 6 月 19 日消息,安全公司 Paradigm Shift 昨日(6 月 18 日)发布博文,宣布在苹果 A12 和 A13 芯片上发现 BootROM 漏洞,将其命名为 usbliter8。 在受影响机型方面,该漏洞影响搭载 A12 和 A13 芯片的设备,涵盖 iPhone XS、iPhone XS Max、iPhone XR 和 iPhone 11 系列,此外搭载 S4 和 S5 芯片的多款 iPad 和 Apple Watch 设备也受到影响: 11-inch iPad Pro (第一代) 11-inch iPad Pro (第二代) 12.9-inch iPad Pro (第三代) 12.9-inch iPad Pro (第四代) Apple Watch SE (第一代) Apple Watch Series 4 Apple Watch Series 5 iPad (第 9 代) iPad (第 8 代) iPad Air (第 3 代) iPad mini (第 5 代) iPhone 11 iPhone 11 Pro iPhone 11 Pro Max iPhone SE (第 2 代) iPhone XR iPhone XS iPhone XS Max 根据博文内容,该漏洞利用苹果 A12 和 A13 芯片内置的 DWC2 USB 控制器硬件 Bug 与特定固件配置缺陷,实现应用处理器启动链的完全攻陷。 该控制器在接收 USB Setup 包时采用环形 DMA 缓冲机制:每接收一个 8 字节 Setup 包,DMA 地址指针递增 8 字节;但接收第四个包时,控制器会尝试将指针回退 24 字节,从而实现环形复位。 然而控制器也接受小于 8 字节的包(但始终按 4 字节对齐存储),导致指针递增量(实际写入大小)与固定递减量(24 字节)不匹配,形成 12 字节步进的缓冲欠载(buffer underflow)原语(primitive)。 在 A12 上 ds,dUSB 控制器的 DMA 缓冲区位于堆中,紧邻 USB 任务栈。通过欠载原语覆盖栈上保存的 LR 寄存器,当调度器切换回 USB 任务时,即可劫持 PC。 A13 则因引入 PAC(指针认证)和堆元数据校验而复杂化。攻击者需分多步绕过: 首先覆盖 DART(设备地址重映射表)相关数据结构,利用 DART 清理例程中的零写入原语清空全局 DART 指针,避免堆校验崩溃; 随后利用 MMIO 寄存器写入 0xF,覆盖全局 panic 计数器,使后续 panic 进入无限循环而非重启; 再精确控制 DMA 写入时机,在 USB 任务运行时覆写其任务结构中的临界区深度字段,触发带 IRQ 的 panic 进入无限循环; 最后在无限循环中继续 DMA 写操作,覆盖 BSS 段中的 USB IRQ 处理函数指针,获得完全 PC 控制。 获得代码执行后,攻击者利用 SecureROM 中罕见的 EL1 模式切换点(SVC 0 指令)。A12 上通过 ROP 链将 DMA 目标地址设为 boot trampoline 区域(只读执行区,但 DMA 可写),写入 shellcode 后跳转至 EL1 权限执行。 尽管该漏洞无法通过软件修复,但利用条件苛刻,需要物理接触设备,且不会直接威胁安全隔区处理器。苹果已收到通报,建议用户升级至 A14 及以上芯片设备以确保安全。
12GB内存组件涨幅271.79%:苹果256GB版iPhone 18 Pro售价恐涨18.2%
IT之家 6 月 19 日消息,华尔街日报昨日(6 月 18 日)发布博文,预估苹果 iPhone 18 Pro 起步售价将上涨 200 美元,从 1099 美元上涨到 1299 美元,增幅为 18.2%,甚至不排除升级到 1399 美元(涨价 300 美元,涨幅 27.3%)的可能。 IT之家昨日报道,苹果首席执行官蒂姆 · 库克表示,AI 热潮引发的存储芯片严重短缺和价格暴涨,涨价已“不可避免”。苹果公司此前一直在努力消化成本,但当前局面已“不可持续”。不过他未透露涨价的具体时间、幅度及受影响产品。 华尔街日报认为,导致苹果 iPhone 18 Pro 起步价格上涨的“罪魁祸首”,就是因 AI 浪潮冲击,导致的 DRAM 内存和 NAND 闪存芯片供应短缺和价格飙升,研究机构 TechInsights 预测,这两种芯片的价格今年秋季将比去年上涨四倍。 该媒体分析成本后指出,iPhone 17 Pro 的 12GB DRAM 成本约 39 美元,256GB 闪存成本约 13 美元。而在 iPhone 18 Pro 上,DRAM 成本可能跃升至 145 美元,涨幅 271.79%,闪存升至 51 美元,涨幅 292.31%。 该媒体指出如果计算其他零部件与组装成本约 530 美元,iPhone 18 Pro 的总物料成本将从 582 美元(iPhone 17 Pro)增至 726 美元,增幅达 25%。 为维持与 iPhone 17 Pro 相同的 47% 毛利率,苹果需将定价设为 1371 美元。但由于苹果习惯采用标准化整数定价,更可能的售价为 1299 美元,对应 44% 的毛利率。 供应链分析师郭明錤表示,新相机系统成本可能比前代高出 50%,若计入这一因素,起售价或进一步升至 1399 美元(IT之家注:现汇率约合 9477 元人民币)。
小米们开始给旧手机电池扩容,充电宝悬了
文 | 源Sight,作者 | 白河、杨子一 从曾经出门必备的续航神器,到如今“非必要不携带”的安全隐患,充电宝真的要淡出历史舞台了吗? 近日,天津航空一由天津飞往揭阳的航班在即将落地之际,客舱内突然出现大量浓烟,机组人员按程序处置后发现,这次险情是由旅客携带的充电宝冒烟引致。尽管事件并没导致人员受伤,机上设施设备无损坏,但天津航空还是建议旅客后续乘机出行时“优先选择不携带充电宝”。 来源:微博 自去年上半年因产品质量问题频发并引发行业集体震动以来,过去一年,充电宝已经成为公共出行领域监管关注的重点。 按照民航局规定,自2025年6月28日起,旅客携带充电宝乘坐中国境内航班,禁止携带没有3C标识、3C标识不清晰,以及被制造商公开召回的型号或批次产品,仅符合要求的3C认证充电宝可正常携带。 今年4月份,由工信部组织制定的“充电宝新国标”,即《移动电源安全技术规范》(GB 47372-2026)正式发布,新规不仅大幅强化充电宝电芯安全测试标准,还将强制要求产品标注制造商、生产日期、建议安全使用年限等信息,同时监管触角将全面延伸至原材料管控和生产过程质量管理。 国泰君安证券预计,新国标的实施将会大幅提高行业门槛,近七成现有产能因无法达标将被迫退出市场。 就在“最严新国标”出台引发外界对充电宝行业前景思考之际,安克创始人阳萌的“充电宝消亡论”近日也开始在社交媒体流传并掀起大量讨论。 在近期一档访谈节目中,阳萌提及他在2016年抛出的观点,即“充电宝这个品类,不但一定不会变成千亿元级品类产品,它大概率过几年就死了。”阳萌认为,尽管现在充电宝还没有到消亡的节点,但他笃定“充电宝这个品类一定会消失”。 召回风波 阳萌这番言论看似激进出位背后,离不开安克企业转型需求的危机感考量。 阳萌认为,类比过去MP3、磁带机等火爆产品的生命周期不过10年至15年,而充电宝自2012年前后开始高速增长以来,预计到2027年左右将会开始衰退。 基于这一判断,安克近年开始加速“去充电宝化”,走上多元化之路,构建起充电储能、智能创新及智能影音三大产品线。财报显示,2025年,安克创新全年实现营业收入305.14亿元,同比增长23.49%;扣非归母净利润为21.79亿元,同比增长15.44%。 其中,充电储能类收入154.02亿元,同比增长21.59%,占总营收的50.47%,仍是公司最重要的营收支柱;智能创新类收入82.71亿元,同比增长30.53%,占总营收的27.11%,增速居三大业务之首;智能影音类收入68.33亿元,同比增长20.05%,占总营收的22.39%。 来源:安克创新财报 在实行多元化的同时,安克也在加速精简充电宝产品型号。在上个月年度股东大会上,公司高层表示过去产品型号过多是品控隐患的根源,为此过去18个月,安克已经削减约70%的充电产品型号,未来18个月计划还将继续削减50%至70%。 去年以来,充电宝行业经历了一轮漫长的召回风波,也让外界更多思考起充电宝品类的发展方向。 2025年6月,北京多所高校发布通知,称罗马仕充电宝在充电时相较其他品牌更容易发生自燃,消息迅速登上微博热搜第一,充电宝行业长期存在的安全隐患被彻底曝光。 经媒体调查发现,这次风波根源指向了供应链上游厂商安普瑞斯,为节约成本,这家电池巨头将部分批次充电宝电芯产品外包给外部代工厂生产,代工厂又违规替换了电池正负极间隔膜的原材料,最终埋下了充电宝产品可能燃烧或爆炸的隐患。 安普瑞斯后续超过70项和电池电芯相关的3C认证被暂停,各大充电宝品牌官宣终止与其合作。据市场监管总局后续披露数据,2025年全年市场监管部门共督促多家头部企业实施移动电源召回10次,涉及产品数量达139.77万台。 这场自燃召回风波,揭开了充电宝行业长期以来存在竞争乱象,繁荣市场背后是低价竞争驱动下的劣质电芯泛滥、认证造假以及生产流程粗放等安全隐患。据此前官方抽检,移动电源不合格发现率甚至一度高达25%。 新国标出台 随着充电宝热失控事件频发,监管部门重拳出击,以罗马仕为代表的行业一批长期忽视质量管控的企业开始走向停产、倒闭,然而充电宝的市场信任危机仍未彻底解除。 去年6月,民航局充电宝新规全面实施,要求没有3C标识、3C标识不清晰、被召回型号或批次的充电宝,禁止携带乘坐境内航班。但时至今日,在社交媒体上仍有不少消费者不了解这一规定的执行范围,在选购全新充电宝时,产品能否携带上飞机仍是大众考量的重点。 充电宝新国标的出台和落地,或将有望改变这一现状。 工信部在今年4月3日正式发布被称为“最严新国标”的《移动电源安全技术规范》(GB 47372—2026),作为我国首部针对移动电源的专用强制性国家标准,它的出台标志着行业彻底告别粗放式发展。据了解,这一新规将于明年4月1日正式实施。 来源:全国标准信息公共服务平台 与过往执行的通用标准相比,充电宝新国标多项安全标准有了大幅提高。 新国标明确要求提升移动电源在高温、过充、挤压等滥用场景下的安全防护能力,其热滥用测试试验温度过去130℃提高至135℃,测试时长从30分钟延长至60分钟,且对于“户外电源”产品,还增加了加热不允许起火的要求,同时引入电池针刺试验,从源头降低安全风险, 此外,这次新国标还新增电池循环老化后析锂检测,以降低移动电源长期使用后的内部短路风险,针对移动电源提出智能管理要求,不仅明确电池电压、温度等关键参数的实时监测要求,还要求产品具备异常信息存储与读取功能,并要求标注制造商、生产日期、建议安全使用年限等信息。 更关键的是,新国标正式将安全管控延伸至生产制造全流程,明确提出原材料、生产过程管控要求,严格限制生产过程中的杂质含量,从根源上提升移动电源的安全水平。 据南都湾财社引述工信部有关负责人说法称,新国标实施后,消费者此前购买的已取得3C认证的合规移动电源产品,仍可以继续正常持有和使用。 国泰君安证券预计,新国标的实施将大幅提高行业门槛,近七成现有产能因无法达标将被迫退出市场,大量缺乏品控和研发能力的贴牌厂商面临出清风险,与此同时,优质电芯、新增的BMS(电池管理系统)芯片以及屏幕硬件升级等要求,将会显著推高制造成本。 这也意味着,新国标带领行业走出中低端无序价格战的同时,消费市场或许也将迎来新一轮的产品涨价潮。 需求端变化 过去十多年,随着智能手机市场爆发引起用户出行续航焦虑,移动电源市场规模实现持续高速增长。 中研普华产业研究院报告显示,我国移动电源市场规模已从2015年的约100亿元增长至2020年的约300亿元,年均复合增长率达到约30%,预计2025年市场规模为500亿元。 然而,在充电宝遭遇“最严新国标”之际,市场需求端开始发生结构性变化。洛图科技数据显示,2026年4月中国移动电源线上市场零售量为323.7万台,同比下降4.2%,今年前四个月线上销量连续录得同比下降。 这一变化最直接冲击或许来自当前国内智能手机电池技术的突破。 Counterpoint最新的《全球手机机型销量追踪报告》显示,2025年5月中国市场智能手机的平均电池容量达到5418mAh,同比增长11%,比海外市场平均水平高出518mAh。这一增长的主要驱动力是国内手机厂商快速采用硅碳负极电池技术,通过将传统锂电池中的石墨负极换成“硅+碳”的复合材料,让同样体积的电池塞进更多电量。 另据不完全统计,过去主要用于三防手机、超大尺寸机型的6000mAh级电池,如今已经成为国产旗舰标配,今年以来,包括荣耀、vivo、OPPO、红米等多家头部品牌已经或计划推出10000mAh级别的超大电池机型。 另外,小米在今年4月正式推出官方“电池升级扩容”服务,其中扩容换电的材料费用为149元,另需支付40元统一人工费。目前,该服务覆盖小米13、小米13 Pro、小米13 Ultra三款机型,其中小米13的电池容量可以从原本的4500mAh升级到了4850mAh,而小米13 Ultra的电池容量则可从出厂的5000mAh升级到了5500mAh。 有数码博主消息称,vivo目前也在调研相关升级服务,老机型容量至多增加500-1500mAh。 值得关注的是,欧盟《电池与废电池法规》(EU 2023/1542)正在推动另一场变革。 该法规明确规定,自2027年2月18日起,在欧盟销售的消费类电子产品需配备用户可自行更换的电池,覆盖智能手机、智能手表、无线耳机等产品,届时,手机电池或将全面回归可拆卸设计。 在欧盟新规推动下,长期来看,直接“换电池”有望取代充电宝成为解决续航问题的有效方案,这无疑将进一步压缩充电宝的生存空间。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。