行业分类:
加载中...
头条分类:
加载中...
“宁王系”,排队IPO
本文4209字,约6分钟 作者 | 冯晓亭 编辑 | 吾人 来源 | #融中财经 (ID:thecapital) 宁德时代,又出手了。 近日,中恒电气发布关于控股股东签署《战略投资合作框架协议》事项的进展公告。公告显示,公司控股股东杭州中恒科技投资有限公司(简称“中恒科技投资”)引进宁德时代新能源科技股份有限公司(简称“宁德时代”)的战略投资事宜正在有序推进中,宁德时代拟以40.9985882353亿元(约“41亿元”)认购中恒科技投资新增注册资本。 中恒电气表示,自《战略投资合作框架协议》签署后,各方基于框架协议达成的基本合意,共同推动有关中恒科技投资增资、公司与宁德时代形成战略业务合作关系等具体事宜的洽谈、磋商工作,目前相关工作仍在有序推进中。 值得一提的是,这并非宁德时代今年在资本市场首次出手。 公开数据显示,今年以来,宁德时代宣布入股的上市公司还有富临精工、赛力斯旗下的赛豆科技、世纪互联等。除此之外,今年3月,天眼查工商信息显示,博裕新智新产(宁波)股权投资合伙企业(有限合伙)发生工商变更,新增十余家投资方,其中便有宁德时代的身影;4月,宁德时代发布公告,拟设立全资子公司“时代资源集团”,后者定位为公司新能源矿产领域的专业投资运营与管理平台……凡此种种,不胜枚举。 且从宁德时代出手项目所涉猎的赛道来看,与自己的动力电池主业几乎没有直接关联。由此可见,现市值超万亿元的“宁王”从产业链协同投资,正转向更广阔的生态圈布局,未来也将有越来越多的“宁王系”企业推开二级市场大门。 而跨界进行投资布局的宁德时代并非孤例。放眼望去,越来越多产业龙头正做出相似的战略选择。在传统股权投资机构募资困难、退出遇阻的背景下,以产业龙头为核心的CVC,正逐渐成为中国创新资本市场不可忽视的一支力量。 41亿元,宁王入股中恒电气 这笔交易,前后历时两个月时间。 早在今年4月,中恒电气发布公告称,公司控股股东中恒科技投资拟接受宁德时代对其进行增资。拟议增资完成后,中恒科技投资控股股东朱国锭和包晓茹,以及宁德时代分别持有中恒科技投资35.70%股权和15.30%股权、49.00%股权。受此利好消息影响,公告发布次日开盘,中恒电气一字涨停。 谈及下一步规划,中恒电气在公告中表示,“各方发挥各自在相关领域的核心竞争力和资源优势,促进宁德时代与中恒电气围绕绿色ICT基础设施、交通电动化、新型电力系统(算电协同)等领域开展相关业务及战略合作,整合资源禀赋,赋能公司发展。” 要了解双方为何跨界联手,得先从认识中恒电气说起。 作为一家专注于零碳智能社会建设的数字能源公司,中恒电气深耕高压直流技术路线。公司主营业务涵盖数据中心与站点能源、数字电网与综合能源服务等领域,是数据中心HVDC(高压直流)供电技术方案的行业先行者,核心产品包括数据中心HVDC直流供配电、预制化Panama电力模组、通信电源系统、电力操作电源系统等,目前已广泛应用于互联网、第三方colo、智算中心、超算中心、通信运营商、金融政企等数据中心场景。 虽然名声不显,但国内HVDC行业集中度高,主要有中恒电气、维谛技术等,其中中恒电气凭借客户壁垒与技术优势成市占率第一企业,头部效应有望延续。 目前,AIDC(人工智能数据中心)投资进入高速扩张周期,数据中心供配电市场广阔。全球主要云厂商资本开支已进入放量期,以亚马逊、微软、谷歌、Meta为代表的海外头部云厂商单季度资本开支总额均在持续攀升,增长显著。资本开支的增量主要投向AI基础设施,驱动AIDC投资进入高速扩张周期。供配电系统作为AIDC的底层支撑,其投资规模与云厂商资本开支增长呈强正相关,变压器、HVDC、UPS、开关柜等关键设备需求将同步增长。 与此同时,随着AI大模型的训练与推理需求快速扩张,数据中心的用电量和供电稳定性要求也在同步攀升,配储也相应成为刚需。配储这个场景,恰恰是宁德时代的主场。 双方联手后,可协同解决AI智算中心绿电适配、峰谷调节等核心痛点,共同打造从绿电生产到储能、高效供电、算力消耗的全链路解决方案。简单说,宁德时代的储能系统可以跟着中恒的HVDC,顺着数据中心的渠道,进入一座又一座机房。在此之前,宁德时代便和商汤科技合作,在上海落地了临港智算中心(AIDC),共同建设了一套规模为17.888MW的储能系统,成为算电协同跑通的标杆项目之一。 至于宁德时代和中恒电气交易达成后会擦出怎样的火花,我们不妨拭目以待。 “宁王系”,遍布资本市场 跨界入股上市公司,对宁德时代而言并非新鲜事。 今年以来,宁德时代便以“股权投资+业务合作”的战略投资模式,直接或间接入股多家上市公司。1月,宁德时代和富临精工合作,双方意在加强在新能源产业的深度合作,同时在新兴产业领域构建务实合作格局,实现更深层次的资源整合与战略合作;5月,美股上市公司世纪互联发布公告表示,宁德时代关联公司PJ Millennium,以9.42亿美元(约合64亿元人民币)收购了该公司约6.5亿股A类普通股,有望成为该公司的第一大股东…… 入股上市公司仅是宁德时代投资版图的冰山一角,在投资圈内,它早已是CVC领域的“老手”,于水面之下构筑起了一座横跨产业链上下游的庞大投资帝国。 企查查数据显示,宁德时代对外投资了158家企业,间接持股企业数量更是数以万计,通过投资,宁德时代的触手深入锂电原材料、整车、新能源、航空航天、具身智能等多个前沿赛道。直投项目中,先导智能、奇瑞汽车、首航新能、极氪汽车、日联科技、微导纳米等项目已成功IPO。与此同时,还有大批“宁王系”项目,站在二级市场门外,等待IPO。 与此同时,晨道资本、一村资本、恒旭资本、博裕资本、高瓴创投、国策投资、中金资本、普洛斯隐山资本、溥泉资本等多家投资机构的背后,都有宁德时代的身影。 其中,溥泉资本由宁德时代CVC“宁德时代新能源产业投资有限公司”持股,是后者的核心产业投资平台。据了解,溥泉资本旗下时代泽远基金历经多轮扩募,目前规模已百亿元,聚焦新能源、新能源汽车产业链、储能、机器人、高端制造、半导体芯片六大核心方向。截至目前,基金已落地近30个优质项目,累计投资金额近60亿元,单个项目平均投资额超2亿元。 团队充分发挥产业资本优势,以大比例、低成本方式入局,深度赋能产业链上下游企业。依托宁德时代深厚的产业协同能力,溥泉资本打造了特色化产投模式:一方面深度布局硅碳负极、电池管理系统、能源管理系统等锂电配套企业;另一方面发力通用机器人、智能机械手、自动驾驶矿车等高端制造领域。目前多个被投企业已启动上市申报工作,不少项目即将登陆港股、A股,投资成果丰硕。与此同时,机构同步推进并购基金、早期科技基金、海外美元基金布局,构建起多层次、全周期的投资体系,全面覆盖资源并购、早期科创、成熟项目投资等多个领域。 在溥泉资本投资项目中,独角兽银河通用机器人近日可谓风光无两,于今年3月正式宣布完成新一轮25亿元融资。值得关注的是,本次融资也是大基金通过国家人工智能产业投资基金首次出手投资具身智能赛道企业。 在宁德时代做LP这条路上,最新一幕发生在今年3月。彼时,天眼查工商信息显示,博裕新智新产(宁波)股权投资合伙企业(有限合伙)发生工商变更,新增宁德时代、腾讯、泡泡玛特、唯品会、宁波金控系、北京国管系、国泰海通系等十余家合伙人,出资额由200万元增至约40亿元。值得一提的是,这不是宁德时代和博裕资本首次合作,据悉,该基金将主要投资于科技、医疗健康、消费品和零售领域的成长期及成熟期企业。 不知不觉间,宁德时代的资本触角已经不再只服务于自身的供应链,而开始指向更广泛的财务回报和生态构建。 宁德时代之外,CVC崛起正当时 触手遍布创投圈的宁德时代并非孤例,在这背后其实是一个更大趋势的缩影。 CVC即“公司风险投资”,是指具有主营业务的非金融企业通过子公司对创业企业进行股权投资的行为。其核心特征包括依托母公司资源、追求战略协同效应而非单纯财务回报、激励机制受母公司制度约束等。投资对象多集中于与母公司行业关联度高或早期创新项目,退出时优先收购被投企业。 中国CVC起步较晚,1998年实达集团投资北京铭泰科技发展公司被视为第一个初具规模的CVC投资案例。随后一段时间发展较为缓慢,直至2010年前后,随着腾讯、阿里巴巴等互联网头部企业相继设立战投部门,中国CVC进入发展窗口期。2013年至2015年,在“大众创业、万众创新”的背景下,CVC投资案例数和金额呈现爆发式增长。近年来,投资主体从互联网巨头进一步扩展到宁德时代、华为哈勃投资等硬科技产业资本。 成立于2019年的哈勃投资,由华为投资控股有限公司全资控股,注册资本30亿元,管理规模约70亿元。据企查查数据,哈勃投资对外投资项目共有132个,重点覆盖半导体芯片设计、EDA工具、封装测试、半导体材料与设备等产业链各环节。 其中十余个项目已成功IPO,分别是瀚天天成、强一股份、昂瑞微、天域半导体、天岳先进、矽电股份、赛目科技、华丰科技、美芯晟、裕太微、杰华特、源杰科技、唯捷创芯、长光华芯、东微半导、炬光科技、东芯股份……项目清一色属于硬科技赛道。近年来,哈勃投资进一步将触角延伸至AI大模型和具身智能领域,入股了面壁智能、千寻智能、极佳视界等明星企业。 在创投圈,联想创投同样是CVC阵营中一股不容小觑的强劲力量。 “上一财年,联想创投年投资收益、IPO数量及被投企业生态协同金额等核心数据均创历史新高,交出了一份投资成果与产业价值并举的成绩单。”今年4月1日,联想集团副总裁、联想创投管理合伙人王光熙在联想集团2026/2027财年誓师大会演讲中说道。 累计投资超过300家科技企业,其中25家已成功上市;为联想集团年平均贡献收益超10亿元人民币——这是联想创投成立的第十个年头交出的一份可量化答卷。 政策层面的鼓励也在同步推进。2025年3月,深圳市发布《深圳市促进风投创投高质量发展行动方案(2025-2026)》,明确支持产业链主企业、上市公司开展企业风险投资(CVC)。“推动我市产业链主企业、大型科技企业和上市公司围绕产业链上下游开展企业风险投资(CVC)、参与上下游协同创新;探索设立面向CVC机构的专业化母基金,联合产业龙头、上市公司等共同出资设立一批‘链主’基金,推动重点产业‘补链强链延链’。” 今年4月,上海市国资委发布《关于进一步推动市国资委监管企业私募股权投资基金高质量发展的指导意见》,提出“鼓励监管企业发起设立创业投资基金,着力投早、投小、投长期、投硬科技”“鼓励龙头企业设立企业风险投资基金(CVC基金),围绕创新链布局孵化科创项目”“鼓励监管企业加大S基金、并购基金等组建力度”。 政策支持、产业需求、资本转向……在各方利好作用下,将有更多CVC在路上。
气笑了,不是美国人都不配用 Fable 5 了是吧?
兄弟们,真是一大早就火大。 昨晚还沉浸在用 Claude Fable 5 写代码的快乐中,结果一睡醒就刷到一条推特。。。 Anthropic ( Claude 公司 )官宣: 美国政府援引国家安全权限,发布了一项出口管制指令,暂停任何外国公民(无论美国境内外)使用 Fable 5 和 Mythos 5 模型。 嗯,甚至包括 Anthropic 的外籍员工。 如果你是 Anthropic 你怎么办? 总不能让所有人赶紧上传护照来验证美国身份吧。完了肯定有人骂,大家都是付一样的订阅费,凭啥美国人能用,其他国家人不能用? 所以 Anthropic 只有一条路,为所有用户禁用这两个模型。 如果有差友不太了解 Fable 5 和 Mythos 5,大家可以看下我们前两天的文章。 省流一下,这 2 个模型能力是世界顶尖的,各个天赋点都拉满,完全数值怪。 Stripe 拿它在一个 5000 万行的 Ruby 代码库里做全库迁移,本来要一整个团队干两个多月的活,它一天干完了。后来又纯靠“看屏幕截图”,自己把宝可梦给通关了。 Fable 是面向所有人的通用版,而 Mythos 专门给网络防御那帮人用。 总之呢,上面的声明一发,哥们的 Fable 5 已经离我而去。 亚马逊云服务也第一时间发公告说通知大家,收到消息撤下全部区域范围的 Fable 5 和 Mythos 5 的访问权限。 你要是在Anthropic 官方评论区下方一翻,那些人一个比一个惨。 有个哥们刚在旧金山创业,正用 Fable 开发自己的产品开发到一半,然后模型没了;有人奔着 Fable 5 才来订阅Claude的,结果 100 刀刚出去就没法用了。 还有人发了张戴着耳机、生无可恋的图,写着我花 200 美元买 Claude 计划,就为了用上 Fable。 你可能觉得这帮人是不是有点夸张了,不就一个模型嘛。 不不不,Fable 5 这玩意是真会让人上瘾啊。 有独立开发者说 Fable 5 是第一个让他感到像雇了一个真人程序员的模型,代码几乎都是一次过,现在又要回到 Opus 4.8/GPT 5.5,戒断反应真的太强了。 还有人说在 Fable 恢复之前,做任何有意义的工作都没意义了。因为用 Opus 得吭哧吭哧干 100 小时的活,Fable 1 小时就给你干了。 类似的观点在时间线上数不胜数。 我也很难受。 我是 Claude 忠实用户,尤其喜欢 Opus4.6(仅限2026年2月),那个版本说话很有灵气,给我文章提意见都很对味。 但最近 3 个多月,我先后经历了 Opus 4.6 的永久性降智,也经历了“稳稳接住你”的 Opus 4.7和 4.8 这两坨,过去写的那些 Skill 根本没法正常运作。 但遇到 Fable 5 我真就跟遇到老朋友一样,有了 Opus 4.6 当初的感觉,久违的灵气都回来了,一切开始恢复正常。 结果兄弟重逢还没两天呢,一觉醒来它又没了。。。 所以为啥啊?为啥美国突然要下架 Claude 这两个模型呢? 原因说出来你可能不太信。 是美国政府觉得,自己掌握了一种能“越狱”Fable 5 的方法 。越狱这词儿你可以这么理解,就是绕过模型的安全护栏,骗它说出本来死活不让它说的东西。 总之美国政府觉得,你这玩意不安全! 但问题是,美国政府这所谓的越狱:就是让模型去读一段代码、然后帮你揪出并修好里面的漏洞。 Anthropic 也亲自试了一遍,结果只翻出来几个早就已知的、还都挺小的漏洞。 更关键的是,这些漏洞,换别的公开模型(包括 OpenAI 的 GPT-5.5)不用任何越狱也照样能找出来,这本来就是全世界搞安全防御的人每天都在干的活儿。 哦对了,到现在为止,政府就给了个口头证据,(截至发稿)连一份正经的书面材料都还没拿出来。 就为了这么个东西,一个已经面向全球几亿人开放的商用模型,说召回就给你召回了。 你要是觉得,是 Anthropic 安全功课没做到位、活该被收拾,可能真有一点点冤枉它。 Anthropic 在发布 Fable 模型之前做了大量的安全测试,让美国政府、英国 AISI、还有一堆第三方机构全拉来做了几千小时的红队测试,变着花样想攻破它的。 还挂出 1000 多个小时的悬赏,请全世界的人来攻击,结果没一个人能找到通用越狱(能大范围撬开所有限制的万能钥匙)。 当然,Anthropic 也知道模型不可能做到完美防越狱,零散的小越狱人人都躲不掉,万能钥匙那种迟早也会被人配出来,所以它干脆走了“纵深防御”这条路。 用户就算能越狱,要么只能撬开一条小缝、要么贵到根本不划算,而且 Anthropic 还配上了全程监控和 30 天的数据留存来追踪卡 bug 的人。 即便在模型发布后,Fable 5 模型护栏严格到离谱,只要遇到一点点敏感的问题,就不会回答。 有位生物医学科学家,研究攻克癌症和肿瘤大半辈子,因为顶着“生物学家”身份,上来跟 Fable 打个招呼,就被直接甩给 Opus 4.8 去接待。 后来大家一扒才发现,根本不用你是生物学家,话题只要沾那么一丁点边,立马给你限流。 小红书上还有位网友,就问了句“痔疮能不能自愈”,Fable 5 回答一半也换上 Opus 4.8 了。 甚至我们同事做个正经的代码审查、顺手改俩漏洞,它都不干,理由就是涉及安全相关内容。 一个谨慎到大家天天吐槽的模型,真的会因为一个“安全”问题被下架吗? 一开始我还不明白了: 如果一个模型真有漏洞对安全产生威胁,那不是应该禁止所有用户或者只授权白名单用户使用么? 为什么要按照国籍判定,仅限美国用户使用? 是所有的非美国公民都是潜在的、可造成威胁的犯罪对象?是只有他们才会利用 Fable 5 漏洞? 后来我仔细看了一下 Anthropic 公告写的:美国政府发布的是出口管制指令。 出口管制这套东西,平时是专门用来管高性能芯片、加密软件、特种材料这些可能被用到军事或战略上的军民两用品。 那我是不是可以这么理解,Fable 5 这一回,被划进了和高端芯片同一类的管制品? 因为出口管制天生就是按国别来的,它的逻辑根本就不是“这东西对谁都危险”,而是“这东西不能落到外国人手里”,就跟高端芯片一个道理,美国人随便买,换某些国家就不许买。 过去这些年,美国出口管制基本管的是造模型的那套工具,高端 GPU、AI 芯片、还有造芯片的设备。 真正动过念头要去管模型的,只有 2025 年 1 月那版“AI 扩散规则”,把模型的参数文件运出美国、运到某些国家,才需要许可,可那条规则还没生效就被撤了。 所以这次 Fable 5 被下架,到底是 Anthropic 咎由自取,被自己天天渲染的 AI 恐慌所反噬。 还是宣告着 AI 大模型正式进入“管制品”范畴,成了大国手里能随时收放的筹码? 我不知道。 讽刺的是,Anthropic 那些外籍员工现在用一下自己亲手造出来的模型,是不是都算违规?他们的代码提交记录,等于在记录自己向自己走私管制品? 我不是说没这个模型日子就不能过了,也不是说美国靠这一两个模型又能卡着谁了,几个月差距而已。 我只是觉得 AI 技术应该是普惠的。 两千多年前,作家宋玉写过一篇《风赋》,里面写到: 风者,天地之气,溥畅而至,不择贵贱高下而加焉。 意思是,风是天地间流动的空气,它普遍而畅通无阻地吹过来,不因你的身份贵贱高低而有所不同。 好的技术,本来也该是这么一阵风。它就应该像水、像电、像我们天天在用的互联网一样,是这个时代的基础设施。你可以按能力高低收费,也可以让大家排队等产能。 但唯独不该按身上披挂的国旗去区别对待,何况这种技术还是吸收了全人类精华。 A 社如此,某国也是如此。 撰文:刺猬 编辑:面线 美编:萱萱 图片、资料来源: Anthropic:Statement on the US government directive to suspend access to Fable 5 and Mythos 5 Anthropic:Claude Fable 5 and Claude Mythos 5 推特、小红书截图
机器人伴侣来了!10天预售3800台 搭载养成系情感大模型
记者|杨卉 编辑|何小桃 杜宇 杜波 校对|黄博文 人形机器人终于走到了离家庭场景最近的一次,但做的不是呼声最高的家务活。 上线10天,主打情感陪伴的人形机器人U1为优必选收获超3800台预售订单,对应的定金总额逾千万元。对去年只卖了1079台人形机器人的优必选来说,这次尝试已经算是“小有突破”。 身着修身西装、可上妆、搭载“养成系”情感大模型、支持多维度外观定制、开启IP合作、仅限成人购买使用,这些特性,将这款分男女的人形机器人快速推到了大众视野,也暗示了另一批客群:粉丝经济和“二次元”文化下的年轻消费者等愿意为“养成系”人设付费的客群。有“二次元”玩家向《每日经济新闻》记者(下称“每经记者”)直言,“若价格控制在10万元左右,能与乙游等IP联动,一定会‘卖爆’”。 另一面,独特的风格同时引起了不少担忧,如支持定制可能会导致“高度类似真人”的版权灰色地带;机器人被设计成情感伴侣可能导致用户产生不健康的情感依赖,进一步削弱真实人际互动等。 在业内看来,U1系列标志着人形机器人从技术演示样机(Demo)向消费品的跨越,但未来还需跨过供应链管控、情感算法自然度、伦理争议平衡的三重考验。而产能爬坡、良率控制、交付一致性等也是挑战。短期,U1系列更适合作为高端情感消费品,而非普适性解决方案。 上线10天定金已超千万元 真实转化率仍要打问号 5月底,优必选创始人周剑开通了自己的视频号账号,发布的第一条动态就是官宣消费级人形机器人品牌优世界。此后的20余天,周剑和优必选“挤牙膏”式陆续放出了其首款全尺寸超仿生人形机器人U1系列(以下简称“U1”)的更多信息,并开启网络预售。 每经记者在名为“优世界京东自营旗舰店”的店铺看到,两款超仿生人形机器人(分男女)目前已经开始预订,定金3000元/台(可退),预计将于6月30日上市,价格尚未发布,订单尾款将于7月16日凌晨开始支付。 图片来源:京东截图 尚未公布价格的前提下,根据电商平台的统计数据,截至发稿(6月12日晚8点),U1已获近4000台预订订单。此时U1系列开启预售仅有10天(6月2日开启预售),如此计算,单是定金,优必选就已经拿到了超千万元。 结合电商平台的商品介绍,U1系列共有男女两款机型,其中男款身高183厘米、重42公斤;女款身高168厘米、重35.2公斤,两款机型均支持Wi-Fi连接、单次充电续航时长为2小时至4小时、无“3C”认证;搭载88个高自由度运动关节;配备“养成系”情感大模型、本地加密存储记忆、支持多维度外观定制、已开启IP合作。 相较参数,两款机器人的视觉效果更“抓眼球”。周剑发布的多条视频中,“转评赞”最多的是一条实拍视频。 视频中,男款机器人身着修身西装,戴着金丝眼镜;女款机器人正在被上妆,眼影、腮红、高光一个不落。两台机器人能眨眼、会转头,“氛围感”拉满。“机器人男模”“赛博女友”等称呼也开始在社交媒体上出现。 图片来源:视频号截图 不过,也有不少网友提出意见,如机器人反应略显迟缓、僵硬;智能水平有限;妆容不自然、过于“漫画脸”等。 值得注意的是,目前市面上多数仿生机器人要么是只有头,要么是不能动,U1系列是否可以双足行走,能否抓取物品等细节成为不少消费者追问的关键。 截至发稿,优必选已公开的信息中并未展示U1的行走和手部能力。每经记者就此询问优必选方面,相关负责人称该项目为高度保密,后续会释放更多细节。 除了网友,资本市场也有反馈。披露订单量破2000台的次日(6月8日),优必选股价涨超6%。炒股平台同花顺给这次股价异动的解释是“仿生人订单火爆+工业合作落地”。 在行业观察人士、广州智纹科技有限公司创始人陈松青看来,U1引发关注不是技术参数领先,而是首次把“人形机器人”做成了一个完整的情感消费品,将机器人从“科技展品”变成了“生活方式提案”。消费者买的不是确定性的产品,而是对未来生活的一种“期权”。另外,春晚的蔡明仿生机器人已经做了市场教育,“优必选时机卡得很准。”陈松青称。 不过在陈松青看来,近4000台的预售订单,对优必选而言是一场结构性产能挑战。毕竟定金可退,真实转化率还要打问号。U1涉及88个自由度,其皮肤材质、妆容定制,供应链复杂度等的难度要高于工业场景的Walker系列,产能爬坡、良率控制、交付一致性都是挑战。更为关键的是,若首批交付体验不佳,社交媒体上的负面口碑会呈指数级放大。“所以优必选现在最紧迫的不是能不能造出来,而是能不能让第一批用户愿意晒单。”陈松青称。 民建中央财政金融委员会委员、重庆理工大学发展规划处高等教育研究室主任王文涛直言,U1是人形机器人从技术Demo(样品)向消费品的跨越,背后还有供应链管控、情感算法自然度、伦理争议平衡的三重考验。短期更适合作为高端情感消费品,而非普适性解决方案。 情感消费的高净值人群是目标受众? 近4000台预订,究竟来自哪类用户? 从事战略定位的人士、福建华策品牌定位咨询创始人詹军豪认为,U1主打情感陪伴、核心客群应是庞大的单身独居青年、都市孤独人群,同时也覆盖少量猎奇体验、科技爱好者。 陈松青划定的客群则更为集中。他认为,U1的首要客群不是科技极客,而是情感消费的高净值人群。从“仅限成年人购买”和“情感陪伴”等定位来看,目标用户大概率是35岁至50岁,有一定经济实力、独居或空巢的中产群体,以及部分有特殊陪伴需求的消费者。 另外,IP合作和外观定制暗示了另一批客群:粉丝经济和“二次元”文化下的年轻消费者等愿为“养成系”人设付费的用户。“这一产品本质上卖的不是工具属性,而是‘情绪代偿’,填补现代社会的人际关系缝隙。”陈松青称。 然而,要做好“养成系”也不是那么容易。 据陈松青介绍,普通大模型大多处于“无状态”模式,每一次对话都是全新交互,而“养成系”情感大模型的核心差异,在于具备长期记忆与人格演化能力。它依托本地加密存储持续记录、学习用户偏好与情绪模式,形成专属“人格档案”,本质类似一套持续运行的RAG(检索增强生成,当下热门的大模型前沿技术之一)系统,并叠加情感反馈循环。 “目前市场上,珞博智能的‘芙崽’也主打“养成系”。但那是桌面潮玩,优必选把这个概念搬到了全尺寸人形机器人上,技术难度和场景深度完全不同。不过‘养成系’需要大量真实交互数据投喂,优必选是否有足够的数据闭环能力还需要观察。”陈松青称。 与业内的预测一致,资深“二次元”玩家小时(化名)就很为这款产品心动。 “如果能做成乙游(专门针对女性玩家群体研发制作的游戏类别,主要从女性视角出发,注重虚拟情感体验)的实体化AI仿生人,会卖爆的。把2D游戏形象落地难度较大,但是《恋与深空》(游戏名)本身就是3D建模类游戏,如果能直接做成仿生人的话,这真的得卖爆了。”小时向每经记者表示。 不过小时也提到,价格是很关键的制约因素。若相对“亲民”会有不少玩家愿意付费。但若到了十几万或二十几万元的级别,影响力就难在此类用户中扩大。“其实我觉得要是能打在10万元/台上下,别上15万元的话,卖的可能会好一点。”小时称。 仅限成年人购买使用 业内:需注意版权及伦理隐患 需要注意的是,小时对U1热情满满的前提是,她有自己想要的脸,或者说固定的IP形象。但这类大热IP是否能够合作,目前还需观望。小时了解到,已有游戏公司开始自己着手做仿生人。 若不能与知名IP合作,是否会有玩家要求定制一些类似面貌? “多维度外观定制我感觉就是融各大乙游IP,就是得和游戏公司谈版权问题。”小时告诉每经记者,此前圈里也有类似的产品,如一些个人定制的BJD 娃娃(泛指各种拥有球型关节的精致可动人形人偶)。玩家会通过定制细节,如妆面、肢体等,将其做成自己想要的特定形象,也有不少动漫人物或名人,但很少出现版权问题。 “主要娃娃这个东西不涉及到盈利。比如订假发什么的,都是订材料,然后去找毛娘(给娃娃做头发的商家)去做成喜欢的样子,包括去找妆娘(给娃娃做妆造的商家)画成她喜欢的样子。毕竟没有涉及到规模盈利,不会存在那么严重的侵权问题。”小时称。 图片来源:社交软件/购物平台截图 对此,陈松青直言,目前来看,支持外观定制确实存在版权风险,且是双向的。若用户要求定制某位明星或名人的形象,厂商需承担肖像权审查的义务。而外观高度仿真人,还会催生非完全复刻、仅神态样貌相似的“灰色地带”,建议企业建立前置审核机制,将外观定制限定在原创IP或用户自有形象上,避免卷入侵权纠纷。 由于还未正式上市,目前仅可见优必选明确购买规则:仅限成年人购买及使用。 除了版权,业内热议的问题还集中在伦理层面。 詹军豪表示,极致拟真外观易让大众产生违和、恐惧心理,同时可能引发人际社交弱化、情感过度依赖、隐私数据泄露等问题。行业目前缺乏对应的伦理规范与监管标准,争议或将长期存在。陈松青也提到,U1目前处于高度像人但尚未完美的“谷底”区间,面部动作或表情若不够自然,反而会触发用户的本能排斥。 “更深层的问题在于,当机器人被定位为情感伴侣,它实际上在替代人类最私密的社会关系,可能引发两大问题:一是用户对机器产生不健康的情感依赖;二是进一步削弱现实中的人际互动。”针对这类问题,陈松青认为机器人厂商需要搭建“伦理护栏”,比如明确告知用户产品为AI设备、给出合理使用时长建议、规避过度拟人化的深夜交互场景等。 “技术可以狂奔,但社会心理的准备需要时间。”陈松青称。
AI定义汽车,先有AI再有车,智能汽车进入新拐点
智东西 作者 | 郭月 编辑 | 志豪 汽车行业迭代至今,智能化早已是行业玩家必争之地。 但现实往往令人尴尬:市面上绝大多数打着“智能”标签的车,还在沿用传统燃油时代的那套造车逻辑——先完成整车架构、硬件配置、功能模块的设计,等产品基本定型了,再把语音助手、车载应用这些AI功能作为附加项“塞”进去。 这种“硬件先行、AI后置”的模式,本质是用硬件上限锁死了智能化上限,带来的不是真正的智能,而是一堆各自为战的功能模块。 用户感受到的可能是功能越来越多,但体验往往越来越碎——各模块各干各的,OTA迭代越多,割裂感越强。打个比方,就像在用户面前摆了一桌子菜,足够丰盛,但并不好吃。 正是看到了这些痛点,赛豆科技旗下AI出行品牌AIVA正式登场,抛出了一个全新命题:“AI定义汽车,先有AI,再有车”。 它不是在现有车上“加装”一个更聪明的车机助手,而是改变AI介入产品定义的时机——前置到产品定义源头,让AI先参与用户需求洞察、场景推演、能力调用和交互体验设计,再反向组织汽车产品。 这背后是汽车从交通工具到“AI智能伙伴”的一次根本转向。 一、从硬件先行到AI前置:汽车可化身具身AI生命体 要理解AIVA提出的“先有AI,再有车”,得先看清楚传统造车流程里,AI到底处在什么位置。 在“硬件先行”的逻辑下,整车架构、硬件配置、功能模块这些都做好了,AI团队才被请进来,算力上限已定,传感器配置已定,执行接口已定,AI只能在划定好的范围内发挥,其能力上限从一开始就被框“死”了。 AIVA带来的变革,是让AI从一开始就参与产品定义,而不是在车辆功能确定后再接入AI。 具体来看,这套造车路径可以从四个层面来拆解,每一层都在改写传统造车的规则。 首先是需求前置,传统汽车产品定义,常常从配置清单出发。产品经理靠目标市场调研、推演场景、收集反馈,来判断用户需求。 这种方式存在天花板:人的认知边界,就是需求挖掘的极限。最后落地的产品,往往只是产品经理认知里的最优解,却未必是用户真正想要的体验。 AIVA的路径正好相反,AIVA从真实出行场景出发,借助AI主动挖掘用户在通勤、家庭出行、长途自驾、车内休憩等情境下的真实需求、状态与生活习惯,让产品研发扎根于用户需求本身。 用AIVA总裁、产品经理李博的话说:“过去是人在前面挖矿,现在是AI在前面挖矿,人在后面淘金”,车是从AI对人的理解中生长出来的。 ▲AIVA总裁、产品经理李博 其次是架构前置,在整车架构设计之初,就需要考虑到AI会调用哪些车辆能力、数据接口和执行系统,为AI协同预留空间。 再者是功能前置,造车不再是把功能拆分为层层菜单、让用户手动查找操作,而是让AI围绕用户目标整合全车能力。 最后是学习前置,汽车不应是出厂定型后就一成不变的产品,而要在长期使用中不断理解用户习惯,成为能够持续进化、不断成长的智能伙伴。 这四层前置叠加在一起,汽车便成为了具备感知和行动能力的具身AI生命体。 这种理念已经在AIVA Origin Concept概念车上有所体现,李博介绍了该车型设计初衷,不是为了沿用某种风格,而是从一个朴素的愿望出发:让车能看见人、感知人、回应人。 ▲AIVA Origin Concept概念车 不同于行业里用锋利的棱线来营造现代感、科技感的车型,该车型没有硬棱角,采用连续曲面造型,整体观感就像水滴一样自然舒展,这也是AIVA想传递的,AI汽车不是一台需要驾驭的机器,而是一个能亲近的伙伴。 ▲AIVA Origin Concept概念车 除此之外,其前脸大灯也极具设计巧思,具备了能表达内心情绪的眼神,用户走向它,它可以热切注视,用户比个心,它也能及时回应,成为有温度的陪伴者。 ▲AIVA Origin Concept概念车 按照规划,首款量产车型AIVA ME7将于年内正式亮相,AIVA全系列车型将覆盖20万元以上主流市场,真正走进用户的日常生活。 二、从交通工具到AI伙伴:人车关系将走向何方? 产品定义的逻辑变了,人车关系也随之改变。 传统人车关系的本质,是人与工具之间的单向操作。而在物理AI时代,人车关系正从“操作关系”走向“协作关系”。 车不再只是等着用户告诉它该做什么,而是尝试去感知用户当前的状态,推测可能需要什么,然后主动给出回应。从“被动执行”到“主动理解”的转变,是人车关系演进的真正起点。 而这一切,首先体现在交互方式上。 过去人车交互中,用户需要适应车辆的操作逻辑:记住每个按钮的位置,熟悉每级菜单的路径,了解语音指令怎么说才管用。 而火山引擎副总裁杨立伟认为,物理AI时代,AI汽车的第一大转变,就是交互从“机械生硬”走向“普适鲜活”。 ▲火山引擎副总裁杨立伟 AI深度嵌入车辆后,系统可以根据场景和需求直达任务,导航、座舱、驾驶辅助、娱乐等系统围绕用户意图协同响应,用户不需要刻意学习,只需表达需求就可以达成目标,人车交互变得更加轻量、自然。 交互变得鲜活的同时,智能的呈现方式也在发生变化。 如今行业比拼智能化,往往陷入功能数量内卷,一味堆砌各类场景模式、车载App,但功能的简单叠加,未必能让用户感知到真正的智能。 功能再多,可能也只是工具集合,每项功能能做什么往往是固定的、有限的,难以满足真实出行中时刻变化的场景需求。 真正的智能,不是体现在AI能执行多少条单一指令,而是能否像人一样灵活地理解情境、用好工具、达成目标。 火山引擎副总裁杨立伟举了一个例子:用户说一句“去健身”,AI就能判断你要去的是工作日还是周末会去的那家健身房,知道该导航哪条路,知道你是不是想更快到达、是不是在意好停车,还会自动关注你去程和返程时偏好的空调设置。 这中间涉及导航、空调、泊车等多个系统的协同,没有哪一项是用户单独下指令完成的。 这就是“能力涌现”的价值,AI可以通过对全车资源进行统一调度,围绕用户的一个目标,自动组织起全车的相关能力,给出一个完整的解决方案。 用户获得的也不再是冰冷的功能清单,而是一套能够持续涌现新能力的整车智能体系。 而当人车交互不再费力,智能功能的实现不再需要用户操心,用车体验也随之改变。 用户开车觉得累,往往是因为注意力被重复、持续的操作占用,当AI变得普适、鲜活、聪明,它就能像人一样和用户交流,帮忙做事,用户可以重新拿回属于自己的精力和时间,用车感受从“单调乏味”走向“松弛愉悦”。 这三层变革的背后,其实是人车信任体系的建立与深化,从“我操作它”,经过“它理解我”,最终到达“我信任它”,人车关系最深层的进化方向,或许就在这里。 三、AIVA×火山引擎:通用AI能力×汽车专业场景的共建 “AI定义汽车”听起来很性感,但要把这个愿景落地,却不是那么容易。 当前把AI大模型接入座舱已成为行业热潮,但大多数情况下,它们只是被“搬”到车上,做成了一个更会聊天的智能语音助手,“把AI搬上车”和“让AI长在车上”,是两件完全不同的事。 AIVA走了一条不同的路:与火山引擎联合定义、联合设计,共同打造AI汽车体验。 ▲AIVA、火山引擎共同打造AI汽车体验 火山引擎所做的,是将成熟的豆包大模型与智能座舱技术,全面赋能给AIVA,帮助其提升交互体验,探索AI座舱、多模态交互、车端智能体等能力,提供能理解人、能调度全车资源做事的AI大脑。 然而,通用大模型本身并不足以应对汽车场景。 通用大模型虽具备通用对话、语义理解能力,但直接上车难以深度适配复杂的驾驶场景。车端场景需要的是极度专业化的推理,这背后离不开海量驾驶场景数据的训练,以及对车辆各系统工程边界的深刻理解。 这正是AIVA所擅长的事情,AIVA提供的是汽车的专业场景,包括真实的出行数据、车端反馈和用户交互行为,用这些数据去训练大模型,通用AI就可以被调教成为懂路况、懂驾驶、懂用户的汽车专用AI。 这本质上是“通用AI能力×汽车专业场景”的一次深度共建,火山引擎提供AI大脑的通用能力,AIVA提供汽车场景的训练数据与工程理解,双方合力打造出一个“长在车上的AI”,而不是“被搬到车上的App”——这正是“AI定义汽车”能够落地的关键支撑。 结语:智能汽车进入新拐点 回顾汽车行业走过的一百多年,无论技术如何迭代,定义一辆车的起点往往都是硬件。 AIVA的探索,第一次打破了这个固有认知。当AI被前置到产品定义的原点,它带来的并非只是造车流程的顺序调整,而是将汽车从一个工业产品,变成一个具备感知和行动能力的AI生命体。 用户收获的,也不再只是一份硬件配置清单,而是一份长久陪伴。这辆车会在日复一日的相处中慢慢了解你、适应你、陪伴你——这种价值,是任何参数表都无法填满的。 从这个意义上看,AI定义汽车不是一次功能升级,而是一次物种进化。它改变的不仅仅是车,更是人与出行、人与机器、人与空间之间的关系范式。 AIVA所做的,不只是推出一个新的产品品类,而是在物理AI时代下打开了一个更辽阔的想象空间:当汽车真正拥有了理解的能力,出行,将变成怎样一种存在?
HuggingFace CEO力荐,Bengio团队也押注:这个1500美元训出的HRM模型,凭什么火了?
允中 发自 凹非寺 量子位 | 公众号 QbitAI 好家伙,这次不是模型圈自嗨。 一个训练成本约1500美元、参数量约1B、从零开始预训练的小模型,把HRM推到了下一代推理架构讨论的中心。 HuggingFace联合创始人兼CEO Clem Delangue亲自转发推荐。 图灵奖得主Yoshua Bengio作为共同作者参与的新论文,也走向了同一条latent recursive reasoning路线。 更反常的是,它不是蒸馏,不是微调,也不是在已有大模型能力上套壳。 它就是Sapient Intelligence发布的HRM-Text。 如果只看参数量,它很容易被写成一个熟悉的故事:“小模型又赢了。” 但HRM-Text真正值得注意的地方,不是小,也不是便宜。而是它背后那套HRM架构,正在问一个更底层的问题: 模型到底需要记住全世界,还是需要学会如何思考、如何查找、如何验证、如何行动? 过去几年,大模型行业的默认答案很简单:参数更多,数据更多,训练更久,Token更长。 HRM走的是另一条路。 它不是继续把模型做成一个越来越大的知识仓库,而是试图把模型做成一个更强的推理核心。 大模型像一个背着图书馆的学生,HRM更像一个会解题、会查资料、会复盘、会行动的人。 当然,真正让技术圈认真讨论HRM-Text的,不是一次转发,而是一组很反常的数字。 一个约1B参数模型,在MATH上拿到56.2,在GSM8K上拿到84.5,在ARC-Challenge上拿到81.9,在DROP上拿到82.2。 训练成本约1500美元,16块H100跑了不到两天。 没有post-training,没有RLHF,也没有依赖显式思维链数据。团队同步开放了论文、模型权重和预训练代码。 这意味着,HRM-Text不是在现有大模型能力上做包装,而是在基础预训练阶段,直接验证一种新的架构路线。 这不是又一个“小模型逆袭”的故事。更准确地说,它是一次推理模型的换脑实验: 不让模型说出更多思维链,而是让模型在开口之前,先在脑子里想完。 而这条路线,很快也出现在了更高层级的学术讨论中。 HRM-Text发布前后,图灵奖得主Yoshua Bengio作为共同作者参与发布了《Generative Recursive Reasoning》。论文提出的GRAM,在核心计算结构上高度复用了HRM的分层递归骨架:同样是高层状态、低层状态、双时间尺度、多轮递归更新,只是在此基础上进一步加入概率生成模块。 换句话说,Sapient不是等行业给出答案之后再追随,而是先把一个关键问题抛了出来,并率先拿出了可运行、可开源、可验证的模型系统: 模型能否在输出之前,通过潜空间中的多轮分层递归计算,完成更深层的内部推理? HRM-Text的问题因此不只是: 一个1B模型为什么能做到这些benchmark? 更关键的问题是: Sapient是否提前验证了一条下一代推理模型值得认真对待的新路线? 知识不等于智能,CoT也不等于思考 现在的推理模型,很多时候像是在“边说边想”。 Chain-of-Thought把推理过程写成一串token,让模型一步一步输出中间过程。 这当然有用,但问题也很明显: Token越来越长,账单越来越高;中间一步错了,后面就可能一路错下去;更关键的是,推理过程被绑定在语言表面,模型很容易学到“像推理的文本”,却不一定真的掌握了“推理的结构”。 HRM问的是一个更激进的问题:推理为什么一定要写出来? 人类做很多题,并不是把脑内每一步都说成一句话。我们会在脑子里反复尝试、修正、排除、回退,最后才说出答案。 HRM想做的,正是这件事:把草稿纸从嘴上拿下来,放回模型的脑子里。 这就是latent reasoning,潜空间推理。不是让模型输出更长的思维链,而是让模型在输出之前,在内部状态里完成多轮计算。 这也是Sapient 从一开始押注HRM的原因。 Sapient押注的从来不是“小模型”,而是HRM(Hierarchical Reasoning Model),分层推理模型。 在大多数团队仍然围绕Transformer做参数、数据和训练技巧优化时,Sapient选择把问题推到更底层: 如果智能不是只来自规模扩张,而是来自计算过程的组织方式,那么模型架构本身是否应该被重新设计? HRM的核心思想,是让模型在输出之前,能够在潜空间中进行多轮、分层、递归的状态更新。 2025年,Sapient推出HRM-Symbolic。 这个模型主要面向数独、迷宫、ARC-AGI等封闭、可验证、强推理任务。这类任务有明确规则、明确状态空间、可验证答案,对组合搜索和多步推理要求极高。 因此,它们非常适合回答第一个问题: 分层递归推理这条架构路线,到底能不能行? HRM的原始论文里,一个27M参数模型在没有预训练、没有CoT数据、只用约1000个训练样本的情况下,在Sudoku-Extreme、Maze-Hard和ARC-AGI等强推理任务上取得了非常突出的结果。 这一步先回答了一个问题: 在封闭、可验证、强推理任务里,HRM这条路线能不能行? 答案是:能。 但这还不够,因为数独不是语言,迷宫也不是开放世界。 于是HRM-Text回答了第二个更难的问题: 当任务进入自然语言世界,HRM还行不行? 这比简单放大模型更难。 因为语言不是数独。语言更开放、更模糊、更知识密集,输出形式更灵活,训练也更容易不稳定。 所以HRM-Text的意义,不是把HRM-Symbolic放大一点而已。 它是在验证分层递归推理这套架构,能不能进入基础语言模型。 从HRM-Symbolic到HRM-Text,Sapient做的不是一次模型发布,而是一条技术路线的连续推进: 先在封闭推理任务中验证架构假设,再把架构扩展到开放语言环境,同步开放论文、代码、模型权重和训练方法,让这条路线可以被复现、质疑、比较和继续验证。 这也是Sapient应该被放到更重要位置的原因。 它不是在追随行业已有的答案,而是在提前提出问题,并把一个原本可能停留在理论讨论中的方向,推进成了可运行、可开源、可验证的模型系统。 HRM的核心:模型里面长出两个脑区 标准Transformer更像一条流水线,输入进来,一层一层往前走,每一层处理一次,最后输出。 增加能力的一种直接方式,就是增加层数、参数和训练数据。 HRM的思路不一样,它在模型内部放了两个以不同节奏工作的模块: 一个是高层模块H,一个是低层模块L。你可以把它理解成两个脑区。 H是战略脑。它更新得慢,负责把握整体方向、维持长期上下文、决定当前应该往哪里想。 L是执行脑。它更新得快,负责局部计算、细节修正、一步步把问题往前推。 关键在于,H和L不是两个外部Agent,也不是两个模型互相发消息。它们在同一个神经网络里,在同一个潜空间中,反复更新同一份内部状态。这就是HRM和普通“多智能体套壳”的区别。 普通多智能体系统,很多时候是几个LLM用自然语言互相聊天。HRM则是在模型内部完成分层递归计算。 可以打个比方:标准Transformer像一篇文章依次交给30个编辑,每个人只改一次。HRM更像两组编辑反复打磨同一份稿子:一组快速改细节,一组慢慢把握整体方向。最后输出之前,模型已经在脑内完成了多轮修正。 这也是HRM-Text和普通小模型最大的区别: 它不是只靠参数数量获得能力,而是让有限参数参与更深的有效计算。 HuggingFace模型卡也把HRM-Text描述为H/L双时间尺度递归架构:高层slow、低层fast,在同一输入embedding上反复迭代,从而在有限参数量下获得更深的有效计算。 换句话说,HRM-Text不是在模型外面拼接一个规划器,而是把分层递归计算内建进模型本身。 它改变的是模型“怎么算”。 参数没有无限变大,但计算过程变深了。这就像一个人不是多背几本书,而是学会了在脑子里多转几圈。 HRM-Text到底做对了什么? 如果把HRM-Text讲得太技术,很容易变成论文摘要。 但它真正做对的事,可以用三句话讲清楚。 第一,它改变了模型“怎么算”。 HRM-Text不是简单堆更多层,而是让模型在输出前做多轮内部递归计算。参数没有无限变大,但计算过程变深了。 第二,它改变了模型“学什么”。 大多数语言模型训练时,会预测整个文本序列里的每一个token。 问题、提示、上下文、答案,统统要预测。 HRM-Text更直接,它用instruction-response数据从零训练,但只对回答部分计算损失。 这不意味着指令部分没有用。指令仍然作为上下文参与注意力计算,回答部分的损失也会反向影响模型如何理解指令。 但模型不再被要求学习“预测题目本身”,而是把训练信号更集中地用于生成答案、完成任务。 直观理解就是,老师批卷子时,不再给“抄题”打分,只看你答得对不对。这样训练信号会更集中地落在任务完成上,而不是平均分散在整段文本里。 这背后配套的是PrefixLM attention mask。 指令部分可以充分整合上下文;回答部分再按因果生成方式输出。结果就是,在decoder-only的实现里,做出了一种近似encoder-decoder的效果。 这部分的关键不是“少预测一些token”这么简单,而是训练信号被重新分配了。模型更集中地学习如何完成任务,而不是平均地学习整个文本序列。 第三,它解决了递归训练容易崩的问题。 递归架构不是新概念。 难点在于,循环越深,训练越容易不稳定。同一组模块被反复调用后,激活值方差可能累积,梯度也更容易消失或爆炸。 HRM-Text引入MagicNorm和warmup deep credit assignment,让模型在多轮递归中保持激活稳定,并逐步加深信用分配。 通俗讲,不是一上来就让模型为所有深层递归步骤负责。而是先让它学会短路径上的内部计算,再慢慢把责任扩展到更深的推理过程。 这说明HRM-Text不是简单把同一层重复跑几遍,而是在系统性解决递归计算如何进入语言模型的问题。 这三件事合起来,才是HRM-Text的核心: 架构负责“怎么想”。 目标负责“学什么”。 训练方法负责“想得深还不崩”。 所以HRM-Text不是一个单点trick,它是一套新的基础模型设计方法,把内部计算深度、任务完成目标和稳定递归训练放在同一个系统里共同设计。 光说不练假把式,HRM-Text的几个改动叠加后,带来了明显提升。 在相同训练FLOPs条件下,ARC-Challenge从51.9提升到81.9;MATH从35.4提升到56.2;GSM8K从48.4提升到84.5。 这说明HRM-Text的表现不是来自某个单点trick,而是架构、训练目标和训练方法共同作用的结果。 它真正做对的,是把模型“怎么算”、“学什么”、“如何稳定训练”放在一起重新设计。 这也是Sapient这套路线和普通小模型路线最大的区别: 它不是单纯把模型做小,而是重新定义了有限参数如何参与更深层的内部计算。 数据量上,HRM-Text仅使用约40B unique tokens训练。考虑重复采样后,实验表中的总训练量约60B tokens。 对比下来,Llama 3.2 3B使用约9T tokens,是它的225倍;Qwen3系列2B使用约36T tokens,更是达到约900倍量级。 但在多个reasoning-heavy benchmarks上,HRM-Text已经可以和一批2B到7B的主流开源模型放到同一张表里比较。 这才是HRM-Text真正反常的地方: 它不是用更多参数、更长训练、更大数据,把旧路线继续往前推一点。它是用新的计算结构,把有限参数的有效计算深度重新拉起来。 当然,HRM-Text这样的结果,一定会引发外界对训练数据和评测数据污染的关注。Sapient对此做了系统验证。 HRM-Text只使用公开且可追溯来源的数据进行训练,并针对评测集进行了严格的数据污染分析。在更严格的clean split条件下,模型仍然保持优势结果。 这说明它的表现不是来自简单的测试集泄漏,而是来自架构和训练方法本身的提升。 也正因此,HRM-Text的意义不是“1B模型已经赢了”。 而是它让行业看到了:模型能力增长,除了参数、数据和算力之外,也许还有另一个更底层的变量——计算结构。 更大的信号:Bengio团队也开始走向同一条路 HRM-Text发布前后,还有一个很值得注意的信号。 图灵奖得主Yoshua Bengio作为共同作者参与了Generative Recursive Reasoning Models,也就是GRAM。 这篇论文不是继续在传统Transformer上堆规模,而是把recursive reasoning、latent reasoning和generative modeling放到了一起。 更准确地说,GRAM不是泛泛意义上的“相似方向”,而是在核心计算骨架上高度复用了HRM的设计。 对比两者结构可以看到,HRM 中最关键的几个元素,在GRAM中几乎都能找到对应关系。 第一,高层状态。 HRM 有高层模块H,用于维持更慢、更稳定、更全局的语义状态。 GRAM中同样存在high-level latent state/high-level recurrent state,用于建模更高层级的推理状态。 第二,低层状态。 HRM有低层模块L,用于快速更新局部计算和细节状态。 GRAM中也有low-level latent state/low-level recurrent state,用于承担更细粒度的递归更新。 第三,双时间尺度。 HRM的核心是H/L双时间尺度:低层模块多次更新,高层模块较慢更新。 GRAM同样采用高低层状态之间的递归交互,形成分层、多步的内部计算过程。 第四,潜空间递归。 HRM不是通过外部文本链条完成推理,而是在潜空间中反复更新内部状态。 GRAM也把推理过程放在latent space中进行递归生成,而不是简单依赖显式文本CoT。 第五,输出前的内部计算。 HRM强调模型在输出前先进行多轮内部计算,GRAM同样强调recursive reasoning,即模型在生成前通过递归状态更新形成更深的推理过程。 换句话说,GRAM并不是另起炉灶。如果去掉GRAM外层新增的概率生成模块,它的底层计算逻辑与HRM高度重合:高层状态、低层状态、潜空间递归、多轮内部更新。 这不是简单的“方向相似”,而是核心架构假设上的高度一致。 当然,GRAM并不只是简单重复HRM。 它在HRM的确定性递归骨架之上,加入了prior、posterior、decoder等概率生成模块,把原本的分层递归推理进一步扩展成概率化、多轨迹的生成式推理框架。 如果说HRM先提出并验证了“高层—低层双时间尺度递归推理”这条路线,那么GRAM更像是在这个骨架上增加了一层generative probabilistic wrapper,让模型能够围绕多个潜在推理轨迹进行生成和采样。 这也是为什么GRAM的出现,反而让HRM的重要性更突出。它不是绕开HRM另起炉灶,而是在HRM已经提出并验证的分层递归骨架上继续加入概率生成机制。 换句话说,Sapient先把“高层—低层双时间尺度递归推理”做成了可运行系统,GRAM则把这套骨架进一步包装成概率化、多轨迹的生成式推理框架。 这意味着,Sapient不只是参与了下一代推理模型的讨论,而是提前给出了一个正在被顶尖研究者复用和扩展的基本结构。 在这个意义上,Sapient的HRM已经不只是一个模型架构名词,而开始成为下一代推理模型研究中的一个参照系。 因此,Sapien在这里的位置不应该被写成“一个被 Bengio点赞的小模型团队”。更准确的写法是: Sapient率先把HRM这套分层递归推理架构做成了可运行、可开源、可验证的模型系统;而Bengio参与的GRAM,则进一步说明这套架构思想已经被全球顶尖AI研究者看见,并被快速吸收进下一代推理模型的研究框架中。 从这个角度看,HRM-Text的意义不只是一个1B模型跑出了好成绩,而是Sapient提前押中了一条正在被顶尖研究跟进的架构路线。 它不是一个孤立的小模型,它更像是一个早期信号: AI推理正在从“写出思维链”,转向“形成内部思维结构”。 下一代推理模型,不应该只靠输出更长的文字链条,而应该在潜空间中进行更深的内部计算。 HRM的贡献,是先把高层—低层双时间尺度递归推理做成了可运行、可开源、可验证的模型系统。GRAM则进一步把这种递归潜空间推理推进到概率生成、多轨迹采样的方向。 如果说HRM先提出并验证了“模型在输出前进行分层递归推理”的骨架,那么GRAM更像是在这条路线之上加入了generative probabilistic wrapper。 这也是HRM-Text这次值得被放到更重要位置的原因。 它不是一个孤立的小模型,它更像是下一代推理架构正在转向的信号。 1500美元真正打破的,不只是训练成本 1500美元当然不是终点,它也不意味着基础模型研发已经变得简单。 HRM-Text仍然只是Proof of Concept。 它还不是成熟聊天模型,也没有经过完整的post-training、RLHF或大规模产品化验证。它在知识覆盖、真实开放任务表现、长上下文能力、工具使用能力、规模化能力等方面,都还需要继续检验。 但这个数字真正刺痛行业的地方在于:它让基础模型研发重新出现了另一种可能性。 过去几年,基础模型越来越像一项重工业。更大的GPU集群,更长的训练周期,更复杂的数据工程。于是行业很容易形成一种惯性: 只有巨头才能探索基础模型、只有巨额算力才能验证新架构、只有Scaling才是唯一正解。 HRM-Text的出现不是否定Scaling,Scaling仍然强大。 但它提醒行业:Scaling不是唯一入口。 如果模型架构本身能提高计算效率,如果训练目标能更聚焦,如果模型能把知识存储和推理能力解耦,那么基础模型创新就不一定只能由算力规模定义。 对企业来说,当前AI落地面临的核心问题,不只是模型能力不够,而是训练贵、基础设施重、迭代周期慢、试错成本高。 很多企业并不需要从零训练一个巨型通用模型。它们真正需要的是在特定任务上获得更高效、更可控、更可定制的推理能力。它们需要的是:能读懂企业私有知识、能找到正确资料、能分析复杂系统、能调用工具、能做规划、能验证结果、能在特定任务上持续学习。 HRM-Text提供的启发是: 如果模型架构本身能够提高计算效率,那么企业AI能力建设不必完全依赖更大模型和更重基础设施。 对研究社区来说,HRM-Text的意义则在于,它让更多架构假设有机会被验证。 过去几年,基础模型研发越来越像一项重工业。更大的GPU集群、更长的训练周期、更复杂的数据工程,让大学实验室、创业团队、独立研究者和开源社区,很难直接参与基础模型层面的前沿实验。 真正令人担心的不是成本本身,而是许多不同的技术可能性,可能会在进入充分验证之前就被过滤掉。 当一条路线需要巨额资源才能验证时,行业自然更容易沿着最确定、最主流、最资源密集的方向前进。而那些更早期、更冒险、也可能更具突破性的架构假设,往往更难获得足够实验机会。 Sapient的意义在于,它没有等到巨头先验证这条路线,而是率先把另一种前沿AI路径做成了可以被行业检验的样本。 它没有否定Scaling的力量,但它让行业看到,基础模型创新并不只能被算力规模定义。 架构、训练目标、递归计算和开源验证,同样可以成为推动前沿AI的关键力量。 从这个意义上看,HRM-Text的价值,不是证明小模型会取代大模型,而是提醒行业: 前沿AI不应该只有一种入口。 HRM的下一步:不是更会聊天,而是更会工作 Sapient对HRM的长期判断,可以概括成一句话: 模型不需要记住一切,但需要学会如何思考、如何查找、如何学习、如何使用信息。 这就是reasoning-knowledge decoupling。 初期,它可以像RAG一样,把外部知识接进来。但更进一步,HRM的目标不是简单检索文档,而是让模型拥有一个更强的推理核心: 知道该查什么,知道去哪里查,知道如何判断信息是否可靠,知道如何把新知识学进当前任务,知道如何制定计划、调用工具、验证结果,知道如何把一个复杂任务真正做完。 这和人更接近。 人也不是把世界上所有知识都背在脑子里。真正聪明的人,是知道问题的结构,知道该找谁、查什么、怎么验证、如何行动。 未来,它可以作为底层推理内核Reasoning Core,扮演很多角色。 比如Reliability Diagnostician:诊断复杂系统稳定性,生成root-cause hypothesis,分析依赖关系、blast radius和rollback plan,并执行安全remediation。 比如System Optimizer:分析系统行为、发现性能瓶颈和资源浪费,自动提出或执行优化计划。 比如Data Organizer:把企业内部杂乱知识、文档、日志、数据库和工作流组织成可检索、可推理、可学习的记忆系统。 比如Tool Calling Director:决定什么时候调用哪个工具、API、模型或数据源,规划调用顺序,验证中间结果,直到任务完成。 这就是HRM和普通聊天模型的区别。 聊天模型的核心问题是:怎么回答用户? HRM更关心的问题是:怎么完成任务? 从这个角度看,HRM的商业价值也不只是“训练更便宜”。更重要的是,它可能改变企业构建AI能力的方式。 过去,企业想要更强AI,往往只能接入更大的通用模型,再通过提示词、RAG、工具链和Agent框架,把模型能力拼接到业务流程里。 但这种方式的问题也很明显:系统越来越复杂,调用链越来越长,成本越来越高,结果也越来越难验证。 HRM想象的是另一种结构: 底层是更强的推理核心;外部接入知识库、工具、记忆和环境反馈;模型不需要记住一切,但需要知道如何组织任务、如何使用信息、如何验证结果。 这也意味着,HRM的下一步,不只是更会聊天,而是更会工作。 从符号到文本,再到世界模型 HRM的路线也不止语言。 Sapient先从symbolic reasoning开始,用数独、迷宫、ARC-AGI这类封闭、可验证任务证明分层递归推理能跑通。 然后推进到HRM-Text,把这套架构带进自然语言模型。 下一步,很自然就是image、video、audio、robotics和world models。 因为HRM处理的不是某一种数据格式,它处理的是更底层的东西:状态、关系、约束、计划、行动、反馈。 这也是为什么HRM具备omni-modal潜力。 符号、文本、图像、视频、音频、机器人传感器数据,本质上都可以变成模型内部的状态空间。 如果HRM能在不同模态中学习“如何组织状态、如何预测变化、如何规划行动”,它就不只是语言模型,而可能成为世界模型的一种候选架构。 这也是embodied AI最需要的能力。 机器人不能只会回答。机器人需要理解环境,预测后果,制定动作,并在失败后修正。 对这样的系统来说,输出一句漂亮的话没有意义。 真正重要的是:想清楚,然后做对。 所以,HRM-Text的意义并不止于语言模型。它更像是Sapient把HRM从符号推理推向开放语言环境的一次阶段性验证。 如果这条路线继续成立,那么HRM的下一步就不只是文本,而可能是更广义的世界建模:理解状态如何变化、理解行动如何产生后果、理解计划如何被执行、理解失败如何被修正。 这也是为什么,HRM的想象空间不应被局限在“小模型”这个标签里。 真正重要的是,它试图为智能系统提供一个更强的内部计算结构。 Lean General Intelligence:AI的未来不该只有一条路 更进一步看,HRM背后是Sapient对通用智能的一种长期判断: 先进AI的探索,不应该只是一条被资源规模不断加固的单一路径,而应该是一场由更多研究者、开发者、创业团队和开源社区共同推进的技术进程。 Sapient可以把自己的长期路线概括为:Lean General Intelligence。 这里的Lean,不是“小”,也不是便宜,而是更高效、更可及、更强调计算结构本身。 过去几年,行业已经充分证明了Scaling的力量。但现在,另一个问题正在变得越来越重要: 当训练成本越来越高,Token账单越来越重,Agent越来越复杂,企业越来越需要可控、可验证、可定制的智能系统时,继续扩大模型是不是唯一答案? HRM给出了另一个答案。 不是让模型背下更多知识,而是让模型拥有更强的推理核心;不是让模型输出更长CoT,而是让模型在潜空间中完成更深计算;不是把所有能力都塞进一个黑箱大模型,而是把推理、知识、工具、记忆和行动重新组织起来。 这就是HRM-Text最重要的意义。 它不是证明1B模型已经赢了,它证明的是AI架构还远远没有定型。 如果说过去几年,行业主线是Scaling。 那么接下来,推理模型可能迎来一个新问题: 模型到底要更大,还是要更会思考? Sapient的答案,是HRM。 而HRM-Text,是这条路线第一次进入基础语言模型语境后的公开样本。它还早,但它足够重要。 因为它提醒整个行业:AI的未来,不应该只有一条路。 更大的模型会继续重要,但更会思考的模型,可能才是下一轮推理架构真正的入口。 从HRM-Symbolic到HRM-Text,再到Bengio参与的GRAM对HRM骨架的高度复用,分层递归推理已经不再只是Sapient的内部路线,而正在成为下一代推理模型的重要方向。 Sapient的意义,也正在于此: 它不是在追随行业已有的答案,而是在提前给出一个可运行、可开源、可验证的新答案。 如果说过去几年,行业已经充分证明了Scaling的力量,那么Sapient正在提醒行业:AI的未来不应该只有一条路。 而Sapient Intelligence,正是在这条新路上最早给出完整答案的先行者之一。
Anthropic 5.2万人调查大曝光!美国人对AI已达成共识
在一个什么都能吵翻天的国家,71%的美国人难得达成共识:AI必须有人管——但管它的,绝不能是造它的人。 15%。 每100个美国人里,只有15个相信AI公司能管好自己造出来的东西。 刚刚,Anthropic甩出一份重磅调查:Anthropic Public Record。 他们调查了51,993名美国人,覆盖全美50个州、华盛顿特区和波多黎各,再按人口普查基准在年龄、性别、学历、种族上做加权。 这是奔着「全体美国人怎么看AI」去的——连压根不用AI的人都被拉进来了。 Anthropic之前做过一次8.1万Claude用户的深度访谈,也定期发布追踪Claude使用数据的经济指数。 但那些说到底,问的都是「已经在用AI的人」。 这次不一样,这是他们第一次把话筒递给普通公众——那些从没碰过ChatGPT、从没打开过Claude的人,也终于有了发言权。 结果很拧巴。 最大的期待:让AI去啃硬骨头 问卷给了17个选项,让受访者从中选出对AI的「前三大期待」。 48%的人把「治愈癌症、阿尔茨海默这类疾病」选了进去,稳居第一,比排第二的「帮助残障人士」(36%)整整高出12个百分点。 排第三的是「推动技术进步」和「让生活更轻松」,打了个平手,都是23%。 说白了,大家最想要的,是AI去啃那些人类啃了几十年没啃下来的硬骨头。 「心理治疗」、「缓解孤独」这类期待,排在所有选项的最末。 这个排名耐人寻味:公众对AI的最大期望不是「更好玩」,也不是「更方便」,而是「救命」。 一个技术的最高合法性,就是去做人做不到的事。 最大的恐惧:64%的人怕丢饭碗 期待归期待,恐惧同样真实。 问卷列了20种AI可能带来的危害,让受访者逐一勾选担不担心,再用五级量表打分。 结果,64%的人担心AI抢饭碗,这是头号恐惧,没有之一。 56%担心「认知依赖」——怕离了AI自己不会思考了。 52%担心被误导信息淹没。紧随其后的是犯罪利用和大规模监控。 有意思的是,这份恐惧清单揭示了一个模式:美国人最怕的,不是AI「失控」,而是AI「被滥用」。 犯罪利用、监控、恐怖主义的担忧频率,远远高于「AI自主暴走」之类的科幻场景。 而且这些恐惧并不新鲜——自动化抢饭碗、智能手机让人变傻、社交媒体催生假消息——每一种都是之前就有。 AI不过是接过了上一代技术的恐惧遗产。 71%要监管,15%信AI公司 真正扎心的,是后面这几个数字。 71%的美国人,要政府下场管AI。 这个数字最不寻常的地方在于,在一个什么都能吵起来的国家,AI监管居然成了罕见的共识。 每一个州,都是过半数支持,从华盛顿特区的81%到夏威夷的63%,无人例外。 大家最希望政府管的三个领域:隐私(56%)、儿童安全(52%)、出了事谁负责(49%)。 那么,让谁来管?至少不是AI公司自己。 只有15%的美国人,信任AI公司自己决定AI怎么开发、怎么用。 这个数字什么概念?联邦政府的信任度是20%,州和地方政府19%,国际机构20%,独立专家43%。 也就是说,在美国人眼里,AI公司比独立专家差出一大截。 被问到「怎么才能让AI真正造福人类」,美国人给出的答案很直接:让AI公司为造成的伤害承担法律责任(47%),安全优先于增长(44%),建立有实权的独立监督机构(29%),为安全放慢开发速度(27%)。 翻译过来就一句话——别光顾着跑,出了事得有人兜底。 两个反直觉的发现 如果说上面这些还算意料之中,那下面两个发现,可能会颠覆你的直觉。 第一个反直觉:学历越高,越怕被AI抢饭碗。 按常理,读书越多、越是脑力工作者,应该越安全才对。 可调查显示,读过研究生的人,对失业的担忧比高中及以下学历的人高出近10个百分点。 原因不难懂:这些高学历者干的活,恰恰和AI被训练去做的事高度重叠——写报告、做分析、查资料、跑数据。 Anthropic自家的劳动力市场报告佐证了这一点:程序员已经有75%的工作任务被AI覆盖,客服和数据录入紧随其后。 第二个反直觉:天天用AI的人,反而不慌。 每天在工作里用AI的人,对失业的担忧是54%;完全不用AI的人,是70%。差了16个百分点。 认知依赖的恐惧也一样,重度用户46%,从不用的人62%,同样差16个点。 越靠近AI的人越淡定,越远离它的人越恐慌。 一种解释是:真上手了,你会发现AI能帮你干活,也会发现它没那么神——它的本事和它的边界,你都摸得到。 你学会的是用它来增强自己,而不是被它整个替掉。隔着屏幕想象出来的怪物,往往比真见到的更可怕。 认知依赖:嘴上喊怕的,没那么依赖 有意思的是「认知依赖」这个恐惧本身。 Anthropic做了一个精巧的交叉验证:问受访者「如果明天AI突然消失,你的生活会受多大影响?」 然后把答案和「你怕不怕依赖AI」对照着看。 结果反转了。 在那56%担心会依赖AI的人里,只有约五分之一表示「明天AI没了我会很难受」;反倒是那44%不担心的人里,约三分之一离了AI真会抓瞎。 换句话说,嘴上喊怕依赖的,没那么依赖;嘴上不怕的,早就离不开了。 Anthropic此前对8.1万Claude用户的访谈还发现,教育工作者报告亲眼目睹「认知萎缩」的比例,是平均水平的2.5到3倍——大概是在学生身上看到的。 在这次公众调查中,教育从业者对认知依赖的担忧也排名靠前,仅次于艺术和设计领域的从业者。 老师们不是在杞人忧天,他们是站在教室里,眼看着它发生。 75%的人觉得AI做研究比人强 调查还问了一个很实在的问题:你觉得AI干活行不行?你愿不愿意让它进你的工位? 75%的美国人认为AI在「做研究」这件事上,已经和人一样好甚至更好。 排在末尾的是「服务与支持」,也有44%的人认为AI不输人类。 总体来看,美国人对AI能力的评价其实不低。 但吊诡的是——即便在他们评价AI最强的领域,比如研究和数据分析,依然有近半数受访者表示:不想让AI碰自己的工作。 不是觉得它不行,是不想让它来。 这说明什么?反对AI进入工作场所的阻力,不全是能力问题,更是心理问题、身份问题。 「它能干」和「我愿意让它干」之间,隔着一道不小的情感鸿沟。 不过调查也发现,认知和接受度是同步的:越觉得AI在某个领域能干,越愿意在那个领域用它。 能力认知在慢慢拆除心理防线,只是速度没那么快。 那群「离不开」AI的人,什么样? 大约6%的美国人,工作和生活里每天都在用AI。 Anthropic给他们起了个名字:「整合型用户」。 这群人画像鲜明:偏年轻、男性居多、住城里、有工作、上过大学。 近三分之二自认是「在大多数人之前就尝试新技术」的人,而普通公众里只有30%这样说。 他们就是AI世界的「原住民」。 他们对各种AI风险的担忧都比普通人低。 但关键来了——即便是这群AI的铁杆,对政府监管AI的支持率也有74%,和全国71%基本没差。 在Anthropic测试的八个具体治理领域里,他们的偏好和普通公众几乎看不出区别。 他们确实更不愿意「放慢或停止」AI开发——这不意外。但他们同样要求:监管得跟上,责任得明确。 这意味着用得越多、越离不开AI,并不等于越愿意把方向盘交给AI公司。 恰恰相反,最懂AI的人,照样要求监管。 一个出乎意料的共识 把这些拼到一起,一幅出乎意料的图景浮现出来:在一个被各种议题撕裂的美国,AI居然没有沿党派、地域、学历的老裂缝把人分开。 大多数问题上,美国人反而站到了一起——既想要AI兑现治病、提效的承诺,又怕它砸了饭碗、夺了人的判断力,并且异口同声地要求:造它的公司,得为它负责。 分歧只在情绪的强烈程度,不在立场。 Anthropic说,这份调查会定期重复,未来还要走出美国,问向全世界。
员工骂高管、限token使用量、扎克伯格承认犯错:Meta内部炸锅了
真是大反转啊! 就在今年春天,Meta 还在公司内部搞出了一套 token 消耗排行榜,甚至催生出一种名为 tokenmaxxing 的玩法:员工们通过大量使用 AI、疯狂消耗 token,来证明自己是 AI 重度用户。 没成想,几个月后,风向彻底变了。当内部 AI 使用成本开始冲向数十亿美元,Meta 不得不从 tokenmaxxing 转向 Tokenminimizing:不再鼓励员工拼命烧 token。 没错,为了削减成本,Meta 开始限制员工的 token 使用量了。 内部 AI 成本,正在冲向数十亿美元 据 The Information 看到的一份内部备忘录显示,Meta 正在搭建一个内部平台,用于实时追踪员工的 AI 使用情况和相关支出,设定预算,并对员工的 token 花费设置上限。Meta 将这份备忘录分享给了约 6000 名员工。 文章地址:https://www.theinformation.com/articles/tokenminimizing-meta-moves-curb-employee-ai-usage-ai-costs-reach-billions 备忘录写道: 我们看到 AI 使用量呈指数级增长,照目前趋势,仅内部使用一项在 2026 年就将花费数十亿美元。与此同时,个人和团队对于自己如何使用 AI、花费多少,缺乏足够的可见性和控制力。到 2027 年,我们预计 Meta 将以更结构化的方式管理 AI token,包括预算、分配决策和配套工具。 作为压缩支出的一部分,一个由产品开发人员和工程师组成的团队已经创建了一个名为 AI Gateway 的中央仪表盘,用于集中监控使用情况和支出。 备忘录显示,Meta 还将推出自动提醒机制,用于提示异常的支出激增。该团队也在跟踪当前成本,以预测未来支出,从而规划算力容量,并与供应商进行谈判。公司计划在未来几周内,向更大范围的员工宣布这些新控制措施和工具。 与此同时,Meta 也准备鼓励员工减少在编码等工作中使用第三方 AI 工具,转而更多使用内部方案,例如公司自研的编码助手 MetaCode,此前名为 Devmate。不过,公司也表示,仍会继续允许员工使用新的第三方模型。 这背后有一个直接原因:Meta 工程师在编码工作中大量使用 Anthropic Claude 等外部工具,内部 AI 成本正在快速膨胀。 据两名知情人士透露,最近几周,Meta 已要求其新成立的 Applied AI Engineering (AAI)部门改进 MetaCode,以减少对 Claude 等外部工具的依赖。AAI 团队负责人还指示工程师生成高质量的强化学习数据,具体方式是设计编程挑战题,让 MetaCode 去解决,从而训练它给出更好的响应。 先鼓励员工用 AI,再限制员工用 AI 这件事有些讽刺。 在开始限制 AI 支出之前,Meta 已经连续几个月在公司内部大力鼓励员工使用 AI 工具。公司不仅向员工开放了自研模型,也提供了来自 OpenAI、Anthropic 和 Google 的工具。去年 11 月,Meta 告诉员工,今年展示 AI 驱动的影响力将成为一项核心要求,表现最好的员工将因交付最显著的成果而获得奖励。 也就是说,Meta 先是要求员工尽可能用 AI,随后又发现 AI 用得太多,开始回头限制 token 消耗。 Tokenmaxxing:AI 重度用户的内部竞赛 这场把 AI 更深嵌入日常工作的推进,在某些情况下产生了意想不到的结果。今年春天早些时候,一些员工开始参与一种被称为 tokenmaxxing 的做法,通过大量消耗 token 来显示自己是 AI 重度用户。 有一段时间,员工们试图冲上一个名为 Claudeonomics 的内部排行榜。这个排行榜根据 AI token 使用量,对前 250 名员工进行排名。 一些员工甚至试图人为抬高自己的使用量:他们让 AI agent 同时运行多个任务,并尽可能增加 token 消耗。The Information 在 4 月看到的一份仪表盘副本显示,员工在 30 天内消耗了 60.2 万亿个 token。后来,这一数字进一步升至 73.7 万亿个 token,随后该排行榜被下线。 急刹车:token 使用量不等于影响力 Meta 首席技术官 Andrew Bosworth 一直试图劝阻这种浪费性的 AI token 使用行为。在 4 月的一份备忘录中,Bosworth 告诉员工,只有当 AI 工具能够真正提升生产力时,才应该使用它们。 他写道:任何人都不应该为了使用 AI 工具而使用 AI 工具。所有动作并不都代表进展,单纯的 token 使用量也不能衡量任何形式的影响力。我们使用这些工具,是因为它们确实能让我们更快、更好地完成工作。 在同一份备忘录中,Bosworth 还透露,Meta 正在通过一项名为 Agent Transformation Accelerator 的计划,围绕 AI agent 重组内部工作。他表示,公司现有的 AI 工具已经变得碎片化,Meta 正在朝着更加统一的方式推进。 但现在看来,Meta 面临的问题已经不只是 token 成本。 员工既是使用者,也是训练数据生产者,引发不满 TechCrunch 援引 Wired 报道称,Meta 成立仅三个月左右的 Applied AI 团队内部,正在出现强烈不满。这个团队约有 6500 名工程师和产品经理,被要求支持公司的 AI 研究和训练工作。 不少员工认为,自己并没有真正的选择权:要么加入这个部门,要么离开公司。一些人甚至把自己称为被征召者。 他们被安排的工作,也与传统软件工程差别很大:生成谜题、编程题等内容,用来训练 Meta 的 AI 模型。一些员工认为这类工作机械、消耗人,甚至有人用非常激烈的词来形容这个部门,称它极度消磨人。 这种情绪已经不只停留在私下抱怨。TechCrunch 提到,本周 Meta 一场面向员工的内部直播演示被人打断,有员工情绪失控,当场爆粗口,并要求在场员工转告一名 Meta AI 高管:他就是个混蛋。据称,其中一名演示者当场用双手捂住了脸。这被视为 Applied AI 团队内部不满情绪集中爆发的一个信号。 与此同时,Meta 内部围绕 AI 训练数据的争议也在扩大。报道称,已有超过 1600 名 Meta 员工签署请愿书,反对一个会监控员工点击和键盘操作、并用于 AI 训练数据的项目。 换句话说,Meta 正在试图把公司本身变成 AI 转型的试验场:员工既是 AI 工具的使用者,也是训练数据的生产者,甚至在某些场景下,还是被 AI 战略重新分配的人力资源。 组织结构本身也在承压。TechCrunch 称,Applied AI 团队最初采用了非常扁平的管理结构,甚至可能出现一名经理对应最多 50 名员工的情况。这种设置原本是为了提高效率,但在实际执行中,也加剧了员工的不确定感和失控感。 扎克伯格承认:AI 转型中犯了错误 随后,扎克伯格也开始在内部承认问题。 据 Reuters 看到的一份内部备忘录,Meta CEO 马克・扎克伯格告诉员工,公司在推进 AI 劳动力转型过程中犯了错误。他表示,考虑到这轮变化的复杂性,Meta 已经犯错,未来几乎肯定还会犯更多错误,但公司会尽可能在组织调整上提供稳定性。 扎克伯格还重申,Meta 今年不预计再进行公司范围内的裁员。 这点很关键。今年 5 月,Meta 曾进行大规模重组,全球裁员 10%,同时将约 7000 名员工转入与 AI 工作流相关的新项目。扎克伯格在备忘录中表示,公司会努力为那些被重新分配去训练 AI 模型的员工寻找新的角色。 Meta 也计划缓和 Applied AI 部门过宽的管理跨度。Reuters 报道称,扎克伯格已经注意到员工对于管理跨度扩大的担忧,并计划收回部分做法。公司还准备增加团队建设投入,包括提高 offsite 和公司活动预算,并在 7 月举办一场大型黑客松,推动不同团队围绕最新模型进行协作。 这也让整件事的矛盾更加清晰。 一方面,Meta 正在准备今年高额的资本支出,其中很大一部分将用于扩张 AI 基础设施,包括数据中心、AI 芯片和人才获取。 另一方面,当 AI 从战略口号进入日常办公,它马上变成了一组具体问题:谁来为 token 买单?谁能使用外部模型?内部工具能不能替代 Claude?员工的工作数据能不能被拿来训练模型?工程师是否应该从写代码转向给模型造数据? Meta 现在做的,正在把 AI 使用从一场内部竞赛,重新纳入预算、权限、监控和治理体系中。过去几个月,Meta 用排行榜和绩效预期鼓励员工成为 AI power user;现在,它又不得不提醒员工:token 使用量本身并不是影响力。 当大模型工具刚进入企业时,最容易讲的是效率故事:员工用 AI 写代码、总结文档、生成方案,个人效率显著提升。但当这种使用扩大到数千人、数万人规模,问题就会迅速变成成本怎么控制,员工角色如何重新定义。 Meta 的反转说明,AI 进入企业之后,真正的难题并不只是让员工用起来,而是让它以可持续的方式用下去。 否则,AI 很容易从生产力工具,变成新的成本黑洞和组织压力。
人类有了第1个万亿富翁,和4400个百万富翁
就在今晚,SpaceX 正式上市,开盘价初步显示高达 156.93 美元/股,较之前公开募股价 135 美元/股飙升了 30%。。。 通过这一波有史以来最大的 IPO,马斯克毫无悬念地成为了世界上首个万亿富翁。。。 我也是真服了这老小子,是不是敲钟敲无感了,直接来了一手远程敲钟 估计大家对万亿富翁这个词都有点没感觉了,所以老外专门做了个网站,证明你压根不懂万亿是啥。 比如它用了一条线,坐标原点是 100 万美元,最右端是 1 万亿美元,然后问你:10 亿美元应该在哪儿? 作为一个身经百战,从十几年考试生涯里磨过来的小镇做题家,差评君脚趾头想想都知道,答案绝对在线段比较靠左的位置,不然就没节目效果了。 可等咱选了一个自以为足够靠左的答案,信心满满地提交之后。 结果正确答案狠狠扇了哥们的脸,在这个坐标轴上,10 亿美元几乎还没走出起点,只有全程的千分之一。。。 这个网站还用了一个更形象的方式,帮大家理解万亿美元到底是多少钱。 方法也很简单,就是在地上不停地堆叠 1 美分 ( 大概和 1 块钱人民币厚度接近 ),10 亿硬币可以从纽约一直叠到佛罗里达州卡纳维拉尔角 ( SpaceX 的发射基地之一 ),相当于从东北的长春一路干到了上海。。。 而万亿的概念,就是你可以从地面一路叠到广寒宫了。 然后返回。。。 然后二二三四再来一次。。。 该说不说,在看完这么形象化地说明万亿有多大后,本来还气鼓鼓的仇富心,反倒是平静了。 不过,SpaceX 这波 IPO,除了让马斯克自己变成不可名状的,克苏鲁万亿富豪之外,顺便还让 SpaceX 的餐厅坐满了百万 ( 美元 ) 富翁。。。 据统计,SpaceX 目前有 2.2 万名员工,其中将有超过 4400 名现任前任们,能靠手里的股票获得百万身家,他们中的 400 人资产更是直接过亿。。。 都来围观下SpaceX股票证书长啥样 你不要以为这些好事,只落在了什么高级工程师、专业研发人员身上。 相反,什么餐厅里的火鸡腿阿姨们、发射基地的焊接工人们。。。只要是劳动合同里有股票期权的,都赚大发了。 外媒就采访到了胡安·埃尔南德斯老哥,作为一个墨西哥移民,到了美国后学了手焊接工。 2015 年时,朋友给他介绍说 SpaceX 在招人,胡安当时连 SpaceX 是个啥都不知道,只知道对方工钱大方,发薪及时,绝不欠薪,于是就把自己的焊接天赋带到了 SpaceX。 起初,胡安大哥的工资是 28 美元/小时,一段时间后,他成功转正,并获得了一份当时价值 1 万美元、分五年兑现的股权,同时他还可以用一部分工资不断买 SpaceX 的股票。 到了 2020 年,SpaceX 的估值已经达到了 360 亿美元,胡安大哥分批卖出了自己的少量股份,成功在德州买房安家,还开了家房地产公司。。。 如今,他手上剩余的股票,还有 88 万美元 ( 按 IPO 价格估算 )。。。 胡安大哥在接受采访时大方地表示:“ 我这辈子顺急了,哥哥 ”。 有意思的是,去年离开 SpaceX 的胡安大哥,转头加盟了马斯克的死对头蓝色起源,接着干自己的焊接老本行。 我咋感觉万一后面蓝色起源也上市的话,这大哥还得出来秀一波呢? 在铺天盖地的新闻里,唯一让我好受点的是,是一个坊间传闻。 说是 SpaceX 的一些早期员工,由于不看好公司发展,加上马斯克常年公开表达对上市的厌恶。 被忽悠瘸了的他们,早早地就把手里的股票兑换例如 CHili's 之类餐厅的礼品卡,相当于拿了阿里的原始股,换成了外婆家的会员卡。。。 内部员工也向外界透露,这些老铁们肠子都悔青啦。 光看 SpaceX 内部人员吃肉喝汤拍断腿可不够,这波 IPO 也让外面的股民们疯了,全世界的散户和机构们正拿着真金白银,疯狂为马斯克的太空梦充值,他们也不想错过这趟史诗级的造富列车。 SpaceX 这次上市,市场的态度其实相当两极分化:一边是全世界排着队、真金白银地抢,另一边是一盆接一盆地泼冷水。 要知道,这次 SpaceX 计划发行规模是 750 亿美元,但在前两天,全球的机构与散户认购额就已经达到了 4 倍、超过 2500 亿美元,其中光散户们就已经超过了 1000 亿。。。 其中,作为亚洲唯一一个允许散户参与本次 IPO 的日本,投资者们陷入了一种 “ 露头就秒,有多少买多少 ” 的亢奋,SpaceX 不得不顺势提高了在日本的发行目标,由 20 亿美元涨到了 25 亿美元。 而在澳大利亚,散户投资者的需求也几乎陷入癫狂。 据当地媒体报道,周一时,投资客服热线排队接近一小时,而咨询内容无一例外,全都和 SpaceX 相关。 一些马斯克的死忠粉甚至试图从闺蜜那借钱、贷款上车买更多 SpaceX 的股票。 在他们看来,“ 好就是多,多就是好 ”“ 投资有史以来最具雄心的公司之一,永远不嫌多 ”。 也就是说,在全世界范围内,马斯克画的大饼,是真有人排着队抢着买单的。 马斯克粉丝在德克萨斯州博卡奇卡的星舰基地外,祝贺 SpaceX 成功上市 只可惜这饼咱买不着,不然你看我要不要高低支持一波火星梦。 当然了,和我们这些看热闹的小老百姓不一样,在很多专业机构看来,SpaceX 的价值,可能更多在于太空数据中心的规划。 大家都知道,全世界都在疯狂建数据中心、囤 GPU、搞 AI 军备竞赛,可眼下最大的问题是能源可能不够用了。 SpaceX 在招股书里明确写道,随着 AI 的发展,地球电网容量和土地资源正在逼近物理极限。 为了满足 AI 对资源的需求,SpaceX 大手一挥,让我们把数据中心搬到太空去吧。 根据 SpaceX 测算,太空中没有大气层衰减和昼夜交替,太阳能收集效率能达到地面的 5 倍以上,且不需要铺设任何输电线路。 同时,还可以利用深空接近绝对零度的环境,进行被动式辐射散热,简直是既开源又节流了。 而且这个路子,按马斯克的第一性原理推下来,至少在 PPT 上,还真挑不出什么毛病。 类似的太空数据中心工程,也已经被很多公司反复提过了。 可哪怕咱假定太空数据中心确实可行,那怎么把这些笨重的设备送上天呢? 看来看去,现阶段还是只有 SpaceX 的猎鹰系列以及星舰最靠谱。 所以在这条赛道上,短期的几年内,SpaceX 可能就没啥真正意义上的对手,这也是大批专业团队认可 SpaceX 价值的重要依据。 按照这个逻辑,短期内掌握超高性价比太空运力的 SpaceX 简直是无敌的? NoNoNo,也有一堆投资人、机构在那给大伙泼冷水。 丹麦一家基金机构就官宣把 SpaceX “ 拉黑 ” 了,他们的投资总监吐槽说,这 1.77 万亿的估值完全是被马斯克的大饼绑架了,也不看看 SpaceX 的治理结构,哪像个现代公司。 更尴尬的是,SpaceX 在 2025 年还赔了 49 亿美元。 而把账拆开看,你会发现 SpaceX 内部相当割裂。 一边是星链和火箭部门在疯狂印钞: 星链去年利润超 44 亿美元,火箭单枚复用 34 次,直接把国家级工程干成了流水线; 而在另一边,新并入的 AI 部门,纯在大出血。 去年,SpaceX 花了足足 127 亿美元,用来建超算中心、采购英伟达 GPU。。。全部砸向了 AI。 到了 2026 年一季度,更是变本加厉,单季资本开支 101 亿美元,AI 独占 77 亿。 所以吧,太空 AI 这事儿,真就是公说公有理,婆说婆有理,同一笔钱,看好的人管它叫下注未来,不看好的人管它叫烧钱闹呢。 而真正让机构不放心的是,这场赌注押多大、押多久、什么时候收手,全世界只有马斯克一个人说了算。 因为马斯克靠着 AB 类股权的分割设计,通过 42% 的持股数,控制了 85% 的投票权,也就是说,想让马斯克从 SpaceX 滚蛋,除非马斯克自己同意。 这对马斯克粉丝来说,这当然是天大的好事,不是这样的话,他们兴许还不买账呢。 但在一些专业团队看来,这种一言堂模式,相当于是把公司的生死绑架到马斯克一个人身上,这种风险可太大了。 所以,站在今天这个历史节点上,事情变得非常有意思。 马斯克拿着 “ 全人类 ” 的钱,去豪赌他的火星殖民和太空 AI 大业; 几千名像胡安大哥这样的打工人一夜暴富,买房买车,走向人生巅峰; 全世界,甭管你买不买股票、关不关心 AI、科技、星辰大海,高低都想看看 SpaceX 这场大戏会走向何处。 而我们在这个历史性的夜晚,再回过头看看。 这张拍摄于 2002 年的照片,一场玛利亚奇乐队,几个看起来有点呆呆的员工,那是 SpaceX 最初的样子。 马斯克回忆往昔:“ 那时候不到 10 个人,我们甚至连办公家具都没有 ”。 谁能想到,24 年后,SpaceX 会成为一家伟大的公司。 哦不,它可能已经贵到,连伟大本身都不够解释了。 这个世界,真他妈有意思。
苹果MacBook Pro屏幕变色:因极限负载下芯片温度突破100℃
快科技6月13日消息,近日,海外社区出现一则故障反馈:搭载M5 Max芯片的苹果MacBook Pro在执行大语言模型(LLM)推理等高负载任务时,屏幕出现罕见的区域性颜色失真。 据该海外社区用户描述,色偏异常集中出现在机身接口区域上方的显示画面,且该现象与屏幕开合角度无关——无论是90度标准夹角还是完全展开状态,失真程度均无变化。 这一特征排除了热风回流导致面板受损的常规可能,更倾向于机身内部芯片积热通过金属框架直接传导或辐射至液晶模组,造成显示层受热变性。该机型目前仅配置单一热管与两枚低矮风扇,面对持续高算力输出时,解热效率明显不足。 尽管M5 Max芯片采用Fusion架构,将CPU与GPU核心整合于同一芯片以提升能效比并降低发热量,但在极限负载下,芯片表面温度仍可突破100摄氏度。 苹果自2020年推进自研芯片战略以来,MacBook Pro的热设计功耗控制长期依赖单热管搭配双风扇的传统模组。 随着M5 Max芯片的晶体管规模与算力密度持续攀升,这套解热架构已逐渐触及性能天花板。 鉴于目前该故障尚属个案,尚未触发苹果的官方技术调查。但供应链消息指出,下一代M6 MacBook Pro将全面重构散热设计,弃用现有热管方案,转而引入VC均热板结构,并可能采用PTM7950等高导热界面材料以提升热扩散效率。 对于已购买AppleCare+服务计划的用户,通过官方售后渠道申请整机更换,是目前最直接有效的解决方式。
ICRA真机挑战赛唯一满分,一支中国具身新团队浮出水面
机器人前瞻(公众号:robot_pro) 作者 | 许丽思 编辑 | 漠影 近期,ICRA 2026、CVPR 2026 Workshops等机器人与具身智能相关会议、竞赛密集举行,围绕真实机器人任务的真机评测,正在成为行业观察具身智能落地能力的重要窗口。 在ICRA举办的REAL-I具身智能挑战赛中,一个比赛结果近期在机器人圈引发讨论:在48支来自全球的参赛队伍中,一支中国团队拿下线下真机操作任务唯一满分。 这支名为deeptouch.ai的队伍,由北京邮电大学教授、瞬恒智能首席科学家方斌领衔。比赛中,团队在人形机器人工业上料操作单项赛中取得满分,成为所有参赛队伍中唯一一支在线下真机操作任务中获得满分的队伍。 相比于在过去两年常被讨论的明星公司,方斌所带领的瞬恒智能此前极少发声,直到赛事成绩引发关注。 一、全球48支队伍参赛,聚焦真实机器人任务 REAL-I,全称The 1st Real-world Embodied AI Learning Challenge,汇集了来自全球各地的48支队伍线下参赛,是此次ICRA中线下真机参与队伍最多的赛项之一。和普通仿真评测或单次机器人演示不同,REAL-I的赛制重点放在真实机器人平台、真实工业任务和统一评测工具上。 参赛团队需要经历仿真、线上真机和线下现场挑战三个阶段。模型不仅要在虚拟环境中跑通,还要被真正部署到机器人上,在现场环境中接受任务检验。 据了解,线下挑战设置了三个典型工业任务:金属件姿态调整、日化瓶取放与上下料、快递包裹扫码分拣。这些任务并不追求视觉上的炫技,但都接近工业现场中常见的机器人操作需求。 在这些任务中,机器人需要实时识别物体位置,判断抓取方式,规划机械臂运动轨迹,并通过末端执行器完成真实物体操作。表面上看是抓取、移动和放置,背后则是感知、规划、控制和执行的完整闭环。 相比一次理想环境中的Demo,这类赛制更强调模型能否被部署到真实机器人上,并在现场条件下完成连续任务。 过去一年,具身智能行业并不缺少机器人演示视频。但真实产业场景中,客户关心的往往不是机器人能否在理想环境下完成一次动作,而是能否在物体位置变化、现场条件不确定、补充数据有限的情况下,持续稳定地完成任务。 二、连续三轮,满分验证真实操作稳定性 在人形机器人工业上下料操作任务中,方斌团队取得了全场唯一的满分,也因此引发大量关注。 在这一任务中,机器人需要从一个传送带上抓取物体,通过双臂协同完成交接,再将物体稳定放置到另一个传送带上。 对人来说,这是一组很自然的动作:看见物体,伸手拿起,递给另一只手,再放到指定位置。但对机器人而言,这个过程涉及多个连续环节。 现场任务中,物体位置会被随机重新摆放,传送带持续运动。机器人需要判断合适的抓取点,规划双臂运动轨迹,完成双手之间的交接,并在动态场景中准确放置。 任一环节出现偏差,都可能导致任务失败。抓取角度不准,物体可能拿不稳;双臂交接时序不对,物体可能掉落;放置位置偏差过大,也无法完成任务要求。 最难的是,REAL-I并不只看一次操作的完成度。按照比赛规则,机器人需要在物体随机重新摆放后连续完成三轮任务,并以平均成绩作为最终得分。因此,满分不仅代表一次成功操作,更代表模型在多轮扰动下仍能保持稳定输出。 对于正在走向产业落地的具身智能而言,这类能力的重要性正在上升。机器人演示可以选择最理想的一次结果,但真实工厂无法接受“偶尔成功”。在真实场景任务中,稳定性、可复现性和现场快速适配能力,往往比单次任务上限更关键。 三、专攻灵巧操作智能,让机器人实现价值创造 deeptouch.ai背后,是成立于2025年的瞬恒智能。 这是一家此前对外信息并不多的具身智能创业公司。经机器人前瞻了解,瞬恒智能聚焦机器人灵巧操作与触觉智能,试图从视触觉融合、触觉感知和末端操作模型等方向,解决机器人进入真实产业场景时面临的操作问题。 和一些从整机形态、运动能力或通用人形机器人故事切入的公司不同,瞬恒智能的技术路线聚焦于解决机器人价值创造的“最后1mm”。 这也是作为首席科学家的方斌长期的研究方向。公开资料显示,方斌曾任教于清华大学计算机系,现为北京邮电大学拔尖人才教授,博士生导师,具身智能专业负责人,兼任中国人工智能学会理事、认知系统与信息处理专委会秘书长、中国计算机学会智能机器人专委会常务委员,在视触觉感知、人机交互与操作大模型等具身智能方向上产出系列代表性创新成果。 机器人前瞻在与方斌的沟通中获知,此次比赛所采用的是统一的机器人平台,核心展现了团队在视觉感知、动作生成、双臂协同和真机部署方面的能力。但也正因如此,瞬恒智能核心专攻的视触觉技术并未在比赛中展现。 在精密装配、工件插接、高精度对位等真正对具身智能有需求的真实任务中,机器人进入接触阶段后,视觉常常会被工件或机械臂自身遮挡。仅凭视觉,模型很难自主完成偏差判断和毫米级的误差修正。 方斌目前带领瞬恒智能团队的主要方向之一,就是视触觉感知与操作模型深度融合,解决纯视觉模型在物理交互中精度不足、实时反馈缺失、仿真与现实脱节的问题。据透露,目前其在高精度工业任务中的装配成功率,相比纯视觉模型已提升了2.25倍。 这个方向并不是瞬恒智能一家公司的孤立判断。 在今年ICRA和CVPR相关机器人议题中,触觉正在被越来越频繁地放到具身智能核心能力框架下讨论。ICRA 2026期间,专项设置了视觉-触觉协同、触觉皮肤、机器人手指触觉传感器集成等多个相关Workshop和Tutorial,相关论文与技术创新数量正在快速增加。 这可能意味着,行业对机器人操作能力的理解正在发生变化。仅让机器人“看见”物体,已经不足以支撑更复杂的物理交互。尤其在抓取、插接、装配、交接等任务中,机器人需要的不只是视觉识别和轨迹规划,还包括对接触状态、受力变化和微小偏差的实时感知。 方斌在接受机器人前瞻采访时表示:“ICRA具身智能挑战赛验证了在纯视觉条件下我们操作模型完成真实任务部署的能力。但面向更复杂、更高精度的工业操作,仅靠视觉还不够。视触觉融合要解决的,就是机器人接触物体之后,如何感知偏差、理解受力,并完成最后的精细修正。” 从这个角度看,deeptouch.ai在ICRA真机赛场拿下唯一满分,并不只是一次单项比赛结果。同时也让一个话题被再次关注:当机器人从展示走向真实作业,操作智能究竟要靠什么补上最后一段能力缺口。 至少在近期的国际会议和真实机器人挑战赛中,答案已经越来越清晰:视觉仍然重要,但触觉正在成为机器人真正进入物理世界时难以绕开的模态。 随着灵巧手、执行器等硬件在触觉感知上的不断成熟,谁能真正把触觉融入模型与操作闭环中,可能会成为具身智能行业的下一个“考点”。
特朗普引以为傲的“美国制造”,其实是一台广东贴牌的HTC
作者|陆 邮箱|xiaoyu@pingwest.com 发布近一年之后,金色的特朗普手机 T1 终于落到了能把它拆开的人手里。 iFixit 联合 NBC 把 T1 放进了 Lumafield 工业 CT 扫描仪里。还没拆下一颗螺丝,X 光片上的照片就已经公布了答案:它的内部结构与 2024 年的 HTC U24 Pro 几乎完全一致。 图源:ifixit 为了验证这是不是真的,ifixit 的拆解团队做了一个更直接的实验:把 HTC U24 Pro 的主板装进 T1 的机身里。这台“混装机”顺利开机,运行正常。 图源:ifixit 到这一步,结论基本确定了。这台特朗普当初宣传以“美国设计、美国制造”为卖点的手机,就是一台更换了外壳的 HTC;更好笑的是这台 HTC 甚至都不是台湾省工厂自行生产的,根据 NCC 认证数据库的记录,U24 Pro 的制造商是位于广东的元昌电子。 iFixit 拆解师 Shahram Mokhtari 把所有能找到的差异都列了出来,数量不多。 T1 的闪光灯位置挪动了几毫米,实现方式是把排线加长了一些,触点本身没有变动;扬声器开孔的图案有调整,但 CT 扫描显示扬声器本体和位置都没变,只是外壳上的孔型不同。Mokhtari 的推测是,项目方原本可能想要更明显的外观差异,但留给厂商的时间不够,最终只在后盖上做了有限的修改。 图源:ifixit 芯片层面,两台机器搭载的都是高通骁龙 7 Gen 3,区别仅在于 T1 的 12GB+512GB 存储封装来自美光,HTC 用的是 SK 海力士,在量产手机上更换存储供应商是常见操作,这其实并不能算是差异。 真正算得上实质差异的只有电池:T1 的电芯容量稍大(19.35Wh 对 17.23Wh),但充电功率从 60W 降到了 30W,对应着随附充电头也进行了相应缩水。 而这块电池,恰好透露了整个项目最关键的信息。 T1 的电芯产自菲律宾,制造商是 Newlix Mfg Inc,2025 年才在菲律宾完成注册,时间点与特朗普宣布要造手机的时间点几乎重合。 图源:ifixit 这是一个看起来非常诡异的选择。全球消费电子电池的产能高度集中在中国大陆地区,无论原材料、规模还是价格都是如此。绕开中国供应商转向一家菲律宾新厂,最合理的解释其实就是一个:这款手机的订单量太小,不足以进入主流大厂的产线;也就是说,特朗普 T1 这款产品的订单,咱们没看上…… 公开信息显示,特朗普移动手机与套餐的合计销量约为 3 万,而官方宣称的预订量是 60 万部。对于动辄以百万为单位排产的手机行业,3 万部的订单确实很难敲开主流供应链的门。 “美国制造”的三次后撤 回过头来看,T1 的宣传话术经历了清晰的“逐级松动”。 2025 年 6 月项目官宣时,小特朗普和埃里克·特朗普为 499 美元的 T1 打出的口号是“Made in the USA”(美国制造); 几个月后,官网措辞悄悄降级为“American Proud Design”(美国骄傲设计); 等到真机出货,包装盒上只剩下“Proudly Assembled in the USA”(在美国组装)。 一年时间,三个版本,特朗普给“信徒”的承诺范围在一步步收窄。 关于产地,特朗普移动高管的说法是,手机及零部件来自“受优待的”或“友好的”国家,目标是“尽可能把供应链移出中国”。考虑到原型机的制造商位于广东,这个目标显然尚未实现。 另一个有趣的细节是,T1 机身背面的美国国旗只有 11 道可见条纹(美国国旗为 13 道),对此特朗普移动与白宫均未对此置评。 图源:ifixit HTC 在这之中扮演了什么样的角色? 整个事件里,态度最微妙的是 HTC。 面对 The Verge 的询问,HTC 表示公司“不为第三方设计或制造手机”,但拒绝确认 U24 Pro 的实际制造方。 HTC 在 2017 年已将智能手机业务的主体出售给谷歌,此后的 HTC 手机大多依赖 ODM 模式,早就失去了“灵魂”。 所以 U24 Pro 的原创设计很可能从一开始就归属于广东元昌电子而非 HTC。特朗普移动要在几个月内、以同样的价位做出一台手机,现实的路径只有一条:去华强北找一家“白牌手机”,直接使用它背后现成模具和产线的工厂。 也就是说,T1 与 U24 Pro 很有可能是元昌电子前后脚接了 HTC 和特朗普移动的两份“贴牌”订单,而非简单的模仿关系。 最大的问题是售后 iFixit 在报告结尾给了 T1 一个还算过得去的评价:对比同为 512GB 版本的 HTC U24 Pro(进口渠道价格约 490 至 525 美元),T1 499 美元的定价并不算溢价,因为你损失的只有 60W 快充,和那两道国旗条纹。 真正的问题是,作为典型的 ODM 白牌机型,这台手机没有公开的维修手册,特朗普移动也没有官方备件渠道,软件更新和安全补丁的维护周期也普遍短暂。 iFixit 给 T1 和 U24 Pro 的可维修性评分都是 3/10:一旦硬件出现故障,它大概率没有被修复的机会。为情怀付费的用户,最终拿到的是一台事实上的“一次性设备”。 至于真正意义上的美国制造手机,目前还是只有 Purism 的 Liberty Phone:它的售价高达 2000 美元,且只宣称“电子元件部分”产自美国。仅从目前的情况来看,智能手机制造回流美国并非不可能,但它需要的是对制造业、人才和技能的长期投入,而不是一场贸易战加一句口号。 这台雄心勃勃的金色手机最终证明的,恰恰就是美国本土造不了手机这件事本身。
马斯克成为首位万亿富翁,但 SpaceX 的麻烦才刚刚开始
刚刚,人类史上首个万亿美元富翁诞生了。 昨晚,SpaceX 正式登陆纳斯达克,代码 SPCX。发行价 135 美元,开盘直接跳到 150 美元,头 30 分钟冲上 165 美元,盘中最高摸到 176 美元,市值一度逼近 2.3 万亿美元,盘中即跻身全美市值前六的公司。 收盘时,SpaceX 报 160.95 美元,涨幅达 19.22%;按收盘价计算,公司总市值升至 21045.6 亿美元。 没有出乎太多意外,54 岁的马斯克纸面身家直接捅破 1 万亿美元。 按《福布斯》的数据,福布斯榜单上排在他后面的四位大佬(拉里·佩奇、谢尔盖·布林、贝索斯、拉里·埃里森),全部身家加起来,才勉强能跟老马一个人打个平手。 那么一万亿美元到底是个什么概念? 这么说吧,如果按一秒数一个数字,数到 100 万,大概要 11 天半;数到 10 亿,要 31.7 年;数到 1 万亿,要 3.17 万年。也就是说,想在今天把 1 万亿数完,你得从旧石器时代就开始数,差不多是尼安德特人刚消失不久的年代。 再换成重量来看看。 1 美元纸币正好重 1 克(为了方便点钞特意设计的)。100 万张摞起来重 1 吨,差不多一辆小型两厢车。1 万亿张 1 美元,相当于 5000 头史上最大号的蓝鲸(单头可达 200 吨)叠在一起。 把镜头拉回这场史无前例的 IPO。 募资 750 亿美元,剔除通胀后约等于沙特阿美 2019 年那次纪录的两倍,毫无悬念登顶人类历史最大 IPO。如果承销商在未来 30 天内行使超额配售权,规模还能再往上加。 而且据《纽约时报》报道,SpaceX 去年 12 月才开始面试投行,前后只用了半年就完成了从筹备、路演到挂牌的全过程。 规模这么大、速度这么快的,史上头一回。 IPO 当天上午,SpaceX 总裁兼 COO 格温·肖特维尔(Gwynne Shotwell)和 CFO Bret Johnsen 在纳斯达克敲钟,马斯克本人通过视频连线现身。 关键是,想买还买不到。 据彭博报道,认购需求超过可发售股份的 4 倍,一大堆机构压根没拿到份额,只能等开盘后去二级市场上入手。更刺激的是,这次公开发售的股份只占总股本的 4% 左右,其余都攥在早期投资人和员工手里。 流通盘极小,僧多粥少,股价想不涨都难。 风投这边,Founders Fund 当年投了 6 亿美元、持股 3%,按发行价算回报已超过 500 亿美元,堪称风险投资史上最大的回报之一。 红杉当年 20 亿美元的投资,如今价值超 200 亿,亲自牵头这笔投资的合伙人 Shaun Maguire 赢麻了。a16z 的持仓也值 100 多亿美元。 投行这边,SpaceX 上市当天凌晨的一份文件透露,主承销商高盛和摩根士丹利将从约 5 亿美元的承销费池子里分走约 20%,也就是各自落袋约 1 亿美元。 员工这边更热闹。 据美国旧金山投资平台 Hill.com 的分析,约 4400 名 SpaceX 现任和前任员工将因这次 IPO 成为百万富翁,其中约 400 人身家将超过 1 亿美元。 一夜之间,现在连焊工也都实现了财务自由。 高估值的背后,SpaceX 的家底确实硬:过去三年,全球送入轨道的卫星质量里超过五分之四由它发射。卫星互联网业务 Starlink 是高毛利现金奶牛,去年营收 187 亿美元,同比增长 33%。 顺便一提,SpaceX 在招股书里宣称自己面对的市场机会规模高达 28.5 万亿美元,并称这是「人类历史上最大的市场」。 口气和市值一样大。至于这个市值怎么撑起来的,还得看招股书里写的故事。 今年 2 月,SpaceX 把马斯克的 AI 公司 xAI 收了进来,而 xAI 此前已经吞下了社交平台 X。于是现在的 SpaceX,等于火箭+卫星互联网+AI+社交媒体的四合一巨无霸,IPO 前估值就达到了 1.25 万亿美元。 SpaceX 公司使命写得也很有马斯克那味:「建造让生命多行星化所需的系统与技术,理解宇宙的真实本质,把意识之光延伸到群星。」 落到具体业务上,主打一个「轨道 AI 算力」概念:用可回收火箭把 AI 数据中心服务器送上太空,并声称这个四合一组合是全世界唯一有条件干成的。 但 SpaceX 净利润却呈现出截然不同的一面。 SpaceX 在 2024 年还赚了 7.91 亿美元,结果下一年由盈转亏,主要原因是在 AI 上疯狂砸钱建数据中心,今年一季度还在接着烧。按现在的烧钱速度,这次 IPO 募来的 750 亿,用不了多久就能烧完。 那投资人图什么?红杉的 Maguire 表示:「马斯克值得一个极端溢价,因为他有提前判断技术趋势的过往战绩和愿景。」ERShares 的 CEO Joel Shulman 甚至表示,要找到可以类比的企业家,得回溯 100 年。 好家伙,正如我们之前所说的,大家押注的不光是 SpaceX,更是马斯克这个人。马斯克本人在上市直播视频里也是这个叙事: 「SpaceX 要做的,就是把科幻小说里的『幻想』二字去掉。无论你是谁,正在看这段视频的你,SpaceX 都想带你去月球、去火星,甚至更远的地方。」 理想很美好,但 SpaceX 招股书,细看也全是活儿。 最显眼的一条:马斯克本人,白纸黑字被列在「风险因素」里,理由是他名下其他公司可能会和 SpaceX 抢夺宝贵的供应资源。而所谓「其他公司」和 SpaceX 的关系,招股书里同样写得明明白白: 特斯拉持有近 1900 万股 SpaceX 的 A 类普通股,原本特斯拉在 xAI 的股份,也在 2 月那次合并后转成了 SpaceX 股票。SpaceX 向特斯拉采购 Cybertruck 和 Megapack 储能电池,还把办公场地租给马斯克的隧道公司 Boring Company。 左手倒右手,一家人整整齐齐。 故事可能还没完。IPO 当天,SpaceX 总裁肖特维尔在接受 CNBC 采访时被问到和特斯拉合并的可能性,她的回答是:这「也许能让马斯克的日子轻松一点」。 而 SpaceX 在上市前修订了 S-1 文件,在风险因素里新加了一句话:「我们可能在未来的交易中发行大量股权。」TechCrunch 分析,小打小闹的收购犯不上写这种稀释警告,这句话的指向,大概率就是当前市值约 1.26 万亿美元的特斯拉。 要知道,马斯克拼积木已经很熟练了:xAI 吞 X,SpaceX 吞 xAI,下一块拼上特斯拉,似乎只是时间问题。 至于 SpaceX 公司治理结构就更野了。 今年 1 月,SpaceX 董事会批给马斯克一份最终多达 13 亿股限制性股票的薪酬包,解锁条件包括在火星建成百万人口殖民地、把大功率数据中心送入太空。这些目标一个都没实现。 但根据招股书,这 13 亿股的投票权,马斯克现在就能用。 类似的安排还有一串:董事会不打算让独立董事占多数,高管薪酬不交给独立董事委员会来定,股东若想依据联邦证券法维权,按公司章程还必须走仲裁程序。加上 IPO 后马斯克掌握约 85% 的投票权,这家公司里里外外,受益人都指向同一个人。 而马斯克的「画饼兑现率」现在也有了一个具体的数据。 《纽约时报》刚好赶在 IPO 前算了一笔账。他们梳理了马斯克 15 年来在社交媒体和投资者电话会上公开立下的 602 个目标,结论是: 按时兑现的只有约 19%,约 35% 要么迟到(有的迟好几年)要么压根没下文,还有约 33% 因为说得太模糊根本没法验证,剩下约 13% 的截止日期还没到。 更扎心的是,他的年度兑现率随时间在走低:2015 年立下的 13 个目标,最后完成了近四分之三;2020 年立的 27 个,按时完成的不到一半。 别的不说,我现在就指望 Grok 5 能拳打 ChatGPT,脚踢 Claude 了。 不过,没有谁比 OpenAI 和 Anthropic 更期待 SpaceX 暴涨了。 目前这两家估值都逼近 1 万亿美元,本月刚刚秘密递交了 IPO 申请。两家的顾问此前一直担心,如果 SpaceX 上市翻车、散户亏钱,后面排队的 AI 股就难卖了。 现在 SpaceX 首日表现亮眼,两家高管总算能长舒一口气口气,准备今明两年很可能迎来的一波史诗级 AI 造富潮。 乱花渐欲迷人眼,泼天富贵压弯腰啊。
特朗普出手!Claude Fable 5与Mythos 5全停了,AI专家:中国才是全人类希望
智东西 作者 | 王涵 编辑 | 云鹏 智东西6月13日报道,刚刚,Anthropic宣布终止所有用户的Fable 5和Mythos 5访问权限。 ▲Anthropic声明(来源:X) 在声明中,Anthropic团队称,美国政府以国家安全为由,发布了一项出口管制指令,要求暂停所有外国公民(无论其身处美国境内还是境外,包括属于外国公民的Anthropic员工)对Fable 5和Mythos 5的访问权限。 为确保合规,Anthropic团队只能立即中止向所有客户提供Fable 5和Mythos 5的使用,所有其他Anthropic模型的访问将不受影响。 Anthropic团队称其于美国东部时间6月12日下午5点21分收到政府指令,但信函中并未详细说明其具体的国家安全的理由,仅提供了关于一个潜在的、狭窄的非通用越狱的口头证据,其基本内容就是让模型阅读特定代码库并修复其中的软件缺陷。 Anthropic团队并不同意这一证据。理由是团队审查了一份他们认为构成政府指令依据的报告,并验证了该报告中所展示的能力水平在其他模型(包括OpenAI的GPT-5.5)中也是广泛存在的,且每天都被维护系统安全的防御者所使用。 Anthropic团队认为,如果这一标准在整个行业中适用,这实质上将叫停所有前沿模型提供商的新模型部署。 据外媒Axios披露,该封政府信函是由美国商务部长Howard Lutnick签署的,直接致函Anthropic联合创始人兼CEO Dario Amodei,称Mythos 5和Fable 5模型将受到出口管制,涵盖美国境外任何地点以及美国境内的所有外国公民。 一位美国政府官员透露,美国商务部之所以采取这一行动,是因为另一家公司声称能够越狱Mythos模型,引起了对潜在国家安全风险的警惕。并且,美国政府曾试图让Anthropic暂停发布最新模型但未能成功,从而促成了这封出口管制信函。 该官员补充说,在美国国家安全机制得到加固(可能在未来几周内完成)之前,该模型需要保持封锁状态。根据美国商务部的信函,对上述模型的出口、再出口或境内转让将需要获得许可证,且Anthropic还需额外提交单独验证许可证的申请,不遵守规定将面临经济及民事处罚。 Fable 5和Mythos 5的关停,引起外网网友的激烈讨论。 有网友认为,美国政府这一干预是十分霸道和无理的,对比中国开放的技术氛围,美国是在将“技术优势”拱手让人。 土耳其AI专家Furkan Gözükara发文称:“这就是为什么中国是人类希望的所在。” 还有一波网友认为Anthropic在这起事件中并不是无辜的受害者。 知名YouTuber、播客Forward Future主持人Matthew Berman发文称Anthropic是自作自受,如果Anthropic当初没有大肆宣扬Mythos有多么危险,这种事根本就不会发生。 “OpenClaw之父”Peter Steinberger调侃道:“他们是不是又没算力了?” 还有网友说自己刚为了使用Fable 5订阅了Claude Max会员,问“能不能退钱?” 6月10日,Claude正式发布Claude Fable 5,以及面向特定机构开放的Claude Mythos 5,这两款模型共享同一个底座模型,同属Mythos(神话)级,即Anthropic迄今为止能力最强、综合性能最高的大模型级别。 Anthropic在技术博客中称,Fable 5在几乎所有AI能力基准测试中处于顶尖水平。与Opus 4.8、GPT 5.5和Gemini 3.1 Pro相比,Fable 5/Mythos 5称得上是断层领先。 被定位为“全球最强网络安全模型”的Mythos 5则在某些领域移除了安全防护措施。这款模型目前率先通过Anthropic与美国政府合作的Project Glasswing项目对外开放,未来打算通过更广泛的受信任访问计划扩展访问权限。 然而仅不到3天,Fable 5和Mythos 5的访问权限被紧急封停。
标致“纯电小钢炮”E-208 GTi发布:281马力5.5秒破百,42900欧元
IT之家 6 月 13 日消息,北京时间 13 日(今天),标致正式发布 e-208 GTi。作为标致首款纯电性能版车型,e-208 GTi 以“小钢炮”定位登场,动力参数比外界预期更强。 e-208 GTi 搭载 M4+ 电机,最大功率 207 千瓦(281 马力),峰值扭矩 345 牛 · 米。新车 0 至 100 公里 / 小时加速时间为 5.5 秒,最高车速限制在 180 公里 / 小时。 电池容量为 54 千瓦时,WLTP 综合续航最高 375 公里。使用标准配置的米其林 Pilot Sport 4S 性能轮胎后,续航降至 352 公里。e-208 GTi 还拥有同级最佳功率重量比,并支持 100 千瓦直流快充,电量从 20% 充至 80% 不到 30 分钟。 底盘也按性能车思路重新调整。e-208 GTi 车身降低 25 毫米,轮距进一步加宽,并配备专属弹簧、减振器和机械式限滑差速器。新车后轴还有增加防倾杆,与普通版已有的前防倾杆形成配合。 外观方面,e-208 GTi 采用专属前唇,亮黑色后扩散器经过重新设计,并配备受 F1 启发的后雾灯。红色装饰、加宽轮拱、“打孔”18 英寸轮圈,以及 C 柱上的 208 GTi 标识,进一步强化性能版身份。 车内同样以红色作为重点。e-208 GTi 配备红色地毯、脚垫、安全带和缝线,专属运动座椅则向 205 GTi 1.9 致敬。座椅上的“中央红色嵌件和红色网状细节”,也呼应了 205 GTi 1.6。 e-208 GTi 还配备皮革和 Alcantara 方向盘、红色主题显示界面和红色氛围灯,氛围灯另有七种颜色可选。标致还加入一套随车速变化的“声音氛围”系统,驾驶者可以手动关闭。 标致目前已经开始接受 e-208 GTi 订单,法国市场含税起售价为 42900 欧元(IT之家注:现汇率约合 33.6 万元人民币)。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。