行业分类:
加载中...
头条分类:
加载中...
车东西专访德州仪器高管:汽车AI芯片不只是TOPS竞赛
智东西 作者 | Janson 编辑 | 志豪 汽车行业对算力的渴望,似乎正在变得越来越强烈。 在数据中心里,性能可以通过更高功耗、更大规模和更强散热来堆出来,但在车上,每一份算力都要被放进更严苛的约束里。 它必须足够安全、足够实时,同时还必须控制重量体积功耗和成本并服务于一套生命周期长达15年以上的长期演进的软件平台。 这也是汽车AI芯片竞争正在发生变化的原因,一颗芯片不仅要完成AI推理,还要和实时控制、音频处理、网络通信、安全机制一起工作。 毕竟,汽车不是一个单纯追求峰值性能的场景,而是一个不断要求系统平衡的工程现场。 在这样的变化中,老牌芯片公司德州仪器被放到了一个值得关注的位置。 作为一家长期围绕嵌入式处理、实时控制、DSP和车规级器件构建能力的企业,德州仪器也正在给出其自己的思考。 换句话说,当汽车芯片的评价标准从单一TOPS性能指标,转向安全、实时性、功耗、软件工具链和系统可扩展性时,TI过去积累的那些看似广泛分散的能力,开始被重新组织进同一个叙事里。 ▲德州仪器处理器业务副总裁兼总经理Roland Sperlich 日前,车东西开展了一场与德州仪器处理器业务副总裁兼总经理Roland Sperlich的专访。 在这场访谈中,Roland围绕边缘AI的爆发逻辑、汽车客户对可扩展平台的需求,以及芯片厂商如何把算力转化为可开发、可验证、可量产的系统能力,系统阐述了TI对汽车芯片竞争新阶段的判断。 一、边缘AI上车之后,汽车芯片进入系统竞争时代 在Roland Sperlich看来,边缘AI之所以在这个时间点快速升温,是技术成熟,与市场需求拉动的共同结果。 一方面,边缘侧已经具备了实时数据处理和分析的技术条件;另一方面,汽车、工业等场景也确实需要更低延迟、更靠近现场的本地计算能力。 换句话说,边缘AI不是一个被“造出来”的概念,而是技术能力和应用需求共同走到临界点后的结果。 这种变化放到汽车行业里,意义会更复杂。 毕竟,汽车天然不是一个只看算力的场景,它既有摄像头、雷达、麦克风、加速度计等多类传感器,也有大量需要实时响应的控制链路。 Roland在采访中提到,边缘AI面临的挑战并不是单纯的“芯片算力”问题,而是传感器、SoC、软件开发环境和算法部署流程共同构成的系统性挑战。 ▲汽车智能化下半场传感器无处不在 这也解释了为什么汽车AI芯片的竞争,正在从单一TOPS参数竞争转向系统能力竞争。 过去讨论AI处理器时,市场很容易把注意力集中在AI引擎或峰值算力上;但在真实的汽车系统里,AI引擎只是其中一部分。 数据如何从传感器进入SoC,如何在片上完成预处理,如何调用DSP、加速器和不同内核,如何在成本、功耗和性能之间取得平衡,都会决定一颗芯片最终能否被车企真正用起来。 因此,TI并不把自身差异化简单定义为“提供一个AI引擎”。 Roland提到,即便假设不同厂商的AI加速能力接近,差异也不会只来自AI引擎本身,还会来自处理器周边能力,例如数据转换器、传感器接口、外设I/O、显示、USB等系统级能力。 这些能力看起来并不如TOPS数字直观,却直接影响客户能否把芯片放进真实系统中,并完成稳定量产。 软件和工具链则是另一个关键变量。 边缘AI真正落地,不只是模型能不能跑起来,还包括客户如何开发、部署和优化模型。 ▲Roland讲述具体案例 对此,Roland举了一个例子:如果客户购买了一颗40 TOPS的MPU,但实际部署后只使用了20 TOPS,那么芯片供应商能否帮助客户识别资源利用率,并进一步优化系统配置,就会变得非常重要。 对TI而言,工具链、软件生态以及对ONNX等主流模型和开放生态模型的支持,都是让AI算力真正被用起来的重要组成部分。 与此同时,汽车电子架构本身也没有统一答案。 有些车企希望在中央ECU集中处理数据,有些则希望在边缘侧先做预处理;有些客户偏好集成式MPU,有些则选择外置MPU。 Roland表示,TI不会替客户预设某一种架构是唯一正确路径,而是通过从入门级MCU到高性能TDA器件的产品组合,以及相对通用的软件和开发工具,支持客户在不同系统架构之间迁移和复用。 从这样的逻辑中不难看出,当下汽车芯片供应商角色的变化。 过去,芯片公司更多是在某个功能点上提供器件,但在边缘AI上车之后,一个能够把传感、计算、软件、功耗、成本和安全要求组织在一起的系统基础变得相当重要。 对于TI来说,真正的竞争点也不再只是“有没有AI算力”,而是能否帮助客户把这些算力变成可开发、可验证、可量产的工程能力。 二、汽车芯片的第一原则,安全优先 如果说边缘AI让汽车芯片进入智能系统竞争时代,那么在Roland Sperlich看来,这套系统能力的第一原则并不是算力,而是安全。 他在采访中明确提到,对TI来说,安全永远是第一优先级,尤其是在ADAS等汽车应用场景中。 毕竟,汽车不是普通消费电子产品,一颗芯片一旦进入关键系统,就必须面对功能安全、长期可靠性和极端环境适应性的多重要求。 更高等级的安全通常也意味着更多安全硬件和软件机制,这会带来成本、芯片面积和系统复杂度的增加,但TI并不认为安全是可以被轻易压缩甚至删减的部分。 这也是汽车处理器和工业处理器之间最重要的差异之一。 Roland提到,汽车设备通常有更严格的安全认证流程,也需要支持更宽的工作温度范围,能够在高温、低温等复杂环境下长期稳定运行。 相比之下,工业设备虽然同样重视可靠性和安全,但应用环境和市场节奏都与汽车不同。汽车市场更垂直、更新速度更快,也越来越接近消费电子,这要求汽车芯片既要满足严格安全标准,又要跟上快速迭代的功能需求。 这种“安全优先”的逻辑,并不只存在于辅助驾驶等高算力场景,也正在渗透到更多传统功能中。 车载音频就是一个典型例子。过去,音频系统更多被理解为体验功能,关注音质、输出功率和沉浸感。 但Roland在采访中提到,高功率车载音频也需要与安全功能结合。例如车辆在行驶过程中,如果系统检测到救护车等外部环境音,可以自动降低车内音量,待风险解除后再恢复。 这意味着,音频芯片承担的角色正在扩展。它不只是负责“把声音做得更好”,也要参与车内外声音识别、降噪、个性化音区管理,以及与整车安全和交互系统的协同。 ▲面向AM62x的嵌入式开发板 TI的AM275和AM62D处理器面向高质量音频处理,具备确定性的实时性能表现,可支持高端及车载音频方案。随着汽车电子电气架构向集中化、区域化演进,音频系统也在从单一功能升级走向系统级重构。 同时,AVB技术正是这种趋势下的重要支撑。通过音频视频桥接协议,车载音频系统可以在提升带宽和系统可扩展性的同时,简化布线并降低整车成本。 对于车企来说,这不仅是音频架构的变化,也是在区域架构下重新组织数据传输、功能协同和成本结构的一部分。 因此,音频、感知、安全、功耗、成本和算力正在被放进同一个系统框架中重新设计。 对汽车芯片供应商来说,真正的挑战也不只是把某个单点功能做好,而是让这些功能能够在安全可靠的前提下协同工作,并最终进入可量产的整车系统。 三、从实时控制到可扩展AI,TI要让算力真正可用 在汽车AI芯片竞争中,算力并非不重要,但Roland Sperlich更强调另一个关键词——可扩展性。 他的判断是,TOPS到了一定量级后,并不需要无限追高。汽车不是云数据中心,车企真正关心的是在安全性、性价比和软件开发成本之间取得平衡。 不同法规、不同市场、不同道路环境,以及不同客户的软件和算法能力,都会影响最终算力需求。 因此,芯片平台不能只回答“最高能做到多少TOPS”,还要回答“能否覆盖不同车型、不同功能等级,并让软件尽可能复用”。 这正是TDA5的产品逻辑。TDA5是一个可扩展的高性能处理器系列,AI性能覆盖从10 TOPS到最高1200 TOPS,用于应对汽车对AI、功能安全和技术集成不断增长的需求。 Roland在采访中也提到,TDA5系列中100 TOPS到400 TOPS产品具备引脚兼容性,客户可以根据不同车型或功能需求,在不同算力平台之间切换,同时尽可能保留既有软件资产。 这种可扩展性背后,对应的是车企越来越高的软件开发成本。 在汽车AI时代,每一次平台切换都可能牵动算法、工具链、验证流程和量产节奏。 如果一个平台能够支持从基础功能到更高等级功能的平滑迁移,就意味着客户可以在不同车型、不同价位和不同功能版本之间复用开发成果,降低重复投入。 ▲汽车也是数字化产品 不过,汽车AI并不只是AI推理本身。Roland在谈到实时控制时指出,很多系统架构本质上是在数据和控制pipeline和延迟之间做平衡。 以电机控制为例,真正的核心控制环路要求极低延迟,AI通常不直接处在这个环路里,而是在外部调整控制参数;控制任务仍然依赖实时控制引擎、Arm内核、C2000系列或专用加速器来完成。 这也是TI长期积累能够发挥作用的地方。TI在嵌入式处理领域深耕近50年,产品组合覆盖MCU、处理器、无线连接和基于雷达的设备,并支持工业/汽车级温度范围、功能安全和多样化封装选项。 在汽车系统中,AI计算、DSP信号处理、实时控制和数据转换并不是彼此割裂的模块,而是需要在同一套系统架构中协同工作。 同时,ADAS场景进一步放大了这种系统复杂度。Roland提到,ADAS与传统实时控制架构不同,原因在于传感器尤其是图像传感器会产生大量视觉数据,这些数据需要快速流式传输到DSP和各类加速器中,同时也要求加速器与DDR内存之间具备足够带宽,才能支撑复杂信号处理。 而VDK则把TI的这套思路进一步延伸到软件开发阶段。TDA5配套的虚拟开发套件VDK支持开发团队在芯片量产前启动软件开发,实现软硬件并行开发,从而缩短产品上市时间。 Roland在采访中进一步解释,VDK不仅能让客户提前验证软件,也能让TI在硬件正式发布前获得客户反馈,提前优化SDK,甚至发现潜在硬件瓶颈。 更重要的是,VDK可以把验证场景做得更前置、更并行。Roland提到,VDK可以部署在云端,同时运行多个实例,模拟不同ECU、不同天气、不同地区道路条件,也可以导入真实摄像头数据测试算法表现,甚至用于构建整车数字孪生。 对车企来说,这意味着软件开发不必完全等待硬件到位,验证工作也不必局限在线下单一环境中完成。 因此,TI在汽车芯片中的角色并不只是交付处理器本身了。 围绕TDA5和VDK,它试图解决的是更靠近车企工程现场的问题,如何让算力覆盖不同需求,如何让软件跨平台复用,如何让开发和验证更早开始,如何让AI能力最终进入可量产的汽车系统。 结语:TI押注长期系统能力的复利 汽车AI时代,芯片厂商的角色正在变化。 过去客户购买的是一颗芯片,现在客户需要的是一个能够支撑多年软件演进、安全验证和平台扩展的系统基础。 对TI来说,提供弹性算力,让每一份算力都能在安全、实时和可验证的系统中真正发挥作用可能,才是一个共赢的解决方案。
SpaceX完成上市首周:股价飙升37%,市值2.4万亿世界第六
马斯克在SpaceX上市前讲话 凤凰网科技讯 北京时间6月19日,据彭博社报道,SpaceX股价在上市首周实现大涨。不过,该股票在本周走势震荡,表明即便是史上最大规模的IPO,也无法免受大型公司上市后常见股价波动的冲击。 由于美股因六月节在周五休市,所以周四是本周的最后一个交易日。截至周四收盘,SpaceX股价下跌3.6%,报收于185美元,使其两日累计跌幅达到8.3%。 不过,该公司上市首周收盘价仍较这桩创纪录IPO的每股135美元发行价高出37%,总市值达到2.4万亿美元,成为全球第六大公司。 “经历一轮大涨之后,出现一两天的下跌,与其说是基本面出了问题,不如说更像是上涨后的疲态。IPO之后股价几乎是垂直拉升,而市场上的流通股又非常少,因此到了某个阶段,买家确实需要喘口气。”投资顾问公司Roundhill Financial CEO戴夫·马扎(Dave Mazza)表示。 SpaceX首周上涨37% 马扎表示:“我最关注的价位是135美元的IPO发行价。只要股价仍远高于这一价位,我认为这只是股票在消化过去一周的巨大涨幅,而不是什么值得担忧的事情。” 股票研究公司Arete Research分析师安德鲁·比尔(Andrew Beale)周四首次将SpaceX纳入研究,授予“买入”评级,目标价为401美元,这意味着该股相较当前交易价格还有超过一倍的上涨空间。 “我们认为,基本面以及SpaceX的长期增长潜力将吸引投资者的兴趣。”比尔表示。尽管他预测该公司到2030年营收将突破2000亿美元,但他也提醒称,实现这一目标的过程未必会一帆风顺。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
一波刚平一波又起:苹果印度代工厂先遭污染委员会核查 卫生部门再度介入调查
快科技6月19日消息,据媒体援引三名官员及相关文件报道,印度泰米尔纳德邦卫生部门目前正在调查苹果代工厂、塔塔集团旗下iPhone零部件工厂的废水排放问题。 多名当地农户反映,自家农田遭到工厂污染物污染,同时自身出现皮肤不适等症状,这场环保纠纷迎来官方调查新进展。 据悉,涉事工厂为塔塔电子坐落于印度南部泰米尔纳德邦霍苏尔市的厂区,主要负责生产iPhone背板零部件。 此前在今年5月25日,该工厂就已收到泰米尔纳德邦污染控制委员会(TNPCB)出具的警示函,被查实存在违规排污行为,造成周边农田和地下水污染。 据TNPCB调查通报,涉事工厂违规将生产废污水排入厂区雨水回收池,导致污水溢出蔓延至周边农田,进一步渗入地下水系统,对当地土壤、灌溉水源及生态环境造成实质性危害。 自2025年12月至2026年5月,当地监管部门已累计接到多起农户针对该工厂的排污投诉,期间先后开展五次实地核查,最终确认塔塔电子厂区污水是周边农田及水源污染的核心来源。 监管部门指出,在多次核查并提出整改要求后,塔塔电子始终未落实有效的污染治理与改善措施。 为此,TNPCB已向企业下发书面警告,要求其限期说明未完成整改的正当理由,若无法给出合理解释,监管方将依法对该工厂采取勒令停工的行政处罚。 针对此次污染纠纷,塔塔电子本周发布官方声明称,监管机构完成厂区最新水样检测后,结果显示水样未检出污染物,且相关核查工作已终止。 此次风波的背后,是苹果供应链全球化布局的深层行业背景。 近年来,苹果持续推进生产基地多元化战略,着力降低对中国供应链的依赖,大力扶持印度制造产业,推动印度本土零部件供应体系逐步成型。 塔塔电子借此成为苹果在南亚地区仅次于鸿海的第二大供应商,是苹果印度供应链的重要一环,主要为全球销售的iPhone供应核心零部件。 行业数据显示,印度在苹果全球产能中的占比正快速攀升。调研机构Counterpoint测算,2026年印度生产的iPhone将占全球总产量的26%,相较于四年前6%的占比实现大幅跃升。
京东618收官!下单用户数再创新高:人形机器人销量暴增10倍
快科技6月19日消息,京东618大促收官,截至6月18日23:59,下单用户数再创新高,多类型服务消费呈现爆发式增长。 最新行业调研显示,这个618,京东在产品、价格、服务的综合体验上获得了消费者的最高满意度。 作为全国第一大品牌电商平台,这个京东618,品牌重磅新品发布数量同比增长超5倍,参与618的中小新商数量同比增长超62%,超3000个首次参加京东618的新商家成交额破百万。 数据显示,在今年618期间,京东家政日常保洁成交额同比增长超200%,家电清洗增长超300%,护士到家失能照护服务订单量同比增长超4倍,家电家居送装一体服务商品成交单量同比增长超120%。 商品消费同样全面走高,3C数码AI趋势产品成交额同比增长100%,超1800个家电家居品牌成交额翻倍,美的、海尔、海信、TCL、格力、小米等家电品牌成交额均超10亿元;以Apple、联想、华为、华硕为代表的高端手机与轻薄笔记本成交额分别同比增长300%与100%。 线上增长之外,京东线下业态也在加速渗透,6月18日京东MALL香港湾仔店开业,3万平方呎体验空间集结博世、西门子、三星、索尼等国际品牌与大疆、小米等科技品牌,多个品牌首次布局香港线下渠道。 此前6月12日开业的上海七宝店3天客流超15.6万、销售额超1.2亿,双店齐开后京东MALL门店规模突破30家,超5800家3C数码门店订单量同比增长超100%,客流量同比增长超3倍。 京东的国际化布局在这个618也在进一步提速,5月31日一位印尼游客在北京完成全国首笔线上购物离境退税,京东成为国内首个境外旅客“网上离境退税商店”。 6月5日广东荔枝36小时鲜达欧洲,6月15日京东欧洲Joybuy“夏季黑五”首日下单用户数和订单量均创新高,超800个品牌成交额环比开业当日翻倍。 与此同时,京东主站面向36国海外用户的全球售平台,在618期间的下单用户数和成交额均同比增长翻番。 更值得关注的是,今年的京东618是首次全场景、全产业融入AI的一届,JoyAI大模型已应用到京东3000多个业务场景,Token调用量是去年同期的7.7倍。 搭载JoyInside的智能硬件累计上新近百款,AI趋势产品成交额同比增长100%,AI迷你工作站、AI感知设备成交额同比增长超20倍,人形机器人销量同比增长超10倍。 JoyStreamer数字人直播日均开播商家数量同比增长5倍,累计带货GMV同比增长100%。,京东物流超脑大模型应用于超1000个场景,618期间累计调度3.2亿揽收订单,无人车累计转运包裹553万件。 【本文结束】如需转载请务必注明出处:快科技 责任编辑:黑白
Claude Code发了个“王炸”功能,打工人狂喜
Claude Code 终于学会用 AI「表演工作」了。不光埋头写代码,还能把自己干活的成果,实时摊在一个网页上给所有人围观。 今天凌晨,Anthropic 宣布 Claude Code 支持 Artifacts 功能。 Artifacts 最早于 2024 年在 Claude 网页版推出,主要用于展示代码和网页内容。如今,这项能力被引入 Claude Code,开始面向开发者的实际工作流程。 相比单纯帮助开发者写代码,Anthropic 希望解决团队协作中的信息传递问题。 借助 Artifacts,Claude Code 可将代码修改、故障排查或数据分析过程整理成实时更新的网页,如 PR 解读、事故时间线和数据仪表盘,方便集中展示与共享信息。 官方博客 🔗 https://claude.com/blog/artifacts-in-claude-code 用可视化页面,「同步一下进度」 Claude Code Artifacts 最有意思的地方,并非只是生成页面,而是生成页面时几乎不需要额外配置。 系统会基于整个会话上下文生成 artifact,包括本地代码库、连接的数据源,以及用户与 Claude 的对话内容,然后自动生成一个可视化交互界面。 Anthropic 也列举了一个典型的案例: 一次线上事故调查中,页面可以同时展示失败测试、对应代码函数、监控系统里的错误率曲线,以及 Claude 推导出的原因分析。开发者不用再搭临时看板,也不用写脚本拉数据,只需要让 Claude Code 生成一个页面。 更关键的是,页面并非静态报告。 Claude Code 工作过程中,页面会持续刷新。同一个链接下不断产生新版本,团队成员打开后看到的是实时进展,而不是某个时间点的快照。 Anthropic 内部测试发现,调试和事故排查是最常见场景之一。 一个工程师早上启动故障调查,Claude Code 自动分析日志并生成页面,里面包含时间线、可疑提交和错误率变化。 等到团队会议开始时,Claude 可能已经更新过两三轮内容。会议不再围绕「谁来讲一下发生了什么」,所有人只需看同一个页面,完成信息同步。 安全方面,Anthropic 延续了企业产品一贯的谨慎。 Artifacts 默认私有,只能在组织内部分享,无法公开访问互联网。管理员可以通过组织级权限、角色控制和合规接口统一管理访问范围。 目前,Artifacts 已以 Beta 形式向 Claude Team 和 Enterprise 用户开放,可通过 Claude Code CLI 和桌面应用使用,生成页面支持在浏览器中查看。 Coding Agent 的下半场,是工作「解释权」之争 把时间往前拨两周,会发现本次发布还有另一层意味。 不久前,OpenAI 刚刚给 Codex 推出了 Sites 功能。它允许 Codex 把想法、分析和计划转化为可托管、可交互、可分享的网站或轻量应用,并通过 URL 分享给同一 workspace 内的成员。 借助 Sites,Codex 的输出不再局限于文档、表格和幻灯片。企业团队可以把客户评审材料变成一个交互网页,集中展示产品更新、开放问题、使用趋势和下一步行动; 也可以把财务模型变成 scenario planner,让管理层直接比较不同假设;还可以把发布材料变成 launch hub,持续更新 messaging、里程碑、负责人和决策状态。 两家公司几乎同时推出 AI 生成网页的能力,看起来像是在争夺同一块企业场景,但路线差异非常明显。 OpenAI 更接近应用平台,Anthropic 更接近工作画布。 Codex Sites 偏向托管环境。它支持 Cloudflare Worker、数据库、对象存储、用户登录和权限管理,本质上是在帮助企业快速生成并部署内部应用。 Claude Code Artifacts 则刻意避开这些能力。 Artifact 是工作的呈现,不是应用,APPSO 查询官方博客发现,每个 Artifact 都只是一个独立 HTML 页面,单页渲染上限 16 MiB(约 16.8 MB),没有后端,没有数据库,也不能调用外部 API。 🔗 https://code.claude.com/docs/en/artifacts 页面无法加载外部脚本、字体或样式资源,所有内容都必须封装在页面内部。从技术角度看,这些限制甚至有些苛刻。 Claude Code 负责人 Boris Cherny 也在 X 上表示,自己已经把 Artifacts 用在代码解释、系统架构图、动画方案预览、数据分析和团队仪表盘等各种场景里。也充分反映了AI 编程工具的竞争,正在进入下半场。 过去两年里,各家厂商围绕代码生成、代码补全、自动修复和 Agent 能力展开激烈竞争。但随着模型能力持续提升,新的问题开始浮现。 当 AI 帮工程师完成了一次故障排查、一轮代码重构,或者一个复杂功能开发后,团队里的产品经理、设计师、管理者、安全负责人乃至公司高层,如何快速理解发生了什么、为什么这么做,以及接下来应该关注什么? 在这样的背景下,AI 编程工具正在从单纯的代码生产工具,演变为连接整个工作流的协作节点。未来的 Coding Agent 不仅要会写代码,还要会展示工作、传递上下文、同步状态,并让不同角色的人都能参与到同一个工作界面中。 对于 Anthropic、OpenAI 以及越来越多进入这一赛道的玩家而言,这很可能会成为 Coding Agent 的下一轮竞争目标。 终端里那个埋头干活的 Claude,这回也总算学会用 AI 给自己写「工作汇报」了。
特朗普歪曲事实?美媒曝英特尔高管对苹果达成合作消息感到意外
特朗普一句苹果与英特尔合作生产芯片的帖子引爆英特尔股价。但最新消息显示,就连英特尔内部高管也对总统的表态感到吃惊。 美国总统特朗普的一则社交媒体帖子,引发市场对英特尔晶圆代工业务迎来重大突破的乐观情绪。特朗普周四表示,苹果已经同意与英特尔合作,在美国设计和生产芯片,此举将有助于强化美国半导体供应链,也为英特尔带来急需的大客户支持。 上述利好消息推动英特尔股价大涨。不过,特朗普发帖后,美国新闻网站Semafor援引知情人士报道称,苹果与英特尔确实已就美国本土制造合作进行了数月磋商,但交易状态目前无法确认,更令外界意外的是,部分英特尔高管此前并不知道特朗普将发布这一消息,对他的表态感到吃惊。 特朗普突然“官宣”,市场迅速点燃英特尔行情 当地时间周四稍早,特朗普在旗下社交媒体发文称:“苹果已同意与英特尔合作,在美国设计和制造芯片。” 特朗普还表示,这项合作将帮助美国重新夺回半导体制造领导地位,并强调芯片必须在美国本土生产。 特朗普发帖后,英特尔股价周四跳空高开8.8%,盘中两位数大涨,即使传出Semafor的报道也未受影响,刷新日高时日内涨近11.9%,助推芯片股总体大涨。费城半导体指数一度涨逾6.7%、创盘中历史新高。 英特尔与苹果达成芯片产品合作的消息迅速引发市场热议。投资者认为,如果苹果成为英特尔代工客户,将意味着英特尔Foundry业务获得迄今最具分量的背书。 近年来,苹果的A系列和M系列芯片主要由台积电代工。对于仍在努力追赶台积电、三星的英特尔而言,若能获得苹果订单,无疑将显著提升其先进制程业务的信誉。 双方接触已持续数月,但正式协议仍存疑问 不过,据Semafor援引知情人士报道,苹果与英特尔围绕在美国制造部分芯片的讨论其实已经持续数月。消息人士并未透露双方是否已经签署最终协议,也没有说明涉及哪些芯片产品。 该报道称,一些英特尔高管此前并未获悉特朗普将公开宣布这一合作,因此对特朗普的表态感到意外。 周四美股盘前,Semafor记者Rohan Goswami在社交媒体上表示:“消息人士称,英特尔和苹果围绕美国制造已经讨论了数月。目前尚不清楚这些谈判进展到了哪一步。英特尔高管对(特朗普)总统的帖子感到意外。” 这意味着,特朗普的帖子可能早于企业正式披露流程,也可能只是基于双方已有接触而作出的公开表态。 英特尔代工业务急需“苹果级客户” 对于英特尔而言,获得苹果订单具有象征意义。 自陈立武担任CEO以来,英特尔一直试图推动公司代工业务Intel Foundry转型,希望将自身打造为美版台积电。特朗普政府也持续将英特尔视为重振美国先进制造业的重要支柱。 此前已有报道称,英伟达、特斯拉等公司正探索使用英特尔先进制程,而苹果的加入则被视为最具影响力的一步。 与此同时,AI热潮导致台积电先进产能持续紧张,也促使大型科技公司开始寻求更多供应来源。市场一直猜测苹果可能会在部分产品上增加第二供应商,以降低对台积电的依赖。 不过,即便双方最终达成合作,业内普遍预计苹果短期内不太可能将核心A系列或M系列处理器全面转向英特尔,更可能先从部分外围芯片、低端处理器或封装业务开始。 市场仍在等待苹果和英特尔正式确认 截至目前,苹果和英特尔均未正式宣布相关合作细节。 因此,在特朗普“官宣”之后,市场焦点已从“是否会合作”,转向更关键的问题:双方是否已经签署正式协议,以及苹果究竟会将哪些芯片交由英特尔制造。 在获得更多官方确认之前,这场被特朗普提前曝光的潜在合作,仍存在不少悬念。
为什么年代剧里“孩子戏”特别“抢戏”?
  备受关注的年代大剧《主角》近日落幕,这部48集的长剧罕见地用前14集的超长篇幅来完整铺陈女主角的童年成长,剧中几位小演员用毫无滤镜的表演,扛起了收视峰值破4.4%的剧集前半程。纵观近年来的年代剧作品,一个明显的创作趋势是童年视角的篇幅与叙事权重持续攀升,多部国产年代剧中的“孩子戏”,通过精细的选角、自然的表演以及对后续剧情的深层启示,承担起代入剧情、积累观众口碑的开局重任和独特的叙事价值。   年代剧童年角色“抢戏”成为常态   当下的长剧市场有“生死前三集”的说法,相比大多数作品在叙事上不敢慢、不敢铺垫,《主角》用整整14集篇幅来铺设一个放羊娃的童年,这种慢节奏、反套路的叙事选择本身是一种对收视习惯的挑战。剧集播出之初,这一叙事策略也曾被质疑“注水”,认为观众的耐心会因为对故事主线的稀释而消磨掉,但很快实现了口碑逆袭,很多观众从最初的质疑转为共情,对剧中的童年角色产生了深度情感羁绊。 电视剧《小巷人家》剧照   《主角》并非孤例,近年来童年角色“抢戏”已成为国产年代剧的常态。《北上》《小巷人家》等年代大剧中童年故事的篇幅一再扩容,小演员们的表现也一次次引发关注。《乔家的儿女》《六姊妹》等年代剧开播时的高口碑,也与剧中少年群像成长史的生动呈现密不可分。 电视剧《北上》剧照   2025年开年大剧《北上》在央视首播即成为收视冠军,然而让观众热议的并非白鹿、欧豪两位主演,而是韩昊霖、李洛伊、李庆誉等小演员。剧集开篇长达4分钟的“认门”一镜到底长镜头,6个孩子仅用肢体动作和方言台词就串起了6个家庭背景和20余个人物关系。小演员们的真实感撑起了这部大戏的开场,让观众瞬间代入。 电视剧《小巷人家》剧照   豆瓣评分8.4的《小巷人家》凭借真实细腻的生活质感与邻里温情成为收视黑马,这部剧的亮点之一,就是对童年角色的成功塑造。这些充满灵气的小演员们不仅撑起了全剧最受好评的段落,更与同期许多依赖特效或流量明星的作品形成了鲜明对比。对童年角色的过分喜爱,还让观众产生了“不敢看太快,怕孩子们长大了”的甜蜜烦恼,有观众表示,让孩子们单开一部剧“可以看100集”。   从“引子”变“地基”   童年故事越来越“抢戏”年代剧,一定程度上体现了创作意识的变化。   在传统的生活史诗剧中,家庭是叙事的主要载体,剧情以家族的兴衰变迁以及人物间的恩怨纠葛作为叙事主线,将个人命运、家庭命运与时代命运交织在一起。在这种叙事框架下,童年角色承担的是故事“引子”或“铺垫”的功能,重在交代人物性格成因和背景信息,篇幅几乎都被压缩到最低限度。 电视剧《主角》剧照   而当下的创作者越来越意识到,童年经验对一个人的个性、气质、思维方式的形成起着重要作用,很多作品中,人物的选择与命运,都能在他们的童年经历中找到根源。《主角》中长达14集的童年戏,也并非一段可长可短的引子,而是整部剧人物、故事的地基。剧情从放羊娃易来弟(幼年忆秦娥)的人生开端讲起,这个出身于重男轻女家庭的女孩,从小不被认可、缺乏关爱,自卑、怯懦、不善言辞的性格由此生根。进入县剧团后,她并未迎来转机,反而从最底层的“烧火丫头”做起,在排挤与边缘化中艰难生存,隐忍与坚韧进一步被磨砺出来。   在双重困境的挤压之下,忆秦娥“苦、忍、孤、韧”的核心人格底色逐渐形成,这正是角色成长、命运起伏的内在逻辑支点。童年故事对忆秦娥性格底色的揭示为成年后的“主角”命运提供了坚实的伏笔,成年忆秦娥在艺术巅峰期的偏执、木讷、不通人情世故,都能在童年经历中找到清晰的因果对应,人物转变因此逻辑严密。童年戏也让成年忆秦娥每一次命运的转折都有迹可循,无论是被举荐、被排挤还是被动卷入纷争,她的每一次“被选择”和“被推着走”,都因为前期扎实的性格铺垫而显得真实可信,而非通过编剧技巧强加的戏剧巧合。   这14集的童年讲述,让一个黄土地放羊娃从泥土中挣扎向上的全过程被细腻呈现出来,观众看着人物一路走来,才能真切感受到“主角”二字背后不只是光环,更是岁月的沉淀和命运使然。可以说,如果没有这段扎实的童年书写,后续剧情中一代秦腔皇后荣辱沉浮的讲述反而会失去人物塑造所依附的血肉。   孩子“扛剧”为何有观众缘   在《主角》中,饰演小忆秦娥的王少熙台词不多,却能通过眼神、微表情和肢体语言准确诠释山里娃的钝感和韧劲,她与张嘉益、秦海璐等实力演员搭戏时也完全接得住。剧中扮演小黑娃的王子铭,身上那股质朴劲完美贴合陕北农村小孩的模样,一出场就能把观众拉回那个年代,角色的意外下线成为观众最“破防”的剧情瞬间之一。 电视剧《主角》剧照   不少观众认为,《主角》能这么上头,一部分功劳要给这群10后小演员。在日前举办的电视剧《主角》创作研讨会上,原著作者、第十届茅盾文学奖得主陈彦也特别提到:“小忆秦娥的扮演者王少熙和黑娃扮演者王子铭等多位童星,以天真无邪的生命质感,将那个时代的儿童生活演绎得淳朴灵动、个性鲜明。”   相比成年演员的选角要在演技、市场号召力、档期与年龄跨度之间反复权衡、处处掣肘,童年演员选角却只需要遵循影视创作的根本规律。据《主角》主创透露,剧组是从上千人里选出这些孩子。导演组拍摄孩子戏的核心策略是“去表演化”与“生活沉浸”,他们摒弃流量逻辑,提前半年选角,大胆使用与角色底色契合的素人小演员(如饰演小忆秦娥的王少熙),要求演员外形与气质天然贴合“放羊娃”的野劲 。剧组还进行了长时间的封闭式培训,让来自全国各地的小演员们体验农村生活,一起练功、学方言,一起扇三角、推铁环……褪去城市孩子的气质,养出那个年代需要的活力和“野劲”。   在构建年代剧真实质感、引发观众情感共鸣等多个维度上,童年戏发挥着独特作用。孩子是天然的“体验派”,他们的表演往往不是“演”出来的,而是基于本能的真情流露。这种近乎本能的“野生感”与“原生感”,恰恰能去除成人演员的固有表演模式和精致滤镜,真实还原特定年代的粗粝与鲜活,让年代感有了血肉。例如在《北上》中,小演员们在偷瓜、嬉水等桥段中,用本能反应活灵活现地展现了运河边花街少年的童真,未经雕琢的本真表演,消除了年代的距离感,让观众悄然完成剧集开篇的情感代入。而童年戏精彩伴生的“创作困局”,则是接棒的成年演员带来的落差感,在《小巷人家》等多部年代剧中,童年角色的退场也成为许多剧迷的意难平。
14年最大变革!微软TypeScript 7.0 RC发布:性能暴涨10倍
快科技6月19日消息,微软推出RC版TypeScript 7.0,性能提升约10倍,且完全兼容6.0语义,支持现有项目无缝迁移。 TypeScript是微软2012年推出的开源编程语言,作为JavaScript的静态类型超集,目前已是前端、Node.js全栈开发行业主流工具。 在此前14年发展历程中,编译器长期采用TypeScript自托管实现单线程运行架构,在百万行级大型代码库开发中,存在编译慢、内存占用高、编辑器卡顿等问题。 本次底层重构是该语言诞生以来规模最大、改动最深的一次架构革新,整套编译器逻辑均逐行移植至Go语言,全程同步使用十余年间积累的全套测试套件验证,确保新旧版本语义完全统一,业务代码无需改动即可升级。 本次性能提升由两部分共同贡献,50%来自Go原生机器码执行效率,另外50%得益于共享内存多线程并行处理能力,整体内存占用减半。 官方公布的性能数据如下: VS Code代码库(150万行)类型检查从77.8秒降至7.5秒(1/10.4) Sentry项目从133秒降至16秒(1/8.2) TypeORM从17.5秒降至1.3秒(1/13.5) Playwright从11.1秒降至1.1秒(1/10.1) 内存使用量:大约减半 加速约50%来自原生代码速度,50%来自并行。 全新编译器基于LSP语言服务器协议重构,原生支持多线程并发处理代码请求。VS Code用户安装TypeScript Native Preview扩展即可抢先体验,扩展内置自动导入、可展开悬停提示、内嵌提示、代码透镜、JSX链接编辑、语义高亮、导入排序、无用导入自动移除等编辑器功能。 官方模糊测试数据显示,新版语言服务器命令失败率仅为6.0版本的二十分之一,大幅减少编码时卡顿、报错、丢失等问题。
清华唐杰正面硬刚马斯克:中国AI达到Fable水平,还要更快
新智元报道 【新智元导读】硅谷教父Marc Andreessen亲自转发唐杰的回应,附上「Interesting」。这件事彻底出圈了。中国AI大佬正面硬刚马斯克的预测,意味着什么?或许,美国把一切都搞反了。 Anthropic的Fable 5,何时能被追上? 马斯克在X上只回了2个单词——「Probably Q1.」(可能明年第一季度。) 中国AI,大概明年第一季度,就能追上Anthropic最顶尖的Fable级别。 然后,清华大学教授、智谱AI创始人唐杰,秒回:「Won‘t take that long.」(不用等那么久。) 你正走在一条浓雾弥漫的赛道上,原本以为领先对手几公里。结果一回头,你才发现对方的呼吸声已经喷到了你的脖子上。 这就是马斯克现在的感受。 谁能想到,中国AI的领军人物之一直接「掀了桌子」。 紧接着,z.ai官方账号也回以三个「记笔记」的表情。 这种姿态,不是在谦虚,而是在叫牌。 它在向世界宣告:2027?太慢了。我们的表针,拨在2026,甚至更早。 中国AI大佬正面硬刚马斯克 今年就达到Fable级别! 时间往前拨六天。 6月12日,美国商务部突然出手:宣布对Anthropic旗下的Fable 5和Mythos 5实施全球出口管制,向中国用户直接关门。 封了。 结果,仅仅24小时后,智谱AI发布了GLM-5.2。 在Code Arena中,超越Claude Opus 4.7/4.8(Thinking),直逼Claude Fable 5。 在BridgeBench推理榜上, GLM 5.2拿下全球第一——推理分数42.8,击败被封锁的Fable 5。 速度300 tokens/秒,成本是美国前沿模型的1/10,全权重开源,全球任意下载。 BridgeBench官方直言,GLM 5.2是他们测试过的最好的中文开源模型。 GLM 5.2用实力证明: 「You cannot export control your way out of open source. The ban didn't slow China down.」 (你无法通过出口管制来摆脱开源。禁令并没有拖慢中国的脚步。) 正是这个背景下,技术博主@teortaxesTex发出了那条引爆讨论的分析帖: 中国AI和美国前沿之间,现在大概只剩7个月代差了。 那照这个速度,什么时候追上Fable? 马斯克公开预测中国AI模型将在2027年第一季度(即明年年初)达到Anthropic旗下最顶尖的Fable/Mythos级水平。 这意味着,Anthropic CEO的节奏被打乱,他所说的「好结局」要求到2028年实现「12到24个月的差距」。 具体来说:这至少意味着到2028年1月,中国最优秀的模型最多只能达到美国2027年1月最优秀模型的水平。 针对这一预测,智谱AI官方及清华大学唐杰教授迅速作出回应,暗示这一突破甚至可能会来得更快。 即便如此,马斯克仍吹捧Anthropic: 即便在跑分上看,中国AI在明年首季的跨越都将极其令人惊艳。 但从「实际落地价值和创造营收」的真正实用性来看,Anthropic优势更大。 不禁让人怀疑马斯克是否被Claude洗脑? 硅谷投资大佬Marc Andreessen也进场,转发回应,附上「Interesting」。 硅谷教父亲自盖章,这件事就算彻底出圈了。 美国出口管制,限制不了开源AI 美国出口管制的逻辑是:限制前沿AI模型的获取,以防止对手使用它们。 问题在于,这一逻辑成立的前提是,相关模型没有可比的替代品。 但这个假设在48小时内就被打破了。 有三点让「你无法通过出口管制摆脱开源」这一论点在此刻尤为尖锐: 开源权重可自由流通。 对封闭API的出口管制是可以执行的。 但对开源权重的出口管制则完全是另一个问题——权重存在于多个司法管辖区的服务器上,无需开源AI的介入即可被重新分发。 开放与闭源模型之间的性能差距可能是暂时的,而开源平台的战略优势却显得越来越持久。 能力差距已经缩小。 一年前,美国的前沿模型还有显著的质量领先优势。 Stanford AI Index 2026报道: 到今年3月,美国顶尖模型领先2.7%,这一差距在过去一年中虽有波动,但始终保持在个位数以内。 如今,GLM-5.2在至少一个主要推理基准上击败了Fable 5。 过去认为长时程、复杂逻辑代码任务(Long-horizon agentic coding)是闭源实验室的专利,但智谱的突破证明:开源/权重开放模型已经具备了深度的「行动力」。 AI能力「护城河」的价值已经缩水。 价格信号正对美国实验室不利。 GLM-5.2以十分之一的成本和300 tok/s的速度,并不是一个「安慰奖」,这是「绝招」:对于很大一部分工作负载来说,它是更好的产品。禁令反而促使开发者加速转向他们原本可能忽略的替代方案。 Uber CTO透露公司2026年AI编码工具预算仅4个月就耗尽,主因就是Claude Code采用激增。 据报道。Microsoft取消大量内部Claude Code许可,转向自有GitHub Copilot。 多家企业实施token限额、从订阅转向按量付费或「token最小化」策略: 开源模型正遵循Christensen颠覆创新路径——成本优势(常低90%)+ 定制化 + 数据主权,快速侵蚀闭源在规模化部署中的优势,重演历史上的Linux、Android等颠覆案例。 更不用说,美国的AI巨头的「末日论」和对算力的垄断,似乎正在得罪几乎所有人:超大规模云厂商、半导体公司、生态系统伙伴、客户、政府机构,甚至部分公众。 它们的资产负债表和现金流也不足以支撑其目标规模的增长和基础设施建设,迫使它们反复向投资者和资本市场寻求越来越大规模的融资。 那么,那个让许多人奉它们为必然赢家、视其为所到之处皆构成生存威胁的护城河,到底是什么? 大家都以为闭源的AI巨头是终局赢家,但实际上,他们可能只是为真正的行业巨头和效率型实验室开路的先锋。 也许,美国把一切都搞反了——一边把每一个现有巨头都当作面临生存威胁,一边又把前沿模型公司奉为AI时代必然的赢家,认为它们理应享有天价估值和最大份额的战利品。
超越SONIC!人形机器人“小脑”的GPT时刻来了,还有史上最大动捕数据,整整20亿帧
编辑|Panda、泽南 当人形机器人仍停留在「见过才会、练过才行」的样本拟合阶段,难以应对新动作、新指令与分布外任务时,银河通用最新发布全球首个小脑 GPT 基模 AstraBrain‑WBC 0.5,全球首个成功验证运动控制 Scaling Law。 银河通用团队用史上最大、整整 20 亿帧的动捕数据,训练出了全球首个人形机器人全身实时运控基座大模型,该模型零样本泛化全新动作,成功率从 MLP 架构的 76.89% 跃至 92.58%,推理延迟仅 0.39ms,效果超越英伟达 SONIC,甚至比目前业内主流 TWIST 系统速度提升至五倍。首次实现领域外分布(OOD)数据的泛化能力,这一研究成果堪比大模型的 GPT-1 时刻,填补人形机器人通用小脑研究的行业空白。 这个工作还被全面开源了出来。 论文标题:Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking 论文地址:arxiv.org/abs/2606.03985 代码地址:https://github.com/GalaxyGeneralRobotics/Humanoid-GPT/ 这项研究的出发点其实很纯粹:把数据堆到原来同类研究的 200 倍以上,换一个 GPT 风格的 Transformer 架构,然后看看 Scaling Law 到底管不管用? 结论很直接:管用,而且很管用。 银河通用率先迈进了这片无人区,用对底层运控能力的突破树立了行业的新标杆。 数据说话:Scaling Law 在人形机器人上成立! Scaling Law 到底在物理世界管不管用?AstraBrain-WBC 0.5 证明它管用了,有三组数据为证! 第一组:架构和规模的双重 Scaling ,效果叠加 研究团队在标准的 AMASS 测试集(训练时未见过的动作子集)上,系统比较了不同架构和不同数据量的组合。同样使用 200 万帧训练,MLP 的追踪成功率(SR)为 76.89%,TCN 为 81.48%,而 AstraBrain-WBC 0.5-S 已经达到 83.26%——架构换代本身就带来了提升。 更关键的变化发生在数据规模扩大之后:随着训练帧数从 200 万增至 20 亿,AstraBrain-WBC 0.5-B 的 SR 从 88.27% 进一步升至 90.43%;最大规格的 AstraBrain-WBC 0.5-L 在 20 亿帧训练下最终达到 92.58%。 骨干网络架构比较与 Scaling 的影响。 同等数据量(20 亿帧)下,论文给出了一个直接对比:即便是表现最好的 TCN 大参数版本,其关键点位置误差(MPKPE)为 56.15mm,而参数量更小的 AstraBrain-WBC 0.5-S 已经达到 43.25mm,领先幅度超过 30%。MLP 和 TCN 并非无法从更多数据中获益,而是获益的边际在递减;Transformer 的训练损失曲线则持续下降,没有出现饱和。 第二组:数据规模消融,幂律曲线清晰可见 固定模型规格(Humanoid-GPT-B),只改变训练数据量,零样本 MPJPE 的变化轨迹如下: 很明显可以看出:数据每扩大 10 倍,误差持续下降,没有出现拐点。这条曲线正是 Scaling Law 在人形机器人运动控制上留下的第一个清晰印记。 第三组:真机验证,仿真结论在真实硬件上复现 研究团队将 AstraBrain-WBC 0.5 部署于宇树 G1 机器人上,用四段完全未见过的舞蹈动作做零样本追踪测试,并与 GMT、TWIST、Any2Track 三款当前最强的开源追踪器在相同协议下对比。 AstraBrain-WBC 0.5 展现出了此前人形机器人运控系统难以兼顾的四项核心能力:更高自由度的全身协同控制,更高动态的运动能力,毫秒级实时响应,更高的鲁棒性。 以 MPJPE(关节位置误差)作为衡量标准,Humanoid-GPT-B 在四段动作中均低于或持平所有对比方法。须知,这些动作直接来自网络视频的运动重定向,没有任何专项数据补充,也没有经过微调。 在四种未见过的舞蹈动作上的真实世界跟踪准确度 工程部署层面同样没有拖后腿。经过 TensorRT 编译和 C++ 流水线优化后,AstraBrain-WBC 0.5 的平均推理延迟降至 0.39 毫秒,控制回路维持在 50Hz 实时频率;与对比系统 TWIST(均值 2.79 毫秒)相比,推理速度提升约 5 倍。规模更大的模型,反而跑得更快,这得益于针对因果注意力和 MLP 融合算子的专项内核优化。 不同优化方法的推理延迟比较 未来,机器人训练不再需要从零开始构建动作能力,可以直接基于 AstraBrain-WBC 0.5 进行二次开发与能力扩展。这将大幅降低机器人训练门槛。 那么,AstraBrain-WBC 0.5 是如何做到的? AstraBrain-WBC 0.5 做到了三件事 具体而言,AstraBrain-WBC 0.5 系统性地回答了三个问题: 动作数据能不能扩到十亿级? 控制模型能不能像 GPT 一样随数据增长继续变强? 规模变大之后,训练还能不能稳定、可部署? AstraBrain-WBC 0.5 概况。该系统包含三个阶段:(a) 数据整理与处理,(b) 基于关键点奖励在集群上训练采用 PPO 算法的运动专家模型,(c) 通过并行 DAgger 监督将全部专家模型蒸馏为单一基于 Transformer 的 generalist 策略。由此生成的 AstraBrain-WBC 0.5 能够将未见过的或在线重定向的运动作为参考输入,并以完全零样本的方式进行跟踪。 第一件事:把数据堆到 20 亿帧 研究团队汇总了人类运动捕捉领域几乎所有主流开源数据集,包括 AMASS、LAFAN1、Motion-X++、PHUMA、MotionMillion,并补充了超过一千小时的大规模自采动作数据。 相比传统动作数据集中大量重复的行走、站立等高频动作,新数据集覆盖日常动作、舞蹈、快速转向、跌倒恢复、协作搬运等多种长尾场景,再经过严格筛选、分割和增广,得到 20 亿帧经过重定向处理的 G1 机器人关节运动数据。 这是此前同类训练集规模的 200 倍以上。 AstraBrain-WBC 0.5 的数据分布情况 然而数据量本身还不够。大规模数据集有一个隐患:常见动作会把不常见动作「淹没」,模型只学会了中间那些平平无奇的步伐,对高难度动作依然无能为力。 为此,团队设计了一种叫做「谐波运动嵌入(Harmonic Motion Embedding / HME)」的表示学习工具,从每条运动序列中提取各关节的振动频率和幅度特征,并据此将所有数据聚类成约 300 个风格各异的动作簇,实现了多样性感知的均衡采样。 在 HME 嵌入空间中,数据集多样性的比较,可见银河通用团队整理的数据集在 HME 空间里的 log-volume 比 AMASS 大约高 4-5 倍。 实验证明,两者缺一不可:数据多样但分布不均衡,模型仍会过拟合常见动作;分布均衡但多样性不够,能力上限就被数据的覆盖范围卡死。研究团队将这一洞察称为「Diversity and Balance」原则,这也是此前所有运动数据集从未系统考量过的维度。 也就是说,AstraBrain-WBC 0.5 不是简单把数据「堆大」,而是在做一件更难的事:让大规模动作数据变得可度量、可划分、可训练。 第二件事:用对架构 过去的运动追踪器大多使用 MLP 或 TCN(时序卷积网络)。这些架构的问题在于,它们对序列历史的建模能力有限,而且到了一定规模后增加参数几乎不再带来收益。 AstraBrain-WBC 0.5 转向了 GPT 风格的因果 Transformer 架构。这可不是「跟风 LLM」,其背后有一条严密的技术逻辑。 运动追踪本质上是一个在线序列决策问题:机器人在每个时刻需要根据当前状态和历史轨迹,预测出下一帧的关节指令。这个问题天然有时序依赖——你现在迈出的这一步,和上一秒的重心、速度、姿态都强相关。 MLP 的致命伤正在这里:它每次只能「看」一个时刻的状态切片,对更长的历史序列只能靠拼接输入来临时凑数,建模能力从根本上就受限了。 Transformer 的自注意力机制则不同。它可以让模型在序列中的每个位置同时「回望」此前任意长度的历史,捕捉到「当前动作与 32 帧前的某个特定姿态」之间的关联。这类长程依赖关系,正是连贯、流畅的全身运动所必需的。 但还有一个关键约束:机器人控制是实时的,不能看到未来。这就是「因果(Causal)」的来源:AstraBrain-WBC 0.5 在注意力层加入了时序因果掩码,严格限制模型只能利用当前帧及之前的历史,推理时不依赖任何前瞻信息。 这使得同一个模型在训练时是并行处理整段序列(效率高),在推理时是逐帧自回归预测(延迟低),两种模式天然统一,没有结构上的割裂。 还有一个被容易忽视的优势:训练效率的质变。 AstraBrain-WBC 0.5 的蒸馏阶段采用 DAgger 框架,每次迭代需要对整条运动序列中的所有历史时刻同时施加监督信号。MLP 每次只能处理单个时间步,想覆盖一条长序列得循环 N 次;Transformer 一次前向计算就能处理整段序列的所有位置,训练吞吐量直接拉开数量级差距。在 20 亿帧的数据规模下,这是能否在合理时间和计算成本内完成训练的关键。 论文中的消融实验也验证了「历史长度」的价值:序列长度从 4 帧增至 64 帧,追踪成功率持续提升;团队最终选定 32 帧作为默认配置,在性能与计算开销之间取得平衡。这本身就是对「长程时序建模能力真的有用」的直接证明。 第三件事:专家蒸馏的流水线 直接用一个模型训完 20 亿帧是不现实的。团队的做法是「先分后合」:在 300 个运动族群上各自训练 PPO 强化学习专家策略(约 384 个专家),每个专家只负责自己那个风格的动作,因此都能高保真地完成族群内的动作;再用 DAgger 蒸馏框架,让单个 Transformer 模型同时向所有专家学习,最终压缩为一个统一的通用策略。 专家数量本身也经过了系统的消融验证。簇数太少(如 128 个)意味着每个专家负责的动作风格过于混杂,单个专家的追踪质量会下降,蒸馏出来的通才也相应变弱;但簇数太多(如 1024 个)则会让相邻专家之间的监督信号互相矛盾,反而给学生模型带来混乱。实验表明,约 384 个专家是当前数据规模下多样性、专家质量和训练成本的最优平衡点。 整个训练过程耗费约 15000 GPU 小时,其中 75% 用于专家训练(RTX 4090),25% 用于 Transformer 蒸馏(H100)。 一旦蒸馏完成,部署时只需要这一个通才模型,384 个专家就可以「功成身退」,不再需要保留。 AstraBrain-WBC 0.5 与相关工作的比较 最终形成的 AstraBrain-WBC 0.5 模型参数规模达到 8040 万级别,已经接近 GPT-1 时代的大语言模型规模。 为什么是银河通用? AstraBrain-WBC 0.5 背后的工业主体是银河通用机器人(Galbot)。 银河通用成立于 2023 年 5 月,总部位于北京。公司从创立之初便将研发重点放在具身智能「大脑」和泛化操作能力上,而非优先追求双足运动能力。其代表产品 Galbot G1 采用双臂、折叠腿和全向轮底盘设计,被业内概括为「大脑优先、身体务实」的技术路线。 从融资节奏来看,银河通用走得并不慢。2025 年 12 月,银河通用完成超过 3 亿美元融资,中国移动链长基金、中金资本、央视融媒体基金等机构参与投资,公司估值超过 30 亿美元。2026 年 3 月,公司再次完成 25 亿元融资,投资方包括国家人工智能产业基金等机构。这也是国家人工智能产业基金首次投资具身智能企业。 商业化方面,银河通用是国内较早推动具身智能机器人规模落地的企业之一,其机器人已进入零售、制造、仓储物流等多个场景。 银河通用在即时零售领域推出了人形机器人自主运营零售仓方案,并已在全国数十家即时零售仓实现规模化部署。依托端到端具身智能模型,机器人能够在数千种 SKU 的复杂环境中自主完成识别、分拣、抓取和打包等流程。 该公司还与美团买药等合作伙伴推动人形机器人智慧药房(智慧药仓)落地,机器人可在包含约 5000 种药品 SKU 的环境中完成自主拣选与打包。目前相关方案已在北京、上海、广州、深圳、杭州等城市部署,并实现 7×24 小时持续稳定运行。 2026 年马年春晚,银河通用成为中央广播电视总台《2026 年春节联欢晚会》指定具身大模型机器人,为公众展示了其具身智能技术与机器人产品能力。现场,Galbot 机器人在沈腾、马丽身边全自主完成盘核桃、叠衣服、货架取物等任务,所有动作由「银河星脑」实时决策,而非预设程序——这是对机器人泛化能力的一次高曝光度公开验证。参阅《沈腾:春晚谁家机器人?除夕夜就扒拉活来了》。 「银河星脑(AstraBrain)」是银河通用自主研发的全身全手端到端具身大模型,也是理解 AstraBrain-WBC 0.5 战略意义的关键背景。 银河星脑采用三层类脑架构:「大脑」负责多模态感知与任务规划,「小脑」负责全身运动协同与实时控制,「神经控制」则处理末端灵巧操作与力反馈。业界多数方案将这三层割裂开发,模块之间存在信息损耗,导致响应迟滞和泛化能力弱;银河星脑的目标是打通全链路、实现端到端统一建模。 银河星脑 AstraBrain 框架 正如近日在 2026 智源大会主题演讲中,银河通用机器人创始人王鹤博士所言:「银河通用推出的 AstraBrain(银河星脑),目标就是做一个通用人形机器人的基座:既有大脑、又有小脑,中间通过脑桥连接,让更快的小脑与相对较慢的大脑实现异步同步。人脑中的脑桥实际上分为三路、有上传也有下载,我们的架构充分参考了人类大脑的结构,目标就是实现完全通用。」 AstraBrain-WBC 0.5 是这套架构小脑能力的展现:一旦小脑具备了跨场景零样本泛化的能力,银河星脑整体的通用性和迁移效率就能随之提升。 顺带一提,AstraBrain-WBC 0.5 论文(Humanoid-GPT)已被 CVPR 2026 接收。 「小脑」之争,这一局定了什么? 在业界,把 Scaling Law 套用到运动控制层方面,AstraBrain-WBC 0.5 不是第一个尝试。此前 SONIC 已经将训练帧数推至 1 亿,但其依然采用 MLP 架构,而实验表明在那个规模上 MLP 已经开始饱和。 AstraBrain-WBC 0.5 的贡献在于系统性地证明:MLP 的瓶颈并非数据少,而是架构本身的扩展性限制。换用 Transformer,一切才真正打开。 随着数据规模扩展至 20 亿帧、模型参数持续增长,模型的性能得以持续提升。人形机器人运动控制或许正迈向「基础模型时代」:如果说过去的机器人是在学习单个技能,AstraBrain-WBC 0.5 则更像是在学习整个人类动作世界。 这个结论对整个产业有直接的战略含义。 当前人形机器人行业的技术路线大致可分为两派:一派更加侧重突破运动控制和硬件;另一派则更加强调大模型驱动的泛化能力。 AstraBrain-WBC 0.5 让后者的主张有了更坚实的技术支撑:如果运动「小脑」本身就可以成为基础模型,那「大脑」与「小脑」之间的边界就会变得模糊,两者可以共同受益于 Scaling Law 的红利。 行业里已有一个共识:2026 年是具身智能的交付元年,企业的竞争重点正从「我的机器人能做到」转向「我的机器人能可靠地、规模化地做到」。在这个语境下,运动控制层的泛化能力,直接决定了一款机器人能否用同一套软件栈适配不同车间、不同家庭、不同任务。这是规模化落地的前提,也是商业壁垒真正形成的地方。 当然,AstraBrain-WBC 0.5 也有局限:它还是纯运动追踪模型,不具备对物体、环境的语义理解。论文作者在结语中明确提出,下一步方向是与视觉-语言-动作(VLA)模型对接,加入视觉、触觉和语言多模态信息,迈向通用具身基础模型(Embodied Foundation Model)。 银河通用已经走出了突破性的一步,后续的棋局,正在展开。
奥特曼押注2028:让AI学会造AI
新智元报道 【新智元导读】秘密提交IPO文件的同一天,OpenAI没急着谈上市时间,反而立下三大目标:造自动化AI研究员、加速经济、让全球人手一个个人AGI。 近期,OpenAI官宣进入第三阶段。 OpenAI CEO奥特曼在X上发布了OpenAI的最新计划。 该计划来自他和首席科学家Jakub Pachocki在OpenAI官网联名发布的一篇博客,标题是《造福所有人:我们的计划(Built to benefit everyone: our plan)》。 https://openai.com/index/built-to-benefit-everyone-our-plan/ 这一篇最新路线图,重新定义了OpenAI未来几年要干的事。 它总结了OpenAI发展历程中走过的三个阶段。 第一阶段,做通往AGI的研究;第二阶段,把研究变成产品,看人们怎么用;第三阶段,AI普惠。这正是OpenAI当前所处的阶段。 博客中写道:「经济正在围绕AI重新成形,核心问题变成了怎么让先进AI足够便宜、足够安全、足够好用,让每个人和每个组织都能从中受益。」 在这一阶段,OpenAI立了三个目标: 第一,造一个「自动化AI研究员(automated AI researcher)」; 第二,加速经济; 第三,给地球上每个人一个「个人AGI(personal AGI)」。 三个目标汇成一条主线:先让AI学会做研究,再用它加速整个社会,最后把发展的成果落到每个人身上。 在这个新的路线图中,OpenAI还特别提到了一个时间点:2028年3月。 到那个时间点,它相信AI系统可能已经在和自家研究员一起,完成相当一部分研究工作。 发布时机,也耐人寻味。 就在这份愿景书抛出的同一天,OpenAI保密提交了IPO草案文件。一个通往公开市场的资本动作,和一份公开的愿景声明同时落地,很难说只是巧合。 其实这套打法,OpenAI早已驾轻就熟。 去年完成重组时,它就打出了《Built to benefit everyone》的旗号,这一回递交IPO,下面又多了一个路线图。 每逢商业或组织结构上的关键一步,OpenAI总要同步抛出一份宏大叙事。 撇开IPO不谈,OpenAI这一次立下了第三阶段的三大目标,它们对于普通人意味着什么,才是更值得我们关注的地方。 自动化AI研究员 让AI去造AI 「自动化AI研究员」,听起来有点抽象,它是干什么的,和我们有什么关系? 这个名词,并不是第一次从这份路线图里冒出来。 早在2025年10月底,OpenAI完成重组的同一天,奥特曼和和Pachocki就在一场公开直播中谈到过这条路线,随后TechCrunch等媒体进行了报道。 这次新路线图,等于把过去大半年的零散表态,正式收拢成一份纲领。 在那场直播上,Pachocki这样描述这个系统:能自主推进较大的研究项目,不只是答题,也不只是写代码。 今年3月,他又接受MIT科技评论独家专访,把这个目标定为OpenAI未来几年的「北极星」,他说OpenAI快要造出能像人一样长时间、连贯工作的模型,将来「你等于在一个数据中心里,放进了一整个研究实验室」。 OpenAI首席研究官Mark Chen(左)与首席科学家Jakub Pachocki(右),「自动化AI研究员」或将从他们手里诞生。 这件事的意义是什么? 以前是人写代码、调用AI。现在OpenAI想反过来,让AI自己跑实验、自己找错、自己迭代,实现「递归自我改进(recursive self-improvement)」。 这个想法并不新鲜。 早在1966年,数学家古德(I.J. Good)就预言:一台超级智能机器能设计出更好的机器,由此触发一场「智能爆炸(intelligence explosion)」,把人类智力远远甩在身后。 把「做研究」这件事本身交给AI,正是这条链路的起点。谁先迈出这一步,谁就握住了技术进步的方向盘。 OpenAI为这条路标出了两个阶段。 2026年9月,先造一个「研究实习生」,能在有限时间里独立啃下几个小课题;2028年3月,再升级成能长期、独立推进完整研究项目的「正式AI研究员」。 Pachocki点破了关键:实习生和正式研究员的区别并非聪明程度,而是「能自主工作多长的时间跨度」。 而这并非科幻里那种一夜觉醒、自己改写自己的超级智能,更像把研究流程一段段拆开自动化:AI帮人写代码、调参数、筛方案,人则退到上面去编排这些智能体。 这条路线上,DeepMind的AlphaEvolve就是现成的例子:这个会自动改进算法的编码智能体,反过来被用去优化训练它自己那批模型的流程。 AI改进AI,已经从PPT走进了实验室,这也是OpenAI在2028年3月这个日期背后,真正押注的东西。 从发模型 到给每个人发AGI 第二个和第三个目标,落点与普通人更为密切。 加速经济,OpenAI的说法是用AI加速科学、生产力和经济增长,同时尽量让收益被广泛分享。它特意强调,每个人都该在AI创造的繁荣里,分到有意义的一份。 这并非临时起意。 早在今年4月,OpenAI就发过一份《智能时代的工业政策(Industrial Policy for the Intelligence Age)》,公开了自己对于AI时代「怎么分蛋糕」的蓝图,提出要「将人类放在首位」。 OpenAI 4月发布工业政策,提出通过公共财富基金和短工作周,共享AI繁荣 其中两条意见最为具体。 一是设立「公共财富基金(public wealth fund)」,由政府和AI公司共同注资,基金再投向AI增长,把回报作为「AI红利」直接分给每个公民; 二是试点每周32小时、四天工作制,把AI省下的效率折算成更短的工时,且工资不减。 加速经济,更多是从宏观着眼,而个人AGI则是将这个宏观愿景具体落在的每个人身上。 个人AGI,是让地球上每个人,都能按自己的方式用上一个AGI:帮你看懂一张医疗账单,学一门新技能,开一家小店,照顾年迈的父母,或者把一个想法变成真东西。 这有点像电力革命对人类社会的影响。 OpenAI把镜头拉回1920年代的美国乡村,电线还没拉进来的时候,打水、洗衣、靠冰块储存食物,太阳一落山一天就结束了。 直到电来了之后,普通人的生活才被真正改写。而AI也该像电一样,走进每个人的日常生活。 全面自动化,并不是我们的追求 在博客中,OpenAI还提到:全面自动化一切,并非我们想要的未来,因为那样的未来既空虚,又危险。 它提出了一个反直觉的逻辑:AI越强,人反而越重要。设定方向、做取舍、扛责任,这些方面人的重要性将愈发凸显,「决定什么事值得做,长期看会是人最关键的角色。」 OpenAI同时呼吁,未来可能需要建立一个国际协调机制,在安全、对齐和社会韧性跟不上AI发展速度的时候,放慢前沿AI的开发。 早在2023年,OpenAI就提过应该有一个类似国际原子能机构的组织,来管超级智能。 就在上周,Anthropic也公开表示,AI进步太快,前沿实验室可能需要放慢甚至暂停,好让社会结构和对齐研究跟上。 Anthropic负责人Marina Favaro与Jack Clark撰文称,世界需要建立一种可验证的协调机制,让前沿AI开发在必要时具备放慢或临时暂停的选项。 AI能力越跑越快,两家手握全球顶尖模型的实验室不约而同把安全摆上了台面。 为前沿AI研究预留一脚刹车,正在从少数人的讨论,进入头部实验室的公开议程,逐渐变成一种行业共识。 IPO微妙时刻 发布新路线图 这份路线图,为什么挑在这个时间点发出? 据Bloomberg等媒体报道,就在发布这篇文章的同一天,OpenAI确认已经秘密递交了IPO申请。 选择这个时机发布,背后用意不言而喻。 按照OpenAI自身的说法,它目前正处在「让先进AI普惠」的第三阶段,这一阶段它反复强调的一句话是:先进AI的使用应当被广泛分配。集中的权力让社会变脆弱,分散的权力让社会更有韧性、更自由。 换句话说:AGI的命题,已经从「能不能造出来」,悄悄变成了「造出来之后,归谁」。 在这份路线图中,OpenAI并没有给出具体的AGI时间表,而是将重点放在了AI普惠和安全上,同时它也提到AGI的终点并非「全面自动化一切」,人仍然居于核心和关键位置。 关于AGI哪年到来,如今连造它的人都没有定论。 马斯克押2026年;Anthropic CEO Dario Amodei认为「强大AI」最快2027年就到;DeepMind的Demis Hassabis则在今年3月说最快可能在2030年前后,届时「会有一个能深度理解你周遭一切的系统」出现。 综合以上大佬的说法,未来5年中的任何一年AGI都有可能降临。 回到OpenAI的新计划,假如到了2028年3月,它的AI系统已经能与自家研究员协同完成相当一部分研究,这个时候人类的地位仍然不可或缺。 也许比起AGI究竟何时到来,另一个问题更为重要:当机器开始替人做研究、替人加速整个世界时,人类还能不能守住最核心的职责,把好方向盘。
我把昨晚的梦输入AI,它居然直接把我拉进去玩儿了一把?
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 先说个事儿,我昨天做了个挺好玩儿的梦:踩着滑板在城市大道上飞!驰! 醒过来还意犹未尽,结果没想到AI不光帮我还原了画面,还把我拉进梦里玩了一把。 我踩着滑板往前冲,换方向、加速、跳跃、甚至秀了个Ollie(豚跳)~ 自动播放 属实给我整精神了,AI啥时候会干的这事?? 不卖关子了,这是HappyOyster 1.0(快乐生蚝)实现的,阿里ATH推出的可实时构建和交互的开放式世界模型产品。 看到世界模型四个字,可能有朋友好奇:这和我之前玩的Sora那些有啥区别?不都是AI生成画面嘛? 嗯……还真不是一回事。 咱先简单聊两句行业现状啊,过去这一年多,AI视频赛道卷得确实热闹,各种产品轮番上场,画面精度一个比一个高,看着确实挺惊艳。 但用多了就会发现一个共性问题:它们都是「单程票」。 你写一段描述,模型渲染出一段视频,生成完,就完了,然后你就只能看,更不能跟画面里的角色互动。 而且时间一拉长,画面大概率就会崩坏,比如角色前一秒拿着剑后一秒空手了,走两步脸都换了一张。 这也是为啥市面上AI视频基本都是短片段,不是不想做长,是长了真绷不住啊…… 说白了,当前文生视频的天花板,就是一段好看但不可更改的影像素材; 而HappyOyster 1.0做的是一件完全不同的事—— 打造一个完整可演绎、可探索、可互动的数字世界。 画面生成出来的那一刻,体验才刚开始。你可以一边看一边下指令,世界实时反馈并持续演化。 就好像以前你是观众,现在你成了世界的…主人。 那这只快乐生蚝到底有多快乐呢??下面就继续实打实测一波! 世界是活的,你就是主角 HappyOyster 1.0主打两大核心模式:Adventure(世界探索)和Directing(实时导演)。 Adventure是「用动作探索,世界即刻延展」的开放漫游模式,你亲自下场当主角; Directing是「用镜头叙事,故事随心掌控」的导播执导模式,你站在世界之上当导演。 一个管“身体”,一个管“脑子”,覆盖了两种截然不同的创作和体验诉求。 咱先来体验Adventure模式。 我丢了一张吉卜力风格的草原图进去,画面生成的一瞬间直接把我拉了进去,整个画面是活的,在等我操作。 那我就不客气了,直接动手! 1.0版本新增了一套很丰富的交互按键,有加速、下蹲、攻击、跳跃,操作手感跟你玩的3A大作相当接近。 我按了一下前冲,少年迈腿就跑起来;按攻击键,少年开始挥剑;再按跳跃,少年腾空而起,落地那一刻角色屈膝动作,镜头有个上升和下坠的变化,这细节属实拉满了。 关键是,这些全都不是预先做好的动画素材,是模型根据你的操作实时推演出来的。 为啥这么说呢?因为同一个场景我反复试了好几次,每次动作角度不一样,角色的姿态也不一样。 而且模型有个很聪明的设定,它会根据场景内容自动匹配可玩的交互方式。 比如我这个画面里有马车,世界就会解锁骑马互动彩蛋。少年走到马车旁,触发对应操作指令,就能直接上马骑行!! 自动播放 如果创建的世界里有汽车,那么就会自动匹配开关车灯、鸣笛的玩法,主打一个「画面有什么,就能玩什么」。 自动播放 而且探索过程中还能随时截屏留存画面,也能保存世界,一键对外分享链接,别人点进来就能看到你创建的完整世界。 意思是,方便发朋友圈了(doge)。 如果说Adventure是让你下场当主角,那Directing就更过瘾了,直接让你当导演。 Directing支持多模态参考,@一张图片就能锁定角色外观,咱直接就是一个POV恋爱互动先安排上! 我给她设定了一个近景特写镜头,全程第一视角对视,然后随手打了几条互动指令,效果be like: 自动播放 好好好,AI生视频这下都吃上自助餐了,我狂吃! 而且1.0版本在Directing模式上做了几个相当重磅的升级,体验完之后我只想说:这才是创作者的终极玩具! 我先用一条prompt启动了一段剧情: 在舞台上,两个人面对面激烈争吵。 看了大概二十秒之后,我觉得剧情可以转折了。 于是我输入了一条新指令: 他们突然释怀了,紧紧拥抱在一起。 接收到新指令后,两个角色的表情开始缓和,身体从对抗姿态慢慢转向靠近,最后紧紧拥抱在一起。 自动播放 而且,整个过程中,不光是场景,两个角色的脸、衣服、体态、发型完全没有变!! 好戏还没完—— 1.0另外杀手锏功能是回溯和剧情分支。 比如,我可以直接回退到争吵的那个节点,换条完全不同的指令,画面就会重新演化。 或者从同一个节点续写,设计出A、B两条完全不同的故事线。 等等,这不就是创作者梦寐以求的平行宇宙嘛!!! 而且所有这些操作都是流式生成的,即说即演,不用等渲染。你随时插话,剧情随时响应,这对内容行业来说,属实是黑科技啊…… 更贴心的是,官方还写了份体验指南放在网页上,教你怎么创建更好的世界~ 为什么能让世界动起来? 上面体验了这么多,估计有朋友已经按捺不住了: 这玩意儿到底是怎么做到的?跟文生视频在技术上有啥区别? 咱先把最根本的概念差异说清楚: 文生视频的工作方式是文本→视频的单向条件映射,你输入一段描述,模型一次性离线渲染出一段固定的像素序列。 世界模型学的则是一套完全不同的东西,是当前状态+用户动作→下一个状态的转移规律。 △图片AI生成 这就要求模型必须同时具备三重能力:物理规律的隐式建模、长程因果链路的追踪、外部干预的即时响应。 首先要说的就是闭环世界状态建模。 要让一个世界持续运行,最朴素的思路是记住所有历史画面,每生成新一帧,就回头看前面所有帧来保持连贯性。 但问题是,这么干计算量会指数级膨胀,时间一长直接寄。 HappyOyster 1.0在这里把世界状态压缩成隐状态摘要(Latent State),在生成链路上递归传递,支撑长程一致性。 就像接力跑一样,跑下一棒之前,上一棒把「关于现在世界的一切」写成一张纸条递过去,一棒一棒往后传。 每生成新的一帧,模型只需要拿到上一帧的那张纸条加上你新发出的指令,就能推演出下一帧。 所以几分钟下来世界不会乱、因果关系不会断。 而且1.0版本因为这个纸条可以被存档,所以暂停、回溯、分支叙事这些功能就自然而然实现了。本质上就是在某个时间点把纸条存一份副本,想从哪继续就从哪继续。 一个架构设计,直接把产品的交互想象空间整个撑开了。 △图片AI生成 第二项核心技术,是内生一致性,解决了生成画面里角色频繁换脸的痛点。 文生视频最头疼的问题就是主体漂移,人物走几步脸就变了,衣服颜色也跟着跑偏。 HappyOyster 1.0以持久的参考表征参与全程注意力来解这个问题。通俗点说,就是给每个角色、物品、场景元素都发了一张「身份卡」。 不管镜头怎么切、角色怎么转身、被其他物体遮挡多久再出现,模型每次生成新画面时都会对着身份卡检查,保证角色不变样不变形。 还有开放因果动作空间,打通动作与语言的表达逻辑。 很多交互式系统的做法是预定义一个动作集,比如能跳、能跑,但只能做这些。 HappyOyster 1.0把动作指令和自然语言放进了同一个语义接口。 比如,你说骑上那匹马,模型就自己推演出上马的完整动作序列和马开始跑的物理反馈。 动作空间是开放的,语言本身就是遥控器,不需要任何人工预设,模型自己就能推演因果。 最后说说长时序音视频协同。 HappyOyster 1.0的音频和视频是在同一个世界状态下联合解码生成的,不是先出画面再配音。 这意味着脚步声跟着你走、雨声跟着天气变、打击音效跟着攻击动作来,真正做到了声画物理合规。 这四大技术一起协同发力,这个世界才能真正活起来。 不过技术做得好不好,光靠体验感受还不够,得有量化标准来衡量。 但世界模型作为一个新兴领域,目前行业里还缺乏一套针对“世界逻辑”的系统性评测基准。 针对这个痛点,HappyOyster团队正在牵头与南京大学共建世界模型评测基准,这也说明,HappyOyster不只是在做产品,更承担起定义赛道标准的责任。 谁能第一个吃到这只生蚝? 从传统文生视频生成一段固定影像,到世界模型搭建可进入、可操控、持续自主运转的完整数字空间,HappyOyster 1.0正是这条全新路线的落地先行者。 它把AI的生成能力从单向输变成了双向实时交互。 而且,一旦世界模型走通了这条路,很多行业的想象空间就变大了。 比如说游戏行业,不用搭建庞大的美术资产库、配置复杂的物理引擎,给HappyOyster 1.0丢一张概念图,很快就能跑出一个具备物理反馈和NPC交互的可玩场景。 在内容生成赛道上,如果一个剧本能分叉出十条故事线,观众自己选走向,那就可能催生一个全新的互动内容业态。 除此之外,文旅景区做虚拟漫游、博物馆做沉浸式历史还原……都可以用HappyOyster 1.0进行沉浸式体验。 现在,HappyOyster 1.0已经正式上线,用手机号注册就能玩!此外,API计划在近期开放。接下来无论是游戏创作、短剧生成、文娱体验,还是数字人直播、虚拟陪伴,都可以用上世界模型,给用户带来全新的交互体验。 这意味着人人都有机会亲手搭建、操控自己的专属虚拟世界,想想就「狠」带劲! 阿里这次属实是打开了大家的想象力,以后谁还满足于只看视频啊……
GPT发AI原创新成果了
听雨 发自 凹非寺 量子位 | 公众号 QbitAI 啥?药物研发也能「全自动」了? 最近,OpenAI和Molecule.one联合发布了一个新成果: GPT-5.4在近乎自主的条件下,改进了药物合成里一个常用反应。 而且还提出了一个化学家都觉得意外的方案。 AI震惊人类,这也不是头一回了哈。 不过终于是震惊到化学领域了。 这次出主意、定方案、决定下一步该试什么的,是 AI。 动手做实验、把关、亲手复现的,还是人。 Molecule.one的CTO Stanisław Jastrzębski表示,这是有机化学领域首个AI近乎自主完成的发现。 GPT-5.4跑通药物自主研发 合成一直是药物发现的一个大瓶颈。 做小分子药,绕不开有机合成。一个反应好不好用,关键看它能不能在各种不同的原料上稳定地搭出同一种化学键。 要是产率太低、副产物太多,化学家可能就得放弃一个本来很有希望的分子,或者花大力气另找路线。 说到底,科学家只能去测那些自己造得出来的分子。 这次GPT-5.4改进的,是Chan–Lam偶联。 这是化学家常用来搭碳氮键的一个反应,而碳氮键在药物里到处都是。 麻烦在于,这个反应不是对所有分子都好使,尤其是拿伯磺酰胺和硼酸去偶联,历来产率都很低。 偏偏磺酰胺这一族又很重要,抗癌药、抗菌药、利尿剂里都有它的身影。 所以如果能把这个又难又有用的反应做得更可靠,就等于给药化学家多开了一条造分子的路。 那么,OpenAI是怎么做的呢? 他们把GPT-5.4接到了Molecule.one的Maria身上。 Maria是一套化学AI agent,后面连着一个能自动跑实验的高通量实验室。 研究团队给系统下了个很开放的目标:去改进某一类重要反应。 至于怎么改、改哪个,全部自己看着办。 于是!系统就开始自己跑了。 它生成研究方案、设计并执行实验、分析实验数据,再据此提出下一轮该做什么。 自动播放 那么,人负责干什么呢? 科学家写了引导和打分用的prompt,让GPT-5.4生成并排序了数千个研究方案,然后从系统排名最高的一小撮里,挑了四个真正送进实验室。 Maria再把选中的高层计划翻译成详细的实验指令,跑出成千上万次高通量实验,分析原始数据,把结构化结果回传给GPT-5.4。 四个方案里,编号OAI-M1-03提出了一个最意想不到的解法。 GPT-5.4自己认定,伯磺酰胺是个又难又有价值的底物类别,然后提出: 用TEMPO这类温和的氧化剂当添加剂,也许能改善这个反应。 这个建议一出来,连人类化学家都震惊了。 而在随后的测试中,十种氧化剂里也正是TEMPO跑了出来。 后续实验里系统还发现,TEMPO可以换成便宜得多的类似物4-hydroxy-TEMPO,性能几乎不打折。 By the way,这整个过程里人类做的最大一次干预,是叫停了用DMSO当溶剂。 因为化学家担心它会和用作对照的强氧化剂起反应。 可以放心,这种活,目前还是得人盯着。 效果如何 有了AI的加持,效果怎么样呢? OpenAI表示,在优化后的条件下,所测试的硼酸里有88%产率提升,磺酰胺里有83%提升。 平均产率从16.6%涨到25.2%,产率超过30%的反应占比,从15.6%提到了37.5%。 但更加惊人的是AI的实验量,两轮下来Maria一共跑了10080个反应。 这比一个化学家每天做三个、连做十年还要多。 此外,人类化学家还手工验证了其中一批代表性反应。 结果发现,14对底物里有11对产率确实提高了,其中八对涨了两倍以上。 整个实验过程历时三个月,从3月4日的第一个prompt,到6月4日把OAI-M1-03的结果交给外部专家。 其中有2个半月在做实验,最后半个多月是人类化学家撰写结果。 虽然这是一个早期案例,不过足以说明当下的前沿模型已经能够支持大部分的科学研究: 包括审查研究、提出假设、设计实验、解释数据,以及发现人类专家可以验证的成果。 但OpenAI表示,这还不算AI全自动药物研发。 他们明确把这套流程描述为「近乎自主」而不是「完全自主」,理由是人类化学家始终在做重要决策。 模型负责提出关键的研究想法,人则提供高层引导和判断、纠正实验细节、帮着备料配试剂,还亲手重复了关键实验。 在整个过程中,人的判断仍然是不可或缺的。 不过…AI虽然还没法独自跑完一个研究,但它已经能决定下一步试什么。 那么,AI实现药物全自动研发,还远吗?
G7惊魂2.5小时!奥特曼笑坐,达里奥“受审”
新智元报道 【新智元导读】G7峰会惊变AI战场!特朗普一纸禁令掐断盟友AI命脉,全球巨头齐聚法国饭桌。奥特曼笑坐总统身旁,Dario Amodei却被隔离对面「受审」。2.5小时闭门午餐,一场没有硝烟的科技冷战正在上演! 2026年6月17日,法国依云小镇。 本来,这里是以矿泉水闻名的世外桃源。 然而,正在这里召开的G7首脑峰会,让两个半小时的工作午宴,变成一场充满硝烟的全球AI博弈场! 这次的G7峰会,法国总统马克龙做东,七国领导人齐聚一堂。但与往年不同,全球AI领域的掌门人,这次也出场了。 名单包括:OpenAI的Sam Altman,Anthropic的Dario Amodei,Google DeepMind的Demis Hassabis,还有Mistral的Arthur Mensch。 表面上看,议程非常温和:探讨AI如何驱动经济增长,如何保护青少年免受AI的负面影响。 但每一位巨头都心知肚明,这场午宴的真正潜台词只有一个——AI顶级模型的生杀大权,究竟谁说了算? 就在几天前,华盛顿的一道连环夺命call震碎全球科技圈的平静,今天下达这道死命令的操盘手特朗普,正大马金刀地坐在餐桌中央。 在他的两侧,是风头正劲、笑容可掬的奥特曼和哈萨比斯。 而在桌子的正对面,法国总统马克龙的身边,则坐着神色铁青、如同「被训斥的小学生」一样的Dario Amodei。 一场顶级大戏,就在这短短2.5小时内,被彻底撕开了遮羞布。 一张耐人寻味的座次表 座位就是态度,座位就是权力。 这场午宴的座位安排,已经说明了一切。 美国总统特朗普稳坐主位,气场全开。 他的左膀右臂——商务部长Howard Lutnick和财政部长Scott Bessent分立一侧。这两人,正是上周对Anthropic祭出出口禁令的幕后推手。 紧挨着特朗普坐着的,是科技界的两位新晋「红人」。 首先是奥特曼,他神态轻松,在席间频频与特朗普微笑互动。 OpenAI近期刚刚内测了专为网络安全打造的 GPT-5.5 Cyber,紧紧跟国家利益捆绑。 哈萨比斯同样坐在特朗普身侧,神情自若。 而桌子的另一头,气氛则十分凝重。 Anthropic CEO Dario Amodei被远远地「放逐」到了特朗普的对立面。 他的身边是东道主法国总统马克龙。所有人都看到,Dario的表情紧绷、局促,活像在听候发落的犯错学生。 Dario的反击! Dario当然不会坐以待毙。 据悉,他在发言中主动向特朗普示好,甚至公开呼吁建立一个「由美国领导的AI国际联盟」,为AI制定规则和标准。 几个合作方向如下: 1.对前沿模型实施「结构化访问控制」; 2.芯片和关键核心零部件的贸易管控; 3.在网络、生物恐怖主义和情报领域,各国情报机构与AI厂商深度共建。 加拿大总理卡尼当场表示赞同:美国可以领导这个AI联盟。 而另一边,奥特曼则显得更加具有全球战略家的风范。 他没有像Dario那样急迫地兜售芯片管控,而是提出要建立一个类似「国际金融稳定委员会(FSB)」的国际多边论坛。 我们需要一个能够制定全球公认测试标准的国际论坛,提供公正的风险分析。但至关重要的一点是,我们绝对不能让这项技术的风险,导致权力出现不当的过度集中。 奥特曼的这番话看似公允,实则高级。 他借着反对权力过度集中的旗号,既安抚了紧张的欧洲领导人,又巧妙地将OpenAI包装成了代表全球主流秩序的「合规模范」,顺便还给老对手Anthropic上了一点眼药。 房间里的大象 「特朗普政府和Anthropic之间的这场矛盾,就像房间里的大象。」一位在场人士这样说。 房间里的大象,就是刚刚被切断的Fable 5和Mythos 5。 每个人心里都清楚,真正要谈的,是谁有资格用AI,谁说了算。 马克龙的愤怒:你们今晚能关掉AI,明晚就能关掉我们的电闸 午宴中,最感到如鲠在喉的,莫过于马克龙这位东道主。 马克龙把G7安排在依云,本是想展现欧洲在AI规范和儿童安全领域的领导力。 但他万万没想到,特朗普带着「出口禁令」,直接来砸场子了。 欧洲领导人原本打算在这顿饭上表达不满。毕竟,华盛顿事先没有任何通知,突然就切断了盟友的AI命脉。 欧洲外交官们在会前就放出风声:这次午餐是欧洲「确保自己声音被听到」的第一个机会。 但真到了桌上,没有人直接掀桌子。 午宴结束后,面对记者的长枪短炮,马克龙终于忍不住开火了。 他承认美国做出的是「强有力的决定」,但他们不能把盟友当敌人。 「如果这些美国公司今天可以因为一纸命令,一夜之间掐断开关,那我们绝不会去购买它们的任何模型。」 英国AI大臣卡Kanishka Narayan也表达了担忧:「在辩论国家安全和技术主权的未来时,确保持续获得AI能力是至关重要的。」言下之意,英国也不想随时被美国断供。 而坐在餐桌下首的Mistral AI的CEO,则成为了欧洲全村的希望。 如果欧洲没有自己的Mistral,在谈判桌上,马克龙连摔杯子的底气都没有。 谁是赢家? 至于特朗普本人呢? 他显然对巨头们的争宠和欧洲人的愤怒甘之如饴。 记者会上,当被问及与Anthropic的谈判进展时,他重复了两次:「进行得很好,我想进行得很好。」 比起具体的模型安全,特朗普更关心的是实在的经济利益。 他在会后疯狂炫耀美国在AI领域的吸金能力: 「我们进行了一场伟大的AI会议,所有最顶级的人都在这里。正如你们所知,我们在国内正在建造数量惊人的工厂,而我们在美国建造的AI数据中心和工厂,将是世界上最大、最大的!」 在特朗普眼里,无论是Anthropic还是OpenAI,只要你们的算力长在美国的土地上,你们的CEO在面对白宫时就必须随叫随到。 最后,一个重磅消息:Anthropic发言人确认,Amodei将在G7结束后前往旧金山,与欧盟委员会和欧盟网络部门会面。 「此次访问是我们与欧盟、各盟友民主国家以及重要国际机构持续沟通的一部分,旨在就前沿AI对网络安全的影响及国际合作机遇展开深入交流。」 显然,Amodei还在努力。
华硕员工暴躁式宣传笔记本走红!现场猛砸、泼水、踩屏幕
快科技6月19日消息,华硕日本团队为宣传ExpertBook商务笔记本的坚固可靠性,在展场以一系列暴力方式现场折磨产品,相关视频在社交平台一天内累计播放超356万次。 ExpertBook是华硕专为商务场景打造的产品线,定位类似联想ThinkPad,全系通过美军MIL-STD-810H军规耐用性测试,涵盖跌落、扭转、转轴、键盘和面板等极端工况。 华硕官方曾对ExpertBook进行过一系列严苛的物理极限测试,但这次日本团队把实验室里的测试搬到了公众面前,用最直观的方式让消费者亲眼见证产品承受能力。 演示中最具反差感的一幕是“不小心关屏”测试,工作人员在键盘上放置坚硬异物后,嘴上平静说着“万一不小心”,却以极快速度将屏幕猛力拍下。 正常情况下屏幕早已碎裂,但ExpertBook打开后玻璃和液晶面板均无损伤,显示正常。 防泼水演示同样夸张,工作人员将一瓶瓶矿泉水直接倒在键盘上,期间对观众大喊“非常感谢您”,犹如模拟在咖啡厅被泼水的夸张戏码。 更硬核的测试是邀请观众参与,直接脱下鞋子踩在整台笔记本上,不仅踩键盘面,连屏幕也直接踩过,以凸显整机抗重压能力。 此外笔记本转轴和机身具备高强度韧性,可180度摊平,只抓住屏幕一角让整个机身明显弯曲也不会损坏。 不少网友被工作人员言行不一的暴躁反差逗笑,有人评论“嘴上说不小心,手上的力气比谁都大”,也有人赞赏这种真枪实弹的演示方式比任何参数表都有说服力。
AI的终极商业模式会是“健身房”?
文 | 吴怼怼 豆包戳破了一个幻觉 晚点一篇关于豆包、Seedance 和 AI 商业化的报道,把一个行业里越来越难回避的问题摆到了台前:AI 到底怎么赚钱? 截至上半年,每天2 亿多人使用的豆包,日收入不足百万元,主要来自电商佣金;而到了今年 5 月,豆包应用每天消耗的算力成本可能已经达到数千万元。文字聊天本身不算贵,但一旦进入推理、图片识别、语音聊天、视频聊天等多模态功能,成本会陡然上升。 这还没有计算训练模型所需的智算中心投入。一座大型智算中心往往需要数万张AI 芯片,还要配套供电、网络、散热、运维和数据中心基础设施。也就是说,AI 更像软件、云计算、电力、半导体和重资产制造业的混合体。 类似的变化也出现在其他大厂身上。 腾讯已经把WorkBuddy 企业版、政务版等智能体开发平台推到更重要的位置。元宝的战略能级反而降下来了。相比一个聊天入口,这些产品更接近企业生产力工具、开发者工具和MaaS 平台,面向的是有预算、有组织流程、有明确效率诉求的 B 端客户。 微软也在重新计算AI 的账本。过去 Copilot 更像一个标准化订阅产品,但当企业 Agent 开始持续调用模型、执行任务、消耗推理资源,“每人每月固定价格”的模式就开始变得吃力。微软已经在部分 Copilot 和 Agent 服务中推进按量计费,让企业基于实际使用量付费,并通过预算和成本管理来控制账单。 Anthropic走得更直接。Claude Enterprise 的 usage-based 企业计划,已经从单纯订阅转向“席位费 + 用量费”的混合模式:企业先为用户席位付费,真正的模型使用量则按 token 单独计费。 这也是这轮AI 浪潮和移动互联网最大的不同。 过去做App,可以先免费、先 DAU、先时长、先占入口,再靠广告、电商、会员、游戏、金融和生活服务慢慢变现。今日头条、抖音、小红书、快手,都是这个逻辑的产物。内容分发的边际成本相对较低,用户多刷一小时,平台并不会按比例多烧掉一小时的高价 GPU。 但AI 不一样。AI 是每一次交互都要消耗算力的产品。用户越活跃,成本越真实;上下文越长,显存越紧张;输出越复杂,GPU 占用时间越长;一旦进入图片、语音、视频和 Agent,成本结构就更像工业生产,而不是互联网流量分发。 这意味着,AI的第一性原理不是“流量”,而是“算力”。 豆包的问题,不是没有用户。恰恰相反,它的问题是用户太多,但商业化还没有跟上。两亿日活说明需求真实存在,但需求不等于收入,收入不等于利润。如果大量用户免费聊天、免费生成、免费调用多模态能力,而平台无法把这些使用转化成足够高的收入,那么规模本身就会变成成本负担。 这就是所谓的“移动互联网式AI 叙事”的幻觉:过去我们相信,先有用户,后有商业化。但 AI 时代,用户增长和成本增长高度绑定。一个 AI 产品不能只讲 DAU、时长和下载量,还必须回答一个更朴素的问题:每一次调用到底花了多少钱?这些成本最后由谁买单? 从这个角度看,豆包和Seedance 的差别就变得非常清楚。 豆包是面向大众的通用AI 助手,用户规模庞大,但付费理由不够强。普通用户当然会觉得 AI 好用,可以问问题、写东西、陪聊、查资料、生成图片。但这些价值很碎,很难稳定变成月费。尤其在中国市场,用户已经被免费内容、免费小说、免费视频、免费会议软件和免费工具教育了很多年。让大众为“更聪明一点的数字服务”持续付费,本来就很难。 Seedance则不同。它面对的是生产者,是短剧公司、漫剧公司、广告公司、内容制作团队。它不是让普通用户为“好玩”付钱,而是帮助原本就有预算的行业降低成本、提高效率。以前一段视频需要人画分镜、做动画、跑后期,现在 AI 可以承担一部分生产流程。客户算账很直接:如果 AI 生成的视频足够可用,并且比人便宜、比旧流程快,那就值得付费。 所以,AI商业化的关键不是 C 端还是 B 端,而是有没有明确的付费理由。 AI编程为什么更容易收费?因为它直接面对程序员、研发团队和软件公司。AI 可以缩短开发时间,提高代码产出,替代一部分重复劳动。企业不是为“聊天”付费,而是为更快交付软件付费。 AI视频为什么有机会?因为它直接嵌入了内容生产预算。短剧公司、广告公司、游戏公司、影视团队本来就要花钱买制作能力,AI 只要能把成本降下来,就能拿走一部分预算。 AI客服、AI 法务、AI 投研、AI 设计、AI 销售线索、AI 数据分析,也是同一个逻辑。 每一次对话,背后都是一张电费单 这也解释了为什么现在看起来最赚钱的是“卖铲子”的公司。 芯片、云、数据中心、电力、散热、网络,是AI 时代最先确定受益的环节。不管最后是 OpenAI、Anthropic、Google、字节、阿里,还是某个新的应用公司获胜,它们都必须训练模型、部署推理、购买或租用算力。卖铲子的人站在最上游,不需要判断谁挖到金子,只要大家继续挖,就有人买铲子。 这就是英伟达和云厂商最强的地方。 但如果因此判断“AI最终只有卖铲子的赚钱”,可能又过于悲观。更准确的说法是:卖铲子的先赚钱,基础模型层高度集中,下游应用要死掉一大批,但真正嵌入工作流、掌握付费场景的应用仍然有机会。 AI的终极商业模式,可能不是单一模式,而是三种模式的混合。 第一种,是C 端的“健身房模式”。 健身房会员制的核心,是大多数人交了钱但不常去,少数高频用户被低频用户补贴。AI订阅也有类似逻辑。轻度用户每月问几次、生成几张图,平台赚钱;重度用户天天写代码、跑 Agent、做视频、读长文档,平台亏钱。 AI 订阅的理想用户,是“愿意为能力付费,但不会把额度用穿”的用户。 这和健身房最喜欢的用户一模一样:办了年卡,偶尔来几次,还觉得自己拥有了健康生活方式。 问题是,AI 最有价值的用户,往往恰恰是最高频、最高成本的用户。程序员、设计师、短剧公司、投研人员、内容团队,越觉得 AI 有用,越会高强度使用。于是平台就不能再靠“健身房式会员”糊弄过去,必须转向用量计费或结果计费。 所以,AI订阅真正赌的是:用户愿意付费,但不要用得太狠。 这也是为什么纯粹的无限量订阅很难长期成立。AI的边际成本太清楚了,每一次 token、每一张图、每一秒视频、每一次深度研究,都能换算成 GPU 时间、电费、显存、调度和折旧。如果重度用户大量涌入,订阅模型就会被打穿。 订阅不是终局,额度才是账本 因此,未来C 端 AI 更可能变成“会员 + 额度 + 超额包”。普通聊天接近无限,高级模型有次数限制,图片和视频生成用点数,深度研究按次数,代码 Agent 按任务量。用户看到的是会员、点数、创作额度、深度研究次数;平台内部计算的则是 token、GPU 秒、推理成本和单位毛利。 第二种,是B 端的“云服务模式”。 云服务的商业模式,本质上是云厂商先重资产建设数据中心、服务器、芯片、网络和基础软件,然后把这些资源切成标准化能力,按需租给企业。企业不用自己建机房、买服务器、招运维,而是按计算、存储、数据库、带宽和API 调用付费。 B端 AI 很像云服务。模型 API、MaaS 平台、企业 Agent、知识库、AI 编程、AI 视频生成,本质上都是把“智能能力”变成一种可计量资源。企业用了多少 token、多少上下文、多少图片识别、多少语音转写、多少视频秒数、多少 Agent 执行时间,就对应多少成本。 但AI 又比传统云更复杂。云服务卖的是资源,AI 最好卖的是结果。 企业客户关心的是:客服成本有没有下降,代码交付有没有变快,广告素材有没有变多,视频生产有没有更便宜,投研报告有没有更高效,法务审查有没有减少人力。 所以,最好的B 端 AI 商业模式是:后台像云一样按资源结算,前台像 SaaS 或行业工具一样按价值收费。 企业为结果付费 对客户说的是:我帮你处理了一千个客服会话,生成了一百条广告素材,完成了一段可运行代码,做完了一份投研报告。 对公司内部算的是:这些任务消耗了多少token、多少 GPU 秒、多少失败重试、多少工程调度成本。 第三种,是“结果收费模式”。 AI最终不是卖模型,也不是卖 token,而是卖可验证的业务结果。 如果一个AI 应用只是把用户请求转发给上游模型,它本质上是在帮上游卖 token,自己很难留下利润。真正能赚钱的下游,必须把 token 封装成工作流,把算力变成结果,把结果变成账单。 Codex、Claude code、Cursor这类 AI 编程工具,重构了开发者写代码的界面。微软把 Copilot 嵌入 Office,字节把 AI 嵌入广告投放、剪映、短剧制作和电商商家工具,也是在卖生产工具。 这才是AI 应用层真正的机会:不是再做一个“我也能聊天”的 App,而是成为某个行业工作流的一部分。 这里就要回到token。 token是什么?它不是 GPU 本身,而是模型处理信息的基本计量单位。输入 token 是模型读进去的内容,输出 token 是模型生成出来的内容。token 越多,通常意味着模型要读得更多、算得更久、生成得更多,最后就会转化成 GPU 计算量、显存占用、推理时间、电力、散热和系统调度成本。 token像 AI 时代的电表。用户看到的是问答、图片、视频和代码,平台后台看到的是 token、GPU 秒和单位任务毛利。 GPU则像发电厂和工厂设备。它不是被 token 一点点“磨没”的,但长期高负载运行会带来电力消耗、热损耗、显存压力、硬件老化和会计折旧。 更关键的是,AI GPU 的寿命不只是物理寿命,而是经济寿命。卡还没坏,但新一代芯片性能更强、能耗更低,旧卡的单位 token 成本过高,就会被迫退到低端任务,甚至经济报废。 这就是AI 基建周期里最大的变量。 铲子先赚钱,淘金者还在算账 短期看,卖铲子的人最确定。芯片、云、数据中心、电力、散热都会继续受益。基础模型公司会继续烧钱争夺门票。下游应用则会经历残酷筛选。 中期看,市场会越来越关心ROI。大厂的资本开支能不能转化成真实收入?企业 AI 的收入增速能不能追上算力投入?GPU 云价格会不会下跌?数据中心利用率够不够高?折旧年限到底该按传统服务器算,还是按更短的技术周期算? 长期看,基础模型层会高度集中,但应用层不会消失。真正的赢家会出现在三个地方:掌握算力入口的基础设施公司,掌握企业工作流的软件公司,以及能把 AI 直接转化成业务结果的垂直应用公司。 最后的问题:谁来买单? 所以,AI的终极商业模式究竟是什么? 答案可能是: C端像健身房,用订阅、额度和沉没成本管理用户; B 端像云服务,用 token、调用量、年框合同和企业锁定收费; 高阶应用像SaaS 和外包服务的结合,用 AI 完成具体任务,再按结果收钱。 订阅可以当入口,但不能当终局。 AI行业正在进入“谁能把算力变成现金流”的阶段。 过去一年,大家讲的是参数、榜单、DAU、下载量和多模态能力。接下来更重要的会是:单位推理成本、token毛利、企业续费率、任务成功率、客户预算来源、工作流嵌入深度和可验证 ROI。 创造价值和捕获利润,是两回事。 AI会提高社会效率,但提高效率的人未必能赚到钱。 AI 会重塑很多行业,但不是每个 AI 应用都能成为公司。 AI 会成为基础设施,但基础设施的生意,最终一定要回到一个非常朴素的问题: 这一轮烧掉的算力,最后到底由谁买单?
苹果A21 Pro或将独享台积电改良版2nm N2P制程 标准版保持N2工艺
据台湾《工商时报》报道,台积电略微改良的 2nm N2P 制程今年将率先被高通和联发科采用,两家公司希望借此在今年晚些时候的新品上抢占相对于苹果的技术优势。不过消息称,苹果预计会在明年的 A21 Pro 芯片上同样导入 N2P 制程,以保持与Android阵营旗舰芯片的竞争力,但这一先进工艺仅会用在 Pro 版本上,标准版 A21 仍将停留在较早的 2nm N2 节点。 面向基础款 iPhone 20 的 A21 标准版,预计会继续采用台积电 2nm N2 制程,该工艺也被认为将用于前一代的 A20 和 A20 Pro,从而在一定程度上摊薄开发与生产成本。在晶圆成本持续攀升、存储器供应吃紧且价格高企的背景下,苹果即便身为市值数万亿美元的科技巨头,也不得不在高端制程导入节奏上做出取舍,以避免利润率被进一步侵蚀。 从性能层面来看,N2 与 N2P 之间并非“代际飞跃”。报道援引业内信息称,在相同频率下,N2P 相较 N2 的性能提升大约只有 5%,并不会立刻在终端体验上拉开巨大差距。加之苹果在芯片架构设计上的积累深厚,即便沿用 N2 制程,也可以通过架构优化和能效调校弥补一部分制程差距,而不必完全依赖最先进的光刻工艺来换取性能。 以 A19 Pro 为例,该芯片上的四个能效核心在架构优化后,可以在“零额外功耗”的前提下实现最高约 29% 的性能提升,显示出苹果在微架构层面的深度挖潜能力。由此推测,苹果在 A21 标准版上完全有可能通过类似的架构改进,将制程不升级所带来的影响控制在相对可接受的范围之内。 另一方面,为维持在高端市场的话语权,苹果仍有动力将 A21 Pro 迁移到 N2P 制程,以在核心数、频率和能效比等方面与采用相同工艺的高通、联发科旗舰芯片正面竞争。随着时间推移,N2P 量产工艺的成熟度提升,台积电晶圆成本有望逐步回落,也会在一定程度上缓解苹果在高端制程上的成本压力。 苹果计划在 2028 年让 A22 Pro 率先导入台积电 1.4nm 制程,这将是苹果第一次跨入亚 2nm 时代,不过目前尚未有标准版 A22 是否同步升级的线索,A21 系列也并未被纳入这一规划讨论。从 A21 到 A22 的路线图可以看出,苹果似乎在旗舰 Pro 芯片上优先引入最新制程,再视成本与市场反馈决定是否下放到标准款型号。 需要指出的是,《工商时报》在相关爆料上的准确度记录并非总是完美无缺,因此消息本身仍存在不确定性,后续走向还有待更多渠道印证。报道本身也强调,读者应对这一系列关于 A21 与 A22 制程规划的传闻持保留态度,静待后续产业链和苹果官方的进一步消息。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。