行业分类:
加载中...
头条分类:
加载中...
Claude Fable 5平替指南突然爆火,真能一句话“复活”?
Claude Fable 5 周末被停用之后,成了不少人心中逝去的白月光。连原本定好的 Claude Fable 5 开发者大会,主角也被临时调整为 Opus 4.8。 可 Fable 的悼念帖还没刷完,知名 AI 模型聚合平台 OpenRouter 带着 Fusion API 闪亮登场。 它自称是市面上最聪明的「拼盘模型」,智力接近 Fable,且价格只要一半。 截至发稿前,OpenRouter 这条推文已经冲到 518.5 万阅读。某种程度上,Fusion API 展示了一种新思路:模型能力不一定只能靠参数的力大飞砖,协作本身也能产生增益。 AI 也讲究群殴战术? Fusion 本质上是一套「多模型协作」机制。 与传统大模型由单个模型完成思考、搜索和回答不同,Fusion 会把同一个问题同时交给多个模型独立研究,再对结果进行综合。 整个流程分为三步: 1. 并行研究:多个参与模型(Panel Models)在相同工具权限下独立完成搜索、资料整理和答案生成; 2. 交叉评审:裁判模型(Judge Model)阅读所有答案,分析共识、分歧、遗漏、独特观点以及潜在错误和风险; 3. 生成结论:主模型根据评审结果完成信息整合,输出最终答案。 因此,Fusion 的核心并非简单拼接多个回答,而是通过独立研究、交叉验证和统一综合来提升结果质量。 为了验证这种协作模式是否有效,OpenRouter 采用了 Perplexity AI 发布的 DRACO 作为测试基准。 DRACO 专门评估深度研究能力,共包含 100 道任务,覆盖学术、金融、法律、医疗、技术、UX 设计、产品比较等 10 个领域。与传统问答测试不同,它不仅考察知识储备,还会评估推理能力、工具使用能力、资料检索能力以及最终报告质量。 每道题接近 40 条评分标准,主要关注事实准确性、分析完整性、信息整合能力、引用可靠性和表达清晰度。同时还设置了负分项,例如给出危险医疗建议或引用明显错误信息都会被扣分,因此模型很难依靠堆字数来刷成绩。 🔗 https://openrouter.ai/blog/announcements/fusion-beats-frontier/ 在这套测试里,Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 三个模型组成团队,再由 Opus 4.8 负责综合,最终拿到 64.7%。 作为对比,GPT-5.5 单独作战为 60.0%;Opus 4.8 单独作战为 58.8%。 而 Fable 5 单独作战的成绩是 65.3%。这意味着 Fusion 的平价组合距离 Fable 只差不到 1 个百分点,但成本大约只有后者的一半。 此外,OpenRouter 还做了一个有趣的实验:让 Opus 4.8 和另一个 Opus 4.8 组成双人小组,然后仍然由 Opus 4.8 负责综合结果。 照理说,两个一模一样的模型搭伙,能有多大变化?结果却拿到了 65.5% 的 DRACO 成绩。相比之下,单独运行的 Opus 4.8 只有 58.8%。也就是说,仅仅增加一次独立思考和综合过程,分数就提高了 6.7 个百分点。 究其原因,同一个模型面对同一个问题时,也可能走出不同推理路径。它可能调用不同工具、搜索不同资料、关注不同细节,最终形成两份并不完全相同的答案。 当这些答案被放在一起比较时,就有机会发现遗漏、修正错误、补充证据。 这也是为什么 OpenRouter 估算,Fusion 带来的提升里,大约四分之三来自综合环节本身,只有四分之一来自模型之间的多样性。 DeepSeek V4 Pro 的表现也尤其让 OpenRouter 感到意外。 它单独运行时拿到了 60.3%,几乎与 GPT-5.5 和 Opus 4.8 处于同一水平。 OpenRouter 猜测,这可能与不同模型的工具使用习惯有关。Opus 4.8 更依赖频繁调用工具,因此在工具预算受限的情况下优势没有完全发挥出来。 Fable 则更倾向于先规划,再行动,因此受到的影响相对较小。 不过,这组成绩也有几个需要注意的地方。比如不同裁判模型可能带来 10~25 分的绝对分数波动,因此成绩不宜直接与论文数据对比,但相对排名通常较稳定。 其次,Fable 的成绩并非基于完整 100 题。由于内容过滤限制,Fable 5 有 7 题未完成,最终按剩余 93 题计算,因此与完成全部 100 题的其他模型并非完全同条件比较。 测试中还有个小插曲:部分模型联网搜索时意外找到了 DRACO 的评分标准,相当于提前看到了阅卷规则。虽然 OpenRouter 认为这并非主动作弊,但仍可能影响公平性,因此后续将相关页面加入黑名单,并重新完成测试,最终公布的成绩均来自屏蔽后的结果。 对于开发者来说,Fusion 的使用非常简单,直接将模型名称替换为:openrouter/fusion 即可自动调用默认组合;也可以自定义参与模型和裁判模型。 从目前数据来看,多模型协作的收益已经相当明显。至少在深度研究任务上,「开会式」协作确实比单打独斗更容易取得更好的结果。单体模型仍然重要,但模型协作也有机会成为新的 AI 基础设施。 Fable 被禁,背后故事比你想象的还要抓马 Fusion 爆火的前提,很难绕开 Fable。 Fable 5 和更高一档的 Mythos 5,最近一起被美国政府出口管制。全球用户都被暂停访问,甚至 Anthropic 内部持外国国籍的员工(比如 Andrej Karpathy),也无法使用自家最新模型。 据 The Information 报道,把这件事推到关键位置的人,正是 Anthropic 的头号金主、亚马逊 CEO 安迪·贾西。 事情经过大致是这样:亚马逊研究人员测试 Fable 5 时,发现了一种「越狱」方法,可以绕过安全护栏,获得和网络攻击相关的信息。随后,贾西把这份测试结果递交给了相关高层。 最大的金主,亲自把被投公司的旗舰模型送进了监管视野。 美国国家网络事务总监肖恩·凯恩斯克罗斯随后召开紧急会议,最终选择用出口管制作为应对手段。留给 Anthropic 的响应窗口,一度只有 90 分钟。 据知情人士说,美国政府当时要求 Dario Amodei 修复这个漏洞,但他拒绝了。Anthropic 官方将这个越狱案例定性为「轻微发现」,并表示其他公开模型也存在类似问题。 美国政府和亚马逊没有接受这个解释。 微妙之处在于,亚马逊从 2023 年起已经累计向 Anthropic 投入 130 亿美元,并计划追加最多 200 亿美元。最大的投资人,在这件事里变成了推动模型下架的关键角色。 接近美国政府的人士还称,这次出口管制大概率不会扩散到其他 AI 公司。换句话说,这更像是一次针对 Anthropic 最新模型的精准限制。 随后,Anthropic 给用户发出通知: Opus、Sonnet、Haiku 仍然可用;使用额度会重置;若用户不满意,可以在 6 月 20 日前从网页端取消订阅,系统会按比例自动退款。通过苹果渠道订阅的用户,则需要走苹果自己的退款流程。 一个前沿模型,就这样突然从全球用户面前消失了。 一句话「复活」Fable,没那么简单 Fable 虽然贵得离谱,但在被停用前,开发者社区已经把它研究了个遍。 Django 核心开发者 Simon Willison 也曾分享过体验: 他只是让 Fable 帮忙排查一个简单的 CSS 问题,结果模型自己调用工具、搭测试环境、跨浏览器验证,硬是跑出了一整套自动化调试流程,最后还花掉了约 12 美元。 🔗 https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/ 这也意味着,编程 Agent 几乎能完成终端里的所有操作,而前沿模型掌握的技巧远超普通开发者认知。一旦受到恶意指令影响,这种主动性带来的就不只是生产力,还有潜在风险。 Fable 被停用后,也总有人试图通过各种方式「复活」它。 开发者 Jamieson O'Reilly 就做了一个实验:Fable 的「性格」到底来自模型权重,还是来自系统提示词? 🔗 https://x.com/theonejvo/status/2065816283476824126?s=20 当时网上流传出一份号称是 Fable 5 的系统提示词(其实是 Anthropic 每次发布模型都会在网上公布的系统提示词)。 Jamieson 把一段提示词「claude --dangerously-skip-permissions --system-prompt-file CLAUDE-FABLE-5.md」喂给 Opus 4.8,另一边则使用原版 Opus 4.8 做对照。两个环境都是「Opus 4.8 · 1M context」,唯一变量就是提示词。 他给两边发了同一句任务:做一个现代苹果风格的落地页。结果出来的两个页面,在品牌设定、文字语气、版块结构、整体气质上都有明显差异。 同样的模型能力,只改一段系统提示词,输出风格就发生了变化。Jamieson 很兴奋地发推:我是不是解锁了 claude-fable-5-lite? 不过,这无异于照猫画虎。 提示词可以模仿姿态,模仿语气,模仿一部分结构。可它不能凭空补出模型在训练、推理、工具使用、长上下文规划上的真实能力。 与此同时,另一边的国内模型也在借势表达自己的立场。智谱日前宣布,GLM-5.2 向 GLM Coding Plan 全量用户开放,从 Lite 到 Pro、Max,再到团队版全面覆盖。 智谱还说,前沿智能不该只属于少数人,也不该被少数规则随时收回,它应该开放、可用、可构建,并服务于每一位开发者。 白月光之所以成了白月光,常常是因为它已经离场。但前沿智能未必只能寄托在一个模型身上。哪怕最亮的那盏灯被关掉,桌上还有很多盏小灯。 把它们摆对位置,也能照亮前方的路。
远离世界杯的BOSS直聘,净利率干到54%
招聘行业进入成熟期,大规模营销的ROI不高。同时,当下环境,招聘平台并不适合大规模营销。相比这些参与感,当前招聘平台正在面对新的“屠龙少年”,在AI深度介入招聘全流程的时代,只靠“信息撮合”生存的中间商,面临着被颠覆的风险。 作者 | 大 饼 编辑 | 金 晓 新世纪以来,除了足球队,中国都是世界杯的常客。 作为全球影响力最高的体育赛事,世界杯是营销角逐的主力。 本届世界杯,营销的主角发生了巨大变化。 曾经,BOSS直聘依靠洗脑广告文案,在俄罗斯世界杯期间引发广泛讨论,又因为在记分牌下加logo引发关注。 如今,这个曾经的世界杯话题企业,悄然淡出了公众视野。 Part.01 花小钱,办大事 世界杯水涨船高的营销费用下,BOSS直聘是花小钱办大事的代表。 2018年俄罗斯世界杯,BOSS直聘成为洗脑广告的代表。在中场休息的广告中,众多身穿白色上衣的求职者声嘶力竭地大喊:“找工作!直接跟!老板谈!升职!加薪!升职!加薪!” 这一段广告成为世界杯期间吐槽的重灾区。 但从营销的视角,用单一的内容方式,反复强调关键信息,目的就是将最核心传达的内容在受众身上加深印象。 到了2022年卡塔尔世界杯,BOSS直聘再进一步,拿下世界杯三级赞助权益,冠名赞助了央视世界杯直播,直接把logo放在了电视转播画面比分牌的下面。 这一系列做法,让品牌曝光实现了最大化。但也让BOSS直聘的宣传方式饱受批评。 到了今年美加墨世界杯,BOSS直聘不再站到营销的风口浪尖,反而格外低调。 这个背后,一方面是招聘行业进入成熟期,BOSS直聘已经牢牢占据很高的市场份额。 根据QuestMobile此前的数据,BOSS直聘的月活用户约5400万-6360万,占行业使用时长份额64.5%。这个数据比智联招聘和前程无忧的越活用户之和还要多。 今年5月,拉勾网,进入破产重整程序。这家曾经炙手可热的公司最终被淘汰,侧面说明招聘市场趋于稳定,份额向头部集中。 BOSS直聘就是移动互联网转型中最受益的招聘平台。短期内,市场份额已经没有太多变数,大规模营销的ROI不高。 另一方面,BOSS直聘做大规模营销已经不合时宜。过往两届的营销,已经让不少球迷干扰反感,在品牌知名度已经很高的情况下,继续做世界杯营销,并不会做加法,反而过犹不及。 不仅如此,当下环境,招聘平台并不适合做营销。在经济下行、失业、担心被裁或者换工作等困境中,求职软件过度宣传,反而会制造焦虑。 就连BOSS直聘自己,也在缩减岗位。 Part.02 净利率超茅台 2025年全年,BOSS直聘员工总数从5688人降至4884人,缩减14%,回到了2021年的水平。 缩减的主要岗位是运营岗,人员数量从1008人降至722人,超过四分之一的人离开了BOSS直聘。 之所以运营岗减少,很大程度上是AI的引入。 数以万计的企业正通过AI工具筛选简历、自动打招呼、批量约面试。系统的高效运转,让过去需要几十个运营人员干的活儿,现在几个人就够了。 这就意味着,这家靠帮别人找工作为生的平台,首先在自己内部完成了岗位压缩。过去需要大量人工完成的信息审核、岗位匹配、基础客服和运营工作,正在被AI化的系统能力替代。 此举带来的一大好处是,费用开支减少,利润的大幅改善。 2025年,BOSS直聘总经营成本和费用为57.81亿元,同比缩减7.1%。今年一季度进一步减少3%。今年一季度,BOSS直聘的一般及行政费用减少16%,连续两个季度缩减。 与此同时,BOSS直聘的利润表现大幅攀升。2025年,其净利润猛增71.7%至26.9亿元,再度刷新了历史新高。 上市以来,其净利润率一路走高,从亏损到2025年达到32.54%。今年一季度,其净利润更是达到了54.42%。这个净利润率水平甚至已经超过茅台。 利润大幅改善后,BOSS直聘宣布将在接下来三年,每年拿出经调整净利润的一半,用于股息和回购。 按照2025年的持股比例,创始人赵鹏持股13.8%。经调整净利润36.02亿元,赵鹏可以分得约2.5亿元。 但问题也就随之而来:AI当前的效率,还有误差,在体验上会打折扣。 理财周刊和网经社数据显示,2025年BOSS直聘位列数字生活领域投诉榜第6位,全年20次消费评级中,9次“谨慎下单”,6次“不建议下单”,负面评级占比高达75%。进入2026年,平台仍被投诉存在虚假高薪岗位、僵尸岗位刷KPI、招转培陷阱等问题。 今年4月2日,人社部等五部门对BOSS直聘等在内的网络平台进行了“规范网络平台招聘类信息发布”联合行政指导。 当行业走向成熟、规范,BOSS直聘也已经处于追求利润和效率的阶段。 Part.03 增长引擎大换挡 大规模增长在BOSS直聘身上已经不太现实。 2025年,公司全年营收82.7亿元,同比增长12.4%。最近三年,BOSS直聘营收逐年降速,今年一季度,其营收为20.7亿元,同比增速进一步降至7.6%。 公司给出的Q2收入指引在13.2%-15%之间,看似有所加速,但管理层也坦言,这一反弹与春节返工滞后需求确认有关,若将一二季度合并来看,上半年增速约为11%,与去年同期基本持平。 BOSS直聘的收入增量到底从哪里来,决定了公司未来的增长质量。 BOSS直聘最早靠服务互联网白领起家。但白领招聘市场份额已经到了极限,未来的增量更可能来自蓝领、低线城市和中小企业。 2025年,平台来自100人以下小企业的收入贡献首次超过50%。2026年一季度,蓝领收入占比首次突破40%,公司明确表示,蓝领群体、低线城市和中小企业是增长的主要驱动力。 这固然打开了更广阔的市场空间——中国有近4亿蓝领群体。但问题在于,招聘蓝领的客户,其付费能力低于招聘白领的客户。 BOSS直聘2026年一季度付费企业客户数710万,同比增长10.9%,但收入增速只有7.6%,单个客户的付费金额在下降。 也就是说,蓝领贡献了用户规模和付费企业数量,但在稀释平均客单价,这一定程度上代表着结构性变化,BOSS直聘营收增长会愈发困难。 向求职者收费更加不现实。2026年一季度,来自其他服务(主要是面向求职者的付费增值服务)收入仅0.11亿元,同比下降约50%,这已是连续第三个季度下滑。 AI工具的出现,让外部实现简历润色、竞争力分析等诉求更容易实现,BOSS直聘的增值服务价值在缩水。 当前阶段,外部竞争压力也不容忽视。短视频平台的“直播带岗”模式也在悄然崛起,这些平台的跨界,正在分食在线招聘市场,用流量优势猛攻蓝领招聘腹地,可能对其中长期获客成本产生持续压力。 Part.04 新屠龙少年 面对主业增速放缓,BOSS直聘选择继续押宝AI。 CEO赵鹏在2025年财报电话会上表示,互联网招聘行业在AI帮助下有机会进化到“闭环服务”。他透露,2025年,公司相关业务营收已达1亿元量级,管理层预计2026年将实现翻倍乃至多倍增长。 “不仅是我们公司,从宏观视角来看,AI确实可以提升经济运行过程中岗位与人才的匹配效率。从我们做业务的角度来讲,AI可以通过更好的数字化匹配双边需求,更好地提高基层人员工作效率,更好地降低大型团队同质化管理成本,从而能够让规模化的闭环服务成为一种现实。”赵鹏说。 所谓的“闭环服务”,是从过去单纯售卖广告位和岗位曝光,延伸到AI简历筛选、人才测评、面试安排、背景核查和offer管理等环节。平台不再仅仅是撮合信息的中间商,而是要成为贯穿招聘全周期的工作流服务商。 BOSS直聘内测了全链路AI招聘Agent“DeepHire”,基于自研大模型“南北阁”,求职端可AI润色简历、自动投递、代聊约面,企业端可批量解析简历、AI打分排序、自动回复咨询、约面日程管理。 商业逻辑清晰,竞争环境也开始发生改变。 过去BOSS直聘是招聘信息平台,猎聘、MOKA等是HR SaaS工具服务商,两者井水不犯河水。一旦BOSS直聘切入简历筛选、面试安排和offer管理,与这些上下游企业的关系就从互补变成了直接竞争。 此外,AI招聘行业还存在“真AI”和“伪AI”的分水岭。据行业数据,国内声称具备AI能力的招聘产品已超过40款,但大多仅停留在简历关键词匹配和基础自动化层面,与Excel筛选功能并无本质区别。 真正算得上深度AI的匹配,需要构建多维人才画像,综合考虑技能关联性、职业发展轨迹和行业迁移可能。 这一系列的功能,恰好在大模型的命中范围,也就是说,招聘服务下一代产品,很有可能是大模型、AI Agent公司唱主角,这些新的可能性,就像是一个个屠龙少年,威胁着BOSS直聘的未来发展。 BOSS直聘从白领互联网招聘起步,用“直聊”模式颠覆了前程无忧和智联招聘,一度是行业颠覆者。但如今,自己也站在了被技术和时代重新定义的路口,曾经“传统平台”的符号,出现在了BOSS直聘的身后。 拉勾网的破产重整为整个行业敲响了警钟,在AI深度介入招聘全流程的时代,只靠“信息撮合”生存的中间商,面临着被颠覆的风险。
外媒:美国政策反转、史无前例管制大模型,为硅谷敲响警钟
凤凰网科技讯 6月15日,据彭博社报道,美国禁止外国用户访问Anthropic的最先进AI模型,这一不同寻常的举措凸显出,特朗普政府如今更愿意对这一关键行业施加控制。与此同时,这也在提醒硅谷:他们所开发和使用的仍是一项尚未被完全理解、其影响也充满变数的技术。 Anthropic 上周五,美国政府采取了前所未有的举措,命令Anthropic禁止所有外国人使用其最先进AI平台。美国政府是在发现Anthropic几天前刚刚发布的Fable 5模型存在被“越狱”的可能之后下达这一命令的。所谓“越狱”是指绕过模型设置的安全防护机制。 此举的快速出台引发了广泛担忧。Anthropic称这一做法是“反应过度”,并警告说,采取这样的监管方式可能会“导致所有前沿模型开发商无法部署任何新模型”。 知情人士透露,Anthropic高层目前正与华盛顿官员就后者所提出的具体安全担忧进行磋商。参与谈判的关键官员之一是美国财政部长贝森特。他此前曾向华尔街发出警告,提醒人们关注前沿AI模型可能带来的风险,例如Anthropic的Mythos。理论上,Mythos能够比人类更快地发现并利用软件中的漏洞。 干预AI公司运营 美国政府的这一反应,是政府官员迄今为止对一家AI公司运营活动进行的最重大的一次干预。此举正值Anthropic等头部AI创业公司寻求上市之际。Anthropic的估值超过9000亿美元。这一出乎预料的管控措施,可能为OpenAI、谷歌以及Meta等主要AI模型开发商树立先例。 如今,美国政府已经愿意动用非常规权力,强制AI开发商按照政府要求处理潜在的安全威胁,尽管特朗普政府在今年6月发布的一项行政命令中曾声明,不会强迫硅谷企业服从政府指令。 “美国的前沿模型正日益被视为战略资产,其使用受到严格管控,并受到国家安全考量的影响,”资产管理公司Allspring Global Investments投资组合经理陈嘉兴(Gary Tan)表示,“这一态势可能会持续下去,因为美国算力领先。” Mythos模型 Anthropic在上周发布了Fable 5,这是其Mythos级模型首个面向公众的版本。该公司曾多次就Mythos的网络能力发出警告,白宫官员也对这些担忧高度重视,并通过非强制性的行政命令为美国各机构开辟了一条途径,使其能够利用Mythos及其他具备网络能力的模型来修补自身系统中的薄弱环节。 华盛顿的担忧可能不仅限于“越狱”或影响某个特定平台的能力。更广泛的忧虑在于,对手可能会试图窃取AI模型的权重,后者是一个极具价值的数字文件,掌握着模型能力的关键。禁止访问Fable和Mythos的决定,恰逢华盛顿对AI公司保护商业机密问题日益担忧之际。美国政府认为,这些公司需要防范来自内部人员的潜在威胁,以免核心技术泄露。 在数十年来将美国尖端技术作为外交和经济工具向全球传播之后,华盛顿如今正朝着相反的方向迈进。现在,美国出于国家安全的考虑,越来越倾向于将技术保留在国内使用。 “这表明美国正在迅速利用出口管制来遏制前沿AI带来的风险。”新加坡南洋理工大学下属国防与战略研究所的助理教授甘丽宜(Stefanie Kam)表示。 硅谷抵制? 撇开政策目标不谈,硅谷很可能会抵制华盛顿试图加强控制的做法。从Meta到OpenAI,各大AI开发商都在争相抢占这一技术领域的制高点,因为这项技术很可能重塑整个经济和众多行业。 然而,要测试AI模型潜在能力的每一种组合是不可能的,这导致人们对威胁产生模糊的担忧,这种担忧随着模型的不断改进而持续受到审视。 “可能存在某些重要的能力门槛。例如,能够在短时间内自动完成大量AI研究与开发工作的AI系统。这类系统可能带来全新的风险。”美国参议员吉姆·班克斯(Jim Banks)在本月致信贝森特、国家网络总监肖恩·凯恩克罗斯(Sean Cairncross)以及国防部长皮特·赫格塞斯(Pete Hegseth)等官员时写道,“业内专家同样对于把这类系统处于人类控制之下的难度表达了严重担忧。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
谁来给阿里Agent扛旗?
“QoderWork的日活、周活、Token用量,在集团所有AI工具里都是第一。” 上周五,阿里巴巴CEO吴泳铭现身QoderWork团队会时,给出了这组内部口径。字母榜从阿里相关人士获悉,吴泳铭在会上提到,QoderWork正在成为“打通大模型和整个数字世界的接口”,未来要帮助所有办公室白领,成为类似OS的存在。 这句话出现的时间点很微妙。 同一时期,钉钉刚经历一场人员风波。CEO无招、副总裁马锐拉相继离职,围绕钉钉内部管理和ONE项目的一篇长文,也把过去一年积累的问题推到台前。 管理问题之外,阿里B端Agent路线上的分歧开始显现。 从时间看,悟空和QoderWork几乎站在同一个起跑线上。一个成长于钉钉,背后是阿里最重要的企业协同入口;一个来自阿里云/Qoder体系,起初更像低调的桌面Agent。但在阿里内部使用声量上,QoderWork已经先跑到前面。 有阿里员工向字母榜表示,自己现在基本只用QoderWork,很少再打开悟空。 从用户角度看,两者能力有重合。但QoderWork更顺手,悟空则更像一个被塞进钉钉里的AI机器人。 行业竞争也在同步提速。OpenAI把Codex和Agent推到ChatGPT前台,腾讯WorkBuddy开始把DAU和留存写进财报,字节火山引擎在MaaS调用量上拿到接近一半份额,并推动TRAE Work、扣子企业版等Agent平台迭代。 阿里并不缺模型、云和企业入口。Qwen、百炼、阿里云、钉钉、QoderWork和悟空,都在各自位置上构成阿里AI版图的一部分。 问题是,在冲击行业SOTA的道路上,阿里需要一个能把这些能力串起来、被内部用户和外部市场同时看见的B端Agent产品。 现在看,这个答案还没有真正出现。 悟空曾经拥有很高的内部优先级。 据接近阿里的人士透露,悟空成立后,无招团队曾在集团内部强力推进落地。无招会亲自与多个业务一号位沟通,推动业务团队把相关能力接到悟空上。 这符合钉钉过去一年想要转向原生AI的方向。 悟空被定义为企业级AI原生工作平台,尽管也有独立的客户端,但其在阿里生态最大的价值是可以接入钉钉企业账号、权限和应用系统,调用钉钉能力完成文档、会议、表格、协同等任务。 在阿里的B端版图里,钉钉原本是最天然的前台。它有企业组织、通讯录、审批流、会议和文档等内部应用,在Agent接入工作场景的命题上,似乎有着天然优势。 但从内部使用反馈看,悟空没有完全兑现这种入口优势。 一些来自阿里内部的声音反馈称,悟空在处理钉钉文档时,会出现分不清是在原文档后追加内容,还是覆盖已有内容;在文档修改中,曾出现图片被删除、内容变成“加载中”的情况。 还有员工提到,自己让悟空在群里发一句话并@指定同事,最终只是普通文本,没有形成真正的@提醒。 要知道,这些都算不上特别复杂的Agent任务。这似乎表明,办公协同和通用Agent之间存在天然张力。 通用Agent追求“一句话完成任务”,悟空也采取了类似的CLI路线。但企业办公里,很多动作不能只追求快。流程上的节点繁多且复杂,让AI驱动工作流并非易事。 更关键的是,钉钉里的大量工作也不是标准化SOP,而是人与人之间的琐碎沟通:催进度、确认信息、拉群、对齐口径、转发文件、临时协调。 Agent带来的自动化,必须建立在办公协同的即时性、准确性的核心指标上。 这种割裂感,在打开当前钉钉的一瞬间就能感知到。首先映入眼帘的是AI对话页面,原本最核心的消息页面,却被放到一级菜单第二项。 可以理解,这是钉钉/悟空团队希望提升AI优先级的设定。但一个办公协同软件,却失去了第一时间触及工作消息的便捷性。 相比之下,QoderWork的优势,就在于它是一个通用生产力Agent。 有阿里内部人士提到,让悟空画流程图,得到的往往是Markdown;让QoderWork处理类似任务,却更容易直接得到图片或更接近交付物的结果。 另有内部人士称,悟空在浏览器自动化时会打开多个页面,任务执行失败后的反馈链路也不甚清晰,使用感更像“在钉钉里遥控一个机器人”。 这类反馈不能代表所有用户,但说明一个问题:当阿里内部已经出现QoderWork这样的通用生产力Agent,悟空很难只靠钉钉入口获得天然优势。 办公协同的土壤里,可以长出AI助手、数字员工和流程自动化,但未必适合直接长出一个通用Agent总入口。 对阿里来说,这不是钉钉一个产品的问题,而是B端Agent路线的分工问题:最靠近企业组织和工作流的入口,未必最先跑出通用Agent能力;最先在内部跑出使用数据的产品,又还没有站到阿里最核心的企业入口上。 阿里和钉钉近期业务和组织上的激变,开始把这个问题推到台前。 回到悟空刚发布时,外界一度把它视为阿里B端Agent的扛旗角色。 今年3月,悟空以企业级AI原生工作平台形态亮相。随后,阿里成立Alibaba Token Hub,整合通义实验室、MaaS、Qwen、悟空等AI相关业务,悟空也被放进更高层级的AI商业化体系中。 彼时,阿里需要一个能把模型、云和企业场景连接起来的产品。 Qwen提供模型能力,百炼提供模型服务和开发平台,阿里云承接企业客户,钉钉负责组织入口。悟空如果跑通,就能成为这条链路上最靠近企业日常工作的前台。 但B端Agent竞争已经越过发布会阶段,开始进入指标竞争。 OpenAI给出的方向是,把Agent推到用户最高频的前台。ChatGPT正在承接Codex、Agent、图像生成和第三方服务入口。它的逻辑很直接:模型能力要变成收入,必须进入用户工作入口。 这也是AI行业从模型竞争进入产品竞争的信号。早期厂商比的是模型参数、榜单和API价格;进入Agent阶段后,竞争开始转向用户在哪里发出指令、任务在哪里被执行、结果在哪里被交付。 国内厂商也在快速分路。 腾讯走出一条轻前端路径。WorkBuddy通过桌面Agent、消息入口和MCP连接器进入用户已有工具链。与此同时,腾讯云还有ADP这样的开放Agent生态平台,深入对接企业AI场景。 更重要的是,腾讯已经开始把Agent产品写进财报叙事。 腾讯在一季度财报中称,WorkBuddy按DAU计在中国生产力AIAgent服务中领先;CodeBuddy和WorkBuddy仍处早期采用阶段,但实现自然增长和较高留存,其中活跃用户留存率超过60%,付费用户留存率超过80%。 腾讯没有披露WorkBuddy具体DAU和收入,但它给出了资本市场可以理解的产品指标:DAU、留存、付费用户留存。 这对阿里构成直接参照。 过去,企业软件的竞争更多体现在客户数、合同额和生态伙伴。现在,Agent产品正在被用互联网产品的方式衡量:日活、留存、付费转化和使用频次。 字节走出的是另一条路径。 火山引擎、豆包模型、扣子企业版、TRAE Work等产品,构成了从模型服务到Agent平台再到开发者工具的链路。这些产品更靠近模型、云和Agent基础设施团队,也更容易获得模型、多模态、工具调用、MCP和开发框架资源。 在模型调用量层面,IDC数据显示,2025年中国企业级MaaS调用量达到1944万亿Tokens,火山引擎份额达到49.5%,阿里云为28%。 企业MaaS调用量,字节取得了国内厂商的主导地位。 另一方面,Agent和AI云之间的关系正在变得更直接。 模型能力如果只停留在API里,就需要企业自己找到应用场景;Agent产品如果跑出来,就能直接创造调用需求。 谁拥有高频Agent入口,谁就更容易把模型能力转化为Token消耗、云收入和客户粘性。 阿里清楚自己需要一个扛旗产品,但眼下,其优势分散在不同板块里。 模型在Qwen,云在阿里云,企业入口在钉钉。它们共同构成阿里的AI版图,却还没有汇成一个外部市场能清晰识别的B端Agent产品。 没有广受市场认可的Agent生态成绩单,正是阿里现在的压力所在。吴泳铭上周面对QoderWork团队的鼓励发言,似乎也是这种压力的真实写照。 QoderWork在阿里内部跑出日活、周活和Token用量第一,但这还远远不够。 资本市场关心的只有一件事:阿里的AI投入能不能变成外部客户、Token调用、付费收入,以及更清晰的增长曲线。 阿里股价的波动,背后正是这种期待的不断回收。 股价层面,市场已经给过阿里AI重估,但这轮重估没有稳定延续。 年初以来,阿里曾因Qwen、云和AI基建投入获得一轮快速上涨。2月,阿里宣布未来三年在云和AI基础设施上投入至少3800亿元时,股价年内涨幅一度超过68%。 但到6月中旬,阿里美股已经回落至112美元附近。上周以来,阿里美股连续七个交易日下跌,6月11日收于112.69美元,较52周高点192.67美元低逾四成。 这说明,市场并非没有给过阿里AI溢价,只是这轮正向预期没有稳定延续。 财报数据同样能解释这种压力。 此前披露的一季度财报显示,阿里云智能集团收入同比增长38%至416.26亿元,外部商业化收入同比增长40%;AI相关产品收入达89.71亿元,占外部收入比重首次突破30%。 但同一季度,阿里集团收入同比增长3%至2433.8亿元,经营亏损8.48亿元。云和AI正在增长,但集团利润端承压,也让市场继续追问这轮AI投入的回报路径。 钱已经花下去,市场接下来要看的,是这些投入能不能换来更多外部客户、更多Token调用和更多收入。 这也是阿里的SOTA焦虑。 这里的SOTA,不只是模型榜单上的第一名,而是市场认知里的第一产品。 阿里站在中国AI公司的绝对第一梯队,但它还没有一个在关键战场上跑到绝对意义第一的产品。 C端,阿里有千问。 QuestMobile数据显示,2026年一季度,豆包、千问、DeepSeek位列国内AI原生App前三,月活分别为3.45亿、1.66亿和1.27亿。千问能稍微压制住元宝,进入C端AI应用第一梯队,但它前面仍然是领跑全行业的豆包。 B端Agent,腾讯正在加速跟进。 腾讯已在一季度财报中披露WorkBuddy进展:按DAU计,WorkBuddy在中国生产力AIAgent服务中领先;CodeBuddy和WorkBuddy保持自然增长,活跃用户留存率超过60%,付费用户留存率超过80%。 阿里的财报中,却难以捕捉到QoderWork和悟空的真实市场表现。 这才是阿里SOTA焦虑的核心。 阿里不是没有模型更新,也不是没有产品动作。6月,QoderWork中国版推出AI生产力计划,免费发放百亿积分,并上线设计、幻灯片、写作等垂直工作台。新一代Qwen也在强化代码、调试、办公流程自动化和多模态Agent能力。 6月,QoderWork中国版推出AI生产力计划,免费发放百亿积分,并上线设计工作台、幻灯片工作台、写作工作台等垂直入口。它不再只把Agent包装成聊天框,而是把任务拆进更具体的办公场景里。 这一步很关键,因为企业用户不缺AI问答入口,缺的是能直接交付结果的工具。 写作工作台对应方案、纪要、周报和文档,幻灯片工作台对应汇报和展示,设计工作台则试图承接图片和视觉物料需求。这些都是互联网企业的高频工作,也是最容易衡量AI使用价值的场景。 这也是QoderWork区别于悟空的一点:它不是从企业组织关系切入,而是从个人生产力切入。 如果说悟空要解决的是“AI如何进入企业工作流”,QoderWork要解决的则是“AI如何变成员工的生产力工具”。 前者更依赖组织权限;后者更容易先跑出个人用户规模。 但在眼下,这些都还只是外部市场的起步动作。 对阿里来说,SOTA焦虑最终要靠产品缓解,纵使模型能力稳定在第一梯队,但只有产品层面的开拓,才能证明这种能力被真实使用。 QoderWork和悟空,现在就站在这个位置上。 谁能先获得市场认可,谁就是阿里AI在商业化领域最清晰的产品锚点。 而在此之前,阿里都只能埋头打磨产品,等待这个答案的出现。
Anthropic即将启用实名制刷脸
新智元报道 【新智元导读】出大事了:Anthropic突发通知,Claude用户7月或将面临实名制「查户口」!从此,每次使用Claude,或许都要准备好身份证了。 Anthropic又出大事了! 最近几天,不少Claude用户打开邮箱,发现了一封来自Anthropic的邮件。 标题平淡无奇——「隐私政策更新通知」。但邮件内容让他们惊呆了:「我们可能会要求您验证年龄或身份。」 有人在X上晒出了邮件截图,评论区瞬间炸锅。 根据邮件内容,从7月8日开始,Claude很可能要向你要身份证了。 Anthropic的实名制验证,终于要来了? Anthropic突然官宣, 实名制真要来了? 6月10号,不少Claude用户的邮箱里收到来自Anthropic的邮件。 邮件中提到,从7月8日起,Anthropic可能会要求用户验证年龄或身份,理由是「加强安全」。 更有意思的是,有人发现自己今天刚收到这封邮件,但其他账号此前压根没收到过,疑似是在分批推送、做灰度测试。 根据邮件中官方更新的隐私政策,核心变化有三条。 第一,多步骤任务与第三方应用的数据流向。 随着Claude能力的提升,它可以代表用户执行多步骤任务(比如帮你规划一次完整的旅行:查航班、订酒店、安排行程),也可以连接第三方应用(比如Google Drive、Slack、Notion等)。 而且,你的数据不再只待在Anthropic的服务器里。 Anthropic在更新后的隐私政策中明确说明:当你连接某个服务或让Claude代表你执行任务时,数据可以在你和第三方之间流动。 这意味着,你的对话内容、上传的文件、甚至你的操作指令,可能会离开Anthropic的服务器,进入第三方应用的处理流程。 对普通用户来说,AI的「代理能力」越强,你的数据足迹就越广。 第二,也是最炸裂的一条:验证数据。 这是本次更新中最具冲击力的内容。 政策原文写道: 作为我们保障服务安全和可靠性的措施之一,我们可能会要求您验证年龄或身份。我们在此说明我们会收集哪些信息以及如何收集。 怎么验证? 根据Anthropic官方支持页面,验证将通过第三方服务Persona进行。 具体流程包括: - 上传政府颁发的、带有照片的身份证件(护照、驾照、身份证等) - 拍摄一张实时自拍照(用于与证件照片比对) Anthropic试图安抚用户,强调这些数据仅用于确认身份,不会用于模型训练;数据不会存储在Anthropic自己的服务器上(由Persona处理);并且整个过程仅针对特定的安全与合规场景。 但这项通知,依然让广大用户瞳孔地震。 X平台上,一位用户晒出邮件截图,配上文字:「6月10日收到的,当时还以为是普通更新……现在回头看,细思极恐。」 还有用户戏称:他们说要验证身份,所以Fable 5要回归了? 第三,研究参与信息。 如果你参加Anthropic的调研、访谈,他们会收集更多信息。 重点来了:以上三个变化,仅针对消费级账户(Free、Pro、Max),商业客户(Team、Enterprise)不受影响。 也就是说,普通个人用户将成为第一批「被验证」的对象。 Anthropic在官方支持页面解释:身份验证此前只在针对未成年人、违规用户或不支持地区账户的特定场景中使用。未来,随着代理任务复杂化,验证范围将逐步扩大。 其实身份验证这件事,Anthropic不是第一次干了。此前在处理未成年人保护、违规账号、以及部分不支持地区的账户时,已经通过类似验证手段。 区别在于,这次的措辞和范围更明确,而且特意点出了一句话——未来随着Agent任务越来越复杂,验证场景可能还会继续扩大。 很多Agent重度用户担忧:以后用Claude跑自动化任务,会不会动不动就被弹窗要求刷脸? 目前官方没有给出更细的触发条件,7月8号之后,大概率会有更具体的说明。 AI的「狂野时代」正在落幕 回想最近闹得沸沸扬扬的「Fable 5被封」事件,一切似乎早有预兆。 当初Fable 5账号因触碰安全红线被而官方封杀,震惊了所有人。 很多人以为,这可能是一次针对个别极端案例的惩戒,但现在看来,Fable 5 的倒下绝不是一个孤立事件,而是 Anthropic 乃至整个 AI 行业全面收紧的前奏。 当 AI 的能力从「陪聊工具」进化为能够操作第三方应用、执行复杂任务的「全能代理」时,官方绝不会允许下一个Fable 5继续在法外之地狂奔。 所谓的「实名制」和「刷脸验证」,标志着在 AI Agent 全面爆发的前夕,各大巨头必须提前建立起坚不可摧的责任追溯机制。 一旦 AI 在代表你执行订票、修改文件甚至更复杂的商业指令时出了乱子,平台必须确切地知道,屏幕背后发号施令的,究竟是哪个真实存在的「人」。 从7月8日开始,每一次你试图让 Claude 帮你完成多步骤的复杂任务,或许都会伴随着一次弹窗:请上传身份证件。 Anthropic的消息透露出——凛冬将至。 从此,刷脸验证,封号清洗,大概率会成为2026年AI行业的日常了。 再过一个月,使用Claude时,得随时准备着举身份证了。 参考资料: https://x.com/ryanmcadams/status/2066201356034011370?s=20 https://privacy.claude.com/en/articles/10301952-updates-to-our-privacy-polic 编辑:Aeneas
特朗普手机终于亮相!博主锐评“廉价又难看”,2年前中端机卖出红米旗舰价
智东西 编译 | 刘煜 编辑 | 陈骏达 智东西6月15日消息,6月13日,测评机构Snazzy Labs在YouTube上放出了对特朗普手机Trump T1的测评视频,该机构的数码博主Quinn Nelson称,T1就是换了金色外壳的HTC U24 Pro,而U24 Pro是中国台湾厂商HTC(宏达电子)两年前推出的中端机型。 ▲Trump T1测评(图源:YouTube) 测评时Nelson称,T1真机外观廉价又难看。具体而言,T1整机的金色涂装色差严重,质感参差不齐。镜头环周边是偏亮的明黄色,镜头外围塑料装饰圈则偏向古铜黄;后盖是反光黄调,氧化铝中框甚至连黄色都算不上,整体偏橘色,观感算不上好看。 ▲Trump T1(图源:YouTube) 此外,Nelson发现,这台手机的指纹传感器出厂就存在故障,部分应用还会闪退,特朗普旗下社交媒体平台Truth Social预装应用也会频繁弹窗,系统更新停留在2月5日版本。 不过,从硬件规格来看,这台手机并不“廉价”。T1搭载骁龙7 Gen 3,属于前代中端芯片,同时配备12GB+512GB存储,电池容量为5000毫安时,屏幕拥有120Hz刷新率。Nelson评价称,T1色彩调校弱于iPhone,但不算差。 T1去年6月16日以定金加尾款形式发售,售价为499美元(约合人民币3371.84元),定金为100美元。当时官方承诺2025年8月左右发货,并特别强调“美国制造”,宣称在美国阿拉巴马、加州、佛罗里达生产该款手机。 在T1手机发布仅6天左右,其官网就悄悄删掉“Made in USA”介绍,改成“以美国价值观设计”。时隔半年左右,这一举动遭美国民主党议员、哈佛法学院前教授Elizabeth Warren公开致信包括FTC(联邦贸易委员会)在内的多个机构,指控其虚假宣传、涉嫌欺诈。 今年4月,T1手机官网甚至直接删掉发货具体日期,改写成“later this year(今年晚些时候)”发货。直到今年5月中旬,T1才开始小规模发货。 如下图所示,T1官网起初发布的渲染图与最终实物在外观设计上有一些区别。T1最初设计的摄像头组件排布类似iPhone 13 Pro,但发货的真机摄像头模组改变了排布方式,周围颜色也从淡黄色改成了黑色,外围由黄色线条勾勒。 ▲T1介绍(图源:T1手机官网) 一、多焦段镜头搭配复古指示灯,塑料机身不防刮 T1整机通体呈黄色,握持手感尚可,手机背部材质为塑料而非玻璃,很容易产生划痕。其系统接近原生安卓,运行比较流畅,但屏幕疏油涂层效果很差,指纹痕迹随处可见。该手机开机画面显示T1标识,带有安卓专属动态开机动画,设计观感上像迎风飘扬的旗帜。 ▲T1开机动画界面(图源:YouTube) 不过,这款手机与同等价位美版三星Galaxy S25 FE相比,不管是各项跑分、相机成像、机身做工、指纹功能还是系统更新都更差。三星Galaxy S25 FE是三星推出的轻旗舰手机,介于三星A系列(中低端)与S25标准版(旗舰)之间。 再与国内手机相比,红米旗下旗舰机K90 Max搭载天玑9500处理器,配备8550毫安时电池、100W快充,但其与T1相同的内存版本售价只需要3699元,基本和T1售价齐平。 T1相机支持1倍、2倍变焦,还有0.6倍超广角镜头。拍摄的照片角落自带时间水印与T1机型标识。另外该机身还保留了绿色状态指示灯,Nelson称,如今的安卓手机已经很少配备这项功能,算是一个实用的复古设计。 ▲T1相机(图源:YouTube) 此外,T1还有一项专属功能Tellihealth(远程医疗),宣称可以借助手机摄像头检测血压。 在T1开始发货前,Nelson在结清尾款时还发生了小插曲:直接结清尾款、开通相关服务是行不通的,必须办理T1所绑定的付费套餐,才能正常支付尾款。该套餐首月费用为47.45美元(约合人民币320.63元),加上税费总计52.37美元(约合人民币353.87元)。 T1手机附赠了SIM卡,即对应前文提到的47.45美元套餐。这张卡通体纯白,没有任何标识和文字。该手机包装盒内配有手机保护壳和一份T1快速入门指南,手机盒盒身还印着“美国本土匠心组装”。说明指南就是最普通的打印纸,碳粉余量明显不足,Nelson称,一看就是喷墨打印机临时打印的。 ▲T1 SIM卡(图源:YouTube) T1标配SCG快充头,产品标注采用氮化镓材质,最高输出功率为30瓦。配套的特朗普移动纸质说明书型号为SGG-06,内容讲解格外细致,连基础操作都一一列明,看得出是面向老年用户设计的。 例如,说明书详细讲述如何拨打电话。用户首先在主界面点击电话图标,再点击拨号键盘,输入号码或联系人首字母,选中联系人后点击拨打按钮。简直像是新手入门教程。 该手机还配有一根USB-C to USB-C编织数据线,不过线材韧性很差,弯折僵硬。 ▲T1数据线(图源:YouTube) 此前网络上普遍传言T1只是换壳版T-Mobile REVVL 7 Pro 5G,后者由中国ODM厂商WingTech(闻泰科技)设计生产。但Nelson拿这两款手机进行对比发现,Trump T1整体品质明显更好,二者屏幕、耳机孔位置、相机模组、内部硬件也全都不一样。 二、机身内部与HTC U24 Pro高度同源,实测排除设备窃听相关传闻 简单上手测评后,Nelson又对T1进行了拆机实测。实测发现,T1与HTC U24 Pro内部结构肉眼可见高度相似。有一处细节不同:Trump T1后盖采用螺丝固定,而非传统的塑胶熔接。 T1的闪光灯与麦克风的位置做了调整,但闪光灯灯珠本体没有改动,只是更换了后盖的柔光罩。同时,这两款机型的NFC模块、无线充电线圈、相机模组、底部组件位置全部一致。 Nelson进一步拆解T1主板,其主板版型、走线、元器件布局与HTC U24 Pro一模一样,两款手机主板可以通用。 ▲HTC U24 Pro(左)与T1(右)主板对比(图源:YouTube) 而这两部手机的核心差异集中在电池。HTC U24 Pro电池型号BTE-4602,额定容量为4450毫安时,额定电量为17.23瓦时;Trump T1电池型号则是BTE-5007,电池容量更大,但充电速度更慢。 另据在线维修社区、DIY维修平台iFixit的首席拆解技师Shahram Mokhtari 6月10日报道,其在对T1和HTC U24 Pro进行拆解对比之后,同样发现二者元器件外形、元器件摆放位置、螺丝点位,甚至防拆贴纸的粘贴位置全都一模一样,仅电池这一核心硬件不同。 ▲T1(左)与HTC U24 Pro(右)电池对比(图源:iFixit) 截至目前,HTC尚未对T1这款产品做出任何表态。Mokhtari称:“这存在两种可能性:其一,HTC将U24 Pro的设计版权出售给了特朗普移动;其二,在我看来可能性更高的是,HTC本身就并不持有该机型的设计版权。” 综上所述,即使官方称T1由美国佛罗里达州的团队使用约十种零部件组装而成,但这并不能代表T1属于“美国制造”。 T1采用双电池接口设计,这类设计常见于大功率快充机型。两款电池都没有预留易拉胶,拆卸过程相对麻烦,不过背胶粘性不强,用异丙醇就能完整取下。 取下电池后,Nelson顺便排查测评T1时出现的指纹传感器故障原因。该款手机屏下指纹模块集成在主板对应位置,拆解后可见模块表面没有防护贴膜遮挡,硬件外观也完好无损。 由此他判断,这一故障原因大概率不是硬件损坏,而是系统底层适配问题,导致指纹模块无法和安全加密区域正常联动。 在测评视频的最后,Nelson对此前T1内置窃听程序的传闻发表看法,称:“我个人并不认同这个说法。倒不是我相信特朗普移动的职业操守,而是以这家公司的技术能力,根本做不出这么复杂的恶意程序。” 因为这款手机本质就是套了新外壳的HTC机型。如果T1品牌选用了一些无良低价ODM厂商,在固件里暗中植入恶意程序,那才确实存在风险。 另外,Nelson在不获取T1最高权限的前提下,使用PCAPdroid这类本地抓包工具监测网络数据,同时配合电脑端Wireshark分析流量对T1的“监听行为”进行监测。 监测结果显示,该设备网络行为完全正常:仅连接谷歌服务、安卓系统后台、应用商店,打开Truth Social时才会与该平台服务器通讯,关闭应用后无后台驻留流量,其余网络请求均指向内容分发网络、系统更新服务器,没有任何异常数据传输,所以不存在窃听行为。 结语:T1为旧机型改款,体验难匹配售价与宣传 综合本次外网博主上手体验、拆机对比可见,在当下竞争充分的智能手机市场,T1的硬件底子、做工品控与定价策略并不具备优势。 针对外界流传的窃听传闻,测评博主通过专业工具监测未发现异常数据传输,相关说法缺乏实际依据。 整体而言,T1是一款基于成熟旧机型改造、附加专属服务与“营销包装”的定制手机,品控表现一般,产品体验与定价并不匹配,其真实制造链路与“美国本土组装”的宣传之间仍存在讨论空间。 来源:Snazzy Labs、iFixit
英特尔公布1.8nm重大进展
具备更高的性能、增强的热特性。 作者 | ZeR0 编辑 | 漠影 芯东西6月17日报道,今日,在夏威夷举行的2026年VLSI(超大规模集成电路)国际研讨会上,英特尔代工公布了其制程路线图和未来技术创新方面的最新进展:Intel 18A系列的首个性能增强版本——Intel 18A-P,现已进入风险试产阶段。 英特尔在标准Arm核心子模块做了测试。与Intel 18A相比,Intel 18A-P在相同功耗下性能可提升9%,或在相同性能下功耗可降低18%,同时具备增强的热特性,在芯片设计上也更灵活。 Intel 18A与Intel 18A-P均为2nm级制程,与台积电N2、三星SF2制程工艺竞争。A是“埃米”,18A即1.8nm,P是指性能增强。 下一代至强服务器处理器(代号“Diamond Rapids”)将采用Intel 18A-P制程,预计2027年上市。Diamond Rapids拥有192核,采用4个计算单元,每个单元均基于Intel 18A-P,每个计算单元包含一个由48个性能核心组成的CPU复合体以及L3缓存。 与Intel 18A相同,Intel 18A-P提供两种单元高度(180nm和160nm),接触栅极间距(Contacted Poly Pitch)为50nm。英特尔代工副总裁Chris Auth在与媒体交流时透露,其160nm方案在与竞品的高性能计算产品对标时,极具竞争优势。 Intel 18A是基础工艺,Intel 18A-P则是其扩展集,不仅提升了性能,还引入更多功能特性,为芯片设计人员提供了从极低功耗到极高性能的完整器件选型。 Intel 18A-P与Intel 18A的设计规则完全兼容,可便捷复用现有IP和设计流程。芯片设计人员无需更改就能将基于Intel 18A构建的芯片设计移植到Intel 18A-P。 在先进制程方面,客户信任来自三大支柱:技术、产能、生态。Intel 18A正全面量产爬坡,缺陷密度走势符合预期发展,良率稳步提升。英特尔正在赢得这种信任。 01. Intel 18A-P: 能效增强,改善热阻,新增晶体管 得益于晶体管、互连和设计技术的协同优化,Intel 18A-P在性能、功耗和设计方面均具优势。 在VLSI研讨会上,英特尔代工的工程师详细介绍了以下技术进展: 1、新增低功耗与高性能晶体管选项。针对低功耗应用,180nm单元高度上新增了W1(宽度为1的器件,超窄扩散区,能在切换晶体管时获得极低功耗),160nm单元高度上增加了W1.5;针对高性能应用,引入了新型双接触晶体管W3P。 下图是芯片设计人员所看到的俯视图布局,上半部分对应180nm单元库,下半部分是160nm单元库,橙色是栅极,两侧是源/漏极,中间紫色/绿色是沟道,180nm上可以用三倍或两倍高度宽度,160nm上可以有三倍、两倍或一倍宽度。 2、新增Power Boost能效增强技术,这是Intel 18A-P的全新双接触、低电阻晶体管方案,可在不增加电容的情况下提升驱动电流,并实现更高的运行频率。 下图左侧是环形振荡器频率与电容的关系,电容能直接反映晶体管大小。W1可优化能耗设计。在标准W2和W3晶体管上,Intel 18A-P所获得的性能主要来自迁移率改善,会有一定频率提升。频率提升更大的来自W3P,在电容不变时性能提升。 图右是RibbonFET晶体管,有4个沟道,所有沟道都汇入源极区域。如果没有背面触点,所有电流必须汇聚并通过正面触点流入。Intel 18A-P在背面加了一个直接触点,利用背面互连给电流多了一条路。正面触点与背面触点之间的连接通过PowerVia实现。 3、针对散热挑战,一是减薄了热载体晶圆并换用新材料,二是引入了热感知EDA工具,在有热的地方会增加更多互连和通孔来快速将热量导向衬底,通过这些材料和设计创新,将热阻降低了20%-40%。 4、利用几何和材料优化,过孔电阻(指芯片各层之间的垂直连接)降低了10%-30%。 5、通过应变工程提升PMOS的迁移率,使电流更高效地通过晶体管。 6、在ULVT(超低阈值电压)和LVT(低阈值电压)之间新增第五组Vt(逻辑阈值电压)选项,为芯片设计人员提供平衡速度与功耗的额外选择。 阈值电压越低,晶体管激活所需的功率就越小,漏电也越大,因此ULVT 晶体管性能最高但漏电最大,HVT晶体管性能最低但漏电最小。新增的超低阈值电压低漏电选项介于ULVT和LVT之间,性能优于LVT,漏电低于ULVT,为芯片设计提供了更大的灵活性。 7、偏差角收紧33%,将工艺波动控制力提升到行业主流水准。偏差角,即客户会看到的晶体管速度分布范围。设计人员需要确保他们的电路在此范围的高端和低端都能正常工作,得在芯片设计中加入大量保护带。Intel 18A-P把Vt波动收窄。设计师就可以把省下来的保护带,转化成更高的性能或者更低的功耗。 02. GAA晶体管与背面供电技术: 布线面积减少11%,频率提升6% 借助Intel 18A制程节点,英特尔代工已将全环绕栅极(GAA)晶体管和背面供电(BSPD)技术推向市场。 面向未来的逻辑芯片设计,英特尔的工程团队在会上探讨了这些技术如何在性能、能效和微缩方面奠定基础。 GAA方面,与许多正在推出GAA晶体管的公司采用的3条纳米带不同,英特尔全新RibbonFET架构采用4条纳米带(ribbon),以提供更大的驱动电流。 背面供电方面,当互连线不断缩小、芯片尺寸缩短时,电源线与信号线之间会产生一种“争夺”,电源线负责将电力送到晶体管,它又大又粗,电阻才又很小,而信号线负责晶体管之间的通信,需要远离任何相互干扰,两者之间存在“粗线与细线”的竞争。 而英特尔的做法是,把电源线移到背面,正面只留信号线,背面专门走电源,这样电力就能直达晶体管,同时腾出了电源线的空间,减少了位于正面的信号线之间的干扰。 英特尔代工副总裁兼英特尔院士Eric Karl展示了英特尔如何量化背面供电和GAA晶体管的优势。 这些技术与同类正面互连技术相比,可减少11%的布线面积,并将动态压降幅度缩小至1/10,从而实现高达6%的频率提升,或超过15%的动态功耗降低。 英特尔代工硅片与平台工程团队的Manju Shamanna分享了基于GAA晶体管和背面供电技术制造的CPU核心的硅片测试结果。 其研究表明,这两项技术在较低电压下(约0.5V)可实现约30%的频率提升,同时减少了IR(内阻)压降,运行也更高效。 03. 面向未来的技术创新: CFET、GaN+硅集成、减成法钌互连 英特尔代工还在VLSI研讨会上介绍了在多个对未来芯片微缩至关重要的领域的长期研究进展,分别对应晶体管架构、电源管理和互连材料三个方向。 (1)互补场效应晶体管(CFET):英特尔展示了单片式CFET反相器,其NMOS与PMOS器件垂直堆叠,栅极间距为45nm。通过垂直器件架构,英特尔为在GAA晶体管之后继续推进逻辑微缩开辟了新路径。 (2)面向电源管理的氮化镓+硅集成:英特尔展示了300mm晶圆上的单片集成技术,将氮化镓功率器件与硅基逻辑(包括一个约1000个逻辑门的数字控制模块)集成在一起,使得高效、大规模的数字控制能够与高性能功率器件在同一工艺下协同工作,并降低系统复杂性。 (3)减成法钌互连(Subtractive ruthenium interconnect):英特尔展示了采用空气间隙集成的减成法钌互连技术,与铜互连相比,电容降低多达约35%,且频率提升显著,为随着互连尺寸持续缩小而改善电阻电容指标提供了一条可行路径。 04. 结语:2nm制程竞赛升温 进入2nm级竞争,头部芯片制造商们不仅在打今天的仗,还在布未来的局。 如今AI的发展正在被芯片制造束缚。从AI训练到推理侧的算力成本,最终会传导到最底层。任何在芯片制造工艺上抠出来的能效,都是真金白银。 通过将Intel 18A-P推到风险试产阶段,英特尔将高性能计算和AI基础设施的地基往下再夯一层。 “我们在VLSI研讨会上展示的最新进展和所作的报告,向英特尔代工的客户和合作伙伴传递了一个明确信号:我们长期坚定致力于前沿制程创新。”英特尔代工执行副总裁兼总经理Naga Chandrasekaran说,“这是一段持续推进的旅程,前方仍有更多工作要做。”
1454亿市值狂欢背后,亿纬锂能“烧钱”赶路 | 风眼观察
摘要: 一份超预期的中报预告,让亿纬锂能股价单日大涨13%。但真正引发分歧的,并不是增长本身,而是利润结构:它到底有多少来自真实经营改善,又有多少来自周期与策略的叠加效应?在储能价格战仍未结束、扩张仍在继续的情况下,市场正在重新判断它的盈利成色。 凤凰网科技《风眼观察》出品 作者|路春锋 编辑|董雨晴 一个被市场迅速定价的“超预期利润” 6月15日晚间,亿纬锂能抛出一份颇具冲击力的中报预告:归母净利润31.3亿~33.71亿元,同比大增95%~110%。 图|源自企业公告 次日,市场迅速给出反馈——6月16日股价上涨13.8%,收报66.88元/股,市值回升至1454亿元。 过去一年,在锂电产业链深陷价格战、企业利润普遍承压的背景下,这样的增长甚至被不少人视为行业触底反弹的明确信号。 但问题在于,这份利润增长,究竟来自经营质量的修复,还是来自周期与策略的阶段性共振? 从结构上看,净利润增速接近翻倍,而公司同期披露的营收增速约为60%。利润弹性显著高于收入扩张,这种差距通常不是单纯来自制造端的自然改善。 公司在公告中给出的解释是:“主动实施前置管理, 通过供应链多元化布局、 战略性采购规划及审慎运用金融工具, 缓冲了材料成本上涨波动,确保了主营业务盈利能力的稳定性。” 翻译成大白话就是,在原材料便宜的时候提前多买、锁住价格,同时通过一些金融工具对冲价格波动。这样,即使后面价格上涨,公司成本也不会被动抬高,从而让利润更稳定。 这一点,与过去两年碳酸锂价格的剧烈波动有关。据上海钢联数据,电池级碳酸锂价格在2024年初一度跌破10万元/吨,较2022年高点下跌超过80%,随后在2025年二季度触底后开始反弹。截至2025年底,电池级碳酸锂现货价格回升到约10万元/吨,期货主力合约突破12万-13万元/吨,较年中低点实现翻倍。 在这样的背景下,中游电池厂普遍采取三种策略:低价阶段提前锁定原材料、长协采购平滑成本、使用期货与衍生品进行套保 亿纬锂能的利润改善也与此相关。比如在2025年年报中公司提到,通过布局上游锂资源,与上游供应商建立长期合作采购机制,平滑原材料价格波动风险;针对碳酸锂、铜等原材料预期采购开展商品期货套期保值,对冲原材料价格大幅波动对经营的影响。 从这个角度看,亿纬锂能上半年的利润高增,并不完全来自当期业务盈利能力修复,还有很大一部分来自低价囤货与套保策略的成功兑现。换句话说,这部分利润具有一定的“金融属性”,其可持续性取决于原材料价格走势,而非企业自身效率的持续改善。 进一步对比今年一季度情况,也能看出这一特征。当时,受碳酸锂涨价暂未完全向下游传导等因素影响,毛利率降至14.0%,环比下滑2.8%,“但公司通过前瞻布局套期保值的方式,保持了净利率的稳定。”中信建投证券在研报中提到。 这也引出了市场更核心的疑问:剥离掉原材料价格波动和金融工具的影响后,亿纬锂能的真实盈利能力究竟恢复到了什么程度? 所以,与其将这份预告视为行业全面反转的起点,不如回归业绩本身。待正式财报披露时再看,剔除周期与策略因素,亿纬锂能靠制造本身究竟赚了多少钱。 二线梯队选手,豪赌一切 如果把时间拉回到几年前,亿纬锂能的故事还相对简单:一家由动力电池、储能电池与消费电池构成的多元电池公司。 其中,动力电池面向新能源汽车与商用车,是强周期、高资本开支赛道,对标宁德时代;储能电池则是近年来增长最快的板块,但价格竞争激烈、毛利率持续承压;消费电池相对稳定,主要提供现金流与利润缓冲。 但最近2年,这条主线开始出现了拐点。从经营结构看,动力与消费电池两块仍是公司的基本盘,但储能成了决定盈利波动的突出变量。 今年3月,亿纬锂能曾在11天内合计宣布约230亿元的投资计划,规划新增储能及动力电池产能高达230GWh。 一个在去年只有41亿归母净利润的二线梯队选手,突然宣布了一项如此巨大的投资规划,背后到底在豪赌什么? 亿纬锂能高级副总裁陈翔接受新京报采访时非常直白的表示,AI的快速迭代催生了对算力的极致需求。承载这一需求的人工智能算力中心(AIDC)基础设施,其高功率密度、高供电可靠性的特性以及快速迭代的节奏,为储能行业带来了发展新契机。 数据中心到底有多费电?吴泳铭曾在2025年云栖大会上表示,到2032年阿里云全球数据中心能耗将提升10倍。 然而这个当前仍旧较为分散的市场,不再是高成长与高利润并存的甜蜜区间,而是迅速演变成锂电产业中竞争最激烈的战场。价格内卷、产能扩张、客户议价能力增强,几乎同时发生。过去三年在抢占市场的过程中,储能电池的单价持续下降。即便亿纬锂能的出货量已经做到全球第二,但规模始终没转化为利润护城河。 对比龙头宁德时代仍能维持超过26%的储能系统毛利率,亿纬锂能的储能毛利率在过去三年持续下滑,至2025年仅约12%。 也正是在这个阶段,亿纬锂能竟然开始加速“跨界”:人形机器人、电动机器狗、各类具身智能终端——几乎所有与“未来场景”相关的电池需求,亿纬锂能都在布局。 在这一点上,亿纬锂能更像是在跟随。韩国的LG新能源,在今年初的一次电话会议中披露,已向超过6家机器人客户供应电池样品,并与行业头部企业协调量产时间。同时,它的电池已经进入了波士顿动力Atlas人形机器人项目。 从产业逻辑看,虽然机器人的空间比汽车小得多,但对能量密度和功率输出要求更高,而这恰恰是电池企业最擅长解决的问题,也是最有可能建立壁垒的方向。 但问题是站在2026年的时点,无论是人形机器人还是机器狗,都还处于样品验证、小批量交付和联合开发阶段,距离规模化放量还有很长的距离。 回到亿纬锂能,虽然它的扩张是有订单支撑的。公开资料显示,自2025年一季度起,其储能产能基本处于满产状态,2025年储能电池出货71.05GWh,产能利用率87.82%左右;另据华泰证券研报,6月在SNEC展会期间,亿纬锂能又获得了超过67GWh的订单量;再加上此前陆续披露的4个合计 230GWh 的产能,“公司订单饱满支撑未来出货”,华泰证券表示。 不过,财务方面的压力也在叠加。2025年虽实现营收614.7亿元,但归母净利润仅微增1.44%至41.34亿元,扣非净利润甚至下滑2.09%,陷入“增收不增利”的困境。核心问题就是储能业务深陷价格战,毛利率降至12.28%。 与此同时,庞大的资本开支导致公司自由现金流为负。截至2025年末,公司资产负债率攀升至64.18%,有息负债逼近330亿元,在货币资金仅85亿元的背景下,百亿级的年均资本支出使其高度依赖外部融资输血。 在储能毛利率持续下滑、行业竞争加剧的背景下,公司没有像LG新能源那样,通过削减资本开支来控制节奏,而是仍在推进主业扩张的同时,同步布局机器人等多个尚未成熟的新方向。这使得其第二曲线,不是在赚钱很多的基础上顺势扩张,而更像是在主业利润承压的之时提前投入布局。 当主业回报率下降,而新业务又处于投入期,两条业务之间不仅尚未形成接力,反而同时消耗资源。 从这个角度看,机器人电池未必是一个错误方向,但它更像是一张远期期权,而不是当下的解药。真正的变量不在于它能否成功,而在于它兑现价值的时间,是否跑赢主业承压的速度。当前的亿纬锂能,正绷紧了这根弦。
全国产!北京AI大模型芯片流片
3D混合堆叠架构,16TB/s超大访存带宽。 作者 | ZeR0 编辑 | 漠影 芯东西6月17日报道,今日,北京AI芯片创企算苗科技宣布,其面向大模型推理的第一代3D TokenPU芯片A4E已于今年6月15日正式流片,第二代芯片A4S定义基本完成,预计2027年2月流片。 A4E是一款依托国产供应链、采用3D混合堆叠架构的大模型专用处理器,旨在提供自主可控、高性能、高性价比的算力支撑。 算苗科技成立于2022年11月,专注3D架构AI云端大算力芯片研发设计,定位为大模型时代原生的算力芯片企业,首创3D TokenPU架构,跳出通用GPU的设计思路,专攻推理场景极致性能。 其核心客户为头部大模型厂商,已联手客户开展近一年的深度研发工作;从芯片定义阶段便针对真实推理场景需求,完成架构与底层算法深度调优。 “我们不是在别人的赛道上追赶,而是在开辟新的方向。”算苗科技创始人兼CEO汪福全博士说,“3D TokenPU专为大模型Token处理而生,不必单纯依赖制程缩小,就能实现算力密度、能效比的跨越式提升。” 3D混合键合技术通过缩短信号传输距离,能极致提升“性能功耗比”,是解决大模型计算饥渴与降低推理成本的有效路径。 算苗科技第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统芯片间的“毫米级”传输距离压缩两个数量级,带来16TB/s的超大访存带宽,有效缓解数据饥饿问题。 在架构设计方面,算苗科技引入Tile-Native软硬件协同理念,将Tile作为数据搬运、存储和计算的基本单元,实现“一次搬运、多次复用”的高效模式。 其硬件原生支持Tile级数据调度与多精度动态切换,软件端则构建适配LLVM、Triton等开源生态的编译工具栈,兼顾开发者友好性与算子优化效率。 这种“硬件架构-软件工具-算法特性”的闭环优化,为大模型推理提供了更高性能和更低TCO(总拥有成本)。 算苗科技已构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。 A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造,与国内头部供应链伙伴深度合作,采用成熟国产工艺也可实现卓越推理性能。 在工程化量产层面,算苗科技核心成员已在高通量存算一体芯片项目中,完成万片级3D混合堆叠晶圆的量产,是全球少数掌握该技术的团队之一。 算苗科技高管团队中,汪福全曾带领团队成功研发全球首款存算一体高通量算力芯片。 他在中科院声学所国家重点实验室攻读博士、做研究员期间师从水声物理学界泰斗张仁和院士,从事高通量阵列信号处理技术研究,毕业后在中科院计算所开展计算机体系结构专业博士后研究,合作导师为龙芯首席科学家胡伟武。 楼建光于2025年9月加入算苗科技,现任首席人工智能科学家。他博士毕业于中国科学院自动化所,师从谭铁牛院士,拥有20年机器学习、自然语言处理、人工智能和软件系统AI的研究和应用经验,是汪福全在浙大的师弟,加入算苗前曾担任微软研究院首席研究员。 其他高管中,联合创始人兼CTO刘明是中国科学院计算所博士,师从胡伟武研究员,在龙芯从事半导体研发15年,拥有两次3D堆叠芯片研发成功的经验,在算苗科技负责芯片定义;首席算法科学家闫超是中国科学院声学所博士,是汪福全的学生,拥有12年龙芯处理器研发经验、15年算法与系统研究开发经历;首席软件架构师魏永明本硕毕业于清华大学,是开源项目MiniGUI/HVML的创始人,拥有数十项软件发明专利及出版物。 算苗科技研发人员约190人,占比超过80%,来自中科院、清华、北大等院校的研发人员占比达20%,预计今年年底研发团队可扩张至300人。 该公司已完成多轮融资,投资方包括国开金融、北京顺禧等国资基金,石溪资本、联想创投等产业资本,以及源码资本、襄禾资本等投资机构。
SpaceX继续造富:600亿收购让这四位20多岁创始人成亿万富翁
桑格、卢内马克、阿西夫和特鲁尔 凤凰网科技讯 北京时间6月17日,据彭博社报道,随着SpaceX斥资600亿美元收购AI编程工具Cursor,后者的四位年轻创始人跻身亿万富翁行列。 2022年,大约在ChatGPT和GitHub的Copilot将AI带向大众市场的时候,四位拥有计算机科学和金融背景的麻省理工学院同窗决定也要参与这场浪潮,只是当时他们还不太清楚该从哪里切入。 “一开始很像拿着解决方案找问题。”Cursor联合创始人兼CEO迈克尔·特鲁尔(Michael Truell)在2025年6月的一次播客节目中说。Cursor正是他们共同创办的公司。 除了特鲁尔外,Cursor另外的三位联合创始人是苏阿莱·阿西夫(Sualeh Asif)、阿维德·卢内马克(Arvid Lunnemark)和阿曼·桑格(Aman Sanger)。特鲁尔是纽约市人,曾在谷歌实习。桑格是麻省理工壁球队成员,曾在桥水联合基金实习。卢内马克在其祖国瑞典曾获数学奥林匹克金牌,曾在简街资本短暂担任量化交易员。 四年后,Cursor已经成为市场上最受欢迎的AI编程工具之一,而他们当初那个“解决方案”如今让四人都成为了身家数十亿美元的富豪。 周二,SpaceX正式同意以全股票交易方式收购Cursor,该交易对公司的估值为600亿美元。彭博亿万富翁指数显示,四位联合创始人均持有Cursor开发商Anysphere公司大约9%的股份,分别价值55亿美元。 该交易预计于今年第三季度完成,届时他们将获得等值的SpaceX股票。 这四位联合创始人年纪都在25岁上下,他们加入了自SpaceX上周五上市以来不断壮大的亿万富翁行列。他们的故事也象征着年轻创始人通往亿万富翁的路径正在发生变化:AI热潮以及风险投资支出的激增,使得新晋亿万富翁越来越多地来自科技行业,而不再主要来自金融行业。 截至发稿,Cursor尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
上一发才两天!中科宇航刷新交付速度:力箭一号遥十五顺利出厂
快科技6月17日消息,今日,力箭一号遥十五运载火箭在中科宇航产业化基地如期完成总装测试工作,顺利通过出厂评审,拟于近期在东风商业航天创新试验区执行“一箭5星”发射任务。 这次再度刷新型号交付纪录,距离6月15日力箭一号遥十四运载火箭“一箭8星”发射任务圆满收官仅间隔两日,实现发射任务收官与新箭出厂高效接续。 当前力箭一号已实现“月月火箭出厂、月月实施发射”的高密度运营节奏,全面印证该型号已具备批量存储、滚动备份、快速发射的成熟运营能力。 依托生产基地脉动式流水线高效生产模式,以及研发、试验、生产、发射全链条自主可控完整体系,力箭一号高密度、低成本、快响应的规模化交付硬实力持续筑牢。 按照规划,力箭一号下半年将开启月月有发射的陆地常态化发射模式。 在此基础上,团队同步推进海上发射布局,此前多项海上发射关键技术已完成验证,目前相关任务筹备顺利,火箭已完全具备海上发射条件。 下半年将在保障陆地发射频次的前提下,开展两次海上发射任务。 力箭一号是中国科学院力学研究所抓总、中科宇航研制的四级固体运载火箭,2022年7月27日首飞,为中国现役最大固体运载火箭,也是目前最稳定的民营火箭。 总长30米、芯级直径2.65米、起飞重量135吨、起飞推力200吨;500公里太阳同步轨道运载能力1.5吨,近地轨道2吨,拥有快速响应、高可靠、低成本的优势。
阿里又放大招!一句话,造一个能走进去的世界
新智元报道 【新智元导读】今天,阿里重磅上线HappyOyster 1.0世界模型,一句话直接生成可实时探索、物理交互的开放世界! 「快乐生蚝」,真的来了! 今天,阿里正式放出了HappyOyster 1.0——这是一款可实时构建和交互的开放式世界模型产品。 一句话,即可生成一个完整、可演绎、可探索、可互动的数字世界。 2个月前,阿里曾把「快乐生蚝」放进了公众视野,如今这只生蚝终于长成了1.0。 一句话,一个世界,这次是真的实现了。 世界模型,AI下一个战场 过去两年,文生视频已经相当成熟。 输入一句话,等上几十秒,就能拿到一段成片,它把「文本变成画面」这件事,做得很好。 只不过,成片有它天然的边界:画面生成完,这段视频就定稿了,你能做的是「看」,而不是「参与」。 而世界模型想做的,是另一件事:让你不只是看一段视频,而是走进一个能实时互动、随时改变走向的世界。 这无关谁取代谁,文生视频交付的是「一段结果」,世界模型为你创造的是「一段体验」—— 你给一张图、一段话,它生成的那一刻,体验才刚开始。 那它具体是怎么做到的? 它把视频,当成一个需要被持续推演的世界状态,学习世界如何随时间演化的规律—— 空间怎么连续、物体怎么守恒、动作之后会引发什么反馈。 它要做的,不再只是「把内容生成出来」,而是「把一个世界持续推演下去」。 放眼全世界,硅谷大厂、AI大佬创业公司,纷纷押注「世界模型」这一赛道。 这其中,不仅有谷歌DeepMind的Genie,也有李飞飞团队倾力打造的Marble。 在这场角逐中,阿里HappyOyster强势入局,路线非常明确:主动式、实时—— 你说话的同时,世界就在回应你。 HappyOyster命名的灵感,来源沙翁的名言——The world is your oyster(世界是你的牡蛎 ,撬开它) 如今,阿里把将这句箴言刻印在「世界模型」上,态度很直白:世界,由你来撬开。 快乐生蚝,一手实测 这一次,HappyOyster 1.0核心版本升级,主打两大功能—— 世界探索(Adventure):你就是世界里角色的一部分,一句话、一张图,即可开启任意世界的探索。 实时导演(Directing):你就成了那个站在世界之上的人,去导演一整个故事。 百闻不如一见,接下来,我们将开启一场全面的硬核实测。 世界探索:你就是世界里的「主角」 一句话或一张图,你就进入一个可漫游、可战斗、可互动的开放世界。 第一人称、第三人称随你切,还支持1分钟以上的实时位移与镜头控制。 「世界探索」新增了一整套丰富的交互动作:前冲 / 加速、下蹲、攻击、跳跃,还支持更复杂的环境交互——乘坐驾驶载具、使用各类武器战斗。 它真正把「看一个世界」变成了「在一个世界里活动」。 下面这个测试中,我们让HappyOyster 1.0生成了两个壮汉在地下拳馆格斗的场景。 这一场格斗里,攻击、跳跃、闪避这些动作,都是实时操控出来的——出拳、反击、再追打,节奏完全跟着指令走。 关键是,一拳打出去,命中之后对手会触发「踉跄倒退」的受击反应。 HappyOyster凭借着对客观世界的理解能力,根据场景实时演化对应的物理交互,让各种复杂动作实时发生。 自动播放 除了战斗场景外,HappyOyster 1.0还可以丝滑处理各类连贯交互动作。 下面这个地牢测试中,人物竟可以主动使用道具——火把。而且,场景的光照状态完成了合理的切换。 自动播放 再比如这台复古老爷车,你可以指挥人物开门、上车,再操控他把车开出去。 从「看一辆车」到「上车把它开走」,中间差的就是能不能实时操控这一步。 自动播放 世界会不会对动作做出实时反馈,雪地是个很好的试金石。 比如下面这个视频中,一名探险者深一脚浅一脚走过厚雪覆盖的山脊,每步留下脚印、踩塌的雪扬起雪粉。 自动播放 更关键的是,不管世界换成什么画风,任何人都能一样地走进去、实时下指令。 如下视频中,是一个黏土风格的微观厨房,可以指挥角色在这个小世界里走动、探索,想去哪、做什么,都是实时演化说了算。 自动播放 实时导演:站在世界之上,一边演一边改 Directing模式能直接让你当导演。流式生成、即说即演,随时注入指令改走向。 它的三大特性,每一条都是一种全新的交互体验: 暂停:任意时刻冻结世界,想好了再继续; 回溯:演到一半折回任意节点重新来过,原版本保留不丢; 剧情分支:从同一个节点分叉出完全不同的走向。 加上首发的多模态参考(用@图片锁定角色外观,3分钟长程一致),试错成本被压到了极低。 通过HappyOyster,便可以第一视角沉浸式体验和数字人的交互,包括捏脸、说话全部都是实时的。 自动播放 亦或是,化身为漫剧导演,亲自执导一场霸总大戏。 剧情的走向、角色的命运,一切全都由你的想象力来主宰。只需在对话框中,输入指令,AI便会按着剧本来演了。 自动播放 创作过程中,可以随时喊停,等创意想好了还能继续。 再来一部「后宫甄猫传」,一个人就能导演一部戏。 自动播放 再来看下面这个demo,二次元老婆换装,想要哪种风格的,一句话直接搞定。 自动播放 核心技术拆解 HappyOyster 1.0 和我们熟悉的文生视频模型,不是同一类东西。 差别不在画面,而在两者学习的目标。 文生视频学的是「文本→视频」的单向映射——给一段描述,产出一段对应的成片,生成完,这件事就结束了。 世界模型则不同,它学的是:当前状态+你的动作 → 下一个状态的转移规律。 模型必须先理解当前的场景结构、实体属性、物理关系,还要在你随时丢过来指令的情况下,准确预测并渲染世界的下一个状态。 用户不再是被动的观察者,而是可以在「世界」里持续交互——体验的核心是中途互动本身。 那么问题来了,HappyOyster 1.0 是怎么把这件事做成的? 它的技术优势可以概括为四点,层层递进。 第一,世界状态建模——世界能持续跑下去的基础。 HappyOyster 把世界的当前状态压缩成一份紧凑的隐状态摘要(Latent State),每生成一段内容就更新摘要,再把更新后的摘要递归传给下一段。 这就像是一场接力赛跑,上一棒把「关于现在世界的一切」写成一张小纸条递给下一棒。 纸条在手,世界的因果就一直接得上——几分钟跑下来,世界不会乱、因果关系不会断。 更关键的是,正因为状态摘要可序列化、可存档,HappyOyster 1.0 才得以支持暂停、回溯和剧情分支这些进阶功能。 第二,内生一致性——世界「不崩」的保障。 HappyOyster 以持久的参考表征参与全程注意力。 简单理解就是,进入世界时给每个人物、每件关键道具发一张「身份卡」,模型全程带着这张卡生成。 这样,当角色转个身、被挡住,甚至走出画面过几分钟再出现时,长相、衣着、物品都不会变样、不会变形。 一致性不靠运气,而是从架构层面就是内生的。 第三,开放因果动作空间——世界「能玩」的核心。 世界生成稳了,接下来的关键是怎么和它交互。 HappyOyster 的做法是让动作指令和自然语言共享同一套语义接口,不需要预定义动作集。 比如,用户按下「攻击」键,HappyOyster不只是播一个「挥剑」的动画,它能自主推演出整条因果链—— 出手→命中→NPC 受击倒地→地面扬尘→旁边的酒杯被震落。 这些因果不是开发者一个一个写好的脚本,而是模型通过大规模因果训练自己学会的。 正因如此,它能自然迁移到从未见过的场景,并根据用户指令推理出新的因果关系。 这是世界模型区别于靠脚本与逻辑拼接的「游戏引擎」的最本质之处。 第四,长时序音视频协同——世界「活着」的质感。 最后一层是感官的完整性。 HappyOyster 的音画是在同一世界状态下联合解码生成的——世界状态展开的同时,声音和画面一起长出来。 脚踩碎石有碎石声,引擎加速有轰鸣,风穿过峡谷有呼啸声——声音不是后期配的,是世界本身的一部分。 这四个点合在一起,HappyOyster 就成为了一个可持续推演的世界模拟器——跑得久、不会崩、可控制、有声音。 从「技术玩具」到「生产力」 谁会最先用起来 HappyOyster 1.0的想象空间,远不止「玩」。 把它放进各行各业,会看到一条共同的主线:每个场景的价值都不在画面本身,而在「实时互动」。 用户能在生成过程中随时介入、即时改变世界的走向。 对不同落地场景来说,这正是世界模型这个新品类最有想象力的地方。 交互式游戏是最直接的落地场景。 传统的开放世界原型验证需要几个月建资产库、搭物理引擎、调NPC行为树。 现在一句话,就能生成带实时物理反馈的开放世界原型。 从FPS战区到国风武侠对决,策划用它验证关卡、测试NPC交互逻辑、感受战斗节奏,而玩家的每一次操作都在实时驱动事件走向。 速度从以周计缩到以小时计。 实时虚拟陪伴,是「世界探索」与「实时导演」都能托起的方向。 它能实时生成一个随时可交互的虚拟角色:能听能说、长时间相处还保持一致,用户可以随时指挥它的动作。 虚拟伙伴、数字人IP、品牌虚拟形象,都能借此从「播一段片」升级为「实时陪着你」。 在互动短剧上,HappyOyster 1.0的暂停、回溯、分支三件套,等于把「分支叙事」的能力直接交给了创作者。 一个开头分叉出十条故事线,观众能在关键节点注入自己的指令、实时改写走向—— 名场面重写结局、POV恋爱互动,制作方式也从「预先拍好多条线、每条都花钱」变成了「实时生成任意一条线」。 还有直播,是「实时」属性最天然的落点。 场景与角色都是实时生成的,主播或观众的一句指令就能即时改变画面走向。 无论是虚拟主播,还是实时互动直播,观众都不再只是「看」,而是能直接参与到画面的演化里。 文旅与虚拟体验则把「去哪、看什么」实时交给用户,同时利用世界模型在「无真实数据场景」中的模拟能力。 月球表面、海底宫殿、高魔幻境——这些现实中拍不到的地方,HappyOyster能在像素空间里持续模拟出来。 写在最后 HappyOyster 1.0版本把「一句话造世界」从概念变成了今天就能用的产品。 而据官方透露,API预计7月初开放——届时,开发者和B端的生态想象力还会进一步打开。 国内站 www.happyoyster.cn 已上线,手机号即可注册,每天登录送免费创作积分。 剩下的,就交给你的创造力了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。