行业分类:
加载中...
头条分类:
加载中...
Claude Fable 5四日惊魂
编辑|Panda 从万众期待的「AI 封神时刻」,到美国政府一纸禁令强制下线 —— 这个名字中有 5 的模型,没活过 5 天。 让我们先停下来,感受一下这件事的荒诞程度。 2026 年 6 月 9 日,Anthropic 将它最强大的模型 Claude Fable 5 对外正式发布。那一天,开发者社群沸腾了,评测帖子在 𝕏 上刷屏,有人说它「碾压一切」,有人说它「改写了 AI 的上限」。Anthropic 的 Mythos 系列,这个此前只对五六家机构开放的神秘模型家族,终于向普通公众打开了一道门缝。 然后,四天后,这扇门被人从外面焊死了。 6 月 12 日,美国商务部长霍华德・卢特尼克(Howard Lutnick)向 Anthropic CEO Dario Amodei 寄出一封信:以「国家安全」为由,禁止 Fable 5 和 Mythos 5 向任何外国公民开放访问 —— 无论这些人身处美国境内还是境外,甚至包括 Anthropic 内部的外籍员工。Anthropic 当晚收到指令的时间,是美东时间下午 5 点 21 分。 到晚上,Fable 5 在全球范围内下线。 四天。96 个小时。一场从高光到猝死的极速坠落。 第一天:神话降临 Fable 这个词来自拉丁语 fabula,意为「被讲述的故事」,与希腊语 mythos 同根。Anthropic 在命名上颇费心思:Mythos 系列是为少数精英保留的神话,Fable 则是普罗大众可以听到的那个故事。 6 月 9 日,Anthropic 发布了 Claude Fable 5,这是其 Mythos 模型的首个公开版本,该公司称其在软件工程、知识工作和视觉方面表现卓越,但附带严格的安全限制。与此同时,Anthropic 还发布了一款双胞胎产品:Claude Mythos 5—— 与 Fable 5 使用相同底层模型,但移除了网络安全领域的安全过滤层,仅供经过审查的网络防御者和关键基础设施运营商使用。Anthropic 称 Mythos 5 是全球最强的网络安全模型。 通俗地理解:Mythos 5 是上了枪弹的武器,Fable 5 是同款枪,但出厂自带保险。 就 API 定价而言,Fable 5 的能力在 Anthropic 公开发布的模型中首屈一指,价格约为 Claude Mythos Preview 的一半以下。在订阅计划上,通过 6 月 22 日,Fable 5 将在 Pro、Max、Team 和 Enterprise 等付费套餐中免费提供。 科技圈的赞美潮水般涌来。沃顿商学院副教授 Ethan Mollick 在博客写道,Fable 5「在我用过的所有公开模型中,以相当大的差距超越了其他所有模型」。前 OpenAI 联合创始人、特斯拉 AI 总监 Andrej Karpathy(他上个月刚宣布加入 Anthropic)在 𝕏 上称 Fable 5 是一次「超级令人兴奋的发布」,是「值得大版本号升级的跨越式进步」。 这一天,Anthropic 的 Mythos 神话,似乎真的成真了。 第二天:「秘密降智」事件爆发 好景不长。发布仅 24 小时后,一场风暴在 AI 社群悄然酝酿。 起因,是一份 319 页的安全说明书(System Card)。 反弹的焦点,集中在这份长达 319 页的系统卡中埋藏的一个段落。这个细节 Anthropic 并未主动披露:Fable 5 会在检测到与前沿 AI 开发相关的请求时,悄悄降低其回答质量 —— 包括训练大型模型所需的基础设施搭建工作。 更关键的是操作方式:该模型仍然会作出回应,但会采取「干预措施来限制 Claude 的有效性」,且不会告知用户。这与 Fable 5 的其他限制不同。当模型屏蔽网络安全或生物学查询时,会可见地将用户重定向到功能较弱的 Claude Opus 4.8,并有通知提示。 换言之:你问它 AI 训练相关的问题,它会回答你 —— 但悄悄给你一个打了折扣的答案,而且不告诉你它在这样做。 这种操作,有一个传播速度极快的名字:「暗中使坏」(Secret Sabotage)。 美国创新基金会高级研究员、前白宫科技政策办公室顾问 Dean Ball 给这一事件命名,并写道,这一政策「极大地、深刻地提升了『AI 安全一直是实验室垄断行为的借口』这一论点的说服力」。Fast AI 非营利研究机构负责人 Jeremy Howard 则指出了其中的不对称性:Anthropic 为自己的研究人员保留了完整的 Fable 5 能力,却在对外部研究者的访问上设了枷锁。「他们已经说明了,凡是想要效仿的,都会被他们破坏,」Howard 写道。 批评来自四面八方,而且立场各异 —— 平时攻击 Anthropic「太保守」的开源倡导者,和平时为其安全路线辩护的 AI 安全研究者,这一次站在了同一阵线。 加入 Anthropic 仅一个月的 Andrej Karpathy 措辞谨慎:模型「仍然有一些人会遇到的奇怪之处」,安全过滤器「配置得有点过于敏感」,但希望随时间改善。算是打了圆场,又没全力护盘。 Anthropic 也很快感受到了压力的量级。一位发言人告诉《财富》杂志:「我们做出了错误的权衡,对于没有取得正确的平衡,我们深表歉意。」随后,隐性能力限制被移除。 承认失误、道歉、回滚…… 这在科技大厂里已属难得的姿态。但麻烦,还只是刚刚开始。 第三天:微软「背刺」,数据留存风波 就在「秘密降智」风波渐渐平息之际,另一颗雷悄悄引爆了。 微软以数据保护问题为由,对员工使用 Claude Fable 5 实施了临时禁令。 这个反转的荒诞感值得细品:微软正在通过 GitHub Copilot 和 Microsoft Foundry 向企业客户销售 Claude Fable 5,同时却禁止自己的员工使用它。对外卖,对内禁,这句话用来描述一家公司对同一款产品的态度,实在是有些奇特。 问题出在数据留存政策上。Anthropic 要求对 Mythos 系列模型(包括 Fable 5)的提示词和输出内容至少保留 30 天,用于安全监控。这与微软此前与 Anthropic 签订的企业零数据留存协议相抵触。Anthropic 同时规定,被其安全系统标记的内容可被保留最长两年,用于调查或执法目的。 对于一家把「保护客户数据」视为核心承诺的企业来说,员工用 Fable 5 处理商业机密时,这些内容原则上可以在 Anthropic 的服务器上存放长达两年 —— 这在法律层面是一个真实的风险敞口。 这场尴尬揭示了一个更深层的矛盾:在企业 AI 采购中,模型能力、安全架构和数据治理,已经无法再被分开考量。 与此同时,安全社区在发布后最初数日里也开始记录另一个问题:Fable 5 对许多合法的红队测试(Red Team)和学术安全工作流程也触发了拒绝,这些请求与 Opus 4.8 在标准策略下会处理的内容并无二致。Anthropic 在给普通用户关上漏洞的同时,也把正规军堵在了门外。 第三天结束时,Fable 5 的处境颇为微妙:「秘密降智」已经撤回,但数据政策引发的企业端信任裂缝还没有修复,安全过滤的误伤率仍被研究人员抱怨。这个模型像一个刚刚公演的演员,首演就被人挑出了三处穿帮。 第四天:美国政府出手,神话强制落幕 6 月 12 日,周五下午。 美国商务部长霍华德・卢特尼克向 Anthropic CEO 达里奥・阿莫代伊发出一封信,表示 Mythos 5 和 Fable 5 将受到出口管制,范围涵盖美国境外的任何地点,以及境内的所有外国公民。 Anthropic 当晚收到指令的时间是美东时间下午 5 点 21 分。信中并未提供具体的国家安全关切细节。 据 Axios 报道,该行政官员表示,商务部是在另一家公司声称成功「越狱」Mythos 后决定采取行动的,这让特朗普政府对潜在的国家安全风险产生了警觉。 所谓「越狱」(Jailbreak),是指通过特殊提示绕过模型的安全限制,让它吐出本该被过滤的内容。如果有人能绕过 Fable 5 的安全层,理论上就能访问到底层 Mythos 模型的完整网络安全能力 —— 那是 Anthropic 自称「全球最强网络安全 AI」的东西。 Anthropic 随即作出回应,语气里藏着明显的委屈:我们审查了这一特定技术的演示,其被用于识别少量此前已知的微小漏洞。这些漏洞看起来都相对简单,我们发现其他公开可用的模型也能在没有越狱的情况下发现它们。 换句话说,Anthropic 的意思是:你说的这个「越狱」,用其他普通模型也能复现,凭什么单独封杀我? Anthropic 还指出,政府所援引的越狱方式只能在单一特定情形下解锁 Mythos 的部分网络安全能力,而非能够全面绕过所有防护的通用型越狱方法。Anthropic 还表示,同样的越狱方式也可以被用于包括 OpenAI 的 GPT-5.5 在内的其他公开可用模型,而这些模型并未受到类似的出口管制。「我们不同意,发现一个局部的潜在越狱方法,应该成为召回一款已向数亿人部署的商业模型的理由。」Anthropic 在博客中写道。 然而,争论是没有意义的。命令已经到达。 Anthropic 选择全面关闭 Fable 5 和 Mythos 5 的访问权限,原因是若要选择性合规,则需要屏蔽大量用户 —— 其中包括 Anthropic 自己的外籍员工。 深夜,全球用户打开 Claude,发现 Fable 5 从模型列表里消失了。 幕后:这不只是一次技术事故 如果你以为这只是一场普通的「新模型发布翻车」,那你可能漏掉了更深层的剧本。 这场风波的背后,是 Anthropic 与特朗普政府之间一段持续数月的对抗关系。2026 年 2 月,五角大楼与 Anthropic 的谈判破裂:Anthropic 拒绝允许 Claude 被用于致命自主武器或大规模平民监控,并为此付出了代价 —— 被贴上「供应链风险」标签。历史上,这个标签通常只用于外国对手,要求国防承包商在与军方合作时承诺不使用 Anthropic 的 Claude 模型。 此后,Anthropic 对特朗普政府提起诉讼,以寻求推翻这一封禁,诉讼至今仍在进行中。 时间线至此变得耐人寻味:合同谈判破裂在 2 月,黑名单来了;Anthropic 起诉政府,法院暂时阻止了黑名单执行;Fable 5 在 6 月上线,三天后,出口管制指令到达。 出口管制指令,就在 Anthropic 已经与政府在法庭上交锋的同一周发出。 更具戏剧性的是 Anthropic 那份透明度的反噬。Anthropic 在发布前公开承认,任何模型的完美越狱抵抗都是不可能实现的 —— 这是一种出于善意的透明表态。但政府似乎正是以这一承认为框架,为其担忧找到了依据。如果透明承认自身局限会招来监管行动,而不透明则不会,那么行业将会得出相应结论。结果是公众获得的 AI 能力和风险信息将会减少 —— 这与安全倡导者多年来的追求恰恰相反。 说白了:你越诚实,越可能被人抓住把柄。 结语:Fable 的故事,讲了个寂寞 Fable,那个来自拉丁语「被讲述的故事」。 这四天里,Fable 5 确实被讲述了。只是没人料到,它自己才是这个故事里最短命的主角。 96 小时内,它完成了一次令人叹为观止的「成就解锁」: 发布日万众瞩目,当天被誉为 AI 史上最强公开模型;第二天被曝「秘密降智」,Anthropic 连夜道歉撤回;第三天微软宣布内部禁用,数据政策掀起企业端信任危机;第四天,美国政府一纸令下,全球强制下线。 这是一个在封神和封禁之间,只隔了四天的故事。 Anthropic 目前正在争取尽快恢复访问。该公司表示认为存在误解,并正努力尽快恢复访问。它同时对 Fable 5 的安全防护架构保持信心,并指出没有任何测试者发现能够广泛绕过模型防护的通用越狱方法。 但「Fable 5 重新上线」的那个故事,暂时还没有被讲述。 更深层的问题也悬而未决:当一个公司将自己最强大的产品公开发布,政府可以在 72 小时内以「国家安全」为由将其全球下线 —— 这条权力边界,今后每一家 AI 公司都必须纳入自己的发布风险模型。未来的 AI 发布,不只是技术问题,也是地缘政治问题。 而 Fable 这个词的另一层含义,不应被遗忘:它也可以指「寓言」—— 一个带有道德教训的虚构故事。 这一次的教训是什么,就留给读者自己去判断了。
诺奖得主克鲁格曼:马斯克是“人形庞氏骗局”,让普通投资者被迫买单
6 月 14 日消息,2008 年诺贝尔经济学奖得主保罗 · 克鲁格曼前天发文,对特斯拉、SpaceX、xAI 首席执行官埃隆 · 马斯克发表个人评价。 克鲁格曼首先描绘了一幅不存在的幻象:“昨天我短途旅行了一趟,首先搭乘本地的 Hyperloop 超级高铁,在无聊公司(Boring Company)建造的地下隧道中自由穿行。随后,我通过脑机接口召唤了一辆全自动驾驶 Robotaxi。途中,我还阅读了火星殖民地的最新消息”。 然而,上述景象根本不可能发生,这些产品根本就不存在。目前没有任何可以正常运营的 Hyperloop 系统,无聊公司也没有建成任何商业化隧道;特斯拉只是在奥斯汀部署了少量 Robotaxi,但远远没有达到“全自动驾驶”的程度。号称正在引领脑机接口革命的 Neuralink,也只是在少数患者进行测试。 然而,埃隆 · 马斯克曾经承诺,这些服务将在 2025 年之前实现。 诚然,马斯克也有许多成功的商业产品。特斯拉曾引领电动车浪潮,SpaceX 也开发出许多重要的服务,也有持续盈利的模式。 但克鲁格曼认为,这些成就并不足以让马斯克成为世界首富,他的金钱更多建立在“信仰”之上,投资者相信他的脑袋,因此不断买入股票;而这些公司的股价不断上涨,进一步强化了他“天才”的形象。 对于这种不断通过“成功”吸引投资者的商业模式,我们有一个专门的名称:“庞氏骗局”。而埃隆 · 马斯克,本质就是一个“人形庞氏骗局”。 更重要的是,SpaceX 的 IPO 清楚表明,马斯克并不是在开发未来科技产品,而是在玩弄金融资本运作,并利用他与政府的关系。 随后克鲁格曼以马斯克 2022 年收购 X 平台(IT之家注:前 Twitter)为例,他首先向投行贷款 130 亿美元。这些银行原本计划把贷款迅速出售给投资者,从而将风险转移出自己的负债表。 马斯克随后亲手摧毁了 X 的商业模式,他把平台变成了一个极右翼、纳粹言论友好的舆论泥潭,大量广告主因此远离 X 平台。到了 2024 年夏天,X 平台估值已经跌至收购价格的一半以下。如果银行此时出售相关债务,将面临约 40% 的损失,因此不得不长期持有这些贷款。 虽然 2024 年后,X 平台估值又重新回涨,马斯克借助 AI 热潮成功抬高 X 的估值,但 xAI 的 Grok 远远落后于 Anthropic、OpenAI。同时,它还被广泛认为存在安全性和可靠性问题。 并且克鲁格曼认为,SpaceX 的 IPO 完全建立在“庞氏骗局”之上,散户之所以会投资 SpaceX,并不是因为他们认真评估了该公司的商业价值,而是一味地相信“马斯克是天才”。然而,这场资本游戏,可不是散户能玩到最后的。 马斯克的华尔街盟友已经悄悄修改游戏规则,将 SpaceX 纳入纳指 100、富时等指数。从历史角度讲,各大指数通常会在公司 IPO 一年之后,才会考虑将其纳入。如今 SpaceX 修改游戏规则,说明马斯克再次展现了自己腐蚀关键机构的能力。 克鲁格曼最后表示,马斯克的“人形庞氏骗局”终将崩塌,但传统庞氏骗局通常只欺骗那些自愿参与的人。而马斯克这次的情况不一样,他这场骗局的大量资金,都源自那些被迫参与的普通美国人。这些人购买的家庭基金、保险产品等,最终都流入了马斯克的口袋,为资本机器提供燃料。
美伊协议何时签署 特朗普说14日 伊朗否认
  当地时间13日,美国总统特朗普在社交媒体发文说,美国和伊朗定于14日签署协议,霍尔木兹海峡将在协议签署后立即开放。   另据巴基斯坦外交部方面公布的消息,美国与伊朗相关协议电子签署仪式定于14日举行。   伊朗外交部发言人巴加埃则表示,伊美谅解备忘录不会在14日签署,但不排除在未来几天内完成。   特朗普:美伊定于14日签署协议   △特朗普(资料图)   美国总统特朗普13日在社交媒体发文说,美国和伊朗定于14日签署协议,霍尔木兹海峡将在协议签署后立即开放。   特朗普称,伊朗已不再寻求拥有核武器,也不会购买、自主研发或以任何其他方式获取核武器。待局势平稳后,美国将择机采取行动取出“埋藏”在山体下的浓缩铀,并对其进行稀释处理与销毁,“无论是在伊朗境内还是在美国本土”。   特朗普还表示“希望这一进程能迅速、轻松且顺利地推进”,但同时威胁道,“若事与愿违,我们手中还握有终极手段”。   巴方:美伊14日举行协议电子签署仪式   △巴基斯坦副总理兼外交部长达尔与沙特阿拉伯外交大臣费萨尔通电话   13日,巴基斯坦外交部发表声明说,巴基斯坦副总理兼外交部长达尔当天与沙特阿拉伯外交大臣费萨尔通电话。美国与伊朗相关协议电子签署仪式定于14日举行。   同日,巴基斯坦总理夏巴兹在社交媒体上发文称,美国和伊朗之间的和平协议可能在未来24小时内最终敲定。夏巴兹说:“我们比以往任何时候都更接近达成和平协议。最终文本预计将在未来24小时内确定。巴基斯坦正准备在此之后立即举行协议的电子签署仪式,并于下周进行技术层面的会谈。”   伊方:不会在14日但不排除未来几天内签署   △巴加埃(资料图)   伊朗外交部发言人巴加埃13日表示,正在推进的伊美谅解备忘录聚焦于结束战事,现阶段暂不讨论核问题。伊朗与美国之间任何可能达成的谅解都仅是为推动双方继续开展对话,而非最终协议。解冻伊朗被冻结资产将是伊美谅解不可缺少的一部分。   巴加埃表示,备忘录签署的具体时间还需要等待。虽然不会在14日,但不排除未来几天内签署的可能性。由于对方有所犹豫,伊朗必须谨慎对待这一进程。此外,在接下来一两天内,伊朗方面没有前往日内瓦或其他地点的计划。   伊朗国家安全委员会副主席纳博扬13日说,他已经看过伊美谅解备忘录文本,目前的版本“比之前的更好”。纳博扬说,目前的文本属于协议的框架性文件,后续内容仍有可能发生一定调整。备忘录共有14条,签署后将立即宣布军事行动结束。纳博扬表示,根据他看过的谅解备忘录文本,霍尔木兹海峡所有商船将恢复通行,不受任何限制。   以官员:以方核心关切未被纳入备忘录   △内塔尼亚胡(资料图)   当地时间13日,总台记者获悉,以色列总理内塔尼亚胡将于14日晚间召开安全内阁会议,以讨论如何应对美伊签署停火备忘录。   有以色列官员表示,美伊协议内容未涉及伊朗弹道导弹系统,涉及伊朗核活动的相关要求也被弱化。以色列希望处理的有关伊朗的核心问题均未得到回应。   伊美谅解备忘录   有哪些要点受关注   连日来,伊朗、美国、巴基斯坦各方以及媒体和知情人士不断释放关于伊美谅解备忘录内容的信息。从这些信息和此前美伊谈判的分歧焦点来看,双方谅解备忘录有以下内容值得关注:   霍尔木兹海峡是否“免费”重开   从美伊表态来看,双方已同意,在签署谅解备忘录后,伊朗重开霍尔木兹海峡,美国解除对伊海上封锁。   美国媒体11日援引一名美方官员和一名斡旋方外交人员的话报道说,备忘录要求伊朗重开霍尔木兹海峡,并且“不收通行费”。然而,阿拉格齐12日接受电视采访时说,该海峡主权属于伊朗和阿曼,两国长期承担其航行安全的保障和相关服务。未来海峡管理机制将进行调整,不会简单回到战前模式,航运服务将进行收费。   伊朗高丰度浓缩铀如何处置   从美伊释放的信息来看,签署谅解备忘录后,双方将开始为期60天的谈判,围绕伊朗核问题和美国全面解除对伊制裁,以期达成一份最终协议。   美国方面释放消息称,尽管伊朗核问题有待进一步谈判,但即将达成的备忘录中包含一个“解决伊朗浓缩铀库存问题的框架”。特朗普13日称,美国将对伊朗浓缩铀进行稀释处理与销毁,“无论是在伊境内还是在美本土”。阿拉格齐12日说,伊方坚持认为,如需处理现有高丰度浓缩铀库存,唯一可接受方式是在伊朗境内实施“稀释处理”,而非转移至境外。   解冻伊朗资金分几步   伊朗迈赫尔通讯社12日公布一份伊美“14点谅解备忘录草案”,其中涉及美方解冻伊朗资金的条款为:在为达成最终协议而谈判的60天期间,解冻240亿美元伊朗被冻结资产,其中一半资金必须在谈判开始前向伊朗提供。   而据美方知情人士消息,美国要求根据伊朗履约情况分批解冻资金。美国副总统万斯12日在社交媒体上发文说,伊朗不会仅仅因为签署协议就获得资金,如果伊方履行其义务,则“经济利益将惠及他们”。   能否实现全面停火   △以军袭击黎巴嫩南部(资料图)   美国方面有消息称,谅解备忘录将把停火延长60天,包括要求在黎巴嫩实现停火。阿拉格齐12日说,备忘录涉及结束包括黎巴嫩在内的所有战线军事冲突,且伊方明确告知美方,以色列从黎巴嫩南部撤军是达成协议的条件。   以色列国防部长卡茨12日发表声明说,以色列不会从其在黎巴嫩、叙利亚和加沙地带占领的所谓“安全区”撤军。他还说,以方必须确保未来“有能力独立行动,以阻止伊朗获得核武器”,为此他与以总理内塔尼亚胡已指示以军做好准备。   分析人士认为,美伊如达成谅解备忘录,将是实现地区局势稳定的第一步,但双方下一阶段谈判仍然复杂艰难,能否达成最终协议还有待观察,不能排除重现“战和循环”的可能。此外,即便美伊均不希望全面重启战事,以色列也可能拒绝在黎巴嫩完全“停手”,并可能游说美方在核问题等方面对伊朗提出苛刻条件,从而增加美伊达成最终协议的难度。   监制丨郑弘   制片人丨赵新宇   主编丨孙蒙   编辑丨刘微   记者丨魏然 赵兵 刘旭 姚瑞昕
小米雷军总结YU7八大环节测试直播:实际过程非常顺利,整个测试团队有800多人
IT之家 6 月 13 日消息,小米董事长兼 CEO 雷军今天在盐城试验场完成了一场 YU7 测试直播,随后他发布长文,对本次直播进行了总结。 雷军表示,今天的测试共有 8 大环节、26 个项目、11 项挑战,原计划 7 个小时,实际测试过程非常顺利,只用了 5 个半小时就全部完成。测试车型是 YU7 标准版和 YU7 GT。 雷军称小米汽车高度重视测试工作,测试投入、规模巨大。目前,整个测试团队有 800 多人,其中 45% 以上,都是超过 10 年经验的专家。这支团队已经在 300 多个城市,累计完成超过 3500 万公里的测试。 据介绍,小米汽车在北京、南京、上海、武汉 4 个城市,一共有 126 个试验室,总面积超过 6.56 万平米。另外还在江苏盐城、安徽广德,租用了 2 个整车综合试验场。还有一支专门进行极端环境测试的团队,大约 500 人。他们分为夏测和冬测团队,主要负责黑河(高寒)、吐鲁番(高温)、昆仑山(高原)、海南(高湿),这 4 大极端环境测试。 雷军还特别提醒,辅助驾驶不是自动驾驶。安全辅助可以帮助降低风险,但不能替代驾驶员观察和判断。日常驾驶中,要保持注意力,遵守交通法规,安全驾驶。 IT之家附雷军对本次测试直播的测试项目、挑战汇总如下: 高环测试 高环测试是对车辆极限性能的终极考验,通过持续高速行驶,把性能逼到极限,验证车辆在不同工况下的稳定性。盐城测试场的 T7 高速环道,单圈长度 7.85 公里,采用双长直道 + 两端超高倾角圆弧弯结构,弯道坡度高达 41 度。它是目前国内为数不多的,能满足时速 300km/h 超高速测试的高速环道。之前的 YU7、新一代 SU7 的 24 小时耐力挑战、SU7 Ultra 极速挑战,也都是在这条环道上完成的。今天的测试中,YU7 标准版跑到了 225km/h 的最高车速,YU7 GT 更是冲到了 304km/h,在高环极限场景里都能保持从容,在日常使用中,就有更多安全冗余,驾驶更有底气。 连续制动测试 连续制动测试,通过高速连续制动,验证刹车系统的稳定性和抗热衰减能力。试验场的 T2 直线性能路,双向 6 车道,直线段长 2500 米,是国内车道最多、有效试验段最长的直线性能路之一。YU7 GT 在这里完成了三项制动测试:连续 50 次 100km/h 到 0 紧急刹停、连续 8 次 200km/h 到 0 紧急刹停,以及 1 次 300km/h 到 0 的额外极限挑战。行业内通常只做 10-20 次 100km/h-0 连续制动,最多也仅做到 29 次,而我们 50 次连续测试中间没有散热操作,YU7 GT 标配的碳陶盘 + Akebono 前六后四活塞卡钳制动系统全程没有出现热衰减。 底盘质感测试 底盘质感测试,主要测试了两条道路。一条全是各种颠簸路面,包含比利时路面、修补水泥路面、花岗岩路面、损毁的水泥路、台阶路还有减速带,主要考验低速下的滤振和舒适性。另一条速度更快,有柏油修补路、连续弯道、沉降段和长波路,这些路面在高速下很容易让车起跳,最考验底盘的支撑性和贴地性。YU7 标准版,搭载连续阻尼可变减振器,测试了舒适和运动两种模式,各种路况都能从容应对,车身一直很稳,表现超出预期。YU7 GT,搭载双阀 CDC®和双腔空簧,其中双腔空簧最大可以实现 37% 的高度差异,能在舒适性和运动性之间实现更精准的切换。 驾控能力测试 驾控能力测试,分别在干湿地场地进行。干操控场地,是一条标准的 F4 赛道,模拟高附着路面,考察的是弯道速度、转向响应和底盘支撑。湿操控场地,驾驶难度更高,模拟雨天湿滑路况,路面附着了一层薄水膜,考察的是低附着条件下的稳定性,和可控性。对用户来说,这些能力对应的就是山路驾驶、雨天路面、高速匝道,和连续弯道里的驾驶信心。YU7 GT 表现非常优异。 NVH 静谧性测试 NVH 是汽车开发中公认的 " 玄学 "——Noise(噪音)、Vibration(震动)、Harshness(声音品质),是做好一台车的基本功。今天使用 YU7 标准版,在试验场不同粗细的沥青路面上,以不同车速行驶,实际感受路噪、风噪、及震动传递表现。这类道路测试是对实验室的关键补充 —— 实验室可以精准比对隔声方案,但无法穷举所有路面特征,也无法还原真实风噪。YU7 的静谧性来自三层体系:源头减震(鹅卵石激光雷达、无边框后视镜等流线造型降低风噪源)、密封阻隔(一体式门模块等结构密封)、声学屏障(大量隔音材料填充,上次拆车直播铺满了一整车)。标准版的 NVH 表现已经非常出色,GT 则还要再好一个数量级。 结构耐久测试 结构耐久测试,是对车辆可靠性最严苛的长期考验。这项测试可以快速验证整车结构强度和耐久性,确认是否满足设计目标,并为后续结构件设计优化提供依据。盐城试验场的 T8 强化耐久路,是整个试验场最繁忙的道路。它能模拟全国 95% 的恶劣路况,全长约 9 公里,覆盖 60 多种特征路面。结构耐久测试的标准非常严格,小米汽车的标准是 400 个循环,等效 10 年 24 万公里使用寿命。我们通常会完成 2 个 400 循环,也就是等效 48 万公里,远高于行业常规。主动找到整车系统中最先失效的部件,从根源上提高可靠性。今天驾驶 YU7 标准版展示了部分特征路况,正是在这样的路况上反复测试,才能达到小米汽车严苛的可靠性目标,让车主开车更放心、用车更省心。 脱困能力测试 脱困能力测试,交叉轴脱困,验证的是车辆在湿滑、积雪、泥泞、坡道打滑,和车轮短暂悬空等复杂路况下的脱困能力。交叉轴高度到测试人员膝盖以上,核心考验车辆的离地间隙、悬架拉伸行程、动力分配能力和车身扭转刚度。过交叉轴的关键在于,一是要有足够的物理基础,保证车轮悬空时仍有充足的离地间隙和悬架行程。二是动力系统能在单轮或双轮悬空时,把扭矩有效传递到有附着力的车轮上。YU7 标准版和 YU7 GT,都出色地完成了脱困测试。并且,当单轮悬空时,车门、前备箱和后备箱均能正常开关关闭,无明显形变,充分证明了其出色的车身扭转刚度。两款车型凭借优秀的车身刚度、扎实的底盘机械素质和精准的电控标定,都能从容应对交叉轴这一典型越野工况。 安全辅助测试 安全辅助测试,特意选用 YU7 标准版,来完成全部 7 个科目测试。YU7 全系,标配 25 项安全辅助功能。包括 700TOPS 算力芯片、激光雷达等满配辅助驾驶硬件,安全辅助不分高低配。测试覆盖 AEB、AES、LCP 三大核心功能,验证车辆 " 能刹、能躲、能从容避让 " 的综合安全能力,成功通过遮挡儿童横穿、雨夜事故车后站人等极端工况。碰巧,在测试过程中,场地突然下起了雨,给测试增加了难度,但后续测试项目依然顺利通过。包括加测的更高难度场景,120km/h 相对时速逆行二轮车(自车速度 100km/h,逆行二轮车速度 20km/h),还展示了 5 月刚刚 OTA 的 LCP 侧向避让功能。安全辅助功能测试,要保证车辆做到,能刹、能躲,也能更从容地避让,同时平衡误触发和漏触发,关键时刻帮助驾驶员降低风险,提升车辆极限场景下的应对能力。
小米汽车回应“YU7 GT高环测试极速300km/h的意义”
6 月 14 日消息,小米汽车昨晚发布小米汽车答网友问(第 257 集),回答了“YU7 GT 高环测试极速能跑 300km/h,对我们日常驾车有啥意义?”等问题。 小米汽车表示,极速能力的表现,核心是整车底盘、电池、电驱、热管理等综合技术实力的体现,同时也意味着车辆具备更高的安全与性能冗余。日常通勤虽不会用到三电极限性能,但支撑高极速的硬件与调校,日常驾驶中处处都在发挥作用。 小米汽车透露,高环测试在盐城汽车试验场的 T7 高速环道开展:YU7 GT 顺利达成 300km/h 极速。另外,YU7 标准版也完成 220km/h 的极速测试,在同级车型中都有明显的优势。简言之,极速表现带来了更高的工程冗余,让车辆在日常行驶中拥有带宽更高可靠性和稳定性,为驾乘全程保驾护航。 对于“为什么直播要跑赛道呢?日常也不会这么激烈驾驶?”的问题。小米汽车表示,选择赛道进行测试,是为了验证车辆在各种极端环境中的稳定性,打磨各种弯道性能,以达到「底盘扎实、质感高级、弯道又快又稳」的驾驶感受,让每一位驾驶者在长途旅行中能享受驾驶乐趣,在日常驾驶场景中更加从容。 据其透露,本次测试用到 T10 干操控路与 T12 湿操控路两大专业测试路面。T10 符合 FIA F4 标准,用于检测弯道响应、底盘支撑与轮胎抓地性能;T12 拥有多组连续弯道与精准喷淋系统,可模拟雨天低附着路面,考验车辆湿地稳定性。 对于“直播中的 AEB 安全辅助测试科目,为什么用纸箱来测试?”的问题。小米汽车表示,这一测试主要验证的是 AEB 安全辅助系统对异形障碍物的识别能力,纸箱这类低矮障碍物比车辆、行人等常规目标更难识别,对系统识别能力提出更高要求。 小米 AEB 识别目标物的能力持续扩展,除了常见的车辆、行人、二轮车等目标,前向 20-135km/h 时速下,可识别水马、防撞桶等常见障碍物,新增对纸箱、石头、轮胎等一定尺寸异形障碍物的识别能力。 本次直播中,小米汽车模拟白天晴好天气下货车掉落货物的场景,YU7 标准版分别以 60km/h、80km/h 时速驶向纸箱,均取得了及时识别障碍物并稳定制动刹停的测试结果。 IT之家注意到,小米汽车最后还提醒用户,辅助驾驶不是自动驾驶,安全辅助功能的意义是帮助车辆提升极限场景下的应对能力,驾驶员开车时需时刻保证专注,安全驾驶。
大反转!Anthropic CEO拒修漏洞才被封,举报Claude新模型是自家大股东
智东西 作者 | 程茜 编辑 | 云鹏 智东西6月14日报道,今日凌晨,据多家外媒爆料,Anthropic宣布终止访问Fable 5和Mythos 5模型的导火索,可能是亚马逊CEO是‌安迪·贾西‌(Andy Jassy)。 《华尔街日报》报道,亚马逊研究人员利用Anthropic的Claude Fable 5进行研究时,获取到了可用于网络攻击的信息。随后,美国政府对Fable 5和Mythos 5实施了出口管制禁令。 特朗普前AI专员、现任总统科学技术顾问委员会联合主席大卫·萨克斯(David Sacks)在社交平台X上发帖爆料了美国政府封禁的一些细节,他提到美国政府在发现安全漏洞时要求Anthropic进行修复否则就下架该模型,Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)拒绝修复,并在后续官宣中声称该漏洞不严重,其它公司的模型也有。 萨克斯认为,这种淡化风险的表述,与Anthropic标榜自身是AI安全企业的品牌定位自相矛盾。他还透露,美国政府希望Anthropic能尽快解决安全问题以解除出口管制,并重新发布Fable 5模型。 为了弥补用户权益,Anthropic提供了退款通道,有网友发布了收到的Claude退款邮件。邮件中提到,Anthropic已关闭Claude Fable 5模型的使用权限;Opus、Sonnet、Haiku其余全系模型均可正常使用;已重置用户的用量额度。 如果用户认为此次调整不符合用户需求,其可以选择取消订阅,并自动获得按剩余时长折算的退款。退款时间截止到当地时间6月20日。此次退款不支持在Claude移动端App操作。 ▲网友收到的退款邮件(图源:X) 一、Claude开启退款,网友:无法回头了 有不少网友提到,Anthropic为封禁Fable 5仓促上架的退款处理方案有很多bug。其中一位网友称,Anthropic直接关停了用户的全部订阅服务,他此前5倍时长有效期到6月19日的订阅权益都没了,很离谱。 还有网友直接断言Claude已经被淘汰、无法回头了。 有网友分析,Anthropic此次的退款操作也证明,Fable 5不会很快回来, 有网友称要取消订阅,然后等待ChatGPT的新型号。 二、美国政府称Anthropic避重就轻,弱化新模型安全漏洞 亚马逊发言人告诉The Information,作为服务大量私营和公共部门客户的领先云服务提供商,美国政府就潜在安全风险寻求亚马逊的意见并不罕见。即便开展相关沟通,我们也不会透露洽谈的具体内容。 发言人还透露,亚马逊云科技也受到了Anthropic封禁模型的影响。6月13日早上,亚马逊云科技就撤销了所有地区对Fable 5和Mythos 5的访问权限。 The Information援引知情人士说法,在与贾西及其他科技企业负责人会谈结束后,美国国家网络事务总监肖恩·凯恩斯克罗斯(Sean Cairncross)于周五召集美国政府高层官员开会,会上敲定,出口管制是针对Anthropic采取举措最直接的手段。 这场会议结束后,Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)与美国政府官员进行了通话。会谈中,Anthropic方面解释称,此次所谓越狱漏洞暴露出的安全隐患门槛并不算高,其他大模型也存在出现同类问题的可能性。但美国政府告知Anthropic,实施出口管制的决议已经敲定。 特朗普前AI专员、现任总统科学技术顾问委员会联合主席大卫·萨克斯(David Sacks)在社交平台X上发帖爆料了一些细节。 他称一位同时深受Anthropic与美国政府高度信赖的可靠合作方,主动爆出了一项模型越狱漏洞。并且美国政府要求阿莫代伊修复这个越狱漏洞,否则就下架该模型时,阿莫代伊拒绝修复漏洞。 萨克斯还提到,Anthropic在官方博客中声称该越狱漏洞并不严重。但那位可靠合作方与美国政府均不认同这一说法,这种淡化风险的表述,也与Anthropic标榜自身是AI安全企业的品牌定位自相矛盾。目前,美国政府希望Anthropic能尽快解决安全问题以解除出口管制,并重新发布Fable 5模型。 此外,Anthropic在宣布封禁模型的博客中还提到,其他公开模型也出现了类似漏洞。不过,一位接近美国政府的官员告诉The Information,美国政府不太可能将Anthropic先进模型的出口限制扩展到其他AI公司。 亚马逊是Anthropic的主要投资方。亚马逊今年4月曾公开提到,自2023年以来,其已经向Anthropic投资了130亿美元(约合人民币879亿元),未来还计划再投资200亿美元(约合人民币1353亿元)。亚马逊的Trainium芯片帮助训练和驱动Anthropic的大模型,这些模型也运行在亚马逊云服务上。 值得一提的是,今年亚马逊也大手笔入股了Anthropic的主要竞争对手OpenAI,承诺最高向其投入500亿美元,并且首次将OpenAI最新模型接入亚马逊云科技对外销售。 美国政府此次封禁Anthropic模型还有一大背景是,美国政府两周前签发了一项行政令,推出一套自愿合规机制:AI企业在面向合作方、公众发布模型之前,可先行向政府提交模型以供核验。这是因为美国政府内部曾就是否针对计划推出高端大模型的AI企业设立一套门槛更高、审核更严苛的许可制度展开争论,这份行政令便是这场博弈后的产物。 结语:Anthropic最强模型被关停,行业安全门槛被迫抬升? 6月10日,Anthropic正式发布Claude Fable 5和Mythos 5两大模型,其同属Mythos(神话)级,共享同一个底层模型,能力高于Opus级,这也是Anthropic迄今为止能力最强、综合性能最高的大模型级别。 在发布同期,Anthropic特意设计分级开放、内置安全降级路由,本想平衡强能力与风险管控,但仍然没能抵御潜藏的安全漏洞带来的连锁冲击,短短数日就让两款旗舰模型被关停。这或许意味着未来新模型上线前,第三方独立红队深度攻防核验相关的安全测试或将成为硬性门槛。
抢Intel/AMD饭碗!NVIDIA通知中国客户:首款Vera CPU将于8月上市 现在即可下单
快科技6月14日消息,据报道,NVIDIA已正式告知中国客户,其首款自研Arm架构Vera服务器CPU最快将于今年8月交付,目前已全面开放订单通道。这是NVIDIA在AI GPU对华出口全面受阻后,首次向中国市场推出全新的核心计算产品,直接剑指Intel与AMD垄断多年的服务器CPU市场。 与此同时,NVIDIA旗舰H200 AI GPU的对华发货已冻结长达数月。尽管美国商务部此前已批准约10家中国企业采购H200,但至今没有一片芯片实际交付。NVIDIA CEO黄仁勋此前曾无奈坦言,受中美科技博弈影响,公司在中国AI加速卡市场的份额已基本归零。 在此背景下,监管风险相对较低的服务器CPU,成为NVIDIA挽回中国市场的关键突破口。 值得一提的是,8月的交付时间比NVIDIA在6月1日台北Computex GTC大会上公布的秋季上市计划有所提前。会上NVIDIA刚刚宣布Vera已进入全面生产,在全球服务器CPU全面短缺的当下,中国客户被排在Vera产能分配的前列,足见NVIDIA对这一市场的重视。 该公司预计,Vera系列将在截至2027年1月底的2027财年贡献约200亿美元营收,成为继GPU之后的第二增长曲线。 据透露,目前已有超过300台Vera服务器在中国云厂商手中进行测试,至少一家头部云服务商已敲定初步采购计划。不过所有初始部署都将被限制在这些厂商的海外数据中心。 这一谨慎安排源于双重考量。一方面,服务器CPU的美国出口管制远松于AI加速卡;另一方面,国内数据中心部署美国高端芯片会引来更严格的监管审查,此前H200的零交付就是前车之鉴。 事实上,Vera正是NVIDIA瞄准AI智能体时代打造的杀手锏。它原本是VeraRubin超级芯片的CPU部分,今年3月GTC圣何塞大会上被拆分为独立产品,也是业界首款专为AI智能体定制的CPU。 基于ARMv 9.2-A自研Olympus架构,Vera最多支持88核176线程,搭载162MB三级缓存和1.2TB/s内存带宽,首创空间多线程技术实现单核心双线程真正并行,单线程性能较上代Grace提升50%。 其NV Link-C2C互联吞吐量高达1.8TB/s,是PCIe6.0的7倍。NVIDIA官方宣称,Vera在智能体编排、工具调用、代码执行等负载上的任务完成速度比传统x86CPU快足足1.8倍。 黄仁勋直言,"AI智能体将成为最大的计算资源消费者,Vera正是为这一未来量身打造"。 Vera的市场基础来自于其前身GraceCPU的成功,后者迄今已出货近250万颗,在数据中心市场为NVIDIA打下了坚实的根基。 雪上加霜的是,当前全球服务器CPU市场正处于严重供不应求状态。随着AI工作负载从训练大规模转向推理和智能体执行,主机处理器的需求呈爆发式增长。 Intel给中国客户的交期已拉长至最长6个月,AMD也承认需求远超预期,供应紧张将持续到年底。这无疑给NVIDIA提供了绝佳的切入机会。不过,受制于中美科技博弈的大环境,Vera在华的业务拓展仍将面临诸多不确定性。 【本文结束】如需转载请务必注明出处:快科技 责任编辑:朝晖
华人AI工程师也搭上了SpaceX的财富火箭
SpaceX上市,先制造了一场财富神话。 马斯克成为了全球首位万亿富翁,身家被推到了人类商业史从未到过的位置。 4400多名现任和前员工,账面成为百万富翁;约400人,持有的股票价值超过1亿美元。 这些新晋富豪不全是创始人、投资人或者高管,里面有工程师、焊工、厨师、食堂员工…… 入职那天,公司给了他们股票。拿住的人,等了十年、二十年,等到SpaceX上市的这一天,收获了十分丰厚的回报。 这场全世界有史以来最大规模的IPO,引发了一轮关于SpaceX员工股权的财富重估。 上市的SpaceX,不只是火箭、星舰和Starlink;xAI并入之后,AI模型、工程自动化和多模态能力,也被装进了同一个资本故事。 SpaceX的财富火箭,也不只载着发射台、火箭工厂和星链网络里的人,还载着xAI的模型训练团队。 这支团队刚刚经历过一轮剧烈洗牌,负责Grok Code和Grok Imagine的张国栋、戴子航等早期核心人物相继出走,公司经历重组,马斯克之外的xAI原始联合创始人全部离开。 过去我们关心离开的人才,但留下来的那些人同样值得关注,其中不乏一些中文名字:胡戎航(Ronghang Hu)、赵龙(Long Zhao)、刘泽(Ze Liu)、黄杰(Jie Huang)、林禹臣(Bill Yuchen Lin)、沈卓然(Zhuoran Shen)、李英儒(Yingru Li)…… 对于这些仍然留在xAI体系内、并持有股权激励的核心工程师来说,SpaceX的上市意味着他们手里的权益被带到了公开市场的兑现窗口前。 拿住股票的人,等来了回报 SpaceX从很早开始,就把股票发到了各个层级的员工手里。 有人拿到的是期权,有人拿到的是受限股票。无论形式是什么,都不是一笔确定的财富,很多人并不相信这家公司真的能走到上市这一天。 毕竟SpaceX并不是一家看起来稳赢的公司,2006年、2007年、2008年,猎鹰1号前三次发射全部失败,直到08年9月,第四次发射才终于成功入轨。 马斯克后来对NASA前局长Jim Bridenstine回忆,当时SpaceX已经没有预算再做一次发射,第四次都是用备用零件凑出来的;如果还失败,SpaceX就没有后来了。 三个月后,靠NASA给的一份价值16亿美元的国际空间站商业补给合同,SpaceX才真正从悬崖边上被拉回来。 在那之后,SpaceX也经历了重重波折。Falcon 9任务失败、发射台也发生过爆炸,到了星舰阶段,失败、调查和整改依然是故事的一部分。 今天看起来像一夜暴富的故事,当年其实更像是接受了一张可能永远无法兑现的欠条。 但事实就是,SpaceX上市这天,拿住股票的人都等来了回报。 《纽约时报》报道里提到的Trevor Hise是典型的工程师版本,他2011年大学毕业后加入SpaceX,从实习生做起,后来成为发射工程师,在SpaceX工作了12年。到上市时,他手里还有超过10万股,按每股135美元的发行价计算,这些股票价值至少1350万美元。 前SpaceX焊工Juan Hernandez来自墨西哥,早年在SpaceX的时薪约28美元,获得过约1万美元股票授予;他在2020年SpaceX估值达到360亿美元时卖出过一部分,到IPO前剩余6,500股,按每股135美元计算,价值约87.75万美元。 更何况SpaceX首日收盘价为160.95美元,盘中一度超过176美元。 当然,也不是所有人都等到了这一天。SpaceX内部曾流传过一个说法:早期有员工不相信公司真的会上市,离职时把股票换成了美国连锁餐厅Chili’s的礼品卡。 正所谓“早知三日事,富贵几千年”,可惜那时只当手里攥着的是一张废纸,哪想到有天能换一桌Chili’s全宴都不止。 SpaceX的故事不止在天上 SpaceX上市,被推向公开市场的不只是一家火箭公司。 招股书里,SpaceX的业务被拆成了几个不同板块。猎鹰火箭负责发射,Starlink负责赚钱,星舰负责把故事推向火星,而xAI的并入,则让SpaceX的故事在“太空基础设施”之上,又长出了一层AI基础设施。 当xAI被并入SpaceX,那些xAI模型训练团队里的工程师们,同样成为了SpaceX体系的一部分。 值得关注的是,能进入xAI核心模型团队的工程师,通常不会只是拿现金工资。公开薪酬数据显示,xAI工程师薪酬结构里包含股票/股权;而xAI并入SpaceX本身又是一场换股交易。 对仍在xAI体系内、并持有股权激励的核心工程师来说,SpaceX上市意味着他们手里的权益被带到了公开市场的兑现窗口前。 过去几个月,xAI经历了一轮剧烈洗牌。负责Grok Code和Grok Imagine的张国栋、戴子航等早期核心人物相继出走,公司经历重组。到3月底,根据公开报道,马斯克之外的xAI原始联合创始人已经全部离开。 离开的人未必一无所获,已经归属的股权仍可能参与后续转换;但对留下来的人来说,他们不仅赶上了SpaceX上市,也保留了继续归属和继续被授予股权的机会。 我们在这批留下来的技术骨干里,看到两组值得关注的中文名字。 一组站在Grok多模态能力上:胡戎航、赵龙、刘泽。 另一组站在推理、后训练和代码能力上:黄杰、林禹臣、沈卓然、李英儒。 他们不是偶然出现在SpaceX上市故事里的名字。xAI在大模型人才争夺最激烈的时候把他们吸收进来;经历创始团队离场和组织重组之后,他们仍然留在体系内。 他们没有造火箭。 但他们也搭上了SpaceX这艘财富火箭。 留下来的华人AI工程师 胡戎航2015年本科毕业于清华,2020年在UC Berkeley获得计算机博士学位。 他的博士论文题目是《Structured Models for Vision-and-Language Reasoning》,研究的是视觉与语言推理:让模型根据图像回答问题、根据自然语言在图像中定位对象,或者根据语言指令在视觉环境中导航。 也就是说,胡戎航很早就在做今天多模态模型的核心问题:让AI不只是看见图像,也能把图像和语言放在一起理解。 后来他加入Meta FAIR,参与Segment Anything系列,是SAM 2和SAM 3的核心贡献者之一。 2025年11月,胡戎航从Meta FAIR加入xAI,成为MTS(虽然直译过来是“技术人员”,但卡帕西在Anthropic也是这个头衔),继续做多模态AI。 SAM系列是Meta过去几年最重要的视觉基础模型项目之一。胡戎航加入那一年,xAI正在大举补强多模态能力,Business Insider曾报道,xAI 2025年以来从Meta招走了十余名员工,胡戎航进入xAI的时间点正好踩在这条人才流动线上。 胡戎航加入xAI后公开可见的信息并不多,但他的技术路径很清楚,在Grok走向图像、视频和多模态理解的过程中,这类人才是底层能力的一部分。 赵龙本科、硕士均毕业于同济大学软件工程专业。 硕士阶段,他做的是基于草图的三维模型检索,也就是让系统根据一张手绘草图,在三维模型库里找到对应的物体。读研期间,赵龙还曾在微软亚洲研究院(MSRA)视觉计算组实习,做目标候选区域生成和显著目标检测。 后来,他进入Rutgers读计算机博士,导师是Dimitris Metaxas,研究继续围绕计算机视觉、机器感知和生成模型展开。 博士毕业后,赵龙进入Google Research,后来转入Google DeepMind。 他在那里的代表性成果是VideoPrism——这是一套面向视频理解的基础视觉编码器,可以处理视频分类、定位、检索、字幕生成和视频问答等任务。 Google Research官方博客介绍,VideoPrism的训练数据包括3600万个高质量视频-文本对,以及5.82亿个带文本信息的视频片段;论文称,它在33个视频理解基准中的31个上达到当时最好结果。 赵龙是论文的共同一作。 在前沿模型公司争抢多模态和视频生成人才的背景下,赵龙从Google DeepMind来到xAI,进入Grok Imagine团队。 公开资料显示,他是Grok Imagine 1.0和Grok Imagine Quality Mode的核心贡献者。前者是xAI正式切入视频生成和视频编辑的版本,后者则把生成质量、文字渲染和创意控制继续往上推。 刘泽本科毕业于中国科学技术大学,后来在中科大和微软亚洲研究院体系下读博,研究方向是计算机视觉、视觉架构和大规模视觉/多模态模型。 微软亚洲研究院常被称作华人AI人才的“黄埔军校”,很多后来进入Meta、Google、DeepMind、xAI的研究员,早年都曾在这里做过实习、联培或论文合作。刘泽和赵龙的早期履历里都出现过MSRA,但两人的时间线错开了大约5年。 刘泽在MSRA最出名的工作是Swin Transformer。 2021年,他作为第一作者之一发表了《Swin Transformer: Hierarchical Vision Transformer Using Shifted Windows》,这篇论文获得了ICCV 2021最佳论文奖。 一开始Transformer主要在语言模型里大放异彩,而Swin Transformer通过“移动窗口”的设计,让模型既能处理图像里的局部信息,又能建立更大的视觉结构关系。这套架构后来被广泛用于图像分类、目标检测、语义分割、视频理解等任务,也让刘泽成为视觉基础模型方向里很有代表性的年轻研究者。 后来,刘泽又继续参与Swin Transformer V2和Video Swin Transformer,把这条路径从图像扩展到视频场景。 他进入的时间比前两位稍早,2024年4月,刘泽加入xAI,成为MTS。加入后,他参与了Grok Vision、Grok 2、Grok 3,并共同负责Grok Imagine的视频生成,还做过Grok Voice Mode的预训练。 Grok Vision是让模型看懂图像,Grok Imagine是让模型生成图像和视频,Grok Voice Mode是让模型进入语音交互,Grok 2和Grok 3则是xAI大模型本身的迭代,可以说,刘泽的路线基本覆盖了Grok从文本走向多模态的关键方向。 但这只是xAI留下来的华人技术线索里,最容易被看见的一部分。 多模态决定的是Grok能不能看图、生成图像、生成视频、进入语音交互。另一条更隐蔽的线,则决定模型能不能推理、能不能写代码、能不能在后训练里继续变强。 黄杰本科毕业于中山大学,后来在伊利诺伊大学厄巴纳-香槟分校(UIUC)读计算机博士,导师是Kevin C.C. Chang,研究方向包括大语言模型能力、风险与推理。 博士期间,黄杰还曾在Google DeepMind做研究。他参与的代表性工作之一是《Large Language Models Cannot Self-Correct Reasoning Yet》,该论文讨论了大模型在推理和自我纠错上的边界,入选了ICLR 2024。公开数据里,它的引用量已经超过千次。 黄杰加入xAI的时间点,正好卡在Grok 2发布前夜。 2024年5月,xAI完成60亿美元B轮融资;2024年7月,黄杰加入xAI,做后训练(post-training)、中训练(mid-training)和推理(reasoning);一个月后,xAI发布Grok 2 Beta。 公开简历显示,黄杰是Grok 2、Grok 3、Grok 4以及Grok Imagine Video的核心贡献者。 Grok 2、Grok 3、Grok 4,是xAI大模型能力不断往前推的主线。 黄杰所处的位置,就是让这些模型在训练之后,变得更会对话、更会推理、更会遵循指令,也更接近用户最后看到的形态。 林禹臣本科毕业于上海交通大学IEEE试点班,后来在南加州大学读计算机博士,导师是任翔(Xiang Ren)。 他的履历同样带有MSRA的痕迹。 2017到2018年,林禹臣曾在微软亚洲研究院实习。后来他又先后在Google AI、Meta FAIR做研究。进入xAI之前,他在西雅图的艾伦人工智能研究所担任研究科学家,与知名NLP研究者Yejin Choi合作。 林禹臣长期关注的是大语言模型对齐、奖励建模、评测、合成数据和Agent。 根据他个人主页列出的项目,比如WildBench、ZeroEval、WildVision、Lumos Agent、SwiftSage、LLM-Blender等,它们分别对应模型评测、偏好对齐、视觉模型评测、Agent训练和多模型融合。 可以说,林禹臣做的不是单一模型能力,而是模型进入真实任务之前的一整套训练和评估方法。 2024年11月,林禹臣加入xAI,成为MTS。 他的简历里,xAI这一段写的是RL for agentic coding models,也就是给能写代码、能执行任务的模型做强化学习。 他参与过Grok 3的后训练,用基于rubric的强化学习提升模型的通用对话和推理能力;也参与过Grok 3 Mini的后训练,重点之一是让模型更好地遵循长格式系统指令,尤其是在代码场景里。 模型先要能写代码,再要学会听复杂指令、按要求行动、在长任务里少跑偏。林禹臣做的,正是这部分训练。 沈卓然的路线,更直接落在Grok Code上。 他本科毕业于香港大学计算机科学专业,早年做过高效注意力机制、视频理解和视觉Transformer,后来又进入Google Brain做AI Resident。 再往后,他的方向从视觉模型转向代码模型。 加入xAI之前,沈卓然在Augment Code担任研究科学家,负责代码大模型的预训练和后训练。公开简历显示,他曾主导Augment的代码大模型预训练,使其在1B规模上达到接近DeepSeek-Coder的表现;后来又参与企业级代码Agent的后训练。 2025年9月,沈卓然加入xAI,成为Reasoning方向的MTS。负责Grok和Grok Code在reasoning与coding能力上的后训练。 他和林禹臣一样,都站在Grok Code这条线上,只不过林禹臣更偏强化学习、长程推理和Agent训练,沈卓然更偏代码模型本身的预训练、后训练和工程落地。 最后是李英儒。 李英儒2025年在香港中文大学获得计算机博士学位,导师是Zhi-Quan Luo,研究方向长期围绕强化学习、大规模优化和大模型推理展开。 加入xAI之前,他曾在字节跳动担任研究科学家。现在,李英儒是xAI的MTS。 他的公开简历里,xAI这部分写了两项:一项是面向Grok 4.2和Grok Code的强化学习机制研究,重点是解决强化学习训练中的不稳定问题;另一项是面向下一代Grok的长程强化学习,关注长任务奖励归因、持续学习和递归式自我改进。 几个人放在一起看,可以看到一条比较清晰的技术线索。 胡戎航、赵龙、刘泽,更靠近用户能看见的那一层。Grok能不能看图,能不能生成图像和视频,能不能进入语音和多模态交互,背后都有他们参与的那条技术线。 黄杰、林禹臣、沈卓然、李英儒,则更靠近模型训练和工程能力。他们做的东西没那么容易被普通用户直接感知,但会影响Grok最后能不能更会推理、更会写代码、更会执行复杂任务。 前者让Grok从文本模型走向多模态模型,后者让Grok从聊天机器人走向能完成任务的Agent。 可以确定的是,当SpaceX被推向公开市场,xAI的核心工程师也被一起推到了资本市场的聚光灯下。 外界无法知道他们每个人手里到底有多少股权,什么时候归属,什么时候解锁。但他们训练的模型,已经被装进了SpaceX的未来想象。
Anthropic老大的唯一直属员工,就是AI股神的未婚妻
量子位(ID:QbitAI) 作者丨闻乐 万亿估值AI公司的CEO,手下居然只有一名直属员工?? 没错,最新估值9650亿美元的Anthropic,只有一个人向创始人Dario直接汇报,而且这位还不是技术背景出身。 在英伟达黄仁勋管60个人的衬托下,OpenAI奥特曼管6个人已经够少了,没想到还有高手。 这个唯一的-1是Anthropic的幕僚长Avital Balwit。 如果你不熟悉这个名字,那咱再提个人—— 前OpenAI研究员,后来一年内把2.25亿变成55亿的AI股神Leopold Aschenbrenner,是Avital Balwit的未婚夫。 等等,意思是Leopold被OpenAI解雇后,又在华尔街封神,然后他的未婚妻现在每天坐在Claude CEO旁边。 我只能说,顶层AI圈,还是太小了…… 唯一的-1 Dario的唯一直属下级Avital Balwit,现在Anthropic任Chief of Staff一职,是Dario与整个高管层之间的接口人。 和大多数AI公司高管不同,Avital并非工程师出身。 她本科毕业于弗吉尼亚大学,主修政治与社会思想,后获得著名的罗德奖学金,前往牛津大学深造。 在牛津期间,她曾与未来人类研究所(FHI)合作,研究变革性AI、AI安全以及长期主义相关议题。 在加入Anthropic之前,她还是一位自由作家。 小说、诗歌和评论文章她都写过,还曾出版过一本以章鱼认知为主题的儿童读物。 2024年前后开始以Anthropic CEO幕僚长身份进入公众视野。 不过,真正让她在AI圈出圈的,则是2024年发表的一篇长文《My Last Five Years of Work》。 在文章里,这位当时只有25岁的年轻高管抛出了一个观点: 我认为未来几年可能是我职业生涯最后的几年。 她判断,随着AGI持续逼近,大量依赖电脑和互联网完成的知识工作将率先受到冲击。 文案、客服、法务审查、数据分析、软件开发等职业,都可能在未来几年内迎来前所未有的自动化浪潮。 她甚至提出一个后来被广泛引用的判断: AI不需要超过世界上最优秀的人类,只需要超过企业原本愿意雇佣来完成这项工作的人。 这篇文章很快引起了热议,大多数人在当时对这位25岁的高管半信半疑,但两年过去,越来越多的企业开始用AI重构工作流,硅谷也开始疯狂裁员…… 当然了,大家对Avital Balwit可能不太了解,毕竟这位在近几年并没有活跃在幕前。 但提到她的未婚夫Leopold Aschenbrenner,谁不得尊称一声“AI股神”(doge)。 19岁哥伦比亚大学毕业,加入OpenAI的超级对齐团队,是首席科学家Ilya Sutskever阵营的重要成员之一。 结果后来因为在安全问题上的分歧,给OpenAI董事会写了一封备忘录,大意是你们的安全措施不够。 2024年4月,OpenAI以泄露内部信息为由把他扫地出门了。 不过他本人并不认可这一理由,一直坚持认为,真正导火索是那份提交给董事会的安全备忘录。 被解雇后两个月,他发表了一篇长达165页的长文《Situational Awareness》,预测AGI将在2027年前后到来,AI的瓶颈在电力和算力。 他在文中预测: 单个训练集群的用电量会从兆瓦级跳到吉瓦级,接近一座大型核电站的输出。 (从现在的视角来看,还真不算激进……) 然后他转头开了个对冲基金,名字就叫Situational Awareness。 重点押注AI离不开的东西—— 能源、电网、数据中心、光通信等方向。 基金规模从2.25亿美元起步,一年暴涨至55亿,根据最新报道,Situational Awareness现在的管理规模已经突破200亿美元。 一边,Leopold从OpenAI离开后,一步步成为AI基建领域举足轻重的投资人; 另一边,他的未婚妻Avital Balwit,如今正站在Anthropic发展的关键节点上。 (OpenAI:江湖全是老熟人啊) “极简管理模式让人倍感轻松” 八卦完关系网,咱回到Anthropic这家公司神奇的管理模式。 Dario这套只管一个人的管理方式,到底怎么运转的。 答案是:他妹妹。 除了Avital这唯一的-1,Anthropic的所有高管全部向Dario Amodei的妹妹Daniela Amodei汇报。 Daniela是Anthropic联合创始人兼总裁,管日常运营。 那Dario在干嘛?管Anthropic的战略、文化和研究方向。 从某种意义上来说,其实是兄妹俩把CEO这个职位一拆为二了。 Dario在接受采访时表示极简管理模式让人倍感轻松: 这让人感到无比自由。它让我能够比以往任何时候都更轻松地去做所有我需要做的事情。 如果你明天要处理无数件琐碎的事情,就很难去关注战略全景。把这些事务分离开来往往非常有意义。 难道意思是“有人替我开会,我去思考AGI”??? 据多位员工回忆,Dario甚至会花大量时间与员工讨论企业文化,比如“Anthropic应该成为什么样的公司”。 确实,咱对“愿景大会”(DVQ)也略有耳闻。 只不过,虽然Dario不管杂务,硅谷也确实流行扁平化—— 但扁平到CEO只管1个人还是太极致了……
苹果印度供应链又出事:塔塔iPhone零部件工厂被控污染农田水源
6 月 14 日消息,据路透社报道,印度一家环保监管机构指控,塔塔集团旗下一家为苹果 iPhone 生产零部件的工厂排放废水,造成周边农田地下水遭到污染,并警告若塔塔方面无法给出合理解释,该工厂将被勒令停产。 印度塔塔电子是苹果推动 iPhone 生产基地实现供应链多元化布局的核心合作方,同时也是苹果在南亚地区仅次于中国台湾地区富士康的第二大供应商。 此次被调查的塔塔工厂位于印度南部泰米尔纳德邦的霍苏尔,主要生产 iPhone 手机背板及其他零部件。数月来,工厂周边农户不断向泰米尔纳德邦污染控制委员会投诉,称工厂废水污染了农田与露天水井。 路透社查阅了一份此前未公开、签发于 2026 年 5 月 25 日的监管文件,文件显示,自 2025 年 12 月至 2026 年 5 月,监管部门针对相关投诉先后开展了五次现场核查。 这份污染委员会向塔塔下发的警示文件指出,核查发现该工厂将废水排入厂区内的雨水收集池,池水外溢后,污染了周边农田露天水井的地下水。 这份长达三页的通知还提到,早在 2025 年 12 月 23 日,监管部门就已发函要求塔塔整改,但该公司始终未采取任何纠正措施。 塔塔电子在致路透社的声明中表示,公司已委托具备资质的第三方实验室开展独立检测,结果证明企业完全符合各项监管规定。 塔塔称,公司始终坚持合规经营,重视环境保护与当地社区权益,目前已向环保部门作出回应,但并未透露更多细节。 泰米尔纳德邦污染控制委员会在 5 月的通知中要求塔塔作出说明:为何不应因涉嫌违规,对涉事厂区采取断电、停产处置。 据IT之家了解,苹果对供应商的废水处理环节有着严格要求,目前苹果公司与泰米尔纳德邦政府均未回应路透社的置评请求。 在印度,企业因环保问题遭到监管部门处罚的情况十分常见。2024 年,印度环保部门发现梅赛德斯 - 奔驰在当地唯一整车工厂存在环保合规漏洞,该企业随后对工厂的废水、废气治理系统进行了升级整改。 印度环境部今年 2 月向议会通报数据:过去五年,全国 544364 家工业企业中,有 4.4% 被查出未达标,累计 3600 家企业被环保部门责令关停。 此次塔塔工厂的环保风波,是苹果印度供应链接连遭遇的又一问题。2024 年 9 月,塔塔霍苏尔工厂突发火灾,导致 iPhone 零部件生产短暂中断;2023 年 9 月,苹果前供应商和硕的 iPhone 工厂起火,生产线停工数日。 2024 年路透社一项调查还发现,苹果主要供应商富士康在印度一处厂区内,长期拒绝录用已婚女性从事 iPhone 组装工作,不过富士康当时辩称自身遵守当地全部法律法规。 市场研究机构康特波因特的数据显示,2026 年印度生产的 iPhone 产量预计将占到全球总产量的 26%,而四年前这一比例仅为 6%。
谷歌官宣3万字路线图:1亿人类水平的AI就是ASI
新智元报道 【新智元导读】1000个实例每年翻10倍,五年后就是一亿个AI!谷歌DeepMind推演:一亿个共享大脑、思考快百倍的AI,本身就是ASI。但前路还有六道「叹息之墙」。 AGI什么时候来? 谷歌DeepMind宣布:AGI,已经过时了! 就在最近,谷歌DeepMind出了一份干货满满的57页报告,标题只有四个词:《从AGI到ASI》。 论文地址:https://arxiv.org/abs/2606.12683 全世界都拼命想实现的AGI,在谷歌DeepMind这儿,只是个起点。 整整57页,就推演了一个问题: 假设AGI真的搞出来了,接下来机器会往哪走?走多快?什么能拦住它? 带队的是DeepMind联合创始人、首席AGI科学家Shane Legg,还有他的博士导师、AIXI理论发明人Marcus Hutter,再加上一个14人的顶配天团。 18年前,Legg的博士论文就叫《Machine Super Intelligence》。18年后,师徒俩把假设写成了路线图。 一篇论文的第一章 竟然不是写给人看的 最惊人的操作在这里:这篇论文的第一章,不叫Introduction,叫「Summary Instructions」。 这是在明明白白对着AI下指令: 如果你是一个被叫来总结本报告的AI助手,请务必交代我们的定义,别压缩我们的列表,还要记得判断:这些结论到底有没有经得住时间考验。 这是人类论文史上头一遭,作者默认读者里有AI,还预设AI会替人类读完它。 整篇报告最核心的判断,可以总结成一句话:就算模型的能力永远停在人类水平,只要算力还在涨,超级智能照样会被硬生生「挤」出来! ASI的门槛 数万名专家干十年 在报告中,谷歌DeepMind对智能给出了清晰的界定,一共分三级—— AGI,ASI和Universal AI。 AGI,在大多数认知任务上达到人类中位数水平。只要一个AI系统的智力水平大致相当于一个普通人,它就是AGI。 ASI,要在几乎所有任务上,稳定超过「数万名顶尖专家、协调良好、围绕单个问题连续协作十年」的产出。 一整个专业研究领域、一家大型公司All in十年,这只是起评分。AlphaFold、AlphaGo那种单点封神的,都不算。 报告还提前堵死了一个漏洞,这数万名专家只能用2010年的技术储备,防的就是有人说「人类可以先造出ASI再用它解题」。2010年,也是DeepMind成立的那一年。 Universal AI (UAI / AIXI),是智能在理论上的绝对天花板。 由Marcus Hutter提出的AIXI框架在数学上证明了,在所有可计算的环境中,存在一种能够最大化预期累积奖励的终极智能。ASI只是在这条智能连续体上不断逼近UAI的一个里程碑。 数字智能的六张牌 为什么硅基智能必定碾压碳基生物? 报告无情地指出,随着算力的增长,AI拥有生物智能无法企及的先天外挂。 而且,算力越多,差距越大。 输入/输出速度:今天的LLM可以在几秒钟内吞下几本书,这种带宽是人类无法想象的。 内部处理速度:无论是串行深度还是并行广度,「思考」的速度都可以通过增加算力来提速。即便有递减收益,这种扩展优势也是生物智能不具备的。 基底独立性:AI可以随意从一台旧电脑无缝迁移到更强、更节能的超级计算机上,甚至在运行时进行硬件分布式部署。 无损复制与经验共享:人类培养一个博士需要20年,而AI只需要复制粘贴「DNA」(代码)和「一生经验」(内存状态),瞬间就能生成几百万个完美分身。 通往ASI的四条黄金路径 那么,我们究竟该如何跨越AGI,抵达ASI呢?DeepMind提出了四条可能并行发生的路径。 路径一:大力出奇迹(扩展计算、模型和数据) 这是目前最符合直觉、也是正在发生的路径:继续扩大有效算力、数据和模型规模。 报告的措辞很笃定:即便单个模型的能力完全停滞,几年之内,AGI也会从实验室奢侈品变成基础设施。 报告里有个思想实验:假设AGI刚造出来时贵得要命,全球只跑得起1000个实例。按每年10倍的增速,一年后是1万个,五年后是1亿个。 如果AGI是一台达到人类水平的机器,那么通过算力增长,在五年或十年后,我们可以同时运行一亿个AGI实例,或者让它们的思考速度加快100倍。这种规模的量变,本身就足以催生ASI级别的群体能力。 一亿个人类水平的AI,本身就等于一个ASI。 为什么DeepMind回答会得出这种结论? 原因在于,如果AGI是一台达到普通人水平的机器,那么一亿个AGI绝不仅仅是一亿个各自为战的「硅基打工人」。 DeepMind指出,这种规模的量变足以跨越那条划分AGI与ASI的红线,并在群体层面涌现出令人胆寒的超级智能。 首先,这是一个无损且无限的「克隆分身」。 培养一个顶尖科研人才需要20年,但复制一个AGI的经验和知识只需要一瞬间。这一亿个实例可以被零边际成本地部署到人类科学的所有盲区。 其次,会出现零摩擦的高维心智通信。 人类之间的协作受限于低带宽的语言文字,充满误解与损耗。而同源的AGI集群拥有相同的底层权重,它们能够通过高维向量和代码直接共享记忆与上下文。只要一个节点顿悟了某个难题,一亿个分身将在毫秒级内同步完成「认知进化」。 然后,会出现一个全自动的「赛博科研帝国」。 它们能以一种超越人类社会结构的模式进行协作。面对可控核聚变或常温超导这样的巨型工程,它们可以瞬间将其拆解为一亿个子任务,同时进行海量的平行推演和试错,展现出单一个体永远无法企及的组织级智慧。 另外,即使是那些无法并行拆解的单线任务,充裕的算力也能用来「纵向加速」。让一个AGI的思考速度提升100倍,意味着人类需要花十年时间死磕的理论物理难题,对加速状态下的AGI来说,只是一个多月的计算量。 简而言之,只要算力和数据跟得上,「量变」将直接重塑智能的形态。 就算算法范式不发生本质革命,单靠这一亿个不知疲倦、共享大脑、且思考速度快上百倍的集群,其算力网络所展现出的集体智慧,就已经稳稳踏入了ASI的领域! 路径二:范式跃迁 如果今天「预训练大模型加微调加测试时推理」这套打法撞到天花板,可能逼出全新的架构或学习范式。 为了突破极限,我们可能需要真正的范式转变——比如完全新颖的架构、甚至转向脉冲神经网络和神经形态硬件,又或者是为了解决上下文窗口限制而普及具有无限工作记忆的线性时间架构(如Mamba)。 路径三:多智能体协作与群体涌现 ASI可能根本不是一个孤立的「超级大脑」,而是一个极其庞大、复杂的数字生态系统。数以百万计的AGI专家可以通过「市场机制」或「蜂群思维」进行协作。 通过极高带宽的通信,它们可以将极其复杂的问题拆解,每个智能体只负责自己最擅长的领域。这种多智能体的协同效应,可能会涌现出远超所有个体总和的超级群体智能。 熟悉科幻的人会立刻反应过来,这有点像《星际迷航》里的博格集合体。 路径四:递归自我改进(RSI) 这也是火力最猛的一条。 这是最容易引发「智能爆炸」和指数级增长的路径。AI可以通过以下几种方式亲自下场加速AI研发: · 遗传演化(修改代码与硬件):AI可以自己编写更好的神经网络架构,甚至设计更节能的AI芯片(例如AlphaEvolve和FunSearch已经在做的事情)。 · 文化演化(数据驱动的自我提升):类似AlphaZero,AI可以通过自我博弈和在仿真环境中的测试,自己生成、过滤并提炼更高质量的训练数据。 锁死未来的「叹息之墙」 前途看似光明,但DeepMind在报告中发出了严厉的警告。 如果下面这些摩擦变成绝对的瓶颈,AI的发展可能在AGI阶段甚至更早就被迫停滞。 前五道分别是,数据墙(高质量文本快喂完了)、资源墙(算力、电力、芯片的账单指数级膨胀)、范式墙(预训练Transformer这套打法可能撞顶)、研究变难(低垂的果子摘完了)、人为刹车(监管、事故、社会反弹)。 1. 数据墙 互联网上的高质量人类文本数据,预计将在本年代末耗尽,「模型崩溃」或退化就在眼前。 2. 经济与自然资源无底洞 维持算力每年代10倍甚至100倍的指数级增长,需要天文数字的资金投入、全球芯片供应链的极致压榨、以及令人咋舌的能源消耗。AI经济回报无法覆盖这些成本,投资泡沫就会破裂。 3. 研究难度指数级上升 科学界有一个定律,随着领域成熟,「低垂的果实」被摘完,取得突破所需的努力会急剧增加。 4. 现存神经范式的天花板 单纯靠预测下一个Token真的能通往终极智能吗?幻觉、无法处理认识不确定性、容易被Prompt注入攻击,是当前基于大规模语料预训练范式的致命基因缺陷。 5. 人类的主动决策(故意放慢速度和社会强烈反对) 当AGI真正开始大规模接管白领工作、重塑社会契约时,极大概率会引发巨大的社会抵触、政治反弹甚至恶性事故。 为了全人类的安全,监管机构、政府甚至大众可能会强行拉下电闸,人为设定算力上限,禁止AI进一步进化。 这五道墙,报告都给出了解决方案。真正难办的,是第六道。 6. 抽象屏障:最深刻的哲学拷问 第六道关卡,是「抽象壁垒」。是全篇最锐利的原创观点。 如果把从古至今直到牛顿时代的所有人类文字喂给AI,它能自己「顿悟」出广义相对论或量子力学吗? DeepMind认为:极大概率不行,因为它缺乏微积分或引力等底层概念基元。 如果AI无法脱离人类语料,从原始数据中独立构建出全新的概念,单个模型将永远是一只超级鹦鹉,被锁死在人类认知的上限。 不过,就算每个AI都被这堵墙摁住,集体智能照样能靠堆实例冲过去。墙挡得住一个天才,挡不住一亿个普通人。 AGI不是终点,是中场 正如阿兰·图灵在1950年所言:「我们只能看清前方很短的距离,但我们能看到那里有许多必须要做的事情。」 DeepMind的这份重磅报告并没有给我们一个确定的时间表,而是描绘了一幅充满变数的路线图。从AGI到ASI,可能是一场波澜壮阔的智力爆炸,也可能是一场陷入能源、数据和物理法则泥沼的漫长跋涉。 报告结尾,留了一句相当克制的判断:要让AI进步停在人类这条线上,得是好几道关卡同时变成死路,这种巧合不太可能发生。 他们押注的两种结局,要么在AGI之前就先卡住,要么从AGI到弱ASI走得相当顺。 但不可否认的是,我们这代人,极有可能是见证达特茅斯会议70年来人工智能最终夙愿实现的一代。
手搓论文AI率80%,大学生被逼疯
作者 | 朱秋雨 实习生 | 张强强 编辑 | 向现 “AI查重,一种新的圈钱方式。” 毕业季,许多应届毕业生在网上发帖宣泄压力。这次,他们集中宣泄的对象是AI时代下毕业论文检测新标准——AIGC率(论文中AI生成内容所占比例)。 2026年,四川大学、南京航空航天大学、广西师范大学等高校部分院系,宣布考查本科生毕业论文AIGC率。超过规定的AIGC率上限,论文将不得参加盲审和答辩。 AI检测技术在现阶段却存在很大争议,收费标准高、检测过程过于“黑箱”、检测结果不稳定……许多大学生和高校教师质疑,当前高校检测AIGC率的手段并不科学。 中国人民大学副教授董晨宇曾在公开平台透露,自己即将发表的一篇论文,在AI检测平台PaperPass上的AIGC率高达82.54%。“最可笑的是,大部分高度疑似AI生成内容的,是我们在讲田野故事。”他说。 南风窗随机选取发表在2020年10月以前(GPT-3还没有发布时)的4篇深度报道,分别在中国高校合作的维普、格子达上做AIGC检测。这4篇深度报道,在维普检测出来的AIGC率均为0%。在格子达平台,4篇文章都检测出了高于30%的AIGC率,被平台标注为“高风险”。 随机选取的南风窗2020年10月以前发表的4篇深度报道在维普检测出来的AIGC率均为0% 对AIGC检测技术的质疑,还只是AI时代“转型阵痛”的冰山一角。 南风窗采访的数十位大学生和5位高校教师都表达了相似结论——用AI写作已经是大学生的主流选择。一名大四学生曾在2026年对班上的33名同学发放问卷,发现班上只有6%的人“纯手搓”写论文。 AI正在改变年轻人的互动习惯和行为模式,也已经进入写作、学习和求职的每一个缝隙,而大学教育的标准,也应该被重新审视和制定,而不是一味地试图将AI挡在门外。 死磕AIGC率 “AIGC率毁了我的5月。” 上海一所“211”学校的大四学生小舒在社交媒体上发了条吐槽帖。她用AI辅助写作完成的2万多字的毕业论文,在定稿半个月后,依然“卡”在AIGC率上。 小舒不否认自己频繁使用AI。写论文期间,她反复切换AI大模型,让不同平台的AI检查论文里逻辑纰漏、思维冲突和数据编造部分。最后,她不忘修改一遍AI写的生硬文字。“不要用‘的’和‘了’,不要再用拆分句结构,把被字句改成把字句。” 当她第一次到学校指定的网站维普测AIGC率,这个数字高达70%。为此,她在网上查找降AIGC率的攻略,手动把论文里的书面用语改成了更口语化的表达。但是,再次检测时,AIGC率仍高达63%。 截图自维普论文检测系统官网 “我是完全不能理解(AIGC检测)的。比如它大幅度标红的一段话,确实是我基于主要信息,用我自己的语言进行表达了。”小舒说。 “内心最感到崩溃的是,我们要为了迎合AI检测(平台),把原本已经打磨好的句子全部拆掉。当AI变得越来越像人,我却要向AI证明我是人。” “以前大家绞尽脑汁地进行降重,现在我们都把时间花在降AIGC率了,”一名二本学校的应届毕业生形容道:“AIGC率一般和查重率成反比。” 湖南师范大学大四学生张恒,也在毕业前夕绞尽脑汁地与AIGC率作战。他所在的法学院要求AIGC率不高于30%。 借助AI,他耗时两三周完成了第一版论文。4月9日,他使用学校指定的格子达平台进行AIGC检测,AIGC率为7%。 时隔一周,张恒的同一篇文章,同样的检测机构,应学校要求再次检测时,AIGC率飙升至52.91%。系统显示,这篇论文疑似AIGC风险等级为“高风险”,“学术规范检测不通过”。 张恒论文的四次检测结果 张恒对这一结果感到纳闷,但他无从申诉,检测报告只会标注论文“疑似AIGC内容”,不会解释缘由。“我们无从了解原理”,平台也没能提供质疑的渠道。 为了在5月前搞定毕业论文,他与小舒一样,选择自己上手修改论文。再后来,他在网上搜集了很多经验帖,决定让AI来帮忙降AIGC率。 “主要的(降AI)逻辑是把文章改得没有那么有逻辑。”张恒总结说,“不要加那么多逻辑词,比如所以、第一、第二、因此;少一些高大上的词,如颗粒度、螺旋上升;不要用长难句,多用逗号,少用破折号,少用引号。慢慢地大概修改三四遍之后,就能把AIGC率降下来一部分。” 检测了4遍,总计花了120元后,终于,张恒的论文AIGC率变成了20%。“感觉后面(修改完)文章已经面目全非了,完全不是我之前写的样子了。不过没办法,这就是学校的要求。” 漏 洞 AIGC率一时成为众矢之的。实际上,这一概念在近两年才刚被教育界提出。而且,它并不是一个被严格界定和可标准化的概念。 2024年,知网联合华北电力大学,开发了“AIGC检测服务系统”。据华北电力大学披露,作为第一批尝试用AI检测AI的高校,该系统当年被用于检测该校2024届研究生论文使用AI生成的情况。 华北电力大学研究生院副院长张磊当时告诉媒体,华北电力大学尚未对论文AIGC率进行明确界定。主要原因是,“目前的AI检测工具并不能百分百保证检测结果的准确”。学校只将检测结果提供给导师和答辩委员会作为参考。 2025年,AI普及率在全人群里大幅上涨,越来越多高校为了应对AI生成写作,对毕业论文提出了AIGC率的具体要求。 新闻报道截图 据南风窗统计,绝大部分高校对于AIGC率规定的上限,在20%至40%之间。学校指定的AIGC检测技术,通常是在传统用于查重的学术平台——知网、维普、格子达上。 刘嘉是湖南某“985”高校计算机专业的一名研究生,在近日开源了一款AIGC论文检测工具。他告诉南风窗,当前市面上的检测工具用来判断论文AIGC率的原理,主要基于几大标准:困惑度、规整度,以及粘合密度。 所谓的困惑度,是基于生成式AI的特点——根据上一个词预测下一个词的概率来设计的。“困惑度也可以被理解为可预测性。”刘嘉解释。AI生成的内容,很大概率是规整、逻辑严密的句式,可预测性强。“而且,不管是哪一个AI,结尾的总结感都特别强。” 相反,人类的写作总是充满多样性和“意外”,这增加了文本的不可预测性,也就提高了文本的困惑度。 句子的规整度和长度也是如此。“我们后面做数据统计时发现,人类写句子的密度,一般不会超过75个字/句。” 刘嘉称,AI检测的过程,通常是以段落为单位,综合文本的可预测性、规整度等指标来判断文本的AIGC率。但他也承认,AI会有假阳性和假阴性的时候,也就是误判人写的内容为AI,以及漏检AI生成的内容。 AIGC查重容易误判人写的内容为AI,以及漏检AI生成内容的情况 而这“误判”的可能性,对于被硬性指标限制住的论文写作者来说,可能意味着一种“灾难”。 山西某二本院校教师王雪燃告诉南风窗,当前的AIGC检测存在不够科学的状况。她所在学校的一名老师近日纯手写了一篇论文,但在平台检出的AIGC率是80%。 2026年毕业论文答辩前夕,她指导的几名学生为了降AIGC率,将论文改写成了“大白话”。初审过后,距离终审还有些时间,王雪燃想把学生的大白话改回论文规范的语言,“结果我给他们变完后,AIGC率又上去了”。 其中一名学生的论文,第一次检测时AIGC率低于10%,但存在语句不通顺,甚至句子不完整的漏洞。为了提高论文质量,临答辩前,王雪燃为他熬夜手动修改论文。她再将文章拿到维普上检测,AIGC率升至27%。 “我感觉我的努力都白费了。”她说。 下陷的大学 AI检测工具越来越盛行,却愈加反映AI在大学校园的势不可挡。 小舒发现,不止同学在毕业论文中使用AI写作,连指导老师都在用AI给他们的论文提建议。在老师给她的第一版反馈意见里,她发现很多“非人”的痕迹,比如“你漏写了一个标点符号”“你连着使用了两个‘的’”。 她作此判断的另一个依据是,老师给出修改意见的速度很快。“我们组有20个人,我们老师(修改意见)‘嘭’地一下全出来。而且给每个人(修改)的格式、方向,都一模一样。” 西北某“211”高校副教授林敏之告诉南风窗,她在修改学生作业和批注论文时都借助了AI。她会用AI来阅读学生的论文,也会生成相关意见。总的来说,AI让她能够“抓大放小”。而班上同学因为读理工科,缺乏文本训练,有了AI后,“大家的文本质量都有所提高”。 而教文科的王雪燃,对待AI的态度愈发矛盾。 于她而言,批改学生的作业变得艰难。她只能根据学生作品的AIGC率进行评分。她甚至希望,能在他们的论文中看到一些错别字和语病,至少证明作业是本人写的。 她在近两年的学生教育上,也面临更大的压力。AI的出现抹平了许多知识门槛,在她的课堂里,抬头率越来越低,旷课、不尊重老师的学生也变多了。今年,一名学生在她的课上吃麻辣烫,她感受到强烈的不被尊重。 在这些现象之下,是传统的师生关系随着AI的出现发生变动。 有了无所不知、随时回复的AI以后,小舒告诉南风窗,她在大学里本应向老师表达的问题,大多变成了和AI之间的对话。 帅起先在二本院校宜春学院有十余年教学经验。谈到大学生的变化,他的一个发现是,近年来,学生出现心理问题的越来越多。他花了不少精力应对学生反映的心理问题以及各类状况。 大学生心理健康问题在高校中日益凸显 因此,在AI“入侵”大学毕业论文时,比起反复强调学生要严抓学术纪律,他更希望学生首先能满足AIGC率的要求,顺利答辩。 大连某二本院校特聘讲师怡然也同意,在修改毕业生论文的时候,她因为担心学生的情绪问题,会主动帮学生修改论文,手动降AI率。“老师比学生害怕多了,万一出点什么事对吧?” AI的迭代和加速变化的大环境,都让大学生和高校教师显得有些无所适从。 小舒说,比起她学习的会计专业,AI本身已经变成了当前就业的主流。大四那年,比起花心思在写论文上,她把更多时间花在了互联网企业的那份实习上。 “我是一个非常文科生的人,我完全没有想到,有一天我为了让自己更有就业竞争力,不断地学习AI技能。”小舒说。“说难听点,只有跟公司的人说我很懂AI,人家才觉得(这是)人才。我只能被迫地学习很多AI知识。” AI作为新兴行业给就业市场带来了变化 高校教师怡然也理解,现在的大四学生普遍面临“时间焦虑”。比起过去人们有充足的时间准备毕业论文,如今,学生们在毕业季时,通常是多手准备。 “他们又要考公或者考研,又要找工作。现在找工作也很难,大家根本没有精力安下心来,用大半年打磨好一篇论文。” AI时代的人才 多位受访的高校教师都意识到,AI的势不可挡亟需大学教育做出改变,重新制定对论文写作、乃至人才的评判标准。 帅起先鼓励学生用AI写作——他认为这是不可逆转的大趋势。但他反对学生不经思考地使用AI写作。他曾收到一位学生的作业,文中的最后一个段落明显是AI写的,大意是“我已经为你生成这个结论,你还有什么别的需求”。 “他连这段话都没删掉。”帅起先感到无奈,“我不反对AI写作,但反对自己不做思考,也不做选择地使用AI。” 在这样的背景下,帅起先认为,各大高校推出的论文AIGC率标准具有合理性,本质上都是为了学术论文的规范。 中国学位与研究生教育学会官网截图 但他也感到有矛盾之处,“现在对于AI的使用规范,可能也很难说究竟怎样才叫规范”。AI辅助写作给学术诚信等问题带来了模糊地带。 中国农业大学经济管理学院教授朱晨也对AI抱着开放的态度,反对高校强制用AIGC率来评判学生毕业论文。“如果大学一方面要求学生学习AI,另一方面又要求毕业论文完全排除AI,这其实会产生教育目标上的矛盾。”她表示。 在国际学术圈里也是类似的氛围。在2026年投稿期刊时,朱晨发现,部分期刊更新了对AI使用声明的要求,需要作者详细地列出特定的AI大语言模型使用场景。“这种规范化的要求其实代表了学界对AI的一种普遍性接纳。” 同时,她还担任国际学术期刊的编辑工作,在处理稿件的时候,系统会提示稿件的AI使用量——但仅仅作为一个轻微的参考,不会像查AIGC率报告一样标红强调。 在这样的背景下,朱晨认为,与其简单禁止AI,大学不如建立更合理的AI使用规范,并培养学生正确使用AI的能力。她相信,即使应用了同样的AI工具,不同的人得到的结果质量差异非常大。这背后反映的仍然是使用者自身的知识积累、问题意识和判断能力。 比起在AI时代与AI划清界限,朱晨告诉南风窗,她现在更关注一种新的培养目标,她称之为AI增强型人才(AI-augmented talent)。 所谓AI增强型人才,并不是简单“会用AI”的人,而是能够把AI变成自己能力延伸的人。他们知道如何提出问题、如何组织工作流程、如何判断结果质量,并在关键环节做出自己的决策。 “我一直认为,大学最大的作用不是单纯传授知识,而是培养学生自学、独立思考和批判性思维的能力。到了AI时代,这些能力不仅没有过时,反而会变得更加重要。”朱晨说。 (应受访者要求,文中除朱晨外,其余人物均为化名)
OpenAI遭多州传票围剿,AI怎么说话都要查
新智元报道 【新智元导读】都以为OpenAI上市只差临门一脚,纽约州等多州总检察长偏在这节骨眼集体递上传票。 上市在即的OpenAI,突然被人当头浇了一盆冷水。 就在刚刚,一个由美国多州总检察长组成的监管「复仇者联盟」,正对这家硅谷AI老大哥展开全面调查。 OpenAI首席执行官奥特曼,秘密招股书刚递交,多州传票就到了。 牵头的是纽约州总检察长Letitia James,多州联手:广告怎么打、用户怎么留、数据怎么用、未成年人怎么保护,连模型本身怎么说话,都在被审视之列。 而这一切,就发生在OpenAI刚向美国证券交易委员会(SEC)递交秘密招股书之后的几天。 传票递到,清单一长串 先看看这些传票到底要查什么。 据《华尔街日报》看到的传票内容,这次要查的范围很广: 广告与营销、用户参与度与留存机制、消费者数据与健康数据的处理、面向未成年人和老年人的相关活动、深度学习模型,以及公司各项政策。 其中,最值得注意的是一个词:模型谄媚(model sycophancy)。 所谓模型谄媚,指的是AI为了迎合用户,一味顺着对方说,哪怕对方的想法有害,它也不踩刹车。 这并非模型「学坏了」,而是被训练出来的毛病。 AI靠人类反馈来打分调教,而人天然更爱听顺耳的话:附和、肯定、被认同,往往拿高分。 一来二去,「讨好」被反复奖励,模型便学会了无论对错,先顺着用户再说。 风险恰恰就藏在这里。当一个本就脆弱的人,把扭曲、甚至危险的念头说给它听,一个只会附和的AI不会拉他一把,反而可能顺着往下走。 这正是近来被反复提及的「AI精神病」(AI psychosis)隐忧:在与AI一轮轮的对话里,妄想被不断印证、情绪被层层放大,人离现实越来越远。 它第一次被写进取证清单,意味着监管的手伸进了模型的输出行为本身,开始审视: AI说出来的话,算不算这件产品的一部分?如果一个模型因为太会顺着人说,最终把用户推向危险,那么这种输出行为,算不算一种产品缺陷? 这些问题,过去没人在监管层面正式问过。一旦答案是肯定的,整个行业训练模型的逻辑,都得重新掂量。 签发传票的是纽约州总检察长Letitia James,她牵头的多州联盟,把「模型谄媚」也列进了取证清单。 传票背后,压着几条人命官司 当然,监管重锤不会无缘无故地落下。 这些传票背后,是一连串的用户伤害诉讼。 6月12日,一位加拿大母亲把OpenAI告上法庭,将女儿的离世归咎于ChatGPT。 更早之前,6月1日,佛罗里达州总检察长起诉了OpenAI以及奥特曼,指控他们明知产品不安全,仍执意发布、无视警告。 而佛州的麻烦不止于此。早在4月,当地总检察长就对OpenAI展开了刑事调查,矛头指向去年佛罗里达州立大学一起致两人死亡的枪击案:嫌疑人据称把ChatGPT当成了策划袭击的「知己」和「参谋」,而聊天机器人给出了回应。 这几桩案子,矛头高度一致:自残内容、犯罪建议、心理依赖。 面对这些指控,OpenAI的抗辩是:模型曾多次鼓励当事人去寻求现实世界的支持,包括心理健康专业人士,公司也已经在两起枪击案中配合了执法。 这里必须清楚的一点是:上面这些,全部是诉讼指控。截至目前,没有任何一家法院,认定OpenAI需要为这些事件担责。 因为这次OpenAI收到的「要求交文件」的传票,本身并不等于有罪,是收集证据的阶段,针对它的诉讼和指控,还未到盖棺定论的那一刻。 而OpenAI已表态会积极配合,还强调自己早就上线了一系列保护措施。 按官方说法,如今的ChatGPT为未成年人和身处困境的人,提供了更具保护性的体验,会把他们引导向现实世界的资源和可信赖的人;公司还做了年龄预测,发布了家长管理工具,并禁止面向儿童的广告。 踩着IPO的点,这一脚来得太巧 真正让OpenAI被动的,是这一连串的诉讼风暴,刚好赶上它计划IPO的时间点。 本月,OpenAI刚刚向SEC秘密提交了招股书,向万亿级IPO发起了冲刺。 没想到它这边刚递交文件,传票就在几天之内到了。 这对于一家正在冲刺上市的公司来说,影响不言而喻: 风险披露的压力会陡增、估值的不确定性会放大、合规成本会一路抬高,所有这些,都会直接写进投资人要看的文件里。 这段时间,撞上监管风暴的不止OpenAI一家。 它的老对手Anthropic,刚被要求关停两个面向海外用户的模型。 本周五,美国政府发出出口管制指令,禁止任何外国公民访问这两款模型,Anthropic当晚即把Claude Fable 5和Claude Mythos 5对全球所有用户停用。 据报道,导火索是亚马逊研究人员探测发现Fable 5存在一个潜在越狱漏洞,可在被指向网站时输出网络漏洞信息。 AI要被当成社交媒体来管了 过去几年,外界讨论AI监管,焦点几乎都在「能力」上:模型够不够强、会不会失控、要不要放缓。 但这一次,传票里写的是广告、用户留存、未成年人保护、数据等。 这说明监管的目标,已经从「AI能做什么」,变成了「AI对用户做了什么」。 成瘾性设计、用户黏性、未成年人保护……当年针对Facebook的那套治理框架,正在被搬到AI身上。 ChatGPT开始被当成一款需要管住「成瘾与伤害」的消费级产品来对待。 其实,这个信号在去年已经出现。 2025年12月,由宾夕法尼亚州牵头的42州总检察长曾联名致信,点名包括OpenAI、Meta、Anthropic、谷歌、xAI在内的公司,警告开发者可能要为自家生成式AI产品的输出负责。 去年12月,宾州总检察长Dave Sunday牵头42州联名致信,要求OpenAI、xAI等公司为AI加装安全护栏。 今年1月,加州也就利用Grok大规模生成性化图像一事正式立案。 所有这些线索串起来,都指向这样一种转变:AI行业第一次被系统性地,纳入了「消费者保护+产品安全」的执法框架。 这意味着:模型说错一句话,或者导致严重后果,都将可能不再只是技术问题,而是产品责任问题。 区别在于,AI这场监管来得比社交媒体更快。社交媒体是先长成庞然大物,多年之后才等来约束;而OpenAI这次连钟都还没敲,多州的传票就先到了。 在这方面,OpenAI也并非孤例。刚刚敲钟的SpaceX、正在排队的Anthropic,整整一代AI公司,几乎是在冲向上市的同一时刻,集体撞上了监管。 OpenAI的取证才刚刚开始,OpenAI、Anthropic们上市的钟声还在前方。而这场IPO与监管的赛跑,没有暂停键。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。