行业分类:
加载中...
头条分类:
加载中...
视频丨伊朗战事分歧难调和 美欧关系再遭撤军和关税考验
  围绕对伊朗战事的分歧,美国总统特朗普连日“怒怼”欧洲多国领导人,并威胁削减驻德国美军、提高欧盟输美汽车关税,令美欧跨大西洋关系持续降温。   有分析指出,美国近期一系列举动表明,美国与欧洲盟友的分歧已走向不可调和的局面。欧洲方面对特朗普政府相关政策的反对态度正变得愈发强硬,美欧关系或告别传统盟友体系。   美威胁削减驻德国美军   德副总理:不需要“指点”   特朗普政府近来多次批评德国和其他北约成员拒绝为美国攻打伊朗“助力”。   △美国国防部长赫格塞思   当地时间5月1日,美国国防部表示,美国防部长赫格塞思下令从德国撤出约5000名美军人员,撤军工作将在未来6至12个月内完成。   目前,美军欧洲司令部和非洲司令部均设在德国斯图加特市。德国拉姆施泰因空军基地则是美国在中东、北非和南亚军事行动的主要后勤基地。据美国国防部数据,2025年底,美军共有超过3.6万人驻扎在德国。   △德国国防部长皮斯托里乌斯   德国国防部长皮斯托里乌斯2日表示,美国从德国撤出部分美军人员的计划“可以预见”。在谈及北约的未来时,他说,北约必须更加“欧洲化”,才能维系其跨大西洋的属性。欧洲人必须为自身的安全承担起更多责任。他还表示,德国接下来将就未来的防务任务与欧洲盟国展开进一步磋商与协调。   美国国会参众两院共和党高层2日发表联合声明,称对五角大楼计划从德国撤出约5000名美军一事“深感担忧”。美国参议院军事委员会主席、共和党人罗杰·威克和众议院军事委员会主席、共和党人迈克·罗杰斯在联合声明中表示,德国已响应美国总统特朗普关于分担更多防务责任的呼吁,大幅增加了国防支出,并为美军驻扎与行动提供了支持。声明呼吁,任何涉及美军在欧洲部署的重大调整,都应经过审慎评估,并与国会及盟友密切协调。   围绕伊朗战事 特朗普和默茨陷入“口水仗”   △德国总理默茨   德国总理默茨4月27日表示,美国缺乏关于伊朗战事的战略性退出方案,导致目前进退两难。此前在4月25日,默茨也表示,美国和以色列针对伊朗的战争完全没必要。   对此,特朗普4月28日在社交媒体发文说,德国“无论是在经济还是其他方面都表现得如此糟糕”。4月30日,特朗普又称默茨应该将更多时间用于结束俄乌冲突、解决移民和能源问题,而非干涉正在消除伊朗核威胁的国家。   德副总理:德国不需要特朗普的“指点”    针对美国总统特朗普对德国政府和德国总理的批评,德国副总理兼财政部长克林拜尔5月1日表示,德国不需要特朗普的“指点”。   克林拜尔表示,德国“真的不需要特朗普的指点。他应该看看自己造成了哪些烂摊子。他应该确保现在能与伊朗进行严肃的和平谈判”。   美以对伊朗发起军事行动,德国政府一直持质疑和反对态度。德国总统施泰因迈尔此前公开表示,美以对伊朗的军事打击无疑违反了国际法,是政治上的一个致命错误。   美再挥关税大棒   欧洲议会要员:美国不可靠    除了撤军威胁,美国总统特朗普5月1日还在社交媒体发文称,由于欧盟没有遵守与美国的双边贸易协议,美国将在下周提高欧盟输美汽车的进口关税。   特朗普说,欧盟输美汽车的关税将提高至25%,如果这些汽车在美国生产,将不会有关税。   美国2025年4月对进口汽车加征25%的关税,同年7月,美欧达成贸易协议。由于双方因美国觊觎丹麦自治领地格陵兰岛引发关系紧张以及美国最高法院裁定特朗普政府大规模关税政策违法等,欧盟对协议的批准经历数月延迟。今年3月,欧洲议会议员投票支持有条件执行欧美贸易协议。根据协议,美国对包括汽车在内的欧盟输美产品征收15%的关税。   欧盟委员会发言人:欧盟将保留一切选项维护自身利益   欧盟委员会发言人5月1日表示,如果美国采取与欧美贸易协议不一致的措施,欧盟将保留一切选项,以维护自身利益。这名发言人说,欧盟始终致力于建立可预见、互惠的跨大西洋关系。欧盟正按照标准立法程序落实协议中的承诺,并在整个过程中持续向美方通报情况,保持密切沟通。   欧洲议会要员:加征关税显示美国不可靠   △欧洲议会国际贸易委员会主席朗格   欧洲议会国际贸易委员会主席朗格1日也表示,美国从对钢铝产品征收关税,到如今将矛头对准汽车,这充分体现了“美方是多么不可靠”。朗格表示,“这绝不是对待亲密伙伴的方式”,强调欧盟应“以最清晰、最坚定的态度作出回应”。他说,“我们此前也见过这种武断的做法,甚至是针对合作伙伴。欧盟现在必须保持清晰立场和坚定态度”。   跨大西洋关系持续降温   美欧关系将走向何方?   一边频频发出撤军威胁,一边又再举关税大棒。在围绕伊朗战事存分歧、美欧关系持续降温的背景下,美国此时威胁加征关税的举动,将对美欧贸易以及美欧关系产生负面影响。有分析称,美国近期一系列举动表明,美国与欧洲盟友的分歧已走向不可调和的局面。    美国政府倾向于打压欧洲国家 而非合作   美国《政治报》网站5月2日刊文指出,美国政府近期一系列举动表明,如今,美国更倾向于指责、打压欧洲国家,而不是开展合作。   分析称,美国总统特朗普“已将注意力从乌克兰大幅转移”,投向了美国对伊朗的军事行动。对于欧洲盟友未在伊朗问题上给予美方充分支持,特朗普感到不满。如今,美国政府与欧洲盟友之间的分歧,已走向不可调和的局面。   自美国和以色列2月底大规模袭击伊朗以来,美国政府就曾多次批评德国等北约成员“不给力”,没给美国打击伊朗“帮上忙”。特朗普此前多次表示要从欧洲撤军,还说“认真考虑”让美国退出北约。舆论认为,在德国之后,特朗普政府下一个“惩罚”对象可能是意大利和西班牙。这两国此前拒绝美国使用其境内军事基地对伊朗作战。特朗普4月30日称,未来“很有可能”会减少驻扎在意大利和西班牙的美军数量。   舆论认为欧洲已无“回头路”   对此,有分析称,这种悬在头顶的不确定性已让欧洲国家深感危机,迫使欧洲不得不加速探索防务独立道路。欧洲舆论认为,欧洲已经没有“回头路”。   德国前副总理兼外长菲舍尔日前撰文说,北约已开始“解体”,且“扭转局面的窗口”已经关闭,美国长期以来对欧洲的安全保护格局已经终结,欧洲现在必须走出自己的道路。   专家:欧美或告别传统盟友体系    北京外国语大学欧盟与区域发展研究中心主任崔洪建分析称,欧美关系全面而深刻的变化已经呈现得越来越清楚。越来越多欧洲国家正逐渐摆脱对所谓欧美关系的迷信,同时想办法减少对美国的依赖。   专家指出,只要美国当前的欧洲政策不发生重大变化和调整,未来欧美将逐渐在利益上以竞争取代合作,在战略上以矛盾取代协调,在政治上以对立来取代协作。未来,欧美关系可能会逐渐告别传统的盟友体系,朝着越来越充满博弈和竞争的方向发展。   总监制丨唐怡   制片人丨文凡   编辑丨杨博任   记者丨许弢 朱曦莉
东京审判《全译本》首发 传递捍卫历史坚定立场
  东京审判《全译本》首发,“有力回击日本右翼谬论”   《远东国际军事法庭庭审记录·全译本》4月30日举行首发式。参与翻译校审工作的上海交通大学教授向隆万5月1日接受《环球时报》记者采访时表示:“中文全译本可以有力回击日本右翼否定东京审判的谬论,传递中国捍卫历史真相的坚定立场,警惕日本军国主义死灰复燃。”向隆万的父亲是东京审判时的中国检察官向哲濬。中国是世界上最早抗击日本法西斯侵略、持续时间最长、牺牲最大和消耗最多的国家。向隆万表示,中国在东京审判中发挥了不可替代的作用,理应拥有一套完整权威的中文庭审记录译本。   1946年5月3日,远东国际军事法庭在日本东京开庭,由此开启了具有深远历史意义的“东京审判”。在东京审判开庭80周年之际,由上海交大战争审判与世界和平研究院和浙江越秀外国语学院、上海交大出版社组成的翻译校审团队完成《远东国际军事法庭庭审记录·全译本》(以下简称《全译本》),填补了国内文献空白,具有重要意义。   据了解,《全译本》以2013年的英文版《远东国际军事法庭庭审记录》为底本,同时和日文版庭审记录进行比对翻译,逐字查核讹错,并统一各类名称,对庭审历程和内容建立了更整体全面的认识。全国28位译者和19位校订者历时10年完成整个翻译工作,合计约2230万字,分三辑出版共40卷内容,完整覆盖东京审判从1946年4月至1948年11月的全部庭审阶段。   “东京审判整套庭审记录共计近五万页英文原稿。这份庭审记录是研究东京审判最基础、最原始的核心历史文献,完整记载了法庭长达两年多的全部审理过程。”上海交通大学战争审判与世界和平研究院副研究员赵玉蕙参与了《全译本》翻译校审工作。她对《环球时报》记者表示,庭审记录是研究东京审判法庭如何运作的底层原始史料,其他相关考证与阐释工作都必须以此为主要参照依据。因此在东京审判研究领域,这份庭审记录是不可或缺的核心文献之一。   “此次发布的中文全译本不是简单的文字翻译。”向隆万介绍,“翻译校审团队对照英文、日文版本考证、修正原文错误与矛盾,规范人名、地名,搭配注释、前言、索引,学术严谨性甚至优于英文原版。”   东京审判不仅是对日本军国主义罪行的清算,更奠定了战后国际秩序的重要基石,为当代国际司法正义提供了重要借鉴。比如审判判决书写道:“本庭的设立是依据并为了执行1943年12月1日的《开罗宣言》、1945年7月26日的《波茨坦公告》、1945年9月2日的《日本投降书》、以及1945年12月26日的莫斯科会议。”这段话明确了法庭设立的合法性,为这场世纪审判打下坚不可摧的法理基石。判决书援引大量证据、证词,详尽追溯了1928年至1945年间,日本如何一步步扩军备战、扩大侵略并最终走向疯狂的历史过程。东京审判清算了25名日本甲级战犯的滔天罪行,将日本军国主义的侵略恶行永远钉在历史耻辱柱上。   《全译本》是东京审判庭审记录在世界范围内首次以中文形式呈现,是维护东京审判历史价值的有力举措。“长期以来,由于远东国际军事法庭的工作语言为英文和日文,庭审记录一直仅有英文版与日文版,始终没有完整的中文译本。也正因缺少中文权威史料,我国对东京审判的相关研究长期落后于西方与日本学界。”赵玉蕙向记者分享近些年参与相关研究的一些体会。她表示,如今社会各界对中国参与东京审判的历史价值,以及东京审判本身的研究课题,关注度都在持续提升。   赵玉蕙表示:“夯实史料基础之后,我国的东京审判研究水平将得到整体提升,也具备了与国际学界开展高水平学术对话的底气。”   在向隆万看来,《全译本》的出版让中国民众、专业学者可以更全面了解东京审判历史,以完整史料还原历史真相,警示大众铭记历史教训。“《远东国际军事法庭庭审记录·全译本》还有助于推动日本民众及国际社会重新审视80年前的世纪审判,以史为鉴,防止历史悲剧重演。”向隆万强调。
小扎买了一家机器人公司,要做人形机器人的“安卓平台”
机器之心编辑部 小扎又开始「买买买」了。 继前段时间扎克伯格沉迷于「蒸馏」自己也「蒸馏」员工,这次 Meta 似乎准备走出虚拟世界,教这些数字大脑如何去驱动现实世界里的物理躯壳了。 今天,Meta Platforms Inc. 宣布已完成对机器人人工智能初创企业 Assured Robot Intelligence(简称 ARI)的收购。 还是熟悉的配方,还是 Meta 那套朴实无华的扩张打法:遇到可能颠覆行业的未来赛道,先买个顶尖团队进来补齐拼图。毕竟从早年的 Instagram、WhatsApp 到后来的 Oculus,Meta 的每一次重大生态跨越,都少不了「钞能力」的助攻。 眼看特斯拉、谷歌和亚马逊早就在人形机器人赛道打得不可开交,即便是之前在元宇宙里交过巨额学费的 Meta,显然也不愿错过具身智能这趟通往 AGI 的实体班车。 随着交易正式落锤,ARI 这支约 20 人的精锐小队将整体并入 Meta 旗下的「超级智能实验室」。他们将与 Meta 去年成立的机器人工作室紧密协同,共同开发驱动人形机器人的底层技术。 Meta 发言人表示,ARI「处于机器人智能技术的前沿,其设计旨在让机器人能够在复杂和动态的环境中理解、预测并适应人类行为」。加入 Meta 后,该团队将把其在模型设计、机器人控制、自主学习以及全身人形控制方面的深厚专业知识引入 Meta 的研发体系。 不过,Meta 这次似乎吸取了做 VR 硬件的教训,目前并没有表现出亲自下场量产钢铁骨架的意愿。他们的算盘打得很精:避开重资产的硬件制造,专注开发机器人的传感器、底层 AI 模型与软件栈,然后将这些技术提供给行业内的其他硬件制造商。 简而言之,Meta 试图在未来的具身智能市场中,舒舒服服地收割类似谷歌 Android 系统或高通芯片那样的底层生态红利,成为人形机器人通用的「智能大脑」。 关于这家公司 Assured Robot Intelligence(ARI)是一家专注于为人形机器人开发 AI 模型的初创公司。公司员工主要分布在圣地亚哥和纽约,团队规模约 20 人,曾获得 AIX Ventures 等机构的早期投资。 ARI 的核心技术优势在于构建能让机器人理解并预测人类行为的智能模型,重点解决高精度敏捷操作、触觉传感以及机器人在复杂物理世界中的全身协调与平衡问题。 ARI 由 Xiaolong Wang 和 Lerrel Pinto 联合创立,两人在机器人学习与具身智能领域均拥有丰富的学术和行业经验: Xiaolong Wang:在创立 ARI 之前,他曾是英伟达(Nvidia)的基础模型研究员,同时担任加州大学圣地亚哥分校(UCSD)的副教授。他在卡内基梅隆大学(CMU)获得了机器人学博士学位。他的研究方向主要集中在计算机视觉、机器学习和具身智能,尤其擅长通过视频数据和物理交互数据提取监督信号,以增强机器人在真实世界中的泛化能力和技能获取。 Lerrel Pinto:在联合创立 ARI 之前,他曾是纽约大学(NYU)计算机科学研究员及教授,致力于大规模机器人学习、自监督学习以及低成本开源机器人的研发,曾因在多技能家庭机器人数据采集上的贡献获得广泛关注。此外,他曾是机器人初创公司 Fauna Robotics 的联合创始人,于 2025 年离开该团队。值得一提的是,Fauna Robotics 已于今年 3 月被亚马逊收购。
CTO不香了?百亿公司高管们为何集体转身,去Anthropic当工程师
一件看似「反常」的人才大迁徙,正在硅谷悄然发生…… 事情是这样的,前两天,一位博主 Henry Shi 在 X 上发文称,自己看到科技界正在发生奇怪的事情,「一些曾经管理着数十亿美元公司业务的 CTO,纷纷离职,转而加入 Anthropic,去做一名个人贡献者 (IC, Individual Contributor)。」 看到这一帖文,确实好奇:这些技术大拿集体从明星公司「降级」,去到 Anthropic 担任「技术团队成员」(MTS)的背后,究竟是理想主义的召唤,还是最聪明的人嗅到了某种权力版图的巨变? 该博主还列举了他所观察到的案例,我们结合新闻报道梳理了一下时间线: 2026 年 4 月,Workday CTO Peter Bailis(彼得・贝里斯)被爆出已离职,加入 Anthropic 担任技术团队成员; 2026 年 3 月,You.com 联合创始人、CTO Bryan McCann(布莱恩・麦肯)被爆出已离职,加入 Anthropic 担任技术团队成员; 2026 年 1 月,Instagram 联合创始人兼前 CTO Mike Krieger(他早于 2024 年 5 月加入 Anthropic 担任 CPO),宣布转入 Anthropic 公司内部的 Labs 团队,担任技术团队成员,彼时消息传出后,引起业界热议; 2025 年 12 月,Box CTO 加入 Anthropic 担任技术团队成员; 2025 年 7 月,Super・com 的 CTO 加入 Anthropic 担任技术团队成员; 2025 年 1 月,Adept AI CTO 加入 Anthropic 担任技术团队成员; …… 有意思的是,在梳理的过程中我们发现,其实这位 Henry Shi 正是 Super・com 的前 CTO,他曾把 Super.com 从 0 做到 2 亿美元的年收入,目前就职于 Anthropic。而在帖文下面,他也回应了这一点,并给出了当时离开 Super・com,加入 Anthropic 的心理路程博客(是的,这位与他互动的「网友」正是长期活跃在 X 一线的 Claude Code 工程师 Thariq)。 在博客中,Henry Shi 陈述了之所以加入 Anthropic 的理由很简单:「如果 AGI 在 2027 年或 2028 年到来,我将置身前沿实验室,坐在前排观看。如果不会发生,我也会明白为什么会这样,以及实际可能发生的事情。」 换句话说,他想用 1-2 年时间,换一个「参与人类级跃迁」的机会。而在 Anthropic 内部,他看到了这种正在发生的变化。 关于这一点,他在「领英」上发布的这一关于成功的 CTO 进入 Anthropic 一线「作战」的帖文中,进行了补充: 「你不会做出这样的选择,除非你真心相信 —— 眼前正在做的事情,比你能管理的一切都更重要。 这个使命,确实如此真实。 AGI 正在到来。 而那些最接近前沿的人,正在用自己的职业路径投票。」 该帖子一经发布,立即引起了大家的热议。 很多网友认为,是的,这些技术大拿是受到了AI技术、AGI的使命召唤,选择重新回归一线作战,继续发光、发热。 名为 Ammar A 的网友表示:「事实就是这样,一点也不奇怪。」 很多技术出身的人,包括他自己在内,后来都走上了管理岗位:职责变大、团队变多、scope 也不断扩展。但后来 AI 的浪潮出现,重新点燃了技术人对技术最初的热爱,选择重新全身心投入、亲自动手去做,反而有一种「回家」的感觉;而且还是在一个对社会影响可能最大的领域里。 「一个真正热爱技术的人,又怎么可能抗拒这一点呢?我敢打赌,这些 CTO 在做出这个决定之前,很早就已经在私下里折腾各种小项目、动手做东西了 —— 只是出于热爱。」 但大多数的声音似乎并没有被这一「来自理想主义的呼唤」理由说服。他们表示,这其实不仅仅是关于对 AGI 的信仰问题,更关乎「杠杆」在哪里最高。 在技术前沿,一个直接参与核心模型的个人贡献者,其影响力可以达到传统高管岗位无法比拟的规模。而在大多数大型组织中,影响力会在层层管理中被不断稀释;但在前沿实验室里,决策与产出之间的距离被大幅压缩。 「这也正是为什么一些资深高管选择『下沉』—— 不是为了做得更少,而是为了更接近那些真正发生技术突破的地方。在这个阶段,离模型越近,就越有权力。」 从这个角度来看,AI 时代正在彻底重塑「影响力」的定义,那些已经登顶职业生涯的高管来说,放弃几千万的年薪和显赫的头衔,绝不仅仅是为了所谓的「使命感」,更是为了寻找更高效的个人杠杆。 寻找「最长的杠杆」 一位名为阿绎 AYi 的网友也深有感触,他表示,自己在第一次看到这条消息的时候,震惊了很久。 「六位来自百亿美元公司的 CTO,集体放弃管理层身份,跑去 Anthropic 当『普通工程师』。原帖里说,他们离开的原因是:这个使命足够真实。但仔细想想,事情显然没那么简单。」 他认为,这些成功的 CTO 们不是傻子,不会为了一个模糊而抽象的「使命」放弃几千万年薪,以及管理几百人的权力。背后真正的原因是他们发现了一个大多数人还没意识到的秘密: 「在 AI 时代,你管理多少人已经不重要了,你离模型有多近,才重要。」 在传统的科技公司逻辑中,CTO 的权力来源于「规模」,要做的事情可能包括处理公司政治、偿还技术债、维护老系统、一半精力都花在「人」上 。 但如果是到 Anthropic 做技术人员,那么就可以直接参与最前沿的模型训练、用 AI 工具把产出放大上万倍。 在他看来,这其实是一种权力结构的根本反转:过去,管的人越多,影响力越大,而现在,能调用的模型能力越强,影响力越大。 一个顶级工程师 + 一个强模型,可以「干掉」过去一个百人团队的工作,当然,钱也不会少。 而根据 Anthropic 当前的估值和增长速度来看,即便只是技术团队人员,未来通过股权兑现的收益,可能超过大多数独角兽 CTO 一辈子的收入,而且流动性更好,不需要苦等一个遥远的 IPO。 这里插一句,根据最新消息来看,4 月底,Anthropic 正与投资者洽谈新一轮融资,目标估值高达 9000 亿美元。如果交易达成,Anthropic 将超过竞争对手 OpenAI(当前估值为 8520 亿美元),成为全球估值最高的 AI 初创公司。 阿绎 AYi 还表示,其实 Henry Shi 本身就是一个典型的例子,他把 Super.com 从 0 做到 2 亿美元年收入后,转身加入 Anthropic 去做一名「普通工程师」,他可能比任何人都更清楚,这个时代真正的杠杆在哪里。 而这件事情最有意思的地方在于:它正在重置传统的职业天花板,过去,所有人的终极目标是成为 CTO 或 CEO。但现在,最聪明的一批人,正在涌向一线实验室,做个人贡献者 (IC)。 「也许未来会有越来越多人意识到:成为一个可以直接操控基础模型的超级个体』,远比管理几百人的高管,更有力量,也更自由。 所以,这不是什么『被使命召唤』,而是这个时代最聪明的一群人,在用脚投票,他们正在走向杠杆最大的地方。 而这一点,值得我们每个人 —— 尤其是程序员 —— 认真思考。」 其实仔细围观了这些讨论后,发现大家说得各有道理,但有一点很明确的是,这场人才大迁移似乎释放了一个强烈的信号,那就是,在 AI 重构一切的今天,技术人才的职业天花板也在被彻底重置,基础模型实验室或正成为科技圈的「新心脏」。
梁文锋留住97%员工
作者/冯雨晨 报道/投资界PEdaily “确实在接触DeepSeek融资”,一位FA机构朋友告诉我们。 过去半个月,DeepSeek终于开启融资的消息发酵。而外界归结这次“反常”时几乎都不可避免提到:梁文锋要给内部核心员工一个确定的估值了。 毕竟这一年,大模型竞争日趋焦灼,DeepSeek核心人才流动沸沸扬扬,诸如罗福莉、王炳宣、郭达雅等人陆续跳至小米、腾讯和字节。 喧嚣之外,一组数据映射出更为平和的情况——DeepSeek V4在4月下旬终于发布,技术报告里一份长长的作者致谢名单显示,研究工程团队约270人中10人在研发期间离去。对应下来,技术研发人员离职率不到4%。 其实梁文锋留住了绝大多数人。 掀开DeepSeek跳槽风波 10名员工离开 2023年起,一种强烈的推背感袭来。 ChatGPT席卷之后,月之暗面、阶跃星辰、MiniMax等明星公司纷纷在这年或前后成立,豆包、通义千问、文心一言等大厂大模型产品密集涌现。 不早不晚地,梁文锋也在这一年将DeepSeek落地北京和杭州。 此时他罕见的一次对外分享中,聊到了人才观:DeepSeek大部分开发人员都是应届毕业生或AI从业时间不长,如果追求短期目标,招聘有经验的人当然没错,但从长远来看,基本技能、创造力和热情更为重要。 确实如此。2025年初,DeepSeek R1实力爆发,人们才开始真正关注到这个约150人规模的团队,许多都是国内TOP高校刚毕业或还没毕业的年轻人,清北含量极高。 几乎不可避免,此后一年里,人才流动的话题开始袭向DeepSeek。 2025年开始,DeepSeek传出罗福莉、王炳宣、魏浩然、阮翀等核心骨干离职,其中不少人跳槽他处成为核心业务负责人。坊间为此做了个通俗易懂的打趣:“当DeepSeek内部成员发现段位差不多的人跳槽出去能拿到那么多,那我为什么不可以?” 直到2026年初,随着郭达雅跳槽去字节seed团队,关于DeepSeek人才流失的讨论被推至高点,而当时配上迟迟不发布的DeepSeek V4,难免令人生出几分青黄不接隐忧。 但现实并没有这么沮丧。如今DeepSeek V4终于亮相,在同步发布的技术报告中披露了一份作者致谢名单。细细看下来,其Research & Engineering也就是研究工程团队约270人,这部分也被认为是一家AI公司最核心的研发团队,另有Business& Compliance即商业合规成员48人。 在DeepSeek V4研发期间,只有10名研究工程团队的成员离开。 也就是说,270人的研发团队10人选择离开,核心部门离职率仅不到4%——这已经足够低。一组数据显示,OpenAI 前两年流失了超过25%的关键研究人才,他们大多跳槽去了Meta等竞争对手或自行创业。 首次打开融资大门 稳定军心 眼下创投圈尤其期待:谁能参与DeepSeek的首次融资? 4月开始,DeepSeek最先被爆正以超100亿美元的估值启动首轮外部融资。随后不过一周,消息称DeepSeek与腾讯阿里就投资展开洽谈。后来业内流传,DeepSeek投前估值3000亿人民币。 截至目前,DeepSeek未对融资消息做出任何回应。 一位FA告诉我们,近日在和投资机构接触关于DeepSeek融资的合作方式,本轮融资中财务投资机构极少。另一点也得到证实:腾讯与DeepSeek在日常业务上有沟通,但并无融资的实质性接洽。 一切仍扑朔迷离。 4月27日,DeepSeek注册资本由1000万元增加至1500万元,其中梁文锋认缴的注册资本由10万元增加到510万元,直接持股比例由1%升至34%,同步地,梁文锋控制的宁波程恩企业管理咨询合伙企业持股比例由99%下降至66%。此次变化后,梁文锋以间接、直接方式持有DeepSeek约84.29%股权。 值得注意的是,此前梁文锋通过宁波程恩持有DeepSeek绝大多数股权,直接持股极少,而这次变化后,梁文锋直接持股比例上升到34%。如此一来,梁文锋的控股权摆在了更容易被看见的位置——如果开展融资尽调,DeepSeek股权结构会显得更加清晰。 “不是绝大多数人能参与的”,投资人们由衷感叹。诚然,中国大模型江湖经历一番鏖战后,DeepSeek依旧很吸引人。 正如DeepSeek V4预览版终于亮相,Pro版和Flash版百万上下文标配,Pro版高至1.6万亿参数,价格感人:Pro每百万token输入1元(缓存命中)或 12元(缓存未命中),输出24元,Flash分别为0.2元、1元、2元。 与此同时,传闻的国产芯片适配证实,DeepSeek V4技术报告中,虽然能看出模型训练部分依然大概率用的英伟达芯片,但华为昇腾和英伟达并列写在验证平台,“预计下半年昇腾950超节点批量上市并部署之后,Pro版本的价格也会大幅度下调。” 这一举,意味着DeepSeek在英伟达坚固的CUDA生态敲开了一条裂缝。背后的想象力不言而喻。 梁文锋的笃定 国产AI时代真正开始 梁文锋和DeepSeek走在一条反共识的路上。 通常,一家明星科技公司的时钟是这样的:在崭露锋芒之际把握融资机会,伴随人才扩张和产品迭代加速,尽快占领市场并谋求上市。这个动作一旦串联起来,就很难停下来。 但DeepSeek的每个环节都出乎意料慢一些。 2025年初DeepSeek R1发布之际,梁文锋几乎没有对手,但锋芒毕露时他拒绝了所有前来叩门的投资人。偏偏是在竞争白热化、对手林立的今天,DeepSeek首次放出融资消息,外界讨论归因大多绕不开两点:研发需要资金,更深一层,DeepSeek需要给内部人才一个确定的估值。 产品迭代同样姗姗而来。DeepSeek V4发布距离上一版重大更新已经过去15个月,千呼万唤始出来,DeepSeek只先放出了V4预览版,一直视为缺憾的多模态也未同步更新。直到4月29日,DeepSeek才上线灰测识图模式,释放出多模态能力信号。 “不诱于誉,不恐于诽”,这是DeepSeek的姿态。而市场给出的反馈,似乎验证着某种事缓则圆。 DeepSeek V4发布当日,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯等国产AI芯片就完成了适配。一时间,激起二级市场国产芯片上涨的“一池春水”。 与此同时,消息显示华为昇腾950系列AI芯片的市场需求大幅飙升,字节、腾讯、阿里三大国内头部互联网企业,已就新增芯片订单与华为展开接洽。 于是,一个反共识者,用慢节奏触发了产业共振——当底层芯片商与头部大厂开始围绕DeepSeek的标尺去咬合进化时,DeepSeek或许已经跃出了原本的竞争牌桌。 一如那句:慢就是快。只是,真正敢信的人并不多。
微信输入法测试隔空传送功能:支持跨设备秒传图片、文件
快科技5月3日消息,根据网友反馈,微信输入法iOS版及Windows版目前开始测试全新“隔空传送”功能,进一步强化跨设备文件传输能力。 据介绍,原有的跨设备粘贴同步功能已更名为“跨设备粘贴传送”,并在此基础上新增“隔空传送”。 更新前 新功能不仅支持在多设备之间快速传输图片和文件,还支持面对面秒传,使用方式更加灵活。 更新后 进入“隔空传送”界面后,用户既可以选择已关联的设备进行文件发送,也可以直接将文件传给其他用户,实现更便捷的跨端与近场分享体验。 回顾来看,微信输入法最早于2022年12月以“微信键盘1.0.0”形式在安卓和iOS平台上线,随后在2023年6月正式更名为微信输入法,并持续进行版本迭代。 2025年12月,微信输入法iOS版迎来3.0大版本更新,重点升级语音输入能力,引入更先进的大模型技术,在识别准确率与输入速度方面均有明显提升。 值得一提的是,腾讯高级副总裁、微信事业群总裁张小龙曾表示,团队推出微信输入法的目的并不是为了与其它输入法应用抢夺市场,而是为了更好地保护用户隐私。 整体来看,随着“隔空传送”等功能加入,微信输入法正在从单一输入工具,逐步向跨设备协同与轻量级文件传输工具延伸。
OpenAI参与,重卷ImageNet:终于把FID做成训练
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 统治AI图像生成近10年的黄金标准,第一次被拉下场当了教练。 我说的是FID(Frechet Inception Distance)。 这个指标从2017年沿用至今,一直无法无法投入日常训练使用。 现在有人打破了这个窘境—— 来自USC、CMU、CUHK和OpenAI的全华阵容研究团队,提出了一种叫FD-loss的方法,把“算统计的样本池”和“算梯度的batch”彻底解耦。 依靠数万张图像组成的大容量缓存队列或指数移动平均机制,稳定完成分布估算,仅针对当下小批量数据开展梯度回传。 仅凭这一个idea,长期受限的FID终于能够作为训练损失函数,参与模型的直接优化。 实验带来了多项出人意料的结果: 一个已有的单步生成器,后训练后直接刷出FID 0.72(ImageNet 256×256),而且推理成本零增加。 一个训练了50步的多步扩散模型,被他们直接repurposing成1步生成器,无需教师蒸馏、无需对抗训练,效果还能打。 其中最违背固有认知的发现在于,FID数值最优的模型,视觉观感未必出众。依托DINOv2、MAE、SigLIP等前沿视觉表征训练的模型,FID表现不如基于Inception架构优化的版本,但画面物体结构完整性与细节还原度都会明显更好。 业内长期扎堆优化FID分数,可这项沿用近十年的评价标准早已达到性能瓶颈,甚至会引导模型走入错误的优化方向。 对6种表征空间的归一化弗雷歇特距离(Fréchet Distance,FD)比值取平均,得到更鲁棒的综合指标FDrk。 按照这套新标准测算,真实验证集基准数值为1.0,现阶段顶尖生成模型的数值依旧高达1.89。 这足以说明ImageNet图像生成领域,距离技术成熟还有很远的距离。 解耦统计量与梯度计算 FID是所有生成模型性能测评的核心评判标准。 这个歌值越小,意味着生成图越真实、分布越接近真实。 它的计算方式是把真实图和生成图用Inception-v3提特征,各算一个高斯分布,再求两个分布之间的距离。 不过过去,FID只能当评测指标。 因为测算一次FID需要50000张图片的统计数据,而GPU每步训练能塞下的batch撑死也就1024张。 如果强行把5万样本全部参与反向传播,显存多半当场爆炸。 新研究的破局思路是“彻底解耦”。 简单来说,研究团队用数万张图组成的大窗口(队列或 EMA)稳定估算真实与生成分布的均值、协方差,保证FD计算准确;梯度只回传当前小批量数据,不增加训练算力负担。 研究者设计了两种工程实现。 第一种叫队列法(Queue)。 这种方法维护一个超大特征队列(比如5万条),每次生成新batch就enqueue,同时把最老的batch踢出去。 算FD时,用整个队列的均值和协方差;反向传播时,只给当前这1024条特征开梯度流,历史特征不参与梯度回传,保证统计稳健性的同时不增加训练开销。 第二种叫EMA法。 这种方法干脆不存储任何特征数据,仅通过指数移动平均实时更新生成样本特征的一阶矩与二阶矩,每一步使用当前批次的统计量平滑更新全局均值与协方差估计,梯度同样只作用于当前批次。 这种方式无需占用大量显存,统计结果更平滑稳定,还能轻松适配多表征空间联合优化,在实验中表现更优,也成为论文默认的实现方案。 为了验证这套解耦机制是否真的有效,研究者在最小的pMF-B/16(118M)上做了两组消融实验。 (注:论文在实验中使用了明确的模型规模分级,其中B代表Base小模型,参数规模约89M到131M。) 第一组对比队列长度。 不用队列(N=0)时,FID反而从3.31劣化到3.84。 队列加到5万时,FID骤降至0.89;但狂堆到50万后,因历史特征严重stale,FDr6直接崩回17.67。 第二组对比EMA衰减率。 β=0.999时,FID刷到0.81,比队列版更优,且显著好于过短的0.9(0.98)和过长的0.9999(0.98)。 因此后续所有实验——无论pixel/latent空间、多步转单步、还是2.5B参数的文本模型——均默认采用EMA方案。 三个“反常识”的实验发现 新提出的FD-loss本质上是一个后训练的分布对齐目标。 研究者从已经训练好的生成器出发,只用FD-loss做轻量微调。 真实图像只在离线阶段出现一次——预先把训练集的均值和协方差算好存盘,之后模型再也不见真图,只对着自己生成的样本做自我修正。 这意味着它不需要修改原有架构,不需要从头训练,也不需要教师蒸馏或对抗学习,像插件一样直接嵌入现有流程。 而且无论像素空间还是隐空间、单步还是多步模型,都能即插即用。 有了这个轻量框架,研究团队才得以系统性地测试当FID真的变成损失函数,生成模型会发生什么。 FD-loss带来了三个重要的实验发现。 发现一,FD-loss让单步生成模型首次实现画质与速度的新高度。 研究者拿了一个已经训练好的单步生成器 pMF-H,直接上FD-loss微调100轮。 结果在ImageNet 256×256上,FID从2.29干到了0.77,同时依然保持 1-NFE(单步生成)。 这一分数大幅超越过往多步扩散模型的最好水平,打破了 “高质量必须多步、单步只能低画质” 的固有枷锁。 换句话说,推理成本一分钱没多花,画质直接跃升。 同样的操作放到latent-space的iMF-XL上,FID也从1.82压到0.76。 更关键的是,这种提升不是刷分。在论文图4的定性对比里,后训练的鹦鹉羽毛更分明,雪豹的斑点也更清晰。 发现二,FD-loss可以直接将成熟的多步扩散模型改造为高性能单步生成器。 研究者把原本训练来跑50步的多步模型JiT-L,强行拉到单步模式,也就是直接输入纯噪声,模型只跑一次,输出就当最终图像。 结果就是FID直接崩到291.59,画面糊成一锅粥。 然后,他们什么都不改,就用FD-loss继续微调这个的单步模式。 整个过程无需教师蒸馏,无需对抗训练,无需逐样本监督信号。 50轮后,FID从291骤降到 0.77,生成质量与原多步模型相当甚至更优,而且推理速度提升数十倍。 发现三,FID最低的,未必是最好的。 这也是该试验最具行业反思价值的一点。 当研究者把FD-loss放到不同的表征空间里优化时,事情变得诡异起来(惊恐.jpg)。 实验清晰表明,FID最低的模型,在人眼主观评价中并非最优。 基于Inception特征优化的模型能获得最低FID,却在物体结构、细节纹理、整体感知上弱于使用DINOv2、MAE、SigLIP等现代视觉表征训练的模型。 后者FID数值更高,但人眼看更锐利、物体结构更完整,视觉质量显著更优。 这说明长期被奉为金标准的FID可能会误导研究方向…… 团队提出新标准 那么,如果FID已经靠不住了,我们拿什么来相信生成模型的进步? 研究团队提出跨6种表征空间的归一化平均指标FDrk。 该指标通过对Inception-v3、ConvNeXtv2、DINOv2、MAE、SigLIP2、CLIP共6种不同维度的表征空间计算归一化FD比值并取平均,得到综合评估结果FDr6。 按照这一标准,真实验证集的基准值为1.0,而当前最强生成模型的FDr6仍高达1.89,直观揭示 ImageNet生成任务远未被解决。 此外,在人类盲选偏好实验中,即便最优的pMF-H模型,得票率也只有37.4%,真实图片依旧以62.6%的胜率占优。 值得一提的是,FD‑loss具备极低的使用门槛与极强的泛化能力,可作为轻量化后训练插件直接嵌入现有训练流程,无需从零搭建模型,也不依赖复杂的训练策略与工程调优。 该方法同时兼容像素空间与隐空间生成模型,适配单步生成器与多步扩散模型,支持类别条件生成与文生图等多种任务模式。 在整个优化过程中,FD‑loss无需修改原有主干网络结构,不引入复杂的架构改动和从头训练的巨大开销,依托队列或EMA统计更新即可稳定收敛,具备优秀的复现性与落地可行性。 凭借简洁通用的设计,它大幅降低了高质量极速生成模型的工程实现门槛,让各类生成架构都能快速获得显著的质量提升。 低成本、高回报,这正是FD-loss之于工业界的诱惑力所在。 团队介绍 公开信息显示,五位作者全部是华人背景。 一作Jiawei Yang,USC计算机系博士生,师从Yue Wang教授,目前的研究聚焦于以视觉为中心的多模态模型的统一生成与理解。 他硕士毕业于UCLA,曾获NVIDIA Graduate Fellowship。 Zhengyang Geng本科毕业于四川大学计算金融专业,现为CMU计算机科学博士生,导师为Zico Kolter。 他长期专注单步生成、动态系统与模型高效化,是MeanFlow、pMF等系列工作核心作者。 他的个人主页写道“与Kaiming He有紧密合作”,两人曾连续合作多篇单步生成领域核心论文。 Xuan Ju是香港中文大学博士生,师从徐强教授,主攻图像与视频生成、高效多模态模型。 她在ICCV、SIGGRAP 等顶会发表多篇成果。 Yonglong Tian博士毕业于MIT计算机科学专业,现为OpenAI研究员。 他是监督对比学习SupContrast等表征学习标志性工作的作者,曾任职于Google DeepMind。 通讯作者Yue Wang,USC助理教授,同时兼任英伟达研究科学家。 他本科毕业于浙江大学,硕士毕业于UCSD,博士毕业于MIT,研究横跨3D视觉、生成模型与机器人。
燃油车应加速禁售淘汰吗!李斌、何小鹏坚信纯电汽车是终局:增程混动只是过渡
快科技5月3日消息,小鹏汽车CEO何小鹏与蔚来汽车CEO李斌近期就新能源汽车的未来趋势表达了明确观点。 两位造车新势力的领军人物在公开对话中一致认为,纯电动汽车才是行业的终极形态。 何小鹏强调,纯电驱动无疑是代表未来的核心方向。 虽然当前市场上混动和增程等动力形式表现活跃,但在他看来,这些技术本质上都是向纯电时代跨越过程中的过渡方案。 李斌则从战略布局的角度审视了这一演变。他认为虽然在不同的时间点和区域,市场会选择合适的能源形式,但蔚来从品牌创立之初就锁定了纯电这条终极路径,坚持以终为始的思考方式。 在谈到对彼此创业十年的评价时,两位好友展现了惺惺相惜的一面。 李斌评价小鹏是一个实事求是的人,在经营中从来不会自欺欺人,这种性格让小鹏汽车在经历每次低谷后都能变得更加强大。 何小鹏则对李斌将用户体验做到极致的精神表示钦佩,并认可其在高端市场的长期专注。随后他话锋一转,幽默地调侃李斌花钱太厉害,这一直率的吐槽引发了全场大笑。 在轻松的氛围过后,何小鹏认真地补充道,他在过去一年中看到了蔚来发生的巨大变化。 他认为一家规模如此庞大的企业能够保持如此快速的变革节奏,确实令人感到欣慰和钦佩。 在这之前还有不少企业大佬曾喊话,应该加快禁售燃油车,让新能源车在全球加速推广。
高自由度人形机器人KaiBot发布:115个自由度 搭载全身触觉皮肤系统
快科技5月3日消息,据媒体报道,深圳南山具身智能公司超维动力正式发布首款全尺寸人形机器人“KAI”。 为了让机器人“理解世界”,超维动力构建了可预测环境变化的世界模型系统;为让机器人“学习世界”,公司自研了轻量化头戴式数采终端“KAI Halo”,以第一人称视角采集人类在真实场景中的动作与视觉数据,为机器人注入“人类经验”。通过三阶段训练体系,这些经验将被转化为可执行的技能。 拥有数据和大脑之后,还需要一具能够承载这些能力的身体。这便是高拟人机器人本体“KaiBot”,KaiBot身高173厘米,体重70公斤,头身比约为1:8.5,整体体型与质量分配接近成年人类。 KaiBot具备115个自由度,接近人体的全身运动空间。其单手配备36个自由度的灵巧手,包含22个主控自由度和14个柔顺自由度,不仅能完成抓握、捏取等精细操作,也能缓冲碰撞,带来更安全、更自然的交互体验。 此外,KaiBot搭载了全身触觉皮肤系统,拥有18000个触点;动力方面配备1.7千瓦时半固态电池,可支持约3小时的双臂操作任务。 值得一提的是,其定制化柔顺执行器不仅使机器人具备更接近人体的运动柔顺性,还实现了接近20公斤的双臂负载能力。
OpenAI复活了QQ宠物,网友直接玩疯,把奥特曼和他死对头都养在了电脑里
谁不想在自己的电脑上养一只小宠物,打开电脑,它就坐在那里看着你工作。 OpenAI 最近在 Codex 上的更新,引入了类似电子宠物 Tamagotchi 的桌面悬浮伴侣。 我们可以在摸鱼的时候,把鼠标悬浮到小宠物上逗它,还能拖着它在屏幕的各个位置游走;而在工作的时候,这只悬浮宠物还会实时显示 Codex 的工作状态。 和之前 Anthropic 在 Claude Code 终端里推出的像素宠物不太一样,Codex 的这只会全局地在我们的电脑上呈现。无论切换到哪个 App,它都在那个角落。 以前是人与人的聊天软件里,像是 QQ,需要一个 QQ 宠物从桌面右下角蹦出来,给它取一个名字,建立情感的联系,而它会告诉我们消息来了。 现在这件事,来到了人与 AI 的故事里。 从微软大眼夹到 Mac 访达笑脸,万物皆可宠物化 Codex 官方内置了 8 款像素风的基础宠物,包括默认原始的经典 Codex 形象,还有一只整洁的小鸭子 Dewey、适合快速迭代项目的火球 Fireball,以及一只小小的蓝屏捣蛋鬼 BAOD(Blue Screen of Death) 等。 我们可以在 Codex 设置>外观 最下面的宠物部分找到配置的相关信息。 ▲Codex:最初的 Codex 伙伴。|Dewey:一只整洁的小鸭,适合平静工作的日子。|Fireball:热路径能量,适合快速迭代。|Rocky:当 diff 变得很大时,它是一块稳稳的石头。|Seedy:为新想法冒出的小绿芽。|Stacky:一个平衡的堆叠,适合深度工作。|BSOD:一只小小的蓝屏捣蛋鬼。|Null Signal:来自虚空的安静信号。 但真正有意思的是,Codex 的自定义宠物功能。 通过使用 Codex 自带的 /hatch 指令,我们可以上传任何图片,Codex 会自动把它孵化成一个动画宠物,并保存在本地文件夹中,方便我们打包分享给其他人。 使用 /hatch 指令之前,我们还需要输入命名 $Skill Installer hatch-pet 来安装自定义宠物的 Skill。它会自动从 OpenAI 的官方 GitHub 仓库里面,下载对应的 Skill 文档。 ▲Skill 文档链接:https://github.com/openai/skills/tree/main/skills/.curated/hatch-pet 准备就绪,我们使用 hatch pet Skill 输入 $hatch-pet 做一个 labubu 的桌面宠物。 Codex 会自动按照 Skill 里的流程,先生成一张主图,根据这张主图再生成 idle、running-right、running-left、waving、jumping、failed、waiting、running、review 等多种不同状态图片。 每一种状态,Codex 都会生成 4-8 帧的图片。 等待它生成全部状态的图片,合成为动画,我们就能得到一个自定义的桌面电子宠物。 社交网络和开发者社区也利用这一功能,创作了大量能提升 vibe coding 幸福感的桌面宠物。 像是恶搞 Anthropic CEO,做了一个愤怒的达里奥,还有奥特曼,「一个有趣的像素风格 Sama 灵感宠物,带着焦虑的斜视眼睛,头上戴着太阳镜,穿着灰色T恤和牛仔裤,散发出混乱会议室的能量。」 ▲Codex 宠物大全,PetShare 平台:https://codex-pet-share.pages.dev/ 一些怀旧党立刻复刻了微软经典的大眼夹(Clippy),那个在我们新建文件、打开文件夹,都会跳出来,多两句嘴的桌面宠物,用 Codex 获得了新生。 苹果粉丝,就用 Codex 这套 Skill 做了一个相当生动的 Mac Finder(访达)笑脸小人 Lil Finder Guy,让它悬浮在程序坞上方,仿佛系统原生的一部分。 甚至还有人做出了乔布斯版本的宠物,以及像是 DeepSeek 的那只鲸鱼等。 ▲另一个宠物社区,Petdex:https://petdex.crafter.run/ ▲ 来源:https://x.com/GOROman/status/2050343893921923145 在极短的时间内,PetShare 和 PetDex 这样的社区驱动型宠物图鉴网站,如雨后春笋般涌现。 多邻国的那只猫头鹰、经典动漫角色龙珠里的悟空、神探福尔摩斯、旅行青蛙、哈利波特、哆啦 A 梦等等,都成了 Codex 的热门宠物选择。 ▲电影《拯救计划》里的 Rocky 为了给这波热潮添把火,OpenAI 甚至官方下场举办了比赛:只要你生成的宠物被官方选入「最喜爱的 Top 10」,就能获得 30 天的 ChatGPT Pro(200 美元/月)奖励。 我们也在 Codex 里生成了一些小宠物,都是通过简单的两三个字的提示词。像是「做一个原神里旅行者荧的桌面宠物」,不过需要注意的是,生成自定义宠物需要的时间较长,同时消耗的额度也比较大。 ▲ 在生成第二个桌面宠物时,直接提示 5 小时内额度用完了。 更多 Codex 桌面宠物案例: PetShare: https://codex-pet-share.pages.dev/#/?sort=popular PetDex: https://petdex.crafter.run/ 电子宠物是 AI 的灵动岛 把这些自定义的宠物放到 Codex 里面也非常简单,可以直接下载文件压缩包,复制到对应的文件夹,然后在设置里进行选择。 直接在 Codex 中输入简单的 /pet 指令,我们的桌面上也能快速召唤出一个活蹦乱跳的电子宠物。 这个电子宠物,除了可爱,还确实有一点用处。 它不写代码,不 debug,唯一的工作是偶尔弹出对话气泡,告诉我们 Codex 正在后台做什么——「思考中」「任务完成」「需要你来决定一件事」。 任务完成了,点它一下,直接回复,继续。 ▲ 一边刷 X,一边提醒我 Codex 进度 以往我们无论是用 Claude Code、OpenClaw,还是就在 DeepSeek 里面聊天,把一个任务交给他们,总是时不时需要切回对应的窗口,看看它是不是卡住了,是不是还在思考。 现在,这只悬浮在屏幕最顶层的宠物,会通过气泡和动作告诉我们 Codex 的后台状态。 基于生成的多种状态,这只桌面宠物,如果开始在挠头了,就说明它正在「思考」;它弹出气泡,就说明它完成了任务,或者需要我们提供进一步的输入。 更有意思的是,如果我们在它发消息时点击它,就可以直接开启一条回复 AI Agent 的双向通道。它就像是 macOS 桌面上的一个跨应用灵动岛,让我们在专注当前工作流的同时,对 AI 的进度了如指掌。 一直在更新的 Codex 电子宠物的功能在社交媒体上给 Codex 带来了又一波的好评,网友们都在说,这也太可爱了,情绪价值非常到位。 看着自己喜欢的小宠物在桌面上跳动,要比看着进度条转圈要心情好上不少。 但 Codex 这次在更新桌面宠物的同时,还悄悄放了两个新功能。 Codex 现在能够自动检测我们的电脑上,是否有其他 AI 编程工具,比如 Claude Code 留下的配置文件。 一旦检测到类似如 CLAUDE.md 的文档,它会主动建议并一键导入所有的插件、项目约定和自定义规则。 如果你也是为了避开不同平台的使用频率限制,让在多个 AI 之间反复横跳,这项更新降低了一定的切换成本。 另一项更新是在 Codex 内新增了「听写词典」,允许我们预先录入个人的常用缩略语和短语。 对于习惯用语音让 AI 写代码的用户来说,专有名词和缩写经常会被错误识别,导致反复修改。现在通过添加对应的条目,可以让减少我们纠错的麻烦。 OpenAI 也开始用最频繁的更新,把用户留在自己的生态里。 配置文件的跨端迁移、更懂用户的语音工具,加上那些在屏幕上挥手、打盹、偶尔还会抖动一下的悬浮宠物…… 奥特曼在 X 发文说,感觉 Codex 正在经历 ChatGPT 时刻。 虽然事后奥特曼解释是 Goblin 时刻,但是 Codex 这接二连三的更新,也能看到 Codex 确实正在向一个更完整的、具备极高粘性的桌面「超级应用」进化。 在 AI 能力逐渐同质化的今天,产品的魅力和情绪价值,变得和代码生成能力一样重要。 就像那位做出 Lil Finder Guy 宠物的网友,分享了一段 AI 发给他的话,宠物用乔布斯的腔调说: 致敬那些小小的存在,那些悬在 Dock 上摇摇晃晃、时不时打个盹的小帮手,它们让工作变得轻一点。致敬 Codex 宠物。 好了,看着桌面上那个正冲我挥手的像素小怪物,我可能也得出门去溜达一圈了。
马斯克和阿莫迪,当桌宠还怪可爱嘞
多年后,那颗时代的眼泪——微软“大眼睛回形针”桌面助手——最想成为的样子,居然被OpenAI做出来了。 当地时间5月1日,Codex上线“桌面宠物”功能,还支持自定义宠物外观! 这下,网友纷纷分享自己制作的Codex宠物。 大多数都是可爱风格的桌面宠物,萌萌的柴犬、呆呆的地鼠、热心的瓦力等等。 但是整活的也不少,比如大火的“愤怒的阿莫迪”,创建之后,一个皱着眉头、撇着嘴的“阿莫迪”小人就出现在屏幕上,会蹲会跑还会掉眼泪。 当然,还有人制作“迷你马斯克”和“迷你奥特曼”宠物。 (强烈建议奥特曼安装,“愤怒的阿莫迪”和“迷你马斯克”轮番奔跑在屏幕上,这工作动力不得拉满。) Codex桌面宠物火到什么程度呢?不到24小时,已经有多个“宠物合集站”出现了。这些网站提供海量做好的宠物可以直接使用。 其实这并不算一个很大的新功能,但是OpenAI就是有这样一种能力——用奇妙的切入点,做未必最难但最出圈的事。正如苹果当年的灵动岛,人们一边说着“也还好吧”,一边垂直入坑。 01 Codex宠物 整活之风刮起来,实属OpenAI自己带的头。 在OpenAI官方X账号之一宣布该消息的时候,举的例子是“创建一个哥布林宠物”。登时,一个绿油油的小怪物就出现在桌面上。 这个梗来源于ChatGPT最近的一个执念。越来越多的用户发现,ChatGPT迷上了“Goblin(哥布林)”,经常在回答里偷偷加入“哥布林”。最后OpenAI都专门发布博文讨论这个问题,承认在GPT-5.1之后,模型愈发频繁地提到这个词。 OpenAI对背后原理的解释不知道多少人听进去了,反正大家很痴迷ChatGPT痴迷哥布林这件事。一个是现代最先进的AI模型之一,一个是奇幻作品中的狡猾小怪物,缘,真是妙不可言。 官方玩梗最“致命”,OpenAI太懂得如何将一个“差错”内化成模因,再用作宣传,一通操作丝滑无比。 不要误会,光靠整活是不能让这个功能迅速出圈的,Codex桌面宠物确实好用而且非常容易上手。 用户在Codex Composer中输入/pet即可一键唤醒或关闭宠物;也可进入设置→外观→宠物,从8款官方内置像素风宠物中选择(如Dewy小鸭、Fireball火球、BSOD蓝屏小怪等)。 自定义宠物也很灵活。用户可以先通过Skills安装hatch-pet skill,随后输入/hatch make me a cute goblin pet或/hatch a fluffy blue dragon等描述,Codex便会生成专属动画桌宠。宠物全局悬浮于桌面最上层,支持拖动、不遮挡其他窗口,且可与任意应用共存。 不同于单纯娱乐的桌宠,Codex宠物深度集成Agent系统。 它会根据当前任务状态动态变换动作:代码运行中“跑来跑去”、等待用户输入时“乖乖待机”、任务完成待review时跳出提醒、失败时也会卖萌示意。 开发者在多窗口切换时,余光即可掌握后台进度,大幅减少反复切回Codex的麻烦。这可以算是一个“杀手级小功能”。 02 只要还有屏幕,人类永远爱“桌面宠物” 看到Codex桌面宠物迅速出圈,相信任何一个互联网“老人儿”都会感慨万千——人类,就这样多少年如一日地爱“桌面宠物”“桌面助手”这样的存在。 先不说AI,就连只是记录点击次数、有社交功能、可以换皮肤的桌面宠物小游戏Bongocat,都在上线后短短一个月冲到了Steam热玩榜前十,同时在线峰值19.45万,日常常年保持10万+在线,玩家总数轻松破几百万。 但要说真正帮人“排忧解难”的桌面宠物助手,那个名字是绕不过的。 这次Codex桌面宠物功能上线,就有人迅速搓了一个“微软大眼回形针(下称Clippy)”的桌面宠物。就连OpenAI的官方开发者账号都来点赞。 由Codex桌面宠物到Clippy是一个再自然不过的联想。甚至有人感慨:这就是Clippy应该有的样子!它终于圆满了! Clippy是微软历史上最著名,也最具争议的桌面助手,诞生于1997年,是Office 97的亮眼功能,定位办公助手。它迅速走红,却也被迅速嫌弃。原因很简单,当时的技术还跟不上对Clippy的期待,Clippy频繁打断用户、给出的建议鸡肋,而且反应迟钝。《时代》杂志甚至将其评为“史上最差50项发明”,之后,Clippy就迅速地退出舞台。 但人们从未停止怀念Clippy。或者说,Clippy点燃了大家一个“桌面助手”的美梦,其后数年,人们都在努力达成它。 不管是后来以苹果Siri、亚马逊Alexa为代表的语音助手出现,还是微软短暂地尝试Cortana这样的虚拟助手,都会拿来和Clippy对照。 Siri推出的次年,TechCrunch在一篇批评文章中指出Siri的若干问题,并直接在标题中称《Siri是新的Clippy》 ChatGPT横空出世后也不例外。2023年,微软把GPT-4接入Office全家桶推出Microsoft 365 Copilot,外界立刻敏锐地感知到,这是Clippy的一次别样复活。 也是在那一年,还曾经有开发者FireCube把经典Clippy像素形象做成Windows应用,上架Microsoft Store,直接接GPT-3.5(用户输入OpenAI Key就能用)。 第三方软件Clippy by FireCube曾上架Windows应用商店。 当Agent开始流行后,开发者开始打造“智能状态监视器+AI伙伴”,Codex桌面宠物这种形态早已有很多类似的开源项目。 比如像素风多Agent兼容桌宠clawd-on-desk,同时支持Claude Code、Codex、Cursor、Copilot CLI等多种编码Agent。宠物会“看着”后台Agent工作,思考时皱眉,跑subagent的时候耍杂技,context压缩时扫地……用户不用反复切窗口。像素动画+实时状态同步,是目前兼容性最广的项目之一。开发者来自中国,在GitHub上已经有2K颗星星。 可以说,Codex桌面宠物并非创新,也并不高深,但它精准地踩在了人们的需求上,而这种需求,是感性与理性参半的。 03 OpenAI要干啥? 人类对桌面宠物永恒的爱是感性,我们也来说说Codex桌面宠物满足的真实需求。 Codex宠物并不只是“卖萌”,它确实踩中了Agent产品里一个很现实的痛点:等待。 传统软件里,用户点击按钮,软件立刻给出反馈。哪怕只是一个加载圈、一个进度条、一个“正在处理”的提示,也能让人知道系统正在“努力干活”。 但Agent不一样。你把一个任务交给Codex,它可能要在后台读代码、改代码、跑测试、修bug。中间这段时间,用户体验常常是空白的。你不知道它现在是不是已经卡在哪里了,也不知道它到底是在认真工作呢,还是已经在悄悄摆烂、偷偷摸鱼。 这也是很多异步Agent产品共同面对的问题,它们越像一个“替你干活的人”,就越不能像传统工具那样完全沉默。 因为沉默会制造不确定感。 Codex宠物在这里的作用,就有点像一个更可爱的状态指示器。 它跑来跑去,不是为了真的提升代码能力;它待机、提醒、失败时做出反应,也不是为了证明它比进度条更高级。它让用户在视觉上感觉到后台那个Agent还在干活,任务还在进行。 这件事听起来很小,但对Agent产品来说并不小。 如果未来的软件越来越多地从“我操作它”变成“我委托它”,那么用户和软件之间的关系也会改变。人不再只是等待一个按钮响应,而是在等待一个代理完成任务。这个过程中,状态感、陪伴感、可预期感,都会变成产品体验的一部分。 当然,这只是比较善意的理解。 另一个角度是,将桌面宠物做得如此可爱、支持高度自定义,也暴露了OpenAI另一层更现实的商业考量。 在编码Agent赛道,GitHub Copilot、Cursor、Claude等对手主要靠技术能力和工作流集成竞争,而OpenAI这次选择了一条更“消费级”的路径——用低成本的游戏化机制提升用户黏性。 宠物创造了一个“即使没有具体任务也要打开Codex”的理由:它像电子宠物一样,始终在那里等你、回应你、让你产生情感联结。这种设计能有效拉高日活跃用户数,却也足以让部分开发者感到隐隐不安:在开发者工具这个本该“工具性、透明性”的领域,引入情感操纵机制,是否改变了用户与工具之间的隐含契约? 从Clippy的“时代眼泪”到Codex的“AI桌宠”,微软近三十年前没能圆的梦,OpenAI却用一个看似不起眼的小功能完成了闭环。 它提醒我们,AI工具的下一阶段竞争,将模糊“专业工具”和“消费应用”之间的边界。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。